顿搜
飞过闲红千叶,夕岸在哪
类目归类
通过计算机把组成文本的字串自动转换为词串的过程被称为分词
英文名:Segmentation
中文通常需要分词
英文名:Tokenization
英语通常不需要分词
需要配备词表
又叫 “合”词法
提/B 高/E 人/B 民/E 的/S 生/B 活/E 水/B 平/E
英文名:precision
准确率(P) =切分结果中正确分词数/切分结果中所有分词数*100%
英文名:recall
召回率(R)=切分结果中正确分词数/标准答案中所有分词数*100%
英文名: F-measure
综合准确率和召回率的评价指标,F-指标=2PR/(P+R)