A-A+

分词方法二:正向最大匹配分词(FMM)

2008年12月03日 未分类 暂无评论 阅读 1 次
正向最大匹配分词方法的基本思想是:假设字典中最长的关键字的长度为i,取当前待处理文本的前i个字作为匹配字段w,在字典中查找,若字典中有w, 则匹配成功,w即做为一个词被切分出来;如果匹配失败,则去掉w的最后一个字,继续去字典中查找. 切分出w后,继续对w之后的字词进行上面步骤的切分,直到切分出所有的词为止.

梁南元先生在其论文《书面汉语的自动分词与另一个自动分词系统CDWS》提到,FMM方法的错误切分率为1/169. 一般不单独使用,而是和其它方法配合使用。

给我留言

Copyright © 浩然东方 保留所有权利.   Theme  Ality 07032740

用户登录