中文分词组件 KTDictSeg 1.2 版本发布及算法简介
作者:肖波
2007/6 南京
经过一周的工作,完成了KTDictSeg 1.2 版本的开发,该版本对词库进行的初步整理,并增加了如下功能
1、 增加了中文人名判断
2、 增加了正向匹配分词和反向匹配分词的选项
3、 增加了停用词过滤
4、 增加了词性标注
该版本对算法进行了改进
算法步骤如下
1) 预分词:预分词以 KTDictSeg 1.0 版本的算法为基础(参见 KTDictSeg 一种简...
中文分词组件 KTDictSeg 1.2 版本发布及算法简介
中文分词组件 KTDictSeg 1.2 版本发布及算法简介
新一篇: 一款轻量级的桌面WebServer通讯组件
作者:肖波
个人博客:http://blog.csdn.net/eaglet
2007/6 南京
经过一周的工作,完成了KTDictSeg 1.2 版本的开发,该版本对词库进行的初步整理,并增加了如下功能
1、 增加了中文人名判断
2、 增加了正向匹配分词和反向匹配分词的选项
3、 增加了停用词过滤
4、 增加了词性标注
该版本对算法进行了改进
算...