如何DIY你的标注语料库 如果你想写分词器,那么就需要有标注语料库进行训练,以下是 成 彦 的一些方法: 语料库标注或加工就是对语料(书面语和口语)进行不同层次的语言学分析,并添加相应的“显性”解释性语言学信息的过程。 语料库很关键,只有经过不周层次加工的“熟”语料才可真正用于自然语言处理系统的训练,测试。 目前我在网上找到的标注语料库是北京大学计算语言学研究所免费提供的“PFR人民日报标注语料1.0”。 PFR人民日报... 2008年12月03日 未分类 暂无评论 喜欢 0 阅读 1 次 阅读全文