如何确定中文字符串的相似度

如何确定中文字符串的相似度
作者:肖波 个人博客:http://blog.csdn.net/eaglet  2007/4 南京  摘要 在数据挖掘的研究中,我们往往需要判断文章是否雷同,对类似文章或短句进行归类处理等,这其中就会遇到这样的问题:如何确定两个字符串之间的相似程度。 本文综合作者的实际工作经验和数据挖掘理论,结合中文字符串特性介绍一套相对完整的方法,以解决上述问题.。   分析      最简单的问题求解        字符串由一组不同含义的单词组...
Copyright © 浩然东方 保留所有权利.   Theme  Ality 07032740

用户登录