通过MySQL内置全文检索实现中文的相关检索 /** * @author : walkerlee * @copyright : www.neatstudio.com | www.walkerlee.net */ 转载请保留以上信息。 注:本文使用的MySQL版本为:MySQL 4.0.x 在MySQL4中,是已经开始支持全文检索(索引)的了。但是只是对英文支持全文检索。 由于英文在书写上的特殊性,使得分词算法相对中文来说,简单得多。一般来说,我们可以通过单词与单词之间的空格,以及标点符号来完成这个分词过程。 但是就中文来说,... 2009年01月03日 学习随笔 暂无评论 喜欢 0 阅读 1 次 阅读全文
如何确定中文字符串的相似度 作者:肖波 个人博客:http://blog.csdn.net/eaglet 2007/4 南京 摘要 在数据挖掘的研究中,我们往往需要判断文章是否雷同,对类似文章或短句进行归类处理等,这其中就会遇到这样的问题:如何确定两个字符串之间的相似程度。 本文综合作者的实际工作经验和数据挖掘理论,结合中文字符串特性介绍一套相对完整的方法,以解决上述问题.。 分析 最简单的问题求解 字符串由一组不同含义的单词组... 2008年05月09日 学习随笔 暂无评论 喜欢 0 阅读 1 次 阅读全文