中文分词的重要概念:条件随机场(Conditional Random Fields, CRFs)

中文分词的重要概念:条件随机场(Conditional Random Fields, CRFs)

一般序列分类模型常常采用隐马模型(HMM), 像基于类的中文分词, 但隐马 模型中存在两个假设: 输出独立性假设和马尔可夫性假设. 其中, 输出独立性假设要求序列数据严格相互独立才能保证推导的正确性, 而事实上大多数序列数据不能 被表示成一系列独立事件. 而条件随机场则使用一种概率图模型, 具有表达长距离依赖性和交叠性特征的能力, 能够较好地解决标注(分类)偏置等问题的优点, 而且所有特征可以进行全局归一化, 能够求得全局的最优解.

作为博客如何写出好的原创文章?

作为博客如何写出好的原创文章?
很多网络编辑对于如何花最短的时间写出象模像样的文章而头疼,今天我就跟大家谈谈这点,如何快速写出一片高质量的文章. 准备工作: 筛选很重要,一定要找一系列有实际意义的文章,例如 栏目下,都找些相关seo的文章,找出一些质量较好的来,然后开始修改. 修改重点: 一.标题一定要修改 (1)替换数字法 比如新浪教育的一篇文章,标题是:“备战高作文:三招让你的文章“亮”起来”,在修改标题的时候,就完全可以改成...

如何做好对于百度的SEO

如何做好对于百度的SEO
在这里找些优化的文章给朋友们看,因为很多朋友再作搜索引擎优化工作,另外相对于百度,大家普遍比较重视. 各个搜索引擎对关键词以及搜索偏好是不同,针对国内行情来说我们更注重百度的优化,中文站百度来的流量是最大的。下面我们就说一下如何优化百度也就是SEO 首先搜索引擎喜欢的是什么 当然是 文字 图片蜘蛛是不识别的,有人说我加批注,批注只是几个文字,而一篇文章多则能上百个关键词,流量从此而来,...

分词方法一:从字构造词

分词方法一:从字构造词
关于搜索引擎技术中的中文分词,让很多全文检索爱好者都头痛不已,这里我将几篇有用的文章介绍给大家。 现有的中文分词方法基本上都是采用基于词表的正(反)向最大匹配法进行词语切分。不过这种分词方法具有一个最大的问题,对于未登录词(也就是在词表中并未录入的词)的切分具有先天的不足,一般的解决方法是在基于正向最大匹配法切分模块后再加入一个未登录词模块,用于处理对于未登录词的切分。而在中文...

如何用GOOGLE分析统计站内搜索流量

如何用GOOGLE分析统计站内搜索流量
前些天我曾推荐用Google提供的自定义搜索来打造你的站内搜索引擎,其中有一个理由就是CSE(Custom Search Engine)可以统计你的读者在你的网站搜索情况。11月2日Google Analytics官方博客介绍:GOOGLE分析(google analytics)在其统计系统中推出了一个新的功能,统计站内搜索的流量,并为你生成相关报告。说白了,就是可以把你博客的访问者的搜索行为记录下来,报告给你。 为什么要统计站内搜索的流量? ...

链接建设策略

链接建设策略
By 理处言语然自 on 星期二, 12月 2, 2008 Filed Under: SEO技术 网站获得好的排名,主要靠两条: 原创、唯一的网站内容 高质量的外部链接 内容为王,每个人都在说,每个人都知道。本文暂不讨论内容问题,主要谈谈如何制定一个强劲的链接建设策略。什么时候通过什么手段来获得什么样的链接,这是本文的重点。下面我就来谈谈我是如何制定这个策略的。 第1天,购买一个有利于关键词排名的域名。 第2天,...

SQL Server中读取XML文件的简单做法

SQL Server中读取XML文件的简单做法
  SQL Server 2000使得以XML导出数据变得更加简单,但在SQL Server 2000中导入XML数据并对其进行处理则有些麻烦。   SQL Server 2000使得以XML导出数据变得更加简单,但在SQL Server 2000中导入XML数据并对其进行处理则有些麻烦。   如果你参考Books Online(BOL),你会发现有相关的条目,包括OPENXML以及 OPENROWSET。所有的这些例子都支持将XML文本作为已经声明的变量,这对于经常处理文本的用户...

MoinMoin Wiki 1.7优化与维护经验

MoinMoin Wiki 1.7优化与维护经验
  (CWDG)从2006年开始在一直使用 MoinMoinWiki 来构建一个魔兽世界游戏插件开发技术知识库, 这2年中wiki的版本也从1.5变更到了1.7. moin1.6是一个变化最大的版本, 连不少wiki语法都改变了, 最显著的莫过于内连接的语法原先是["xxx"]现在与mediawiki一致了[[xxx]], 还有不少细节语法的改变, 这不知是一件好事还是坏事, 好事是和mediawiki大多语法兼容了方便内容移植, 坏事是googlecode的wiki还是在使用moin...

MoinMoin Wiki 权限使用指南

MoinMoin Wiki 权限使用指南
权限简介  本文假设您已经安装好了MoinMoin Wiki并在参看本文前阅读了官方帮助文档页面, 帮助-访问权限控制表(中文翻译版本)或HelpOnAccessControlLists(英文原版). MoinMoinWiki通过ACL(访问控制列表)提供了灵活的方式来处理页面访问权限. 你可以简单方便的为每个页面或一组页面配置个性化的权限. 在每个页面的顶部只需要类似这样的一句话即可实现权限控制. 示例 #acl simonw:read,write All:read 这指明...

安装MoinMoin Wiki后的简单配置

安装MoinMoin Wiki后的简单配置
访问已运行的Wiki,http://localhost/mywiki 注册一个新的用户,比如admin。 wikiconfig.py的修改如下: 1. 设置默认的访问权限: superuser = [u"admin", ] 这句设定刚建的admin用户为superuser acl_rights_default = 'All:' acl_rights_before = u'admin:read,write,delete,revert,admin Known:read,write' 这里,我设置的权限是:默认没有任何权限,必须登录才能使用Wiki;admin用户具有管理员的权限;...
Copyright © 浩然东方 保留所有权利.   Theme  Ality 07032740

用户登录