如果你想写分词器,那么就需要有标注语料库进行训练,以下是 成 彦 的一些方法:
语料库标注或加工就是对语料(书面语和口语)进行不同层次的语言学分析,并添加相应的“显性”解释性语言学信息的过程。 语料库很关键,只有经过不周层次加工的“熟”语料才可真正用于自然语言处理系统的训练,测试。
目前我在网上找到的标注语料库是北京大学计算语言学研究所免费提供的“PFR人民日报标注语料1.0”。
PFR人民日报...
Wordpress的Blog系统如何显示全文或者摘要
Wordpress论坛里,有些人曾几次问过如何在首页显示日志的摘要,或者是想把本来显示的摘要改成全文显示。在QQ的Wordpess群里,也有好多人问起。其实显示摘要或者全文是根据选择的模板不同,而有所区别的。虽然这个问题很简单,但还是有必要总结一下。
首先我们要明白模板文件的调用规则:
显示Blog首页调用的文件为index.php
显示单篇日志调用的single.php
显示存档(分类存档,按月存档)调用的是archive.p...
AJAX如何与后台交互
Ajax全称为“Asynchronous JavaScript and XML”(异步JavaScript和XML),是指一种创建交互式网页应用的网页开发技术。Ajax技术是目前在浏览器中通过JavaScript脚本可以使用的所有技术的集合。Ajax以一种崭新的方式来使用所有的这些技术,使得古老的B/S方式的Web开发焕发了新的活力。
Ajax技术之中,最核心的技术就是XMLHttpRequest,它最初的名称叫做XMLHTTP,是微软公司为了满足开发者的需要,1999年在IE5...
如何在jsp中使用 jquery 的 ajax 功能
$(document).ready(function() {
$("a").click(function() {
$("#decimal").val('这是一个例子');
$("#inputtext").val('控制text');
});
/*
$("a").click(function() {
alert("Hello world!");
});
*/
});
function convertToDecimal(){
$.ajax({
type: "GET",
url: "/jqueryjsp/response",
data: "key=" + $("#key").val()...
如何锁定MYSQL数据表
在进行数据表检查或修补时,可以先将数据表锁定,可确保数据表的安全:
mysql>LOCK TABLE tbl_name READ;
mysql>FLUSH TABLES;
将数据表锁定后再进行检查或修补的工作。完成后再解除锁定:
mysql>UNLOCK TABLES;
//LOCK TABLE tbl_name READ表示要锁定成只读状态,在这个状态下用户只能读取数据表,不能写入。
LOCK TABLE tbl_name WRITE则是更严格的锁定...
在Windows平台下如何编译MySQL代码
说明:这不是一篇论文也不是代码阅读指导,写这篇文章的目的只是告诉朋友们如何编译MySQL代码,或许有些人觉得从Windows平台编译MySQL的代码有些复杂,其实不然。如果您对本文中所提到的知识有任何疑问可以透过CSDN的MySQL板或者MySQL@CHINA支援论坛寻求帮助。这篇文章中所提到的东西没有任何的创新性,只是对MySQL已有文档的总结。
一、为什么要编译代码
小的时候妈妈就告诉我做事情要先有个打算,不然就...
Mysql入门系列:MySQL数据目录的位置
从概念上讲,大多数关系数据库系统都是类似的:它们都由一组数据库组成,且每个数据库都包含一组表。但是,所有的系统都有自己的管理数据的方法, MySQL也不例外。
在缺省设置时,由MySQL服务器mysql管理的所有数据都存储在MySQL数据目录中。所有的数据库和提供有关服务器操作信息的状态文件也存储在那里。如果要执行MySQL安装的管理职责,应该熟悉数据目录的布局和使用。
本章包括以下内容:
怎样确定数据...
如何不让访问PHP程序文件
如何不让别人访问自己定义的某些PHP文件呢?
由于我们有需要用到某些php文件,而又不希望别人直接访问这个文件,我们可以在其他包含文件比如global.php中定义一个参数,在被访问页面data.php前面判断是否定义了该参数,没有定义则禁止访问
在global.php中定义
<?php
define('ROOT','./');
?>
在data.php文件中判断:
<?
//data.php
if (!defined("ROOT")) {
echo "You Cannot Access...
使用OTA来发布你的J2ME程序
使用OTA来发布你的J2ME程序
众所周知,J2ME程序发布的形式主要有:OTA、数据线传输、红外和蓝牙传输等。这里简单说说如何通过OTA来发布你的程序。
OTA是Over The Air的简写,也就是通过网络下载,这是主要的发布形式之一。现在的百宝箱都是采用这种形式。
使用OTA来发布程序,需要如下几个步骤:
1、在你的WEB服务器上添加对于jad和jar文件的MIME支持。
后缀名:jad
MIME类型:text/vn...
Fatal error: Maximum execution time of 30 seconds exceeded解决错误方法
Fatal error: Maximum execution time of 30 seconds exceeded 出现这个错误如何解决?去哪里可以设置最大执行时间?
答:
修改php.ini:
max_execution_time = 300 时间,然后重起apache服务
或者在程序写
set_time_limit(时间); //0为无限制