常用于web spider中URL排重的Bloom Filter算法学习… Bloom Filters是一种效率较高的内存索引算法,它本身具有矛盾性:一方面能快速测试目标成员是否存在,另一方面又不可避免的具有假命中率。如下文档仅供参考。 loom Filter 数据结构广泛地应用于网络技术中,它是由 Burton Bloom 在 1970 年提出来的。 它的优点是可以有效地节省空间,缺点是不能做到精确无误,不过这个看似很郁闷的缺点却可以使用调节参数的方法有效控制, 也可以通过不同的应用手段来避免... 2008年12月24日 未分类 暂无评论 喜欢 0 阅读 1 次 阅读全文
文本挖掘,构造垃圾站 最近为ruby,ruby on rails的灵活和魔幻而着迷。爽。 上上周一个同事给我们介绍了自然语言处理的一些知识,觉得很不错。事实上虽然是雅虎公司的一名工程师,但是因为我不是搜索/邮箱/平台研发这些部门,基本上没有接触到比较深一点的东西,也许对于这些部门来说很简单的东西,对于我来说还是很难以理解的。 课后自己去找了些东西看了看,然后有这样一思路,可以用来构造一个垃圾站。 基本思路是: 1.首先... 2008年12月24日 未分类 暂无评论 喜欢 0 阅读 1 次 阅读全文
使用PHP直接读取该实际文件 然后下载 你一定会笑我"下载文件"如此简单都值得说?当然并不是想象那么简单。例如你希望客户要填完一份表格,才可以下载某一文件,你第一个想法一定是用 "Redirect"的方法,先检查表格是否已经填写完毕和完整,然后就将网址指到该文件,这样客户才能下载,但如果你想做一个关于"网上购物"的电子商务网站,考虑安全问题,你不想用户直接复制网址下载该文件,笔者建议你使... 2008年12月23日 PHP 暂无评论 喜欢 0 阅读 1 次 阅读全文
30分钟学会用PHP写带数据库的简单通讯录 我接触PHP也不是很久,所以有什么不足的地方,欢迎各位指正,让大家见笑了。 这篇小教程的对象是PHP初学者,都是些最简单、最基本的东西,因此高手们可以略过哦。 为了让各位初学者提起兴趣、尽快入门,这里写的是将是最简单,最基本的PHP程序,相信你只要有一点点的PHP基础知识,10分钟之内就能把它学会。没有PHP基础知识也没有关系,只要耐心的看,学会它也不会超过一个小时的。 我写这... 2008年12月23日 未分类 暂无评论 喜欢 0 阅读 1 次 阅读全文
php防盗链的方法 1.简单防盗链 CODE: [Copy to clipboard] $ADMIN[defaulturl] = "http://21nw.com/errorinfo.htm";//盗链返回的地址 $okaysites = array("http://21nw.com/","http://21nw.com"); //白名单 $ADMIN[url_1] = "http://21nw.com/temp/download/";//下载地点1 $ADMIN[url_2] = "";//下载地点2,以此类推 $reffer = $HTTP_REFERER; if($reffer) { $yes = 0; while(list($domain, $subarray) = each($okays... 2008年12月23日 PHP 暂无评论 喜欢 0 阅读 1 次 阅读全文
最强的PHP字符串截取函数 <?php /***********************************************************************/ /* */ /* Author: */ /* HomePage: www..com */ /* Email: phforum@163.com */ /* QQ... 2008年12月23日 PHP 暂无评论 喜欢 0 阅读 1 次 阅读全文
结合AJAX进行PHP开发之入门 异步 javascript 和 XML(Asynchronous JavaScript and XML,Ajax)无疑是最流行的新 Web 技术。本文中我们将完全使用 PHP 和 Simple Ajax Toolkit (Sajax) 创建一个简单的相册作为在线 Web 应用程序。我们首先用标准的 PHP 开发方法编写简单的相册,然后再用 Sajax 将其变成活动的 Web 应用程序。 创建一个简单的相册 本文将使用两种方法创建一个简单的相册:传统的 Web 应用程序和基于 S... 2008年12月23日 PHP 暂无评论 喜欢 0 阅读 1 次 阅读全文
PHP实现验证码一法 前段时间看了一些关于验证码的文章,就是将一串随机产生的数字或符号,生成一幅图片,图片里加上一些干扰象素(防止OCR),由用户肉眼识别其中的验证码信息,输入表单提交网站验证,验证成功后才能使用某项功能。 有篇文章也简单的介绍了实现的方法,如下: 代码一: <?php /* * Filename: authpage.php * Author: hutuworm * Date: 2003-04-28 * @Copyleft hutuworm.org */ srand((double)microtime()... 2008年12月23日 PHP 暂无评论 喜欢 0 阅读 1 次 阅读全文
windows下开发并编译PHP扩展(步骤说明) 开发PHP扩展对于普通程序员来讲可能一直是一件很神秘的工作,其实,只要你对C语言熟悉,了解了开发PHP扩展的步骤和规则,开发PHP扩展也是一件很普通的工作。 现在就简单说一在WINDOWS下开发PHP扩展的步骤: 首先需要准备的软件有: cygwin 安装路径e:appcygwin visual studio C++ 6.0, 修改环境变量,把已经安装好的PHP路径设置为环境变量。在这里,假设我的PHP安装目录是:e:appphp5.2.5,那么我把WINDOW... 2008年12月23日 未分类 暂无评论 喜欢 0 阅读 1 次 阅读全文
PHP编程技巧:看实例学正则表达式 首先,让我们看看两个特别的字符:’^’ 和 ‘$’ 他们是分别用来匹配字符串的开始和结束,一下分别举例说明: "^The": 匹配以 "The"开头的字符串; "of despair$": 匹配以 "of despair" 结尾的字符串; "^abc$": 匹配以abc开头和以abc结尾的字符串,实际上是只有abc与之匹配; "notice": 匹配包含notice的字符串; 你可以看见如果你没有用我们提到的两个字符(最后一个例子),就是说 模式(正则表达式) 可... 2008年12月23日 PHP 暂无评论 喜欢 0 阅读 1 次 阅读全文