Blog的三大核心功能及RSS详解
Blog的三大核心功能及RSS详解
三大核心功能:
RSS
Permalink
Trackback Ping
Permalink
Trackback Ping
RSS
首先谈RSS,RSS其实很多朋友都已有了解。RSS是站点用来和其他站点之间共享内容的一种简易方式(也叫聚合内容),通常被用于新闻和其他按顺序排列的网站,一段项目的介绍也可以是包含新闻的全部介绍等。或者仅仅是额外的内容或者简短的介绍。这些项目 的链接通常都能链接到全部的内容。网络用户可以借助RSS Reader在不打开网站内容页面的情况下阅读支持RSS输出的网站内容。网站提供RSS输出,有利于让用户发现网站内容的更新。
现在很多站点都有RSS Feed,那么为什么是Blog的核心呢?RSS 本质上中是一种遵循W3C RDF规范的XML格式,Blog和RSS结合十分紧密,自Blog一诞生以来,标准的Blog站点都支持RSS技术规范,能够包含网站的Logo、Link、标题、内容等等。
Permalink
中文翻译一般叫做固定链接,其实我觉得翻译成静态链接更为贴切。下面切入正题:
不得不承认,将动态网页链接rewriting成静态链接是最保险和稳定的面向搜索引擎优化方式。
此外随着互联网上的内容以惊人速度的增长也越来越突出了搜索引擎的重要性,如果网站想更好地被搜索引擎收录,网站设计除了面向用户友好(User Friendly)外,搜索引擎友好(Search Engine Friendly)的设计也是非常重要的。进入搜索引擎的页面内容越多,则被用户用不同的关键词找到的几率越大。在Google的算法调查一文中提到一个站点被Google索引页面的数量其实对PageRank也是有一定影响的。由于Google 突出的是整个网络中相对静态的部分(动态网页索引量比较小),链接地址相对固定的静态网页比较适合被Google索引(怪不得很多大网站的邮件列表归档和BLOG按日期归档的文档很容被搜的到),因此很多关于面向搜索引擎 URL设计优化(URI Pretty)的文章中提到了很多利用一定机制将动态网页参数变成像静态网页的形式:
比如可以将:
http://d4e.org/showthread.php?t=12327
变成:
http://d4e.org/2004/09/08/01
实现方式主要有2种:
基于url rewrite
IIS的ISAPI REWRITE(免费下载)
基于path_info
具体实现细节不是本文重点,不再细述。很多BLOG程序后台都能打开此功能,也要注意WEB服务器的设置,使用虚拟主机无法设置服务器的朋友请参考path_info的一些资料。
静态地址还有什么好处:
隐藏后台实现:这在后台应用平台的迁移时非常有用:当从asp迁移到java平台时,对于前台用户来说,根本感受不到后台应用的变化;
简化数据校验:比如我们需要将应用从news.asp?id=234迁移成news.php?query=234时,前台的表现可以一直保持为 news/234.html。从实现应用和前台表现的分离:保持了URL的稳定性,而使用WEB服务中的mod_rewrite甚至可以把请求转发到其他后台服务器上。
从技术层面来讲,论坛如果想被搜索引擎更多的关注的话,同样可以实现Permalink。
Trackback
TrackBack最早是Movable上的一个小功能。可以说就是这个小功能在blog界却掀起了一场革命。
TrackBack为将全世界无数个blog连接起来的功能。例如,当你读了某个网站的文章,想对此写下自己的感想。这个时候利用网站准备的讨论功能进行留言是很最常见的做法。但这样只是把自己的评论意见写下来向别人的网站投稿,而你自己手里却什么也没留 下。
TrackBack 则与之有很大的区别。可以把评论写到自己网站上。然后向原始文章的服务器发送该网页的URL及标题、部分正文、网站名称等信息(注)。尽管这一过程只是称之为“发送TrackBackPing”,但通过这种办法,在原始文章的地方就留下了你的评论的URL 、标题等部分信息。当然别人也可以向原始文章发送TrackBack Ping,所以在原始文章中就将包括你的TrackBack Ping在内的所有评论都记录了下来。
此外,如果你在自己网站上也设置了TrackBack Ping功能的话,那么谁都可以通过TrackBack Ping来发表针对你的意见了。这样,多家网站就通过相关话题而联接起来。各种评论在因特网上就像网眼一样联接起来。这样就创造出了与日记网站完全不同的文化。
注:发送地址采用原始文章指定的URL,这一URL就称为“TrackBack Ping URL”。TrackBack的技术标准刊登在“LowLife.jp”的blog网站上。
如果你使用的是服务商提供的Blog服务,服务商没有提供Trackback怎么办?或者你的空间不足以放下太多的Trackback回复,又怎么办?
到HaloScan.com去看看。
最后用一句话总结这三大功能:
RSS:能让用户更方便的订阅
Permalink:能更好的让你的文章被搜索引擎关注
Trackback:能更好的与其他Blog进行交流、讨论、沟通
什么是 RSS :rss.txt
RSS 系列介绍(一):RSS的一些背景资料
讨论与Blog相关的技术,不可不谈的就是RSS,这个缩写在英文中可以有几个源头,并被不同的技术团体做不同的解释。既可以是“Rich Site Summary”,或“RDF Site Summary”,也可以是“Really Simple Syndication”。为什么有这么多含义呢?这还要从RSS的一段今天也没有理清的关系说起。
今天肯定有人还记得IE 4刚刚推出来的时候有一个有趣的功能,那就是新闻频道。这个新闻频道的功能与Netscape推出的新闻频道是很相似的(当时Netscape还是市场上领先的浏览器)。为此Netscape 定义了一套描述新闻频道的语言,这就是RSS,只不过Netscape自当时起每况愈下,所以最终也没有发布一个正式的RSS规范(只发布了一个0.9版本)。而微软也在当时推出了支持自己IE的CDF(Channel Definition format)数据规格,与RSS非常接近。微软试图用新闻频道的功能把“推”(Push)技术变成一个应用主流,并与Netscape抗衡。不过出乎预测的是,“推”技术自始至终没有找到合适的商业模型,而且伴随着其他各类网络特性的出现,也日益无法显 现自身的优势。新闻频道在浏览器中的地位最终日暮西山,最后也在IE的后续版本中消失了。
新闻频道的确进入了低谷,但是RSS并没有被业界人士所抛弃。过去两年,Blog从一个专业群体开始,逐步成为了网络上最热门的新话题。而RSS成为了描述Blog主题和更新信息的最基本方法。于是RSS这项技术被著名Blogger/Geek戴夫·温那(Dave Winner)的公司UserLand所接手,继续开发新的版本,以适应新的网络应用需要。新的网络应用就是Blog,因为戴夫·温那的努力,RSS升级到了0.91版,然后达到了0.92版,随后在各种Blog工具中得到了应用,并被众多的专业新闻站点 所支持。在广泛的应用过程中,众多的专业人士认识到需要组织起来,把RSS发展成为一个通用的规范,并进一步标准化。一个联合小组根据W3C新一代的语义网技术RDF对RSS进行了重新定义,发布了RSS 1.0,并把RSS定义为“RDF Site Summary”。这项工作并没有与戴夫·温那进行有效的沟通,而戴夫则坚持在自己设想的方向上进一步开发RSS的后续版本,也并不承认RSS 1.0的有效性。RSS由此开始分化形成了RSS 0.9x/2.0和RSS 1.0两个阵营,也由此引起了在专业人群中的广泛争论。
因为争论的存在,一直到今天,RSS 1.0还没有成为标准化组织的真正标准。而戴夫·温那却在2002年9月独自把RSS升级到了2.0版本,其中的定义完全是全新的模式,并没有任何RSS 1.0的影子。这引发了网络上进一步争议,究竟让一个越来越普及的数据格式成为一个开放的标准,还是被一家公司所定义和控制,成为了争议的焦点。戴夫·温那并没有为自己辩解,他的观点是RSS还需要进一步发展,需要专业人士更明确的定义,不过恐怕这种轻描 淡写不能消除人们对RSS“被一家商业公司独占”的担心。
前面的铺垫对用户来说也许没有什么太大的意义,可能更多人关心如何在自己的Blog增加RSS输出,这样可以让很多新闻聚合工具(例如CNBlog刚刚推荐的NewzCrawler)很容易找到你并自动获得你在Blog中的更新内容。
所以我们会在后面的系列文章中逐步增加对RSS工具的介绍,以及如何在你的Blog中添加RSS输出格式和相关的标志链接。等不及的用户,可以先到我的个人站点上的一个临时链接地方尝试起来了,我提供了一个简单的RSS生成工具和相关的介绍(对Blogg er.com工具最佳,其他工具还没有做测试)。
P.S. goghs 的一个留言,供大家参考,普通用户大可以跳过: “关于RSS两个标准之争前段时间确实很激烈,很多局内人士被迫翻出了陈年老帐。有些争论甚至到了攻击的地步。跑开情感因素不论,作为一个完全的局外人,我个人是比较偏向于0.9x/2.0 (具体就是0.91 -> 0.92 -> 0.94 -> 2.0)的。1.0将rdf的命名空间重新加入了RSS,这有它的意义。但是从RSS使用的领域,至少是现在的使用目的而言,1.0标准显得过重了。相比之下2.0更简单更实用一点。 至于说一家公司控制标准的问题,其实从一开始RSS就处在这种状况之下,如果你认为它是被控制的话,从一开始就被控制了,即使在Netscape的年代。作为一个开放标准,这种控制并未对用户形成什么危险。 其实1.0背后也是一家公司,知名的O'Reilly。 从既有资源而言,0.9x系列占有压倒优势,我想2.0会作为当然的既得利益者,继续占有统治位置。
但是对于一个开发者来说,可能这种争论更容易被调和,因为你可以同时支持他们,甚至包括以前所有的标准。 这涉及两个方面: 1. source: 你可以生成两个版本,分别符合1.0和2.0规范。 或者你可以生成一个XML源,然后使用XSL/XSLT转换成1.0/2.0格式。 2. aggregator: 对不同的格式分别使用不同的解析。
当然,我希望最终还是能够互相妥协,只保留一个标准。不过这也许很难,因为这在计算机领域是最不常见的一件事。不管是公司之间,还是业余开发之间,都不容易达到一致。”
Isaac: goghs的留言很好,算是对这场标准的争论的一个补充吧。大家可能会奇怪,这种争论会不会对Blog的发展产生不利的影响。照我说,不一定,很可能是促进作用更多一些。不像最近国内的某些争吵,吵来吵去其实伤害了发展和进步。另外,从技术开发上来说,我 也非常支持0.92系列的简易性,把新浪新闻变成RSS 0.92并导入NewzCrawler 就是一个10分钟的工作,而RDF相对麻烦一点,当然也不过是处理一些额外的命名空间而已。但是从整体来说,Sementic Web(语义网)也需要大家的通力支持才能够有更好的未来,而作为承载语义网的一个重要部分,RDF应当被有责任感的人们所推动。不过我还是要承认RDF应用到RSS中还为时过早。
RSS 系列介绍(二)
--------------------------------------------------------------------------------
RSS与新闻聚合前面介绍了RSS的一些历史渊源,今天我再与大家聊聊RSS在新闻聚合,而下一次我还会介绍RSS在网站联合中的应用。
其实,RSS就是一段规范的XML数据,用一些大家约定的标记描述一个Blog或者一个新闻源的最近更新的内容。RSS是Blog走向社区化和快速普及的一个技术推动力,Blog也因此技术而走向了专业化领域。连同本来网络上的各种专业媒体提供的新闻源, 人们可以透过RSS在桌面上轻松访问大量与自己的兴趣相关的主题,而忽略掉访问网站带来的复杂过程,还有那些讨厌的花花绿绿的广告。新闻聚合(News Aggregation)和网站联合(Syndication)两个概念由此出现并广泛被Blogger们所采用。我们今天先谈谈新闻聚合。
所谓新闻聚合,就是通过软件工具或编程的方法从多个新闻源或Blog站点搜集新闻并在一个界面中提供给读者进行阅读。新闻聚合的基础条件就是这些新闻源都提供通用的数据格式,目前最流行的格式也就是RSS。也不知道是有了RSS,才有了新闻聚合的概念,还 是有了新闻聚合的想法,才出现了RSS的技术,总之技术最终应当是为人们的需要服务。目前网络上有一些流行的新闻聚合工具,他们都支持多种目前处于版本的RSS格式。我们在这里介绍几种比较流行的工具:
Aggie 是一个很小的新闻聚集工具,连同源代码下载也不过84K。唯一的限制是它建立在Microsoft .Net 框架上,所以运行起来还要这个平台的支持(.Net 框架的基本运行版本也要20M左右)。Aggie把用户登记的各种Blog或专业媒体新闻网站的信息都搜集在一起,并直接输出为一个本地网页,自动启动IE提供给用户进行浏览。
NetNewsWire 则是一个运行于Apple公司电脑上的新闻搜集和阅读工具。它提供的三个板块的版面格式与电子邮件应用非常类似,它可以直接在应用程序的界面中浏览新闻。
Straw 也是一个高效率的桌面新闻聚合工具,不过运行在GNOME环境中,在Linux和支持GNOME的UNIX环境中都能够运行。
CNBlog 心得集近期曾经推荐过NewzCrawler这个新出现的新闻聚合工具,这是我在PC桌面上看到的最好的新闻聚合工具了。无论从功能还是易用性方面来看,这个工具都比前面介绍的几个工具要更优秀。唯一的问题是,正式版本的NewzCrawler不是免费的 。现在我能够利用这个工具每天轻松地察看来自一些新闻站点(例如新浪和CNET等)的最新消息和一批我关心的Blog的更新内容,还能够便捷地用工具中内嵌的Blog输入工具把感兴趣的内容摘录到自己的Blog中,效率大增,真是令人产生了全球信息尽在指 尖的感受。当我们深入去想的时候,会发现这大概正是网络走向个性化和对传统媒体的一种挑战所在吧。
在新闻聚合的观念下,我相信Blog会与RSS共同发展,越来越成为人们最喜爱的信息来源。
Permalink:能更好的让你的文章被搜索引擎关注
Trackback:能更好的与其他Blog进行交流、讨论、沟通