扫描这本书:数字图书馆和搜索技术的版权困境
寰宇图书馆(Universal Library)——在文中指包含人类所有知识的,并且内部的知识充分互相连接的一个数据库。谷歌计划扫描下面五个大图书馆的全部图书全文:斯坦福大学、哈佛大学、牛津大学、密歇根大学和纽约公共图书馆的一千多万本书。
扫描这本书:数字图书馆和搜索技术的版权困境
在保守的图书主人和开放屏幕主人的较量中,屏幕主人将获胜。通过这10亿人面前的屏幕,搜索科技将会把人类所有的知识从孤立的书本中转化成为寰宇图书馆。
作者:Kevin Kelly 译者:周详
[译注:寰宇图书馆(Universal Library)——在文中指包含人类所有知识的,并且内部的知识充分互相连接的一个数据库。在文中出现的“大图书馆”、“数字化图书馆”和“新型图书馆”也指同样的或者同类的数据库]
Donews编译(周详)在世界各地诸多乏善可陈的写字楼里面,数以千计的小时工打开桌上的扫描仪,把满是灰尘的旧书按进高科技的扫描区。他们就这样一页页地装配着一个寰宇图书馆。
这源于一个古老的梦想:在一个地方装下古往今来所有的知识——以所有语言写成的所有的书籍、所有的文件、所有的思维产物。这个想法对我们来说并不陌生,因为许多年以前,人们曾大致地造出了这样的图书馆——建造于公元前300年的亚历山大大图书馆,当时就是被设计成用来放置已知世界的所有羊皮卷。在相当一段时间内,它里面放置了约50万个羊皮卷,大概占了当时所有图书的30%~70%。但是即使在大图书馆被毁坏之前,能够把所有知识放在一幢房子的时代已经过去了。从那以后,持续的信息膨胀超越了我们的保存能力。2000年以来,寰宇图书馆,就和隐形衣、无重鞋、无纸化办公这些永恒的愿望一起,成为跨越时空的梦想。
直到现在,当谷歌在2004年12月宣布它将把世界上5大科研图书馆的书籍加以扫描以使其内容可以被检索,一个寰宇图书馆的愿景复活了。的确,互联网爆炸般的兴起,在10年内从一无所有发展到包罗万象,足以让我们相信奇迹的发生。难道长久以来人们所盼望的那包含所有知识的伟大图书馆已经来到我们身边了?
负责另一项扫描计划的一个档案保管员Brewster Kahle说,寰宇图书馆已经触手可及了。“我们超越希腊人的机会来了。”他喊道。“只需要现有的科技就能实现,不需要等到明天。我们可以为全球所有人提供所有的作品。那将是一个被历史铭记的事件,就像把人送上月球。”并且与已往仅对精英开放的图书馆不同,这个图书馆将是真正民主的,它为每一个人提供每一本书。
然而在为我们带来整个星球所有书籍资源的同时,这种技术也将彻底改变我们现在所知道的“书”和“图书馆”的本质。寰宇图书馆和它里面的书将和任何我们已知的书不同。把我们带离纸张成堆的大部头,迅速推向无所不知的伊甸园的,是最新最火热的搜索引擎技术。
1. 扫描“图书馆的图书馆”
扫描技术已经出现了几十年了,但是直到最近,随着谷歌、雅虎、Ask和MSN等搜索引擎的出现,书本数字化的技术才刚刚成型。当数百万的书本被扫描进一个数据库时,搜索技术能让我们找到并阅读任何一本书。如果一切顺利,在这个图书馆里我们还能读到任何一张报纸、任何一本期刊里的每一篇文章。这样够了吗?当然不够。这个寰宇图书馆还应该囊括古往今来每一个艺术家的所有绘画、照片、电影和音乐。甚至可以包括所有的广播电视节目和广告。噢,我们怎么能把网络忘记了。这个大图书馆很自然会容纳所有曾经出现过的网页(几十亿之多)和所有的网络日志(那可能有几百亿了),现在,这些网页挂在网上的时间就像早晨的露珠一样短暂。总之,这意味着人类自有史以来,各种语言的全部作品,将永远地对所有人开放。
这是非常巨大的一个图书馆。但凭借数字技术,你能够通过几乎所有带显示器的设备来使用它。从苏美尔人的黏土写字版时代至今,人类至少已经“出版”了3200万本书、7.5亿篇文章、2500万首歌、5亿幅图画、50万部电影、300万个视频短片和电视节目还有1000亿个网页。所有这些东西都分布在世界各地的图书馆和档案馆。当彻底数字化之后,这所有数据可以被压缩到(以目前的技术水平)50P(50,000,000G)字节的硬盘里。现在如果你想装下50P字节的话,你需要一幢小镇图书馆那么大的房子。但当科技不断发展,装下它很可能只需要一个IPOD。到那时,这个“图书馆的图书馆”可以被放进你的手袋或者皮夹(如果科技还没有先进到用细细的白线把它直接连到你的大脑上)。有些人一定巴不得自己在这样的事情发生前就死掉。但是其它人,尤其是年轻人,很想知道究竟会怎么样。
技术的发展促使我们把所有知识向通用的数码比特形式转化。美能达已经退出了胶卷相机制造行业,而尼康也马上就要退出了(他们仿佛在说:从今以后还是考虑数码摄影吧。)几乎所有的当代音乐都已经数字化了(很多是歌迷自己弄的)。互联网电影数据库中所记载的50万部电影中,约1/10已经转化成数字化的DVD了。不过由于版权问题和对翻页的物理需要,书籍的数字化相对迟缓。最多也只有二十分之一的书籍从模拟转成了数字。因此,寰宇图书馆还只是一个没有多少书的图书馆。
不过情况正迅速变化。现在世界各地的公司和图书馆每年都要扫描将近一百万本书。光Amazon一家就扫描了几十万本当代图书。位于硅谷中心的斯坦福大学(与谷歌合作的5所图书馆之一就在这里)正在用一家瑞士公司4DigitalBooks的“艺术之都”机器人扫描它的八百万本藏书。这台机器有一辆小型SUV车那么大,它能自动把每本书翻页并且扫描,每小时能扫1000页。只需要一个操作员工把书放到水平支架上,气动机器指会精确地翻开每一页,推动它不断掠过扫描镜头。
不过,与其它很多经济全球化的例子一样,这些工作实际在相隔很远的地方同时进行,包括在我们睡觉的时候。我们把扫描工作也外包给了别人。超星,一家位于北京的新兴公司,已经扫描了中国200座各类图书馆中的全部藏书。它已经完成了130万册中文图书的数字化,大约是1949年以来所有中文出版的图书的一半。在斯坦福,每扫描一本书要花去30美元,而在中国只要10美元。
卡内基梅隆大学的Raj Redd教授决定要把一个较大规模的英语图书馆搬到一个扫描劳动力便宜的地方。2004年,他从卡内基梅隆图书馆和卡内基图书馆的库藏室借了3万本书,把它们用一个集装箱运到了中国,让中国工人在流水线上对这些图书进行扫描。他把自己的计划称作“百万图书计划”。他打算利用分布在中国和印度的20个扫描站每天扫描出10万页,并且希望两年内总共数字化100万本图书。
这个想法能够为缺乏图书的发展中国家提供简单而便宜的书本内容。超星把它所扫描的书本拷贝返销给提供图书的大学图书馆。这些图书馆可以一夜之间把馆藏从6万册增加到130万册。考虑到每本数字图书只要5毛钱,这是一个扩充馆藏的廉价手段。Adobe公司的电子出版部经理Bill McCoy说:“像我们这样的人,家里可以有几千本书,可以去大型书城和大型图书馆,也可以让Amazon.com把书明天就送到家。数字图书馆最大受益者并不是我们这些‘有书人’,而是全球几十亿无法得到普通纸质图书的人。”正是那些缺少书的人——马里的学生、哈萨克斯坦的科学家、秘鲁的老人们——当他们能够得到即使是最简单最朴素的寰宇图书馆的雏形,他们的生活也将彻底改观。
2. 当书连结起来时会发生什么
关于数字化阅读最不重要,但是最容易引起争论的问题总是这几个:我们真的要放弃已经高度发展的油墨印刷技术,换成在讨厌的机器上阅读吗?或者我们还可以继续躺在海滩上读我们的小说吗?现在看来,两者的答案都是肯定的。预言中出版商因为电子书刊革命而损失大把美元的情况至今没有出现,而纸质书刊的全球销量也在逐年上升。同时,网络上也出现了超过5亿个PDF文档,人们不用打印,就能开心地用电脑阅读这些文档。还有很多人每天花几小时用手机屏幕看电影。我们今天的显示设备:从掌上设备到大型平板显示器,已经好到足够让我们把书本转移到它们下一个进化的舞台——完全数字化阅读了。
然而人们对寰宇图书馆的未来(甚至整个电子书刊的未来)的普遍认识,还只是停留在孤立的书本上,就像你现在能在公共图书馆的架子上看到的那样。在书架上,每本书都不怎么关心它周围的其它书。当一个作者写完一本书,这本书就定型了。就算它想要有所变化,也只能等待读者读完它之后,在读者的脑袋里做一些运动。在这样的期望下,数字化图书馆的主要好处是便携性——把一本书的全文巧妙地转化成比特,使它可以在任何地方的显示器上出现。但是这种期望错过了数字化图书所带来的最重要的革命——在这个寰宇图书馆中,所有书都不再是孤岛。
把印刷字母变成屏幕上的电子点阵只是创造这个新型图书馆的首要步骤。真正神奇的是接下来的一步——每一本书中的每一个词都被互相耦合、串接、引用、摘录、排序、分析、注释、混合、重组,并且被融汇到比已往更深的文化中。在这个书本的新世界里,每个比特都影响着它的伙伴,每个页面都读懂了其它的页面。
最近几年,几十万狂热的业余作者共同完成了一部完整的在线百科全书——维基百科。在它的鼓舞下,许多网虫相信数以亿计的读者能够一个链接一个链接地可靠地把已往书刊的页面都组织起来。那些对某一主题、某一作者或某一本书特别感兴趣的读者,会不断地把重要的部分连结起来。当每个读者的举手之劳累积起来,就会把寰宇图书馆彻底地整合起来。
除了明确把词语、句子或者书本联系起来的链接之外,读者还可以为它们增加标签——最近刚出现就开始流行的网络新发明。标签是一种公开的注释,就像是关键词或者分类名称,它附加在一个文件、页面、图片或者歌上,对每一个想要寻找它的人都有效。比如,在照片分享站点Flickr上,浏览者会为其它用户上传的照片贴上他们自己的简单分类,来描述这些照片的主题:“山羊”、“巴黎”、“蠢蛋”、“海滩晚会”等等。因为标签是用户自定义的,当涉及到图书领域时,使用标签比那些过时的分类法——比如杜威分类法——更便捷、更广泛也更有效。尤其是在一些前沿的交叉学科领域,比如纳米科技或者形体塑造。
链接和标签也许是近50年来最重要的发明。当人们最初定义它们时就已经意识到了它们的威力,但是它们真正革命性的力量来自于所有普通用户每天在网上对它们的一次次点击。并没有人意识到每个微不足道的点击都是对链接的一次“投票”,决定了链接的相对等级。可能你只是在浏览网页,随意地扫过某个网页的某一段,但实际上你正默默地用你些微的注意力在构建整个网络。这种些微的注意力被搜索引擎采集并分析,以加强每个链接目标和标签描述对象的相关性。这在网络上已经是非常普通的技术,但是对以前的书本世界来说,还很陌生。
当一本书通过这样的链接被整合到新型图书馆时,它的内容不再与其它书本的内容相隔离了。举个例子,今天一本严肃的著作通常会有一个参考书目和许多脚注。当书本被深度整合后,你可以点击参考书目中的任何一个标题,或者任何一个脚注,以此来找到这些注释中提到的其它书目。参考书目中提到的那些书同样也在这个图书馆中,可以被读到。这样你就可以像我们浏览网页一样地浏览整个图书馆,从一个脚注到另一个脚注再到另一个……直到你达到链接尽头。
接着我们来讨论词语。比如一篇关于水族馆的文章里,可以有一些单词链接到一些鱼类术语的定义。而在数字化的图书中的任何一个单词都可以通过超链接指向其它书的某部分。书刊,包括小说,将会成为一个名词的网络和一个概念的社区。
搜索引擎改变了我们的文化,因为他们发掘了“联系”的力量,那正是所有链接的本质。世界上共有大约1000亿个网页,每个网页平均包含10个链接。那就是穿过网络的一万亿个电子连接,这一复杂的联系正是网络无穷力量的源泉。而静态的书本世界也将被这样转化成相同程度的“联系”,通过每一页书都将能够发现另一本书的另一页。当内容数字化之后,书本将摆脱原本的束缚,将自己组织到一起。这样构成的一个图书馆的集合智能,将让我们看到从单独一本书中看不到的东西。
当书本被数字化之后,阅读会变成一项社会活动。书评将会被大家分享。批注将被公开传播。阅读书目也会被互相交换。你可能会收到这样的消息提醒:你的好朋友Carl刚刚评论了一本你最喜欢的书。片刻之后,他也会收到你的消息。通过这样有趣的方式,寰宇图书馆将变成一个非常非常庞大的一本书——世界上唯一的一本书。
3. 书籍:流动的版本
与此同时,当书本被数字化之后,书可以被拆散成单独的页面,或者更小的片段。这些小片段可以被重组成新的书籍和虚拟图书集合。就像音乐听众把歌曲混音重组成新的专辑(或者新的“播放列表”,iTunes里的说法)。寰宇图书馆将会鼓励创造这样的虚拟“书集”——针对某个专门的方面把一些短小的片段或者整本书集中到一起。就像音乐的播放列表一样,这些“书集”被创造出来之后,就会被公布、被公共交换。实际上,有些作家将会写一些专门用来分割成片段或者是按页重组的书。而能够将单独的书页或者章节出售、阅读并重组的技术也一定会影响参考书(烹饪书、操作手册、旅行指南)的未来。你可以编写你自己的“阿卡笛亚烹饪精选”,从不同的书中搜集相关信息并且集中到一起。它可以包括网页、杂志剪辑和完整的阿卡笛亚烹饪教程。Amazon现在已经可以提供你出版自己书集的机会(Amazon把它叫做listmanias“书单也疯狂”),只要你列出你认为值得推荐的关于某个专业主题的书单并且稍加评论。而读者们也早已经使用Google Book Search来创造针对某一主题的迷你图书馆——比如所有关于瑞典的书,或者关于钟的书。当每本书的片段、章节和页面都可以信手拈来、随意组合时,读者或许可以通过编辑一本出色的书集而声名远扬,甚至以此补贴家用。
大大小小的图书馆(也包括许多个人)并不急于放弃油墨印刷的书刊。因为纸张印刷是目前为止我们所掌握的最稳定最可靠的信息保存技术。阅读印刷的书刊不需要中介设备,因此也就避免了技术上的事故。而且纸张与硬盘或者光盘相比要稳定许多。从这个角度来说,一本精装书的稳定性和坚固性简直是奇迹。它可以巍然不动地站在那里,坚守着自己的本来面目,但是,它是很孤单地站在那里。
那么,当所有的书变成了一团相互联结的词语和概念所构成的流动的组织,将会发生什么事?四件事:首先,现在几乎无人问津的小众作品将会找到比现在的接近零要多的读者。无论在“长尾曲线”多远的尾端(“长尾”指销售额从低到零的那部分商品,绝大多数书籍都处于这种情况),数字链接可以提高几乎所有书目的读者人数,无论多么深奥。第二,寰宇图书馆将加强我们对历史的掌握。因为历史上所有的原始文档都被扫描并且互相连接了。第三,寰宇图书馆将培育出新的权威认识。如果你真的能够把某一个学科的所有文字——古往今来,各种语言——都联结起来了,那你会发现,作为一整个文明、一整个物种,我们知道多少,不知道多少。我们集体无知的领域会被突显,而我们所了解掌握的知识锋线也会被完整的勾勒出来。这种程度的权威认识现在的学术界还很少见。但是将来,这会是家常便饭。
最终,一个完整的寰宇图书馆将好过有史以来任何优秀的助手。网络搜索会变成一种全新的公用事业和公益服务。现在,当你把谷歌地图和Monster.com的服务结合起来用,你可以根据薪水要求找到工作地点。同样地,在寰宇图书馆中,任何一个曾经在书中被提到过的地方,比如伦敦特拉法加广场,都可以被链接并显示在屏幕上。通过这种方式,世界上每一个物体,每一个场所或者地点,都会“懂得”古往今来所有语言所写的所有书中的内容。这样一种通透的知识结构将形成一种新的互动参与型文化。
然而这种愿景还离我们相当遥远。现在最大的问题是,寰宇图书馆并没有多少书。尽管网志作者和维基编写者尽了最大的努力,世界上绝大多数的知识仍然停留在书本中。要知道,一个没有书本内容的寰宇图书馆根本就谈不上是个图书馆。
可以例举出无数的理由说明把图书变成数字化网络的一部分有多么美妙,但是现实与理想仍相差很远。最大的一个原因就是:霸道的版权。
4. 版权的胜利
所有作者的最终目的都是能够让自己的作品被所有人知道。一段文字、一段旋律、一幅图片或者一个故事的最佳状态,就是当它能够与尽量多的其它头脑和作品产生联系。理想情况下,一个作品历尽沧桑,与孕育它的文化环境紧紧相连,密不可分。就像圣经、莎士比亚、灰姑娘和蒙娜丽莎都已经与我们密不可分了。人的想法通过创作以作品的形式表达出来,是文化的重要来源,事实上,文化就是思维和创作的混合物。
在中世纪,一件作品很少被复制。主要原因是在那时,创造你自己的作品远比一模一样地复制别人的作品要容易。把羊皮卷上的字一个一个抄到另一张羊皮上,或者照着一幅油画一笔笔临摹所需要的精力和体力,比你用自己的方式来写或者画要多得多。所以,大多数的作品在被代代相传转述的过程中不断地改进。民间传说会变成神话,正是因为许多人不断地转述,并且把它从口头的传闻变成了其它形式(戏剧、音乐和绘画)。这样的传承体系对作者和表演者来说都不错,但是在这种情况下,大多数作者只能依靠他人的资助来维持生计。
这种古代的作品经济在工业时代的初期就被大规模生产技术颠覆了。突然之间,复制品的价格变得比原件低得多。随着印刷术的降临,印刷一千本书都要比抄一本来得便宜。这样,印刷商赚得钱就比作者还要多。这种不平衡促生了版权技术和新的规则。版权制度给予原作者一定期限的作品复制的专有权(在美国,这一期限是14年)。这个办法可以鼓励作家和艺术家进行创作,同时也促使大量便宜的拷贝可以繁荣公众的文化生活。
随后,公共图书馆因为便宜的书本拷贝而发展起来。在工业时代前,图书馆往往是贵族精英的私人财产。而凭借大量的复制,每一个小镇都可以在广场造起一座图书馆,在木质书架上摆满人类最伟大的作品的拷贝。图书馆众多公开的图书促使了学术、评论和教育的发展,这些领域在美国不受版权法律的限制,因为它们能迅速把作品展示在公众面前,在保护作者版权的同时把作品与公众文化编织到一起。这样的行为我们现在称为“合理使用”。
这个良好的平衡被同样良好的愿望打破了。最初,美国国会在1976年通过了一个新的版权法。新的法律规定,原作者不再需要自己登记或者更新版权,创作作品的同时,版权就会自动产生。如果没有特殊情况,每个新作品的版权都属于私人所有而不是公共所有。一开始,新法律似乎和已有的创作文化并不冲突。所有可以被复制的作品都会自动归作者所有,艺术家和作家们都很高兴。但是1976年的这部法律,以及后来对它的不断补充和发展,造成我们很难把一件作品放到公共领域,而公共领域原本应当是所有人类创造物天生拥有的使命和归宿。随着越来越多的知识产权成为公司财产而不是个人财产,这些公司成功地说服国会不断扩展版权的保护范围,以避免作品回归公共领域。在一再的游说之下,国会把版权的保护期限从14年增加到了28年、42年,最后变成了56年。
在大公司和立法委员们试图让时代倒退的同时,科技却在加速前进。在互联网时代,哪怕14年的专利都是相当长的一段时间,而与人的寿命一样长的专利就可以称为永恒了。当国会1998年通过了把版权年限再增加70年的法案后,专利的年限已经超过了任何作者可能的寿命——无论如何这已经背离了版权原来鼓励创作的出发点——显然,这是主要是为了保护现在正受到威胁的商业模式。同时由于国会决定把所有现存的版权年限都再增加20年,所有东西——所有已经存在的知识成果——在2019年之前都不会再回归公共领域,而所有当下创作的作品将要到下个世纪才会回到公众手中。因此,共享并且不断改进作品的溪流(想想“一千零一夜”,圣诗“奇异恩典”,还有“美女与野兽”)将会从此干涸。
在图书领域,不断增加的版权保护年限已经造成了不良影响。它导致大批的作品被出版商遗弃,大批作品就这样被扔到了无底黑洞,不见天日。绝大多数出版商是因为觉得继续出版这些书无利可图,而另一些则根本搞不清楚自己是否拥有它们的版权,因为以前作家的合同并不像现在写得那么明晰。这些被抛弃的图书总数令人震惊:在全球的图书馆中,大约有75%的图书已经成为孤本,只有15%的图书是公共所有的。还算幸运的是,有10%的图书仍然在出版。而其余的大部分图书,已经沦入黑洞。
5. 扫描图书的道德使命
全世界320万本在册的图书中,有15%是公共所有的,我们可以随意借阅、模仿、出版或者复制。现在,美国图书馆几乎所有的扫描任务都集中在这15%上面。“百万图书计划”只针对这一小块蛋糕,谷歌也一样。因为它们是属于公共领域的,没有法律会妨碍我们把它们扫描添加进寰宇图书馆。
仍在出版中的那10%的图书也将在不久的将来被扫描。Amazon大约有四百万本书,包括同一本书的不同版本。Amazon正在慢慢地扫描这些书。近期,美国的几个大出版商宣布他们马上要将他们所有的库藏图书都转化到数字形态。它们中的有些正在和谷歌合作,谷歌扫描这些书,把出版商认可的样本页面在网上公开,告诉读者哪里可以买到实体书。人们也相信,电子图书会慢慢盈利。简单的商业刺激可以保证正在出版的图书不久就可以被全部扫描进寰宇图书馆。这并不是问题所在。
对于大出版商来说,主要的问题在于他们不确定哪些书是他们真正拥有的。如果你想借此自娱自乐一下,可以从图书馆借一本绝版的书,然后试着找出它的版权所有者。这可不容易,并没有这样一张清单可以告诉你作品的版权归属。国会图书馆也没有这样的目录。出版商也同样没有这样一张浩瀚的清单,甚至他们连自己印刷的东西也搞不清楚(尽管他们说正在为此努力)。作品的年份越早,版权就越含糊,它的出版商(如果依然存在的话)也就越难说清楚这个作品的版权是否归还给了作者,这个作者是否还活着,他有没有把版权又卖给了其它公司,出版商是否依然拥有作品的版权,是否依然愿意把它扫描进数据库以让它复活。如果你想寻找这些问题的答案,准备好大把的时间和精力吧。我曾花了两年时间查询一本书的版权归属,最后找到了蓝登书屋。这本书是否还归他们公司所有?我能复制它吗?三年过去了,这个公司仍然在努力寻找着这个问题的答案。所以,想要找出大约2500万本绝版图书的版权,简直是异想天开。
法律的围栏把75%的书拦在数字化的世界之外,把它们留在了黑暗中。的确,它们并非都是名著,但是历史的完整性需要它们留下来。如果它们不能被扫描的话,它们实际上就消失了。但因为不可理喻的过度的版权保护(美国最高法院2003年宣布版权法无理但不违宪),所有这些黑暗中的图书都无法回归到公共领域(这样才能被扫描),直到2019年之后。因为没有商业利益可以吸引出版商去花钱扫描这些绝版书,它们将慢慢淡出视线。加州数字图书馆的技术总监Peter Brantley说:“这应该是一种道德使命,我们应该去图书馆的架子上把绝版书拿下来,放上扫描仪。”
一直没有人能够解开这个版权问题的戈耳迪之结,直到2004年,谷歌提出了一个巧妙的解决办法。除了与图书馆合作扫描那15%的公共领域的图书,与出版商合作扫描那10%的在印图书,谷歌的公司高层宣布他们同样将扫描剩下的那75%没有人愿意碰的绝版图书,而不管它们的版权状况。扫描出来的内容将放在谷歌的内部服务器上,对所有搜索用户开放。不过谷歌将只给用户看这些书的一个个小片段。谷歌的律师称这些小片段就像是名人名言,或者是评论时候的摘录,属于“合理使用”的范畴。
谷歌计划扫描下面五个大图书馆的全部图书全文:斯坦福大学、哈佛大学、牛津大学、密歇根大学和纽约公共图书馆的一千多万本书。每本书都会被索引,但是不同的书将会以不同的方式在搜索结果中呈现。对那些公共领域的图书,谷歌将显示全文。对那些仍然在印的图书,谷歌将和出版商协商决定哪些部分在哪种情况下会被显示。对那些绝版书,谷歌将只显示片段。任何人或者公司,如果可以证明拥有某一绝版书的版权,可以以任何理由要求谷歌把这本书的片段都移除。
一眼望去,这简直是天才的想法。通过扫描所有图书(只有谷歌才有钱做的事啊),谷歌将会离它整合所有知识的目标更加接近。这将使图书能被搜索,而且尽管谷歌还没有动手,这些搜索中蕴藏着广告价值。与此同时,谷歌将拯救那75%被人遗忘的图书。对许多作者来说,这一浩大的工程简直是救世主。谷歌变成了一个探索工具,而不仅仅是商业机构。少数畅销书作家害怕盗版,但所有的作家都害怕被遗忘。让他们的作品能够在这个全球通用的搜索框中和其它网页一样被搜到,对作者是个好消息,对死气沉沉的出版产业来说也是个好消息。无论是对那些正在出版的图书的作者,还是那些被出版商抛弃的图书的作者,谷歌都提供了这样一个机会:更多的用户将会读到,乃至购买他们殚精竭虑几年才得以完成的作品。
6. 反谷歌案
一些作者和许多出版商从谷歌的计划里看到的是邪恶而不是天才。让他们不爽的原因主要有两个:1. 图书的完整虚拟拷贝就在谷歌的服务器上;2. 在计划中,谷歌可以先动手,然后再被质疑。任意一点都足以让作者和出版商起诉谷歌侵犯版权。在去年秋天调解失败后,美国作家协会和五大出版公司起诉了谷歌。它们的意见很简单:为什么谷歌不把它的广告收入(如果有的话)分给那些版权所有者?为什么谷歌在扫描任何书之前都不用经过版权所有者的同意?(在这个案例中,我陷入了两难,一方面作为一个作者,我的出版商为了我的利益起诉了谷歌;另一方面,我通过放置在我网志页面上的Google Adsense广告赚到了谷歌的钱。)
这个问题的复杂之处在于,这些出版商过去是,现在也是谷歌图书搜索伙伴计划的忠实搭档。它们仍然希望谷歌能扫描它们在印的图书,尽管它们自己也在扫描。因为它们认为,搜索引擎是读者的探索工具,能够搜索到图书的扫描版本对它们是有利的。
关于分享收入的争议同出版商正在出版的那三到四百万部书没有什么关系,谷歌已经把这些书相关的收入分给了出版商。(谷歌说出版商从这个计划的广告收入中拿走了“大头”)。争议主要在那75%被出版商认为不能赚钱而抛弃的书上面。当然,直到谷歌将那些书的经济价值发掘之后,出版商才开始关注起这些弃婴来,这件事情本身就很有趣。因为图书搜索功能,这些书开始大放异彩,而出版商也开始想要阻止这一潜在收入从它们身边滑走。它们现在正忙着钻进它们的档案记录里,试图找出还有哪些书的版权是属于它们的。
第二个问题更加复杂。谷歌称想要找到每一本绝版书的版权主人是几乎不可能的,所以,他们只能先把图书扫描了,之后才接受合法的把书删除的要求。在这点上,谷歌遵循了互联网的规则:谷歌先扫描所有的网页,只要在网上出现,它就会扫到。网页,按照法律,也是自动获取版权的。这样的话,谷歌等于是按时把几十亿有版权的网页都复制到它的搜索服务器上。但是如果你不希望谷歌搜到你的网站,你可以写几句代码在你的主页上以说明你不希望被搜索到。这样谷歌和其它搜索引擎都不会再来打搅。一个站长可以这样选择避开搜索(几乎没有人这么做。)。谷歌把这样的原则也运用到了图书搜索。作者自己可以选择告知谷歌,如果他不想自己的版权作品被扫描或者搜索的话。如果世界上只有谷歌一家搜索公司的话,这或许是一个合理的要求。但是搜索服务已经变成日用品的今天,如果能赚到一点钱的话,不难想像会有一大群陌生人都开始扫描绝版图书。如果你是一个作者,你不想你的书被扫描,你就不得不去找到每一个扫描你书的怪人,你会接受吗?而且,万一你漏掉了一个呢?
这里有一个技术上的解决办法:所有的搜索公司都共享并维护一个“不愿被扫描”的作者列表。一个出版商或者作者只要告知任何一个搜索公司,任何搜索公司就都得把他的作品移除。因为谷歌——包括其它一些搜索公司:微软、Amazon和雅虎——是技术出身的公司,它喜欢这样的解决方案。但是争论并没有就此结束。
7. 当商业模式发生冲突
当我思考这个关于搜索的争论时,我意识到这一冲突可以从许多方面来理解。首先我想到,在书的主人(他们更愿意用法律手段解决问题)和屏幕的主人(他们更愿意用技术手段来解决所有问题)之间有着相当的误会。去年12月,纽约公共图书馆(谷歌的五个合作伙伴之一)发起了一次辩论,邀请了作者、出版商代表和谷歌的支持者。我饶有兴致地看到了这样的结果:图书的保卫者们来自东海岸,屏幕的保卫者则来自西海岸。但是尽管存在这样的一道文化鸿沟,我还是渐渐设计出了一个新的更加可行的框架。那需要彻底颠覆现有的商业模式。
作者和出版商(包括音乐和电影制作人)一直以来都依赖这样一个商业模式:廉价的拷贝成本,严厉的反盗版法律,以及对公众灌输的版权的神圣性。这一模式从上个世纪以来,孕育了人类历史上最伟大的成就,一个创作的黄金时代。受保护的物理拷贝让几百万作者可以靠出售自己的作品,而不是极不稳定的捐助来养活自己。不仅作者和艺术家从中获益,受众也一样。在那之前,还从来没有一个时代,几十亿普通人可以方便地接触到每件著作。在莫扎特的时代,几乎没有人能够超过两次欣赏到他的某个交响乐。但廉价音乐碟片的出现,让爪哇的理发师也可以成天反复地听。
然而新兴的数字技术体系却打乱了这一基于批量拷贝的商业模式,包括艺术家们的自给自足。电子经济的疆域仍然在不断拓展,但与此同时,老式经济所积累下来的财富正试图通过立法和强制手段保护这一陈旧的商业模式。保护批量拷贝的法律被加强到了极限,同时以“自我保护”的名义宣判市场上的新技术为“非法”,这种疯狂手段带来的“正义”正在走入歧途。(这些都在意料之中。事实上,整个产业所包含的财富都有消亡的危险。报纸、杂志、好莱坞、唱片公司、广播公司以及这些领域无数辛勤工作的人才都不得不彻底转变他们赚钱的方式。不是所有人都愿意这样的。)
当然,这种新模式建立在无形的比特之上,这样一来,拷贝就不再是廉价的,而是免费的了。它们可以免费地流向任何地方。就像一台电脑从网页上获取一幅图片,或者显示服务器上的一段文字时,它就创造了这些作品的临时拷贝。实际上,你在网络上所做的每个动作,都会生成某些东西的拷贝。拷贝的这种极端易得性使它从电脑的内核中泛出成为电脑时代的文化。人们采取了很多措施,试图阻止无限制的拷贝传播,包括防拷贝计划、防拷贝硬件、教育课程、甚至立法。但是所有的措施都没有效果。这些措施都受到了消费者的反对,并且被盗版者轻松破解。
随着版权的失效,建立在其基础上的经济模式也轰然倒塌。随着拷贝的泛滥,拷贝本身已经失去了价值。它们不再是财富的基础,取代它们的是关系、链接、互动和共享。价值从作品的一份拷贝转移到了对作品的无数种回顾、注释、挑选、编辑、鉴赏、显示、记录、转换和投入上。作者和艺术家们可以通过(有些已经这么做了)出售他们作品的这些方面,而不是拷贝,来维持生计。他们可以销售演出,销售与作者见面的权利,销售为个人定制的作品,销售附加信息,销售注意力(通过广告),销售冠名权,销售期权——总之,所有不能被复制的价值。便宜的拷贝成为了销售这些无形价值的载体。但是出售“不能被复制的东西”这样的模式对作者来说还远远不够完美。这种模式仍然有很多问题(也可以说是机遇)。比如说,管理创作和作者酬劳的法律仍然停留在已经支离破碎的有形拷贝模式。
8. 搜索改变一切
搜索引擎公司,包括谷歌在内,是新王朝的管理者。“搜索”是一个全新的概念,我们的知识产权保护法1.0版并没有预见到它的出现。最近在内华达州法庭的一次判决中提到,搜索具有“革命性的效果”,可以为搜索的对象增加社会性的价值。搜索所能发现的不仅仅是关键词,还有信息之间互相关联的内在价值。虽然说,几乎所以艺术家都同意,作品的价值最终可以用作者最后获得多少报酬来衡量(对有些艺术家来说这个价值已经足够了),但同样也不得不承认,作品的价值随着共享它的人增加而增加。搜索技术通过创建亿万个新的连接来使作品的价值最大化,而且是原本你根本无法想到的那亿万个连接。当一样东西具有被链接的潜在因素时,它才能被搜索引擎搜到。这种潜在因素可以很简单,比如一个标题,也可以很复杂,比如来自另一个页面的一个脚注的一个连到这个页面的一个脚注的一个链接。它可以像发行一首单曲一样简单,也可以像要区别每个独立的乐器音轨一样复杂——甚至需要区别每个独立的音符。
搜索打开了创意之门。它能唤起人类传播的本性。可以被搜索的作品对文化发展非常有好处。好处是那么的大,实际上,大到我们可以作出这样的判断:出版权利(版权)将会被出版义务抵消。一个作者如果希望公众保护他的作品的复制权(就是版权),他就必须让他的作品可以被搜索到。没有搜索,就没有版权。当歌曲、电影、小说和诗歌都可以被搜索的时候,这些作品之间的潜在联系将结成一个紧密的组织,单独一个拷贝无论如何做不到这点。
在自然科学领域,我们可以更加清楚地看到这个效果。自然科学长年以来不断地把所有知识整合成为一个宏大的、内部互相联系、互相解释、互相依存的网络。单独的实验和理论,尽管可能在它所在的领域有意义,但对整个自然科学来说没有价值(只有伪科学和超自然科学,才是完全游离于科学体系之外的小水塘)。因此,每一个新发现、每一个新的数据添加进科学网络之后,都会增加所有其它领域的价值。科学界有一个基本的准则,就是让新发现可以被搜索到。没有人认为当人们找到或者抄写这些科研成果的时候,科学家应该问他们要钱。相反地,我们通过其它的方式来支付他们重要劳动的报酬。他们的报酬源于他们的成果被引用、共享、链接的程度,这些都不是他们所有的。他们可以从发明中获利的专利期非常短(20年),短到足够激励他们发明更多东西。很大程度上来说,他们通过各种方式放弃了他们知识产权的版权,但同样可以维持生计。
图书版权和搜索引擎之间的法律冲突看来还要持续很长时间。HarperCollins公司在作为谷歌合作伙伴的同时,也参与了反对谷歌的这起诉讼。该公司首席执行官Jane Friedman说:“我不认为这场官司会在我有生之年结束。”她是对的。这个案子可能会随着问题的不断升级而永久僵持下去。不过到最后,它将不再是个问题,技术的发展会将它甩在身后。中国自己的扫描工厂在宽松的知识产权限制下,会不断制作电子书。而且随着扫描技术越来越快、越来越好、越来越便宜,热情的用户会像对待音乐一样,组建自己的数字图书馆。
这样的技术说明了什么?说明了版权将会毫无意义。披着笨拙封面的书本马上就要被淘汰,而这些书本的内容,将以数百万种途径被索引,被复制,散布到世界各地。重要的是这些内容将如何被连接、操作、评论、分类、筛选、标记、翻译,如何转化成其它形式的媒体,如何被组织到寰宇图书馆中。很快,寰宇图书馆外的图书就会像互联网之外的网页一样,苟延残喘。事实上,能够让书本在我们的文化中保持它们那日益缩小的权威的唯一方法,就是把它们的内容连接到寰宇图书馆中。
但是,依靠版权过活的时代还没有结束。在将来几年里,来自图书出版商、电影公司和唱片公司的说客会竭尽所能鼓吹消灭“无限制的拷贝”,甚至不惜宣布先进技术是非法的。太多的作者仍然依靠版权制度谋生,尽管它最终会消失。考虑到这些人的利益,版权法不会立即改变。
不过事情会慢慢改变。版权时代已经不再适应科技的发展。新的作品都将以数字化的形式发表,把它们加进寰宇图书馆,就像在一个长篇故事后面加几行字一样容易。而大批的绝版图书,总共2500万本无法确定版权归属的实体图书,最终将被扫描。无论它们是被谷歌扫描的,还是被国会图书馆、中国人或者是读者自己扫描的,这都会发生在这种行为合法化之前。因为科技发展让扫描变得如此方便而又如此有价值。在保守的图书主人和开放屏幕主人的较量中,屏幕主人将获胜。通过这10亿人面前的屏幕,搜索科技将会把人类所有的知识从孤立的书本中转化成为寰宇图书馆。
(本文原载于纽约时报杂志,作者Kevin Kelly。Kevin Kelly是Wired杂志的“资深独立评论员”,也是《失控:机器、社会制度和经济世界的新生物学》等书的作者。他最近还为时报杂志撰写了关于数字音乐的评论。)