图片服务的防盗链问题
图片服务的防盗链问题,Hanson发过一篇牢骚: 门户网站的blog服务大部分都是禁止其他网站引用上传图片的,而最近国内专业的图片管理网站又拍也限制了图片的外链访问。从图片的hosting网站来说: 由于存储设备和存储机制的改进,图片存储一般不是太高的成本。主要的成本在于带宽:而很多盗链(寄生)网站经常利用免费服务存储一些色情图片,这些内容的流量非常大,如果不及时控制的话,非常容易形成破窗效应从而导致免费服务的成本失控。 同样是个人图片管理网站: FlickR是如何对图片流量进行成本控制的呢?
技术保障:
1 有基于用户帐号的月度流量控制。免费用户一个日历月的流量以前是有上限的20G(现在没了),上传文件的空间上限是20M(现在是100M);
2 FlickR的缺省供免费用户共享的图片大部分是较小幅面的缩略图:幅面一般在400像素以下,文件大小只有几k到几十k;收费用户才可以从外站引用原幅面的图;
3 用户帐户注册是要有邮箱校验的激活机制,防止自动/机器大量注册免费帐号;
用户协议上:
1 如果发现免费用户使用非原创内容,flickr是有理由删除内容并停用帐号的;
2 Flickr在对外共享图片的时候: 是要求加上链接指向原图(在FlickR上的)地址的,并且为图片插入很多Blog系统提供的API支持;
所以对于外部引用图片这个问题,以道德好坏来评判门户有些偏颇,如何区别恶意的图片盗链和正常的网站内容引用是各家网站都面临的一个问题。需要的是从技术协助改进规则制度上的不足,如何发现有更建设性的过滤机制,是开发人员更需要关心的。
博客大巴也逐渐严格了图片的外站访问,甚至能够发现不少迅雷,快车这样的下载工具不仅模拟IE浏览器,而且还用referer模拟图片所在服务器的上级目录,所以防盗链还是需要开发人员多想想的:
1 如果对免费账号的流量进行比较实时的监控:因为现在很多文件服务都需要CDN进行分流,如何将分散在CDN的各个文件流量日志搜集并半实时统计就是一个问题;
2 如何方便的对上传图片的内容进行版权甄别也是可以做一些简单的方便人工审核的工具;