自从Blog开始成为一种风潮,人们就一直在问Google什么时候推出Blog搜索,今天这个问题终于有了答案,因为GoogleBlog搜索开始测试了。
今天面世的GoogleBlog搜索有些奇怪居然不支持Firefox,只支持IE,这一反Google的传统,更何况Google的员工中就有Firefox的核心开发者。看过Google开放的一些Api的朋友可能会发现,在JavaScript层面,Google有自己的封装的浏览器无关的类库,所以,这有点让人感到惊讶。也许这仅仅是个疏忽吧。我们拭目以待。
另外一个很奇怪的问题在于,GoogleBlog搜索收录了很多中文的Blog,居然没有收录我们的中文Blog一哥Keso,这太令人诧异了。用keso作关键字搜索可以找到2193个结果,但是这里面却没有keso自己的Blog,奇怪。
这个项目显然已经进行了很久,我在里面搜索本Blog可以找到最早的一篇是我在2005年4月20日写的李化伟说“我和佘祥林都算幸运的”。搜索韩磊的Blog,则可以找到的最早的Blog是2005年3月10日写的南人·北地·片语(六) 。我没有做更广泛的测试,但是显而易见,至少在今年的3月份,GoogleBlog搜索的爬虫就已经开始工作了。(经过keso的提醒发现我的论断武断了些,韩磊的Blog更新并不多,所以很可能并不是3月份抓到的,也有可能是5-6月抓取的时候,抓到的。这个很难用实验证明。另外,根据keso说6月份有人发现过GoogleBlog的爬虫。看来大概开始的时间应该在5-6月份)另外很我疑惑的是,我的Blog可以找到的最新的一篇文章是7月25日写的我的魔兽综合症。而韩老大的Blog最新一篇9月11日写的文章都被收录了。我的Blog为什么后来不收录了呢?莫非是Google的技术人员觉得我的Blog越来越八卦,把我的剔出去了?( -_____-# 另外一个可能性是DonewsBlog的稳定性闹的,天知道呢!)
Blog搜索将对我们有什么意义呢?
如果你不是一个Blogger,最大的意义我想在于用Blog搜索可以得到更加整齐的搜索结果,里面将几乎没有垃圾信息。这点很类同在365key里面进行搜索,结果不见得最全,但是基本上是质量可以保证的。365key的搜索广义看来,可以理解为我曾经谈过的“人肉搜索引擎”的一种,它的质量保证来自于大部分用户使用365key是为了收藏好的文章,也就是说,它的数据采集端不同于传统基于链接网的爬虫,它的数据采集是经过了人工筛选了的。很有趣的是,李学凌的文章“把用户的权力还给用户 相信机器还是相信人”讲的本是Donews的直通车机制,但是他讲的道理也很适合于Blog搜索。Blog搜索的质量保证正是建立在于Blogger的审核上,建议在对人的信任之上的一种思想。这两种思想不能简单地分优劣,反而可以相映成趣。
对于Blogger来说,Blog搜索的意义不仅仅是一个新的访问来源,而且也将会成为一个新的话题空间。
Trackback: http://tb.donews.net/TrackBack.aspx?PostId=554288