旧文:
Google是最大的野心家:http://it.sohu.com/2004/04/21/95/article219909522.shtml
IT.SOHU.COM 2004-04-21 16:38 作者: 方刚 转自: 搜狐IT
几点最新理解:
搜索引擎在2006-2016年10年时间内的主要进展将是:
1)社区化:百度的贴吧仅仅是一个最低级层次的开始。
2)抓取更多的内容和知识,包括:
a)保存在互联网上,但隐藏在Database内的公共知识。目前绝大部分搜索引擎抓不到冰山下的这些数据,因为它们大多以动态网页呈现,有的是注册服务甚至收费注册服务。比如WSJ。
b)没有保存在互联网上的公共知识。Google做了很多,百度了做了一些,比如大量存在于学术机构的硬盘上的知识。比如图书馆搜索,比如所谓的国学。
c)保存在互联网上,但由千千万万网民建立的个人知识。含义不用多说,但这个数量巨大,质量良莠不齐,而且很多经过客户端技术如ajax个性化之后的网页,并不那么好抓,好更新和好索引。这需要新的技术投入。
d)没有保存在互联网上,但保存在千千万万网民的电脑上的个人知识。也不多说,Google和百度,包括微软都在做,刚刚起步。
e)保存在互联网上,但属于隐私范畴的个人知识。比如我的长达10年的Gmail往来邮件,这仅仅是一个例子而已。
f)世界上99.999999999%的知识都不在互联网上,也不在企业和机构的硬盘里,也不在个人的硬盘中,在每一个人的大脑里。
g)搜索引擎通过社区化,会把人脑的知识逐步取出来,并用所谓分享和增值的方式,穿过隐私和版权的墙壁,纳入自己的版图。百度在做“知道”,是个尝试。
h)人脑之外是上帝的脑。我们居住的这个星球叫做地球,地球的知识原本存在于上帝之脑,搜索引擎也要把他取出来。Google earth迈开了很小很小的一小步。
3)抓取更多的人和关系,包括:
略。
4)信息的产生和抓取同步。抓取和索引同步。索引和Rank同步。rank和聚合同步。信息的背后是人或者组织,人的背后是关系,关系的背后是金钱和交易。
5)未来的互联网世界,一个是搜索,一个是C2C。
Trackback: http://tb.donews.net/TrackBack.aspx?PostId=695865