google的作风一向低调,神秘。他们一般是不披露自己在做什么的。只有等到都准备的差不多时,他们才会透点口风。

google labs的研究人员最近做了一些演讲。从中可以看到他们可能推出的新技术或新服务。

google labs在web 2.0和Washington大学的两个演讲中都提到了word clustering。word clustering是把相近/相关的词汇聚合在一起,并以某种方式表达他们之间的关系如:意义的近似、相关、反义、包含等等。google用的技术是经典的bayesian networks。这是一种表达能力非常强的概率图模型,但是它所要求的计算量是非常大的。理论上讲, bayesian networks的计算是NP-Hard。可能google的研究人员找到了一种特殊的图结构和相应的算法,再加上google上万台的pc cluster, 能够有效地完成web级的海量数据处理。

有了这个东西,google可以干什么?他们可能会推出:
1。智能化的搜索帮助:根据用户的初始搜索,推荐新的相关的搜索关键字或搜索导航
2。基于概念的搜索:可以对概念一级进行搜索,搜索的结果不再局限于关键字

比较搞笑的是,在google的word cluster中bush总是和idiot联系在一起。


4条评论

  1. google搜索英文的时候,有一个翻译的BETA

    http://bbs.maidaole.com/viewthread.php?tid=1133

  2. Ping Back来自:www.donews.net

  3. 写的好,对我们大有帮助

  4. 站长,可以做个朋友吗

    QQ:68343246

发表评论

评论也有版权!