业界一直流行这样的说法,百度更适合搜索中文。

米晓彬先生的这篇百度上市后之九:中文之美成就百度算是比较全面的一个总结。

而我则半信半疑。

因为在我的经验里,只有新浪新闻中的关键字出现过分词错误,而使用Google,则好像没有发生过这种情况。(非常抱歉的是,我一时也举不出新浪的关键字错误的例子,只能凭印象说一说,Sina的新闻中,一度提供自动识别关键字然后提供一个超链接,但如果有一个人叫做李高峰,那么它会给高峰两个字加一个链接,链接到关于足球运动员高峰的相关新闻页面)

为此,我搜索了一下分词,结果发现了这么一篇文章:http://www.sunsou.net/ssjs.htm

这篇文章里,提到了“和服”的例子,本来,我觉得我的这篇Blog可以放弃了,但我贼心不死,亲自测试了一下。结果是,目前在google和百度上,都能正确地实现对“和服”为关键字的搜索。

因此,我决定征集分词错误的例子,否则,百度的这个宣传画,只是个噱头而已。



11条评论

  1. 就利用这个图片

    我分别在google和baidu搜了下"本人"

    google的前10中有7个和"本人"有关,3个"日本人"有关

    baidu的前10都和"本人"有关

  2. 恩?

    我现在的时间是11:32

    但是laobai的文章确实:发表于 2005年08月31日 12:04 AM

  3. 用百度和google分别搜索一下“省长”看看 :)

    百度输了。

  4. 又试试“市长”,百度还是不灵

  5. 多呢,就不列举了

  6. 在目前全球一体化的背景下,技术、人才、资金都在流动,百度能自己开发中文分词技术,Google也可以请到甚至更好的中文处理专家,再提中文的独特性使国内公司具备先天的竞争优势则近似于痴人说梦了。

  7. 终于见识了百度的威力…

    为了验证老白所说的,我做了一些小测试,没想到让我小小见识了一下有中国特色的搜索引擎.

    我试着搜了一下江前主席的名讳,结果百度搜索马上就不能访问了,我开始还以为是我的网络出了问题,但是我点百度贴吧,新闻还是好用的,于是我在贴吧又试了一次,结果贴吧马上也不能访问了, 过了大概2,3分钟才恢复.

    佩服佩服!

  8. 因此,如果我不是一个IT人的话,三联的记者们用笔还是用电脑打字,对我而言都不重要,重要的是思想。

    就像我们在万能的无忌中经常说:摄影的成败,并不取决于相机前面的镜头、而取决于相机后面的那个头–也就是你的脑袋。

  9. BBC 中文网| 中国报道| 印中将重新打通古丝绸之路

    印度官员称,印中正准备携手重新打通自1962年印中边界冲突以来便一直弃置的直接贸易通道。

    news.bbc.co.uk/chinese/simp/ hi/newsid_4230000/newsid_4234600/4234610.stm – 26k – 网页快照 – 类似网页

    BBC 中文网| 中国报导| 美中将举行定期高层会谈[ 繁体 ]

    美国同意与中国举行定期高层会谈。据报,副国务卿佐利克将是美方主要联系人。

    news.bbc.co.uk/chinese/trad/ hi/newsid_4420000/newsid_4426900/4426971.stm – 27k – 网页快照 – 类似网页

  10. 这正常的很

发表评论

评论也有版权!

click to change验证码