刚才,老门在蓝天博客的看到,百度近日已经悄然恢复对淘宝网页的抓取和收录。

    文中说,“在3月13日却惊奇的发现,百度已经悄然恢复对淘宝网的页面收录。根据查询,我们发现百度目前已经收录了淘宝网132,000篇网页。而在3月10日左右,我在查询淘宝网在百度的收录情况时发现,百度只收录了淘宝网的首页。”

    点开蓝天博客中页面收录的链接,百度的搜索提示就是“找到相关网页132,000篇”。

    研究过搜索引擎的人应该知道,搜索引擎的搜索提示经常会有偏差,实际收录数少于提示数,在翻到最后一页时才会出现那个实际的收录数。于是老门开始向后翻页,当翻到76页时已经到了最后,并且在搜索结果最后看到以下提示:“限于网页篇幅,部分结果未予显示。”再看一下搜索提示,还是“132,000篇”,数量没有变化。

    这又是怎么回事呢?按照以往经验,如果真是收录了那么多,搜索结果最后的提示应该是这样的吧:“为了提供最相关的结果,我们省略了一些内容相似的条目,点击这里可以看到所有搜索结果。”

    在向后翻页的过程中,老门注意到,收录的页面绝大多数是店铺首页(shopxxxxxxxx.taobao.com),而没有一个是具体商品。难道这就是百度C2C负责人李明远曾在淘宝网宣布屏蔽百度蜘蛛后表示的,为淘宝网店卖家提供专门的绿色通道?

    另外,蓝天博客的页面收录链接中,搜索框的内容是:site:taobao.com,但淘宝网的主域名是www.taobao.com。老门就把搜索内容改成:site:www.taobao.com,新的搜索提示是:“找到相关网页80篇”(注:没有那个“”字)。而搜索结果只有一个“手机淘宝”的页面,后面就是“提示:为了提供最相关的结果,我们省略了一些内容相似的条目,点击这里可以看到所有搜索结果。”点开所有搜索结果,80个页面一个不少,同样没有具体商品,也没有上面的店铺首页。

    至此,可以得出结论:百度恢复对淘宝网的页面收录的说法不实。老门觉得不会引起所谓的关公战,最多是百度的猫腻而已。(作者原创,转载请注明:爱淘宝/门贺丰)


评论

该日志第一篇评论

发表评论

评论也有版权!