垂直搜索大家现在都很看好,因为搜得窄,所以搜得准。客户的预期也明确,算法也就比General Search要容易许多。算法的问题以后讨论,今天来说说数据来源的问题。

上次看到7feel在论坛里面的一篇帖子,觉得说得挺有道理的,不过有些地方说得不透,也是因为行业不同所以有些规律不尽相同的原因。我是做购物搜索的,结合自己不长的经历,贡献一点浅薄的想法。

无论做什么垂直搜索,数据都有来源。来源可能很好,也可能不够好,当然最后你呈现给User的结果要够结构化,数据要非常有序,而且可以通过各种条件组合进行过滤,这就是你的价值。你的价值就在于把那些很可能是无序的、对于个体而言收集整理有序化成本非常高的信息给收集整理有序化了。

那么如何获得这些数据呢?以购物搜索为例,所面对的数据来源主要是两类,一是线上的网站,一是线下的店铺。在美国,这两者都不是问题,因为如果你想做,别人都能提供良好的数据包。在中国,这就是个很头疼的问题。对于线上的网站,你可以写爬虫,可是很多网站你无法爬,甚至是知名的网站都有可能,或者是爬的成本很高,或者是网站根本不标价格,跟现在登招聘广告一样,除了扫地的阿姨,所有职位一律面议,爬了也是白爬。对于线下的店铺,看看zol/pconline就知道,价格只能做参考,商家能有多及时地更新价格,很难说。一个朋友做网站的,经销商给他报价,一个礼拜发次传真就不错了。

怎么办呢?照搬美国的方法是不行的。首先,要有爬虫(要有光?)。在初期,是不可能依赖商家提供数据包的,因为很多商家不具备这个能力和意识。其次,要有维护界面,给商家使用。这是中国的国情,对于有能力和重视的商家,给他一个界面来维护信息的更新有时是很不错的选择。最后,要大力推先进的模式,但不要超越所处的时代。“找到了”为什么死那么早?就是因为他超越了所处的时代,从先驱走到了先烈。最后一点,不要过分依赖先进的技术,要早走一步,就要能融合新旧模式。即使雇个人专门收传真然后录入电脑也许都能服务20个客户呢?数据的标准化、传输都得慢慢来,但是现在不来,说不定明年就晚了。

最后,欢迎大家看看我们的网站:聪明点购物搜索-http://www.smarter.com.cn/,多提意见,多探讨。


3条评论

  1. 虽然不是搞技术,但是你写的很简单易懂,我想我应该看明白了。尤其最后那个建议,我觉得真的很对,很贴实际。就我自己的体会,如果没有自主管理界面,不能自由修改价格,我也会懒得去发传真呢。

    想想,大多数类似商家加盟的购物网站,有自助管理后台好像不多吧

  2. 不错的网站

  3. 不错,

    <a href="www.begoo.com.cn">比购网</a>

发表评论

评论也有版权!