2006年03月30日

今天晚上吃饭时瞥到电视里面的《艺术人生》,朱军在“采访”小崔。一晃十年,小崔老了,眼袋、皱纹全上了,但是他那种淡淡的幽默、轻松中透露出的执著依然如故。朱军“采访”他实在不是对手,基本上插不上话且不说,也基本上接不上话,高下立判。春晚上冯巩对他的讽刺似乎没有带来什么改进,他的套话永远都不会少,貌似深情的字斟句酌等来的结果却是遣词造句方面的矫揉造作,看着着实地累。小崔在今年春晚上貌似无心的一句“没关系我这节目收视率低”让我听了心里一酸,上次看了期《实话实说》,采访一个警察,主持人和嘉宾都没有什么问题,但这节目已经再也不是当年小崔主持的那个《实话实说》了。那份犀利,从题材到过程到背后想表达的意思,如今再也回不来了。他说的作为媒体的责任感,真不知道如今的行里有几个人能听得进去。超女红了后,台湾某著名策划人不屑地说“这有什么,我们以前在台湾炒作熊xx时就这么做过”云云。我看了心里真是难过。大家除了赚钱其他什么都不顾了,还争着比谁堕落得早。这个社会怎么了?为什么我们在学习西方的文明时学成了这个样子?遍地的事故,各种各样的事故,什么行业都有,相同的是为了钱而草菅人命。不说了,洗洗睡了。

- 以后坚持每天写一篇垃圾,信笔由之,一吐为快。

2006年03月06日

垂直搜索大家现在都很看好,因为搜得窄,所以搜得准。客户的预期也明确,算法也就比General Search要容易许多。算法的问题以后讨论,今天来说说数据来源的问题。

上次看到7feel在论坛里面的一篇帖子,觉得说得挺有道理的,不过有些地方说得不透,也是因为行业不同所以有些规律不尽相同的原因。我是做购物搜索的,结合自己不长的经历,贡献一点浅薄的想法。

无论做什么垂直搜索,数据都有来源。来源可能很好,也可能不够好,当然最后你呈现给User的结果要够结构化,数据要非常有序,而且可以通过各种条件组合进行过滤,这就是你的价值。你的价值就在于把那些很可能是无序的、对于个体而言收集整理有序化成本非常高的信息给收集整理有序化了。

那么如何获得这些数据呢?以购物搜索为例,所面对的数据来源主要是两类,一是线上的网站,一是线下的店铺。在美国,这两者都不是问题,因为如果你想做,别人都能提供良好的数据包。在中国,这就是个很头疼的问题。对于线上的网站,你可以写爬虫,可是很多网站你无法爬,甚至是知名的网站都有可能,或者是爬的成本很高,或者是网站根本不标价格,跟现在登招聘广告一样,除了扫地的阿姨,所有职位一律面议,爬了也是白爬。对于线下的店铺,看看zol/pconline就知道,价格只能做参考,商家能有多及时地更新价格,很难说。一个朋友做网站的,经销商给他报价,一个礼拜发次传真就不错了。

怎么办呢?照搬美国的方法是不行的。首先,要有爬虫(要有光?)。在初期,是不可能依赖商家提供数据包的,因为很多商家不具备这个能力和意识。其次,要有维护界面,给商家使用。这是中国的国情,对于有能力和重视的商家,给他一个界面来维护信息的更新有时是很不错的选择。最后,要大力推先进的模式,但不要超越所处的时代。“找到了”为什么死那么早?就是因为他超越了所处的时代,从先驱走到了先烈。最后一点,不要过分依赖先进的技术,要早走一步,就要能融合新旧模式。即使雇个人专门收传真然后录入电脑也许都能服务20个客户呢?数据的标准化、传输都得慢慢来,但是现在不来,说不定明年就晚了。

最后,欢迎大家看看我们的网站:聪明点购物搜索-http://www.smarter.com.cn/,多提意见,多探讨。

2006年03月02日

对大学物理老师记得最清楚的一段话是这样的:

数学工具的介入使物理进入了一个新的境界,但是在公式推导得酣畅淋漓时,需要时刻回过头来想一想,我们现在推导的公式在现实世界中代表了怎样的物理现象或物理规律。

这段话我一直谨记,是因为它提醒我,不要陶醉在虚无的畅快里,要经常想想现实,如果一个理论听上去非常完美,更应当这样做,否则就会很容易陷入自我陶醉。忘记现实是最危险的事情。