2006年06月05日

我搬家了,搬到这里了。
以后这里就不更新了。
不知道有没有人在订阅我的blog(估计是没有的),不过搬家了还是应该在旧宅上贴个告示,于己心安。
:)

2006年04月19日

试用了一下Google Calendar,很舒服,功能蛮强大的。但是在从Outlook导入到Google Calendar时遇到了问题,无论导出成CSV(DOS)还是CSV(WINDOWS)格式的文件,Google Calendar都不认,一点Import就报错:

Failed to import events:
Failed to upload ical/csv file

郁闷中只好曲线救国,用Rainlendar读取Outlook的Calendar(正好平时也用Rainlendar),然后从Rainlendar导出成ics文件,再用ics文件导入到Google Calendar里面,居然成了。

谁知道如何从Outlook导出Google Calendar能认的CSV文件?

2006年04月17日

Google的中文名字叫-谷歌,寓意是丰收之歌,所以这“谷”应该是五谷杂粮的那个“谷”了。

看看中国搜索引擎市场的佼佼者们,不是“狗”就是“狐”,还有“猪”,再加上个“谷歌”,还有那个爪子印,整个一个农家乐。

这就是中国,唉……

2006年04月13日

最近听朋友的推荐,看了余华的《活着》和《许三观卖血记》。很久不看小说了,感觉现在很多人的小说基本上都是在抖包袱和卖乖,那种机灵看多了就免疫而致麻木了,反而不如多读点历史去。嗯,前不久刚看了曹聚仁的《文坛五十年》,很不错,推荐。
看了余华的这两本书(事实上是《活着》还没看完),发觉自己还没有麻木,良知还没有泯灭。看着看着就想哭,我觉得自己早就心如铁石了,看来还没有。

华很冷静,看着他的不带感情的描写,就这么平铺直叙地讲述别人的故事,看他讲那些平凡人物的真实的心理、思路、动作、语言,就是这个字:真实。有时候我非
常痛恨这冷静,我在一旁看得悲从中来,他还自顾自地有条不紊地叙述着。有时候我也能感受到他的叙述也有感情,即使是简单的一句重复句,那种深深地叹息就缓
缓地升起。
看着许三观和福贵对生活默默的承受,心里像刀割一样。普通的小人物们对于自己命运的把握实在是有限得很,对于他们来说,站在命运面前就像站在车轮前的螳螂一样,除了低首啜泣还能怎样?他们只能随着大浪浮沉。
我很怀疑那些励志的书能有多少用处,能改变多少现状。历史是少数人的,从这个意义上来说是正确的。历史里面书写的人名有多少?历史上活过的人有多少?现在正在活着的人又有多少?
《芙蓉镇》里面姜文的那一嗓子,包含了多少屈辱、不幸和坚韧?好死不如赖活地活着。
扯远了。对于余华这样的作家,我是又爱又恨。
朋友说,电影里面的福贵和书上比,就是在天堂里面。信哉。

2006年04月05日

每天在公司忙工作,回到家里吃完饭都快9点了,常常没有时间和心情来写点什么,所以我看博客那么久,自己的博客文章却是寥寥无几。在地铁上想,如果真的可以通过手机写博客了,就去搞个PDA来,每天在地铁上写点小感想什么的,发到博客上去,真的是很方便的。
朋友以前曾经说,每个人其实多少会有些灵光闪现的,但是因为懒于记录,于是慢慢忘记了,很多好东西就此埋没,人也会变得越来越没有条理。此言不虚。这么多年来,自己常会涌出一些念头、想法、思路、观点,但疏于记录和整理,到如今自己也不记得什么了,真是可惜啊。
如果有了移动博客,至少我是会用的,比随身带个小本子要强些吧。

2006年03月30日

今天晚上吃饭时瞥到电视里面的《艺术人生》,朱军在“采访”小崔。一晃十年,小崔老了,眼袋、皱纹全上了,但是他那种淡淡的幽默、轻松中透露出的执著依然如故。朱军“采访”他实在不是对手,基本上插不上话且不说,也基本上接不上话,高下立判。春晚上冯巩对他的讽刺似乎没有带来什么改进,他的套话永远都不会少,貌似深情的字斟句酌等来的结果却是遣词造句方面的矫揉造作,看着着实地累。小崔在今年春晚上貌似无心的一句“没关系我这节目收视率低”让我听了心里一酸,上次看了期《实话实说》,采访一个警察,主持人和嘉宾都没有什么问题,但这节目已经再也不是当年小崔主持的那个《实话实说》了。那份犀利,从题材到过程到背后想表达的意思,如今再也回不来了。他说的作为媒体的责任感,真不知道如今的行里有几个人能听得进去。超女红了后,台湾某著名策划人不屑地说“这有什么,我们以前在台湾炒作熊xx时就这么做过”云云。我看了心里真是难过。大家除了赚钱其他什么都不顾了,还争着比谁堕落得早。这个社会怎么了?为什么我们在学习西方的文明时学成了这个样子?遍地的事故,各种各样的事故,什么行业都有,相同的是为了钱而草菅人命。不说了,洗洗睡了。

- 以后坚持每天写一篇垃圾,信笔由之,一吐为快。

2006年03月06日

垂直搜索大家现在都很看好,因为搜得窄,所以搜得准。客户的预期也明确,算法也就比General Search要容易许多。算法的问题以后讨论,今天来说说数据来源的问题。

上次看到7feel在论坛里面的一篇帖子,觉得说得挺有道理的,不过有些地方说得不透,也是因为行业不同所以有些规律不尽相同的原因。我是做购物搜索的,结合自己不长的经历,贡献一点浅薄的想法。

无论做什么垂直搜索,数据都有来源。来源可能很好,也可能不够好,当然最后你呈现给User的结果要够结构化,数据要非常有序,而且可以通过各种条件组合进行过滤,这就是你的价值。你的价值就在于把那些很可能是无序的、对于个体而言收集整理有序化成本非常高的信息给收集整理有序化了。

那么如何获得这些数据呢?以购物搜索为例,所面对的数据来源主要是两类,一是线上的网站,一是线下的店铺。在美国,这两者都不是问题,因为如果你想做,别人都能提供良好的数据包。在中国,这就是个很头疼的问题。对于线上的网站,你可以写爬虫,可是很多网站你无法爬,甚至是知名的网站都有可能,或者是爬的成本很高,或者是网站根本不标价格,跟现在登招聘广告一样,除了扫地的阿姨,所有职位一律面议,爬了也是白爬。对于线下的店铺,看看zol/pconline就知道,价格只能做参考,商家能有多及时地更新价格,很难说。一个朋友做网站的,经销商给他报价,一个礼拜发次传真就不错了。

怎么办呢?照搬美国的方法是不行的。首先,要有爬虫(要有光?)。在初期,是不可能依赖商家提供数据包的,因为很多商家不具备这个能力和意识。其次,要有维护界面,给商家使用。这是中国的国情,对于有能力和重视的商家,给他一个界面来维护信息的更新有时是很不错的选择。最后,要大力推先进的模式,但不要超越所处的时代。“找到了”为什么死那么早?就是因为他超越了所处的时代,从先驱走到了先烈。最后一点,不要过分依赖先进的技术,要早走一步,就要能融合新旧模式。即使雇个人专门收传真然后录入电脑也许都能服务20个客户呢?数据的标准化、传输都得慢慢来,但是现在不来,说不定明年就晚了。

最后,欢迎大家看看我们的网站:聪明点购物搜索-http://www.smarter.com.cn/,多提意见,多探讨。

2006年03月02日

对大学物理老师记得最清楚的一段话是这样的:

数学工具的介入使物理进入了一个新的境界,但是在公式推导得酣畅淋漓时,需要时刻回过头来想一想,我们现在推导的公式在现实世界中代表了怎样的物理现象或物理规律。

这段话我一直谨记,是因为它提醒我,不要陶醉在虚无的畅快里,要经常想想现实,如果一个理论听上去非常完美,更应当这样做,否则就会很容易陷入自我陶醉。忘记现实是最危险的事情。

2006年02月28日

刚刚过去的2005年被业内称为“电子商务年”。这一年里,淘宝宣布继续免费三年,并在各大小网上零售网站推广其“支付宝”产品,易趣eBay悄然宣布其免费政策,挟PaypalSkype之势欲重夺国内C2C的龙头地位,腾讯与当当则先后推出各自的C2C平台,一时间网上购物成了潮流,为众多消费者和业内人士所看好。

围绕着网上购物,旧的和新的话题、难点再次被大家拿出来探讨,例如过去常说的“三座大山”以及“搜索+电子商务”概念的探讨等。毋庸置疑的是,中国电子商务发展的环境是逐渐变得越来越好,随着众多的银行支持网上支付以及第三方支付方式纷纷出场,四大物流巨头进入中国以及中国邮政自身的改善与进步,很多过去被认为单靠网上销售方自身力量无法解决的问题正表露出向着良性方向发展的趋势。

与此同时,新的问题正从我们的学习对象-美国,包括整个西方-那里暴露出来,从而引发我们的思考。例如搜索引擎领域与网上购物领域同时遇到的一个问题就是,用户/消费者如何能从互联网上众多的信息中找到对自己有价值的信息。事实上,网上购物领域比搜索引擎领域更早遇到这个问题,这也是shopping.combizrate.com等公司几乎与Google同时期起步的原因。消费者知道互联网上有大量的零售网站,但面临着1)找到他们2)做出选择两个难题,比较购物网站的出现就解决了上述两个问题。用户去shopping.com,找到自己想要购买的商品,就能知道网上有多少商家在销售这件商品,比较他们的价格差异,最终决定到哪个网站下单。

这一概念在2000年前就传入中国,那时的“拉拉手”、“找到了”等网站均涉及这个领域,但是那时比较购物模式的前提,同时也是土壤-网上购物本身刚起步,国内还没有几家网上零售商,比较的意义不大,自然自身的价值也就很小。加之转眼间互联网的冬天来到,皮之不存,毛将焉附,连卓越都险些被卖掉,这些网站自然很快就烟消云散了。

但是随着国内电子商务环境的逐渐改善、形势的好转,国外大批巨头或资金的进入,晚上零售行业再度红火起来,而附属在这个行业之上的比较购物也重新回到人们的视野里。根据我的初步的保守估算,国内3C/图书/音像制品/服装/化妆品等较大的领域内,网站建设有一定的规模、运营时间较长、较成熟的商家每个领域内找出200~300家是不成问题的,在每个领域内均有5~10家行业内小有名气的领头羊,但全国范围内都知名的则不过卓越、当当等有限的几个而已。与此同时,截止2005年底,国内从事比较购物的网站大大小小加起来已有20家左右,小有名气的也有3~4家,例如聪明点(smarter.com.cn)、丫丫搜索(askyaya.com)、大拿网(danawa.com.cn)等。

搜索引擎行业内步入了一个类似的变革时代,即以google为首的常规搜索引擎开始逐渐暴露出其弱点。在每一个不同的领域内,信息的结构、组织、传播以及价值判断标准都不尽相同,有时甚至大相径庭。传统的搜索引擎算法即使再复杂,也不能照顾到所有的细分领域。因此,抱着不同目的来使用google的人可能对得到的相同搜索结果持不同的看法也就不足为奇了。Google自己很早就意识到了这个问题,例如google有单独的图片搜索,并开辟了froogle这个子品牌,专门搜索购物方面的信息。但是,仅有相关的网页信息是不够的。消费者需要的是更加有序的信息,信息的结构化和有序化成都决定了使用者在使用这些信息时的成本,从而间接决定了这些信息的价值。那么消费者需要怎样的信息呢?想一想哪些比较购物网站能够提供怎样的信息就知道了。

另一方面,对于哪些比较购物网站而言,当他们的网站有上万个商家、过千万的商品时,传统的类似Yahoo早期的目录导航方式将不再适用,搜索这一有效的快速命中目标的方法从一个手段上升到网站定位的策略层面。

这么一来,两个领域在这里不期而遇,购物搜索或者说搜索购物的概念也就应运而生。

一旦进化到了购物搜索的概念,就会有新的观点和视角产生,限于篇幅,不能赘述,不过我们不妨作一些简单的设问来启发一下思路。

1.数据的来源。传统的比较购物网站,数据的来源均是商家提供。如果与其他的平台合作,数据也是由合作伙伴提供。无论是谁提供,都属于被动方式的。搜索引擎的介入给大家提供了新的思路,即主动收集相关的数据。但是搜索引擎是以所有可以被访问到的网站/网页为目标收集信息,而所有垂直搜索类网站所搜集的信息都是有针对性的,因此不能照搬传统搜索引擎的做法,而应该发展出适合这个行业的有效的信息收集方法。国内目前以soaso.com为首的是采用被动式的数据收集方式,以丫丫搜索为首的则采用主动式的数据收集方式,而聪明点(smarter.com.cn)则是两者兼而有之。

2.提供给用户的功能。搜索引擎网站可以提供网页的快照(snapshot),并将关键字高亮显示。而购物搜索网站则是显示高度结构化的数据,表现形式也有很大的不同。但即使是在美国,众多的购物搜索网站也只能提供与价格相关度比较(如税、运费)。Smarter.com是首先将Coupon等促销信息集成到商品层面上显示的购物搜索网站之一,这一功能大大提升了自身的价值。在国内,当这类数据还不能很好地结构化时,除了价格之外,我们还能给消费者提供什么其他的信息呢?

3.如何长久地发展。购物搜索网站之间的竞争基本上是一种同质化的竞争,这种竞争是恶性的,因为大家长得太像了,谁能胜出可能只有天知道(当然不是真的只有天知道,具体的分析另文讨论)。大家应该追求一种良性的竞争,即差异化的竞争。要让消费者感受到不一样的服务,才能把他们留住。只有留住消费者才能保持对网上零售商的价值,购物搜索网站自身的生意才能做长久。

网上交易是不可逆转之势,即以每一个消费者而言,C2C/B2C终将会改变人们的生活方式和生活习惯,只是时间早晚的问题。类似购物搜索这样的行业,在网上交易的土壤里生根发芽,依靠网上交易的发展而发展,然而有一天也许会反过来推动和促进网上交易的秩序化和规范化。与其他甚嚣尘上的垂直搜索不同,购物搜索由于有现实的基础、可见的需求,深深扎根于网民的生活之中,其发展前景不可限量。

天天乘地铁,每天到站在站台上都能听见屏幕上传来的广告声:他们都站累了么?用来形容那些在地铁里拥挤的人群真是恰如其分。

一日之晨就听到这样的话,真似对这一天工作的预告。