09月 25, 2012

文/DoNews著名作者 刘建国

中文搜索历史轨迹

搜索引擎技术实际上在学术界原来叫做IR技术、信息检索,这个技术实际有20多年历史,在互联网之前其实有这个技术,比如图书馆里边大家借书,实际是检索,通过书名、作者等参数获得你想要的书。

95年以前整个互联网在学术界、教育界,是从95年开始商业化,有WWW、雅虎等等创新的模式建立起来。在中文搜索里边也是从95年开始,我有幸在北京大学计算机系,当时做互联网搜索引擎,当时做的系统是天马,主要中英文搜索引擎,主要在教育科研范围提供服务。从95年到2000年之前也有很多搜索,比如TRS主要做数据库搜索,但是95年互联网商业化的时候,没 有成熟的搜索技术所以很多网站在使用TRS技术,比如搜狐。

2000年以后百度诞生,百度是真正意义上提供商业化搜索引擎服务的公司,它有创新性的技术,这个技术就是通过在互联网里边网页之间连接的关系,来判断一个网页它主要说什么?除了网页自己内容之外,别人链接和链接上的文字也是非常重要的参数,仅仅因为这个技术,所以把整个搜索引擎体验提高到非常大的层次,这项技术百度采用的,同时代是Google。

百度如何在创新中崛起

在百度诞生的时候,商业模式是B2B,百度作为技术服务提供商,给别的互联网门户网站提供搜索的技术,也就是像新浪、搜狐、网易等搜索由百度提供的,百度是这些网站获得技术融合。因为百度技术非常领先,高了非常大的一块,仅仅半年时间80%市场份额垄断了,随即发现一个问题,因为门户数量有限的,所以百度收入也是有限的,即便在百度80%—90%市场份额的时候也不能做大,没有办法自己走到前台,搜索服务直接走到前台为用户提供服务,这是没有办法的选择,当时百度是逼出来的。也就是这一步非常重要的一步,产品因为直接面对消费者,所以必须要分析用户需求到底是什么?到底想要搜什么?商业模式也要革命,原来向门户网站搜索,现在必须想别的。当时百度经过讨论推出现在商业模式。现在都是很大的创新,百度走到前台之后,创新的问题一直存在,主要三个方面的创新。

一个技术创新,这个是搜索引擎的基础,我搜索的时候怎么准确找到用户想要的,这是非常挑战性的课题,牵扯的技术非常多,尤其在中国环境 下、互联网环境下有很多特点和其他国家不一样的,虽然Google在国外也能提供中文搜索引擎服务,但是并不了解真正中国互联网、内容特点、甚至用户需求。

一个“反作弊”,很多做恶意SCU网站拿低质量、垃圾信息在百度搜索很好的排名,用户查的时候其实上当了,这是非常重要的一个应用。

另外“去重”,当时有一个现象所谓SAP,SAP本来是内容提供商,但是在中国变成内容复制商,你要判断那些网站真正原创、那些是复制的,必须把这些剔除。中文检索和英文完全不一样,有很多问题,比如中文没有空格,你要理解它的语意,需要人为判断。

另外像“超链分析优化”都有上千万的接口,“服务体系结构”在海量数据、海量访问量情况下怎么启动稳定快速服务,这是空前的挑战。另外“电信运营上面的互联互通”的问题,比如中国电信、中国联通两个用户都要访问很快,怎么做?这些问题面临非常多,而且错综复杂,必须技术上做非常大的创新解决这些问题,所以技术创新是需求推动的。

恩格斯说“一个需求比100所大学更能推动创新”。所以总结下来讲,在搜索引擎全、准、新、快四个方面都要进行非常多的创新和技术研发。在产品方面,百度几乎成立之后每年都有一个重量级的产品推出来,比如2002年MP3音乐搜索,当时MP3搜索推出极大的满足用户对于免费音乐的需 求,所以在百度很早期的时候,网页的搜索量MP3小很多,很多人认识百度是从MP3搜索上认识的。比如2003年贴吧,当用户搜索一个关键词的时候,别人也会搜索同样的关键词,这些人一定有共同兴趣,百度作为这个关键词作为这个吧的吧名让大家在里边,实际就是BBS,这是由用户分,这个也是非常好的创新,把搜索本来是一个让搜多东西尽快离开的事情,变着有点社区性、大家可以留下来讨论的事情。

比如2005年好123,这个与中国国情有关系,中国很多人对互联网没有什么经验、不太使用的,像好123导航非常简单,下边就是网站 不需要搜索,只需要点就可以,所以好123产品非常有用的,直到今天也是非常有用的服务。再比如2005年知道,知道是网民去发问题,然后由其他人回答, 按道理来讲你有一个问题通过搜索引擎搜索可能获得答案,但是搜索出现很多噪音的问题,用户不知道在这里获得东西应该相信哪个?哪个是他的答案,知道是让知 道这个答案的人从信息海洋萃取出来,所以我是给知道有一个形象的比喻,知道实际由人做VIP,知道推出来反过来优化整个搜索引擎,这个也是非常好的创新。 另外06年的百科,百科关于知识,用户可以编辑共享最后让这个知识很完备。当然后来百度从产品也有很多创新,比如09年框计算也是非常好的产品创新,很多时候是找到信息,然后把信息落到另外网站上,变成我在搜索上边直接得到答案,不仅仅搜索信息、而是搜索答案,这是非常好的创新。

在商业模式创新上,用竞价排名表的方式,可能好多人觉得竞价排名有问题,实际有问题并不是竞价排名模式,搜索怎么变现的时候?当用户搜索有商业意味着词,实际用户表达非常强的需求,这个时候广告最有相关性的,所以转化率相当高,竞价排名解决一个关键的词怎么竞价?不同广告一定定市场合理的价位,当然竞价排名本身商业广告信息和搜索信息非常清楚区分开的。当然与商业模式相关的背后也有技术创新、产品创新,只不过技术创新我同样搜索流量怎么 赚更多的钱,其实这个技术非常重要。比如Google和雅虎都是同样搜索量,但是Google挣的钱多,这是技术。产品也是一样,这个产品面向广告主,比如效果营销分析怎么统计流量等。百度是2005年8月上市,从那个时间点以后,百度变成家喻户晓。

如何撼动百度地位

从这个来看创新是综合的,不是单一的创新,每个创新里边有的颠覆性、有些就是微创新。搜索里边还有一个垂直搜索崛起,百度是通用搜索,在垂直里边这几年也有很多创新,比如2004年去哪儿旅游搜索,专门搜机票、酒店。2007年爱帮网,是本地的搜索,我们是搜索与生活有关、与吃喝玩乐、 衣食住行这些场所的信息或者生活设施的信息,这样的信息商家的信息,帮助网民方便他的生活,进行消费创新的选择,我们只做生活搜索,别的都不做,所以可以把信息做的很深入,可以把原来平坦结构给网民一站式搜索服务。比如做商家搜索的时候,一次让你获得商家电话、地址、地图、消费者点评、是不是有优惠等这样 信息全部在网站结构化呈现,不需要到通用搜索里边,第一条是他的电话、第二条是他的地址,效率提高很多。尤其智能手机起来的时候,又加了一个地点纬度,所 以让在手机搜索这样事情变着更加体验,2010年一淘网也算是垂直搜索。

创新必须产品创新、技术创新、商业模式创新,我认为产品创新还是非常重要的,因为产品代表用户需求,其他都是为用户服务的。我想谈一下 中文搜索整个市场竞争,在中文搜索里边一直不缺乏竞争,比如最初百度和3721竞争,这个竞争是地址栏搜索和门户网站搜索竞争,这是用户习惯的争夺,这个 最终百度赢了。另外是Google中国和百度的竞争,实际这是一个同样一模一样竞争,只不过Google原来在国外应用的,后来开复进来之后在中国应用,Google和百度竞争实际从05年7月真正开始,服务的时候非常不好、性能也慢、而且不稳定,这场战争后来由Google退让香港为终结。还有一直 专门做搜索,比如04年搜狗、09年搜艘、今年360,未来还会有更多的。

我有一个观点,要捍动百度地位,如果用同样东西竞争的话基本没有戏,关键有用户体验不同,甚至用户体验大幅度提高,才能够打败。何况百度是垄断的,另外我个人认为同质化竞争没有出路,仅仅依靠渠道、仅仅依靠导航这些东西没有天花板,必须要有差异化,比如说像微软和Google竞争,Google一定不会做PC操作系统,它是做搜索、用搜索方式打败操作系统的方式。当然Facebook也不会用搜索的方式打败Google。诺基亚和苹果也是手机上的竞争,但是它完全颠覆这种模式,诺基亚比较封闭渠道很多,但是苹果提供更多的丰富应用获得用户,然后给他的手机产生价值。这些都是用非同类竞争才会有出路。差异化体验、差异化技术、差异化产品竞争才是关键。智能手机有很多在PC上边没有的特点,比如它可以做个性化、原来个性化提很长时 间,但是基于云端做个性化很难做,比如中国有做网吧没法做,但是手机不一样,手机是你自己,而且随时随地带着。另外移动和生活相关的信息才是真正需求,所以在移动里边做搜索,用户的需求、实用的场景、需要的技术都是不一样,当然商业模式也不一样,只有在这些方面进行差异化真正满足用户需求,最后才能成功。

======带个自私自利的小AD=========

欢迎向DoNews投递关于互联网业界的热点类、观点类、趣点类、分析类、爆料类稿件。地址:tougao@donews.com

转载请注明 DoNews著名作者/刘建国

Tags: ,,.

Welcome to DoNews Blog. This is your first post. Edit or delete it, then start blogging!