陈沛做客网易科技频道
主持人 说:因为是直播,所以视频地址还打不开,请大家先记下来,等聊天开始后再进入。
主持人 说:陈沛先生除了是一位非常优秀的程序员、总裁外还是一位业余的围棋高手。
主持人 说:他曾经编过一个五子棋的程序非常有名。
主持人 说:到时候我们会请陈沛先生为您一一解答。
主持人 说:各位网友大家好,陈沛先生已经来到网易公司直播室,聊天马上就要开始了。
主持人 说:各位网友大家好,我们视频的网址是rtsp://202.108.34.60:554/encoder/cp.rm,请大家注意在线收看。
主持人 说:好,我们的聊天马上就要开始了
主持人 说:各位网友下午好!今天是3月12日植树节,我们网易科技绿色新版推出之后,迎来了第一个栏目嘉宾,中国搜索总裁陈沛先生,在程序员栏目中,我们作为老程序员,陈沛先生将会讲述一下他的程序人生
主持人 说:欢迎陈沛先生为网友讲几句话。
主持人 说:网友朋友们,大家好,我是陈沛!
主持人 说:谢谢陈沛先生!陈总,您最近忙什么呢?
陈沛 说:基本上简单地说,我在忙事业。
主持人 说:中国搜索凝聚了您很多心血,从开始到现在,你花了多长时间,投入了多少人力和资金?
管理员 说:视频地址: rtsp://202.108.34.60:554/encoder/cp.rm
陈沛 说:这个实际上是很难计算的事情,实际上我做跟搜索有关的事情,大概是从1994年开始的
陈沛 说:我那时候早期研究是全文检索技术,主要是搜索技术,主要用于企业级服务。
陈沛 说:1995年我们做了一个产品,叫I设计,主要用于企业级的信息管理,从那个开始,实际上我就和搜索结下了不解之缘,很多的搜索技术有很多的相通的地方
陈沛 说:我们真正做搜索引擎是2001年进入高端的搜索引擎,算时间的话,大概应该是有十年之久,从1994年,1995年开始从事和搜索有关的内容。
陈沛 说:高端搜索引擎我们取得了一定的成绩,集中计算起来可能有三、四年的时间。
主持人 说:面对google,雅虎,百度这样的竞争对手,中国搜索在服务、产品、技术等方面有哪些对策呢?
陈沛 说:一个我们应该是非常尊重我们竞争对手,我们也认为他们非常的强大
陈沛 说:所以在你讲的几个方面,无论是产品、服务、还是技术方面我们有全面应对的准备。但是一定要特殊强调某一个方面的话,还真是公司的机密,我不能事先说出来
陈沛 说:否则他们可能就有准备了
主持人 说:在网上,我看到很多关于您的采访,在我的脑海里面有一句话“坚持再坚持”,这是您说的,对我来说,非常记忆犹新,你能解释一下吗?
陈沛 说:我想企业的运作,包括企业的成长是一个马拉松式的竞争,实际上很难说是一站获胜,某种意义上胜利属于最后能坚持住的人
陈沛 说:因为所有成功的企业和成功的人,实际上都不是一帆风顺的,有顺境有逆境,包括互联网也是这样的,我们看到了第一次高潮,也迎来了第二次高潮
陈沛 说:但是我们往往记住的是刚刚过去的互联网最低沉的时候,现在的互联网企业恰恰是能熬过冬天的企业,某种意义上,就是能在逆境中忍耐,是个人的品质,也是企业的精神
主持人 说:现在在圈外的朋友称呼你一个什么样的称呼呢?好象是“中国搜索第一人”,您对这样的称呼有什么样的看法和感受呢?
陈沛 说:这个称呼肯定首先是一种鞭策了,我记得好象是某一个媒体率先用这个题目做了一篇文章,以后就有这样的称呼。
陈沛 说:我觉得主要是鞭策了我,我也没有问他为什么起这样的名字,这样的称呼,肯定我们不是说我们做得最好,因为我们正在努力成为做得最好的人
陈沛 说:如果说做得时间长,我们特别比较过,中国做搜索引擎和相关技术的人很多,也许我做的时间是比较长的
管理员 说:土匪已经倍踢出!请各位网友注意个人的形象!注意文明!
陈沛 说:但是时间比较长的话,只能说明我进步的比较慢,这也许就变成了一种批评了,你做了这么长时间,做到现在做成这样
主持人 说:听说你10岁开始习武,你习了多长时间,对你少年时代的成长有多大的帮助?
陈沛 说:我确实有一段学习中国武术的经历,连续坚持了8年的时间,每天早上很早起来练功,有时候晚上还有一次
管理员 说:家在高老庄已经被剔除,请各位网友注意个人的形象!注意文明!
陈沛 说:我想最大的帮助,应该是培养了一种意志品质,一种坚韧不拔的意志品质。武术有时候是出于喜欢,有时候是一个兴趣
陈沛 说:但是你每天坚持做同一个动作,实际上是非常非常枯燥的事情,完全没有乐趣可言
陈沛 说:更多的时候是对意志的磨炼,特别是冬天,每天六、七点从被窝里爬出来,每天都要做,每次都是一个斗争,这应该算是一个收获
主持人 说:您第一次接触电脑是什么时候?
陈沛 说:我记不太清楚了,实际上我是浙大数学系的,我最早学的是数学,大学时候开始选修计算机的课程,走向计算机这条道路,大概是在18岁左右这样子,不是少年计算机天才
陈沛 说:因为像我们那个时候,更多的是受陈景润他们的影响,特别是哥德巴赫猜想影响着我们,学的数学
主持人 说:当时的心态呢?
管理员 说:-桃子- 重复发言被踢出,请大家保持文明的态度!注意个人修养!
陈沛 说:没有特别复杂的心态,那时候就是做课题或者是学习计算机语言的时候,去做一段代码,我相信不是一段特别好的代码
主持人 说:当时在接触电脑之前,您当时的心态和理想是什么?
陈沛 说:我后来走上计算机道路的话,有一本书对于我有很大的影响
陈沛 说:叫《IBM的奥秘》,这本书上有一句话,“计算机可以实现人类所有的梦想”,这句话给了我非常大的激励,使我对计算机本身充满了幻想
陈沛 说:事实证明,计算机也确实在不断实现这么一个理想。所以它能够让你在多少年从事一个行业,你不觉得厌倦,而依然能够保持一种激情
陈沛 说:我想这可能是计算机行业特定的一种优势,我很难想象,如果让我去学十几年的数学是否能保持持久的激情
陈沛 说:你们现在的目标是什么?打算多长时间完成这个目标?
陈沛 说:这个目标说了可能很多人听了不是特别高兴,我的近期目标是击败我的主要竞争对手,包括让更多的人使用中国搜索的搜索引擎,而不是google
陈沛 说:某种意义上,我个人是有一种民族情节的,大家从这个公司的名称可以看到,中国搜索是非常民族化的品牌
陈沛 说:某种意义上,我们把企业的品牌已经牺牲掉了。很多的企业,搜索,网易都有自己企业的名称,
陈沛 说:中国搜索是谁呢?实际上它把一个企业的品牌贡献给一个民族的品牌,这里面包含了我们对产品本身的期待
陈沛 说:我们真正是希望它成为中国人自己的搜索引擎,成为一块儿民族品牌
陈沛 说:这个也不是一天两天的,因为作为中国的一个程序员,我们看到了我们和别人信息产业上的差距,我们已经失去了很多的机会,包括在操作系统
陈沛 说:在大型数据库等很多领域,我们实际上无法和国外的同行进行竞争,我们的差距非常之大
陈沛 说:如果说幸运的话,还留下了少数几块领地,特别是和中文密切相关的领地,在模式识别,机器翻译,以及中文的检索方面
陈沛 说:使中国人有一点机会跟你的国际列强做一次竞争,我们希望我们能够把握这次机会。
主持人 说:您刚才也提到了您读书的时候,数学非常好,那您为什么没有朝数学方面发展,而是朝程序员方面发展呢?
陈沛 说:这是很自然的,我的同学有两部分人,一部分是学纯数学的,还有一部分全部转向计算机了
陈沛 说:我想我对计算机本身的兴趣超过对数学本身的兴趣。比较而言的话,我觉得数学太枯燥了,而计算机刚才我说了,让人始终充满激情。
主持人 说:您当时在程序方面的时候,最崇拜的程序员有吗?
陈沛 说:这很难说是一种崇拜,我喜欢的程序员,我喜欢的人是程序员出身的,包括像王志东等这些都是我很喜欢的,他们对我都产生一定的影响
主持人 说:年轻时候的程序员经验对您今后的发展起到了什么样的帮助?
陈沛 说:我从来没有总结过,程序员这种生活,对我有什么影响,如果要有或许的话,一定要有的话,也许会使你的逻辑思维更严谨一些
陈沛 说:但是这个我觉得不完全是来自于程序员,因为我自己学数学的,我的围棋也挺好的
陈沛 说:这使我具有非常严谨的逻辑思绪,我想程序员也会起到这样的作用。
管理员 说:今天的访谈记录将会在访谈结束后在网易科技体现,地址为,tech.163.com/2004w03/12489/2004w03_1079056813122.html
主持人 说:说到围棋,您的围棋是下得很好的,是业余几段?
陈沛 说:我是业余五段,拿过一次北京市业余围棋的冠军,那是过去的事情了,现在很长时间不下,水平也大不如前了
主持人 说:平常您安排你的业余时间是怎样的呢?
陈沛 说:平常我基本上没有太多的业余时间,我是一个工作狂,我所有的精力和兴趣集中在我工作上面
陈沛 说:另外时间的角度来说,我大部分的时间都不是我安排的,而常常是工作安排我的时间。
主持人 说:在1988年的时候,你编写了一个五子棋的程序,是不是对棋类的兴趣影响着?
陈沛 说:不是,我在北大进修人工智能,我喜欢这个程序,当时就尝试做一个驳议程序,因为这是最能体现人工智能技术的程序,我就去做
陈沛 说:当时老师说这个程序想象起来容易,做起来很难,我坚持去做了,而且做得很好
陈沛 说:我的程序当时可以和最好的人去下,水平非常接近现在的人类,是我当时最喜欢的一个程序,我认为很多的程序都不如那个程序写得好
陈沛 说:因为那个时候不仅使用了人工智能基本的驳议的方法,也引进了包括新的人工智能的一些知识库,专家系统的支持
陈沛 说:当时我认为那是我对人工智能充满想象的一段时间
管理员 说:屠夫网友好,你问的是“陈先生是中国搜索的总裁吗”,我回答您:是的
主持人 说:像五子棋跟中国搜索之间有没有关联呢?
陈沛 说:我想有非常重要的关联,实际上我是比较早介入人工智能领域的,我参加过第一届全国人工智能年会
陈沛 说:在人工智能界当时也是一个学习者现在看过来是比较早的介入这个领域,而且我个人对它非常有偏好,我喜欢
陈沛 说:我也是比较早的把人工智能技术引进到检索领域的人。我在1995年将自己做的全文检索的产品命名为智能设计,那时候我引进了人工智能知识库的概念和推理的概念
管理员 说:各位网友好,主持人问题结束之后,陈先生将回答各位网友提出的问题!
陈沛 说:去年我们推出了第三代智能搜索引擎,明确提出智能化是未来搜索引擎的方向,这和我个人人工智能的背景和经历是密切相关的
主持人 说:说到下棋和写程序,除了这两个兴趣,您还有别的兴趣吗?
陈沛 说:我兴趣非常广泛,我喜欢打桥牌,乒乓球,应该说打得都不错,自从喜欢上搜索引擎以后,我大部分的爱好都放弃了
主持人 说:您关注人工智能技术,是从什么时候开始的?
陈沛 说:大概是1987年,1988年这样的时间
主持人 说:在1998年的时候,您是在什么样的情况下发现的全文搜索和数据库无缝对接的技术,当时这个技术起到了什么样的价值?
陈沛 说:如果用宣传一点的口吻来说,它也是一个里程碑式的成绩,当时全文检索作为一个独立的内容管理系统和数据库系统在并存
陈沛 说:全文检索将非结构化数据有效的管理起来,但是我们会发现随着信息产业本身的发展,我们发现关系数据库里面会存在很多非结构化数据,包括很多的文本,图片,多媒体信息等等
陈沛 说:早期的这种关系数据库的体系结构的设计,不太支持非结构化设计
陈沛 说:而事实上也证明了当时的判断,现在在大型数据库上已经开始不断的支持非结构化的数据,包括支持文本的,图片,各种多媒体的等等
陈沛 说:用什么样的手段能够支持它的检索呢?那就是把全文检索技术引进到大型数据库里面来,但是大型数据库也具有中文全文检索这样的能力
陈沛 说:当时我就开始研究这个课题,并且去实施它,最早我跟IBM合作,实现了这个技术,真的是大型数据库里面能够非常有效的使用中文的全文检索技术,这在以前是完全没有的。
主持人 说:你能谈谈中国搜索以后的发展趋势吗?
陈沛 说:实际上我已经比较公开的表达了,我认为智能化是搜索引擎发展的一个主要的趋势
陈沛 说:因为从我对搜索引擎技术的了解,现有的这种搜索引擎技术很难实质性改善搜索引擎的结果,而现在搜索引擎能满足人们的基本应用
陈沛 说:但我们看来仍然有很多的不足,用户不一定能够非常快速的,简单的找到自己需要的内容,他需要从非常庞大的数据内容中挑选出自己的东西来
陈沛 说:我认为必须有人类的知识和技能参与到检索和排序中,才能使搜索引擎的质量有一个实质性的飞跃
陈沛 说:这就是我认为人工智能技术的广泛应用将是搜索引擎的结果有实质性的飞跃
主持人 说:说到实质性的飞跃,因为现在很多搜索引擎都开始赚钱了,比如百度,google,您发明的网络猪最近推出来了吧?你能不能介绍一下?
陈沛 说:我们刚刚推出网络猪的产品,这个名字比较有争议,这是我们个人信息门户的一个产品
陈沛 说:我们在这个产品里面诠释了我们对搜索的理解,我认为是一个非常非常重要的产品,而且我相信事后将证明
陈沛 说:网络猪这种现代搜索的方式将被仿效和追随。通过网络猪可以看到我们在搜索技术上新的理念,包括一种全新的理念
陈沛 说:很多人把搜索认为是一个输入框,打入关键词,搜索是这样的,我们认为不是
陈沛 说:因为搜索已经发生了非常重要的变化,搜索不是一个简单的查询,现在的高端搜索引擎的技术包括了从整个互联网的信息采集到筛选,到检索,甚至到定制,以及及时传播等等
陈沛 说:整个信息处理的流程,所以它已经超越了简单的检索的工具,这样搜索会有更多更丰富的表现形式
管理员 说:我们大约5分钟之后接受网友提问!谢谢大家支持!
陈沛 说:所以我个人认为,网络猪现在的产品,看起来不太像一个搜索,但是实际上体现的是新的搜索技术
主持人 说:您是程序员转型的典范,您认为八十年代至九十年代的程序员与现代的程序员之间的区别有什么吗?
陈沛 说:这个问题肯定超出了我自己的研究范围,我没有特别的去体会他们之间的这种差别
陈沛 说:如果说要有的话,也许以前的程序员更单纯一点,它更多的精力放在做程序上面,没有更多的想象
陈沛 说:而现在的程序员他们更有操作程序员本身的愿望,他的程序和他的商业模式密切相关,他可能很早就去做创业了
陈沛 说:现在他们可能刚刚出学校,就希望自己创一个公司,把自己的程序和商业模式结合起来,把个人的技术成长经历和人生成长经历更快的结合起来,也许这是一个比较大的差异
主持人 说:您认为现在的程序员应该具备哪些素质?您公司的优秀技术人员应该具备哪些素质?
陈沛 说:实际上我是希望技术人员先做一段技术的,即便你有很远大的抱负,想从事商业经营,想做其他的事情,或者是市场,或者是其他的行业
陈沛 说:但是先做一些技术,对你以后的生活依然是有很大帮助的,所不同的是,计算机专业的学生,刚出校门马上从事其他的行业,基本上没有太多的机会从事技术的领域了
陈沛 说:实际上在信息产业成长的过程当中,你会越来越感觉到技术的北京,包括对技术的理解和驾驭的能力,也会帮助你驾驭未来的高科技企业
陈沛 说:所以我希望大家有机会的话,可以在技术上多放一点时间。
主持人 说:从程序员到CEO你是转型比较成功的,能否谈谈中间的经过?
陈沛 说:我不是特别赞同这个说法,称为是一种转型,其实我也有一个观点,企业家其实不是培养出来和学习出来的
陈沛 说:我们学了各个学科,但是我们没有一个学校是专门培养企业家的,现在可能MBA,MBA培养一些专业化的管理技能和知识,但是也不是真正培养企业家的
陈沛 说:某种意义上,企业家必定来自于一个技术专家,来自于一个营销专家,或者是来自于另外的专家,他们早期都不是做企业管理的,由于某种原因最终走上了管理的岗位
陈沛 说:就像我讲国家主席和美国总统是不可能培养出来的,他必定来自于另外的领域,所以我认为它本身不是一个转型的过程,某种意义上是工作的分工和经历的过程,或者是在一段时间内的过程
陈沛 说:我认为它不是一个转型,是一个自然工作的延伸
主持人 说:您刚才说了年轻的程序员都想创业,创业的程序员要具备哪些条件和素质?
陈沛 说:因为关于创业的人才有很多方法来判断一个人是否适合创业,我个人的感觉,现在从一个创业的角度来说,或者是从一个企业家的角度来说,情商可能比智商更重要
陈沛 说:以前我们都知道智商是很重要的,当然了,企业家没有智商肯定是不行的,但是有智商不一定就行。情商主要表现在哪几个方面呢,一般叫勇气与决断力是第一个
陈沛 说:很多人智商很高人,他不下海没有机会成为企业家,因为他不能承担更多的风险,而企业家需要有承担风险的能力,这是一
陈沛 说:第二个,他有更好的人际沟通能力和表达能力,这使他能够成为一个企业家,因为一个企业家不仅仅要在某一个领域上做得比较出色,你要把很多不同的人团结和组织在一起,所以你必须具有人际沟通的能力和表达能力
陈沛 说:第三个大的方面没有一个企业是一帆风顺的,所以企业家具有忍耐与持久力。常常一个企业能够成功,是因为企业家坚持住了,而他的很多同伴或者员工常常坚持不住而离开了这个企业
陈沛 说:所以企业家要具有特别的忍耐和持久力,现在也有人把这种能力称为是逆商,这一点对于成为一个企业家是重要的
主持人 说:你能否谈谈关于程序员与老总之间的关系,他们有共同的地方吗?
陈沛 说:实际上我觉得如果做过程序员的老总,你去管理一个高科技的公司,特别是软件的公司,他有很多的优势
陈沛 说:因为你自己经历过你所有员工经历过的事情,你知道他们在怎么想,他们的能力主要集中在哪些方面,如何激发他们的潜能,某种意义上,你自己的献身经历会帮助你管理这个企业
陈沛 说:如果你管理完全不熟悉的人的话,实际上是增加了管理本身的难度,一个程序员跟老总什么关系,他成为老总的时候,他管理程序员的时候可能会更好一些
主持人 说:每个人成功的背后都要有一个故事或者是一个人,您的成功背后有什么呢?家庭与家人给予了你什么样的帮助?
陈沛 说:关于成功大家有不同的定义,不同的方法,我是比较喜欢爱因斯坦对于成功的定义,他成功一个是天赋,一个是勤奋,一个是机遇来决定一个人是否成功
陈沛 说:一个人的成功最主要是靠他自己,而不是靠别人。很多人可能在自己成功的时候,把他所有的功劳都归于别人,当然这是一个非常好的表达了,但是对于每一个成功首先取决于他自身
陈沛 说:从天赋的角度来说,我会感谢我的父母,我父亲是搞语言逻辑的,是社会科学家,是学文科的,也是教文科的,我母亲是学自然化学,是学理科的,他们使我掌握的知识更全面一些,知识结构角度来说,我相对更全面一些
陈沛 说:这是我主要的一个优势。如果说还有什么故事或者什么,不是某一个故事使一个人成功的,而是一个机遇,更多的是在一个过程中坚持不懈,坚定了信仰
陈沛 说:这可能是一个人成功最重要的观念,因为在别人都不自信的时候,你自信,你坚持,这确实是成功一个非常重要的故事
主持人 说:您的座右铭是什么?您的信仰是什么?能不能谈一谈?
陈沛 说:这个问题还是比较有挑战性。我自己本人现在还是中共党员,但是谈率地说,关于信仰的问题,我也不能说我有一个特别坚定的信仰,因为现在我们整个社会处在一个比较浮躁的环境
陈沛 说:多少人有坚定的信仰实际上是很难说的,这是一个关于信仰的问题。另外一个呢,座右铭的话,我现在还没有特别一生的座右铭,但是我喜欢几种人生的格言,在不同的时期,不同的阶段可以激励你
陈沛 说:我比较喜欢的实际上是“人贵有自知之明”这样一句话,主要是想让自己清醒地认识到自己的优势和劣势,让人在各种因素中发挥你的长处,回避你的短处,一个人要想成功,发扬优势比克服你的弱点可能更重要
主持人 说:最后问两个问题,你认为现在是成功吗?
陈沛 说:我想肯定不是,现在肯定不是一个成功,我充其量只能算是一个追求成功的人
主持人 说:您的发展方向是什么?
陈沛 说:我没有看得特别远,如果就近的角度来说,很公立的看的话,我希望我们公司中国搜索能成为国内最好的搜索引擎,被广泛使用,中国的民族品牌能和google,雅虎的竞争中获胜
陈沛 说:完成自己的民族心愿,是我近期的一个主要目标
陈沛 说:至于大的人生目标说真的,我现在也是迷糊的,我们现在的人生是不是成功的人生,健康的人生都不一定,如果可能的话,我希望有一天不去做非常压力巨大的商业竞争
陈沛 说:去做另外一件可能更轻松的事情,也许那也是一种很好的人生
主持人 说:您是一个老程序员,您希望孩子也继续是程序员吗?
陈沛 说:我从来没有想过这些事情,他的成长主要是适合他的道路,现在最起码我没有看出来。
主持人 说:好了,我的问题就到这里,下面是网友提问的时间。我这里有一个网友提问,他问很多程序员不喜欢微软,但又离不开微软,您个人对微软的看法是怎样的?
陈沛 说:我尊敬微软甚至崇拜微软,特别是作为一个程序员,或者是一个软件企业的老总,我对微软确实充满着敬意,他们能把软件做到这样的程度,真的是值得尊重的,这是一方面
陈沛 说:另外一方面,我也希望有新的软件的企业,能够进行竞争,某种意义上,微软的成功是给很多人的成功打上了阴影,所以我希望有抱负,有能力的企业,应该发起向微软的挑战
主持人 说:壁虎漫步:请问陈总,搜索引擎是以什么为利润点
陈沛 说:主要是通过付费排名的方式,通过付费在网上获得比较好的位置,这成为搜索引擎的主要收入
主持人 说:你是练什么拳?
陈沛 说:我有一个很好的老师叫蒋玉坤,也是杨臣浦(音)的地子,学过太极拳,没有学好,因为我的性子可能不适合学太温柔的拳
主持人 说:ysdn:你会不会忽略了家庭呢?是不是能做到兼顾?
陈沛 说:这其实是非常难的,对于中国这样一个快速成长的国家,很难做到兼顾
陈沛 说:铸锭有一些人要牺牲掉某一些东西,如果要唱一个高调,中国有一代人会被牺牲掉,就像日本战后一样,他们将付出自己很多,但是他们会为他们的后人带来一个非常好的环境和发展的空间
主持人 说:coco:此次贵公司推出的网络猪,是否是有计划的把网络猪可爱的形象出现,并商业化呢?
陈沛 说:应该是的,网络猪实际上是非常非常有计划的,网络猪可以说是我多年的理想,其实我一直希望有这样一个软件,能够替代现在的搜索,有更好的搜索方式
陈沛 说:因为网络猪体现了无处不在搜索,个性化的定制,展现的都是各种各样新的理念,使我很长时间,四、五年的时间所追求的理想和目标,所以说它是一个理想的实现,同时也一个理想的开始
主持人 说:微分倒戈:中国搜索在搜索里面排行第几?
陈沛 说:中国搜索是一个新的品牌,我们在去年12月独立成为中国搜索,所以说我们是一个新的品牌,很多人可能不太了解我们,至于排位,不适合我来说,而是应该通过第三方。
主持人 说:仰光:政府为什么会和你合作,这里有什么动机?
陈沛 说:这涉及到互联网新闻中心对中国搜索的投资,因为我们跟互联网新闻中心有一个长期的合作关系,我们从2000年就开始了这样的合作
陈沛 说:所以有长期的信任与合作的关系。另外我也相信,政府也希望真正有一个自己的民族的搜索引擎,能够和别人进行抗争
陈沛 说:所以我想应该是体现这两点,一个是长期信任合作的关系,另外希望有一个真正的民族搜索引擎
主持人 说:网友问:可以说说目前中国搜索在目前的市场丁薇上是国内还是国外呢?若是国外,与google,雅虎等这样的对手有何优势呢?
陈沛 说:我们这几年的目标是立足于国内,我也说过我们要超越google的话,可能很多人没有听全我的话,对google充满了这样的崇拜
陈沛 说:我认为google虽然是全球最好的搜索引擎公司,但是我们依然有信心在中文搜索中超过它。为什么我们有这样的信心?主要是在于两点
陈沛 说:第一个,我们对于中文的理解,包括中文技术的理解和应用,可能会超过google,因为google在全球支持27种语言,没有所有的精力都放在中文上
陈沛 说:第二个是更重要的,我们对中文搜索本身的理想和激情,使我们更专注于中文搜索,这种持久的专注是支撑我们最主要的武器
陈沛 说:我们在中文上的投入远远超过google上的投入,所以我们超过它只是时间上的问题。我个人认为,我们和百度实际上现在在中文搜索上,可能已经超过了google
主持人 说:网友问:现在您对您的个人事业有没有更高的要求?
陈沛 说:我现在没有更高的要求,因为我现在有非常大的压力,因为我们的竞争对手都很强大,我不断的从他们那里学很多的东西,我相信他们也会从我们这里学到很多东西
陈沛 说:我们对自己公司的丁薇是这样的,公司2004年对于我们是非常重要的一点,我们说要么我们就脱颖而出,成为互联网的领导者,要么就昙花一现成为互联网的又一个过客,所以我们有非常大的压力
主持人 说:网友问:中国搜索和慧聪国际有什么关联?
陈沛 说:慧聪国际是中国搜索的大股东,有股份合作的关系。
主持人 说:网友问:你个人什么时候开始搞网络管理的?
陈沛 说:实际上我是1995年下海的,自己成立了一个很小的公司,虽然只有几个人,但是那时候也可以说开始了管理。以前我也当过组长之类的,但是那可能是早期的管理。
主持人 说:您认为一个人成功很注重学历吗?
陈沛 说:我觉得不是,我觉得主要是能力。一个人的能力决定你这个人是否可以成功,至于学历的话,学历是能力中的参照而已
陈沛 说:而且我们也知道彼尔盖茨大学没有读完,就开始创业,有了今天的读书,包括戴尔都是没有读完。
主持人 说:感谢各位网友的参与,今天的访问到此结束!期待大家继续关注网易科技,关心《在线程序员》,再次感谢!
阿葱和他的好哇!网上导航http://www.howow.net

Google PageRank排名新算法一
原著:Dan Thies
编译:Karen
第一部分: 最新消息! Google的主要变化
Google的主要变化始于2003年11月的16号,从那时候起,网上论坛就开始对此议论纷纷并产生了形形色色的推测。这种更新对一些人是坏消息,而对另外一些人却是好消息(不过大多数猜测都来自于那些认为这是坏消息的人)。Google对其变化只字不提,当然我们也别指望它会说点什么。因此,这篇文章代表了我个人的部分推测,希望它至少为读者您提供了一些“较为可靠的推测”。
除了在对搜索结果的排名方式上有一些显著变化外,Google在搜索结果的格式上亦有一些根本的改变,在我看来,这些变化在极大程度上展示了Google的整体发展方向。
我首先会回顾Google最近的变化,然后提出我对Google新策略的一些探索,并对一些不好的传言进行澄清。最后为如何在“新”Google中取得成功献上我的个人建议,供大家参考。
1-1. 总观Google新变化
现在,Google确定无疑是在进行一些新的及与以往完全不同的改变,并使得如此多查询条件受到影响,使它们的搜索结果与以往完全不同。让我们在深入挖掘其“巨大变化”之前,先来看看并未引起人们太多关注的一些较小的变化(如下所示)。于用户而言,这些小变化加起来产生了许多新的特性
1-1-1.关键词词干法(Keyword Stemming)
Google的另外一个变化是开始采用词干法进行搜索服务。换言之,如果在搜索框中键入“dietary”,那么也会得到一些基于“diet”的搜索结果。关于这一点还是请大家看看Google的解释--“Google目前使用了词根还原技术”。也就是说,它不再拘泥搜索与输入查询完全相同的词语,亦会向用户提供与部分或所有查询词语相近的搜索结果。例如,对于查询词语“pet lemur dietary needs”,Google也会显示“pet lemur diet needs”及其它词性变化形式的搜索结果。而且对于搜索结果页上出现的查询词本身及其不同的变化形式,Google会以粗体突出表示。”
实际上词干法的介入已有一段时间了,只是在此之前我们没法确定它到底是属于玩票还是试验性质的,不过现在看来,Google已在其搜索技术中正式引入了词干法。
1-1-2. 信息第一位了吗
在“新”Google的搜索结果中,我们很多人注意到的第一件事情就是,即使用纯粹商业性质的词语进行查询时,位于页首的却往往并非一些相关的商业性站点,而是被大量含有“信息”和“资源”的性质的页面所占据。但我却并不认为它必然地说明了Google对商业站点存在着偏见。
我反而觉得,Google目前的搜索结果的变化揭示出一些原来排名很好的网站的“真实面目”,它们虽然赚取了较高的页面级别,但却只是徒有虚名,本身并没有提供什么有份量的网站内容。而且在过去,一个网站要想排名在前十位并非什么难事,只要对页面进行优化,获取足够的外部链接数量(不管这些链接是否具有同一主题甚至是否相关),然后您再瞧––排名效果立竿见影。
如果一个网站本身的内容就很少,而且相关的外部链接又少,并且所有外部链接都是通过链接交换而得到的,这种网站的排名在Google这次的更新中往往首当其冲受到显著的影响。Google的新算法似乎对那些含有大量实用内容的主题性站点极其有利,用户喜欢的也是这样的站点。
1-1-3. 随时调整排名算法
自从去年11月15号以来,Google始终在对排名算法进行调整,有很多原来排名大幅下降的网站现在不但恢复了排名,而且位置较以往有了显著的提升。我们可以期待,Google会坚持不懈地对算法进行调整和改变来提高搜索结果的质量。
1-2. Google的发展战略
倘若搜索引擎能够理解用户的查询本意,那么向用户提供高质量的搜索结果也并非难事。但是,当用户键入“DVD PLAYER”这几个字时,你知道他到底想要什么吗?是想买DVD播放机呢,还是想知道怎么把DVD和电视相联?是想看关于DVD播放软件方面的评论呢,还是要找能够在计算机上播放DVD的软件?
Google的发展战略与其它搜索门户网站不同,其目标是向不同类型的搜索用户提供不同的搜索服务类型。“新”Google的一个有趣之处是在其主要搜索结果中开始揉合使用其它搜索工具。
《搜索引擎观察》杂志的资深编辑丹尼-苏利文(Danny Sullivan)发明了一个叫“invisible tabs”的术语,用来描述搜索引擎可能会怎样来试图提供更贴近用户本意的搜索结果。
他认为:搜索引擎(例如Google)已然能够使用多种资源(象Google就提供了网页、目录、网上论坛、新闻、在线购物、图书搜索等多种服务形式),这些资源信息将被引入搜索引擎的主要搜索结果。
1-2-1. Google的商品购物搜索引擎Froogle
2002年12月,Google推出了商品购物搜索引擎Froogle测试版。用户登陆froogle.google.com后即可在网上找到想购物的网站,然后可以比较世界各地同类产品的价格。
此外,在用户进行普通查询时,若查询术语与商业相关,则Google将从Froogle获得相关商品信息,并将其展现在普通搜索结果的顶端。
对网上购物站点来说,Froogle实在是个不错的选择。不但免费收录你的网站,提交步骤亦相当简单。
1-2-2. Google的目录搜索服务
Google Directory依据的是网上最大的人工编辑网络目录DMOZ,再结合Google的“网页级别”技术,让网页根据重要性来排列,并通过网页列表前的绿色横线长度来标明网页的重要程度。
在Google提供的普通搜索结果中,若一个网页已被DMOZ收录,则Google会列出该网页在DMOZ中的描述及相应的目录信息。此外,在普通搜索结果页的最上方位置,大家也可以看到与查询条件相符合的目录链接。
Google的目录搜索服务可满足那些想要浏览某特定主题下相关信息的用户。如果你的网站还未被DMOZ收录,那就赶紧行动吧。
如果你还在质疑目录列表对网站的重要性,我建议你去读一读Google搜索小贴士上的最后一段: “当无法确定查询条件时,我们推荐用户使用Google网页目录。它可有效限定搜索范围,不会向用户显示其它类似但无关的网页。例如,若在“天文学”目录下查找“土星”,则返回关于土星的信息。而在汽车目录下搜索“土星”时,则返回通用公司“土星车”方面的信息资讯。当搜索范围涵盖太广时,使用目录服务可有效缩小搜索范围。”
Google欲自用户处了解他们想在目录下查找什么样的信息。等我讲到“主题性页面级别”的时候,你就可以明白,Google是怎样来提供与目录主题匹配的搜索结果的。
1-2-3. Google的新闻搜索服务
Google新闻保留了三十天内所发生的较有价值的报道和头条新闻,用户可使用其新闻搜索系统查找当前事件的新闻。新闻报道依照发布日期,相关报道数量和新闻来源的受欢迎程度进行排序。
在一般性搜索中,我们可以看到搜索结果页顶端的部分新闻搜索结果,当用户进行一般性查询时亦可看到相关的新闻内容。
目前尚为测试版的Google News与其它搜索服务稍有不同,其新闻来源并不仅限于象“纽约时报”这样的大型传媒。目前Google新闻搜索服务已有4,500家传媒来源。尽管其它大型ICP网站也提供了重要新闻网站的链接,但在涵盖面和消息来源上往往不如Google。
1-2-4 Google的图书检索服务
继亚马逊网站之后,Google也推出了其测试版图书搜索服务Google Print。用户可找到图书的简要节选,评论及作者简介等,甚至可能找到图书的外观照片。搜索结果中还提供了在哪里可以买到这本书的相关链接以及Google的相关广告。Google一直都在探索如何进一步提高搜索服务的水平,这次推出的图书搜索服务的测试正是该公司不断改进搜索服务努力的一部分。目前该项服务所提供的印刷图书数量仍十分有限,不过Google这个搜索巨人是不会让我们失望的,让我们拭目以待吧。
1-2-5. Google会推出更多搜索服务吗?
Google不断地推出新的搜索服务,其目的无外为用户提供更好的搜索体验。这不但对用户来说是个好消息,因为他们可以更加便捷地找到自己所需的信息,而且对网站也是好事情。可能不久以后网站就只需针对目标群体来有的放矢,而无须在日益庞大的搜索结果中喊破嗓子来招揽生意了。 |
Google PageRank排名新算法二
原著:Dan Thies
编译:Karen
第二部分: 探索Google PageRank新算法
2-1. Google的主题性趋向
2-1-1. 关于页面级别(PageRank)及Google的旧算法出现问题的原因
页面级别(PageRank)计算系统所遵循的思路是:通过一个经由互联网的“随机运动”来告诉你哪些站点是最重要的。该系统模拟的是一个随机冲浪者跟进点击某页面上的随机链接,至最深层页面时按“返回”按钮这一过程。页面的等级越高,则随机网络冲浪者发现它的机率亦越高。
这种思路其实相当富有创意。一个网页的外部链接越多,则对任意网络冲浪者来说,发现它的机会也就越大。同时,在页面级别算法系统中,页面越流行,则其导入链接就越能从链接中受益—这是由于任意网络冲浪者发现这些链接的机会就越大。
在特定领域的研究论文查询方面,页面级别系统几乎无可挑剔。例如,如果用户查询关于素粒子物理学研究方面的论文(或网页)文献集,则对于一个给定条件的查询,页面级别的算法可以很快告诉你,哪些论文才是与该特定查询条件最相关及最重要的论文,其原因就在于这些论文较其它论文的引用次数要多。
若互联网上的资源具有同一主题性,那么这种工作可说是尽善尽美了。但正如我们所知道的,互联网上的资源涵盖了上百万甚至更多的主题,而且在人们的实际生活中,查询用户所寻找的往往是一些具有特定主题的信息。所以虽然页面级别系统考虑了所有链接,但却忽视了链接页面的主题性。
Google已试图将链接的文本内容计入排名算法来克服这一局限性。但精明的搜索引擎营销商却通过在网络上到处建立充盈关键词的链接来欺骗Google的排名算法。一种新的作坊式行业也随着PageRank应运而生—即有偿交换和交易一些来自较高“页面级别”页的链接。
如果网站能够从毫不相关的站点购买或交易导入链接而使网站排名得到提升的话,那么页面级别技术已然无法为绝大多数查询条件提供高质量的搜索结果了。我们有理由相信,当Google这个世界最顶级的搜索引擎一旦发现其搜索结果的质量开始恶化时,它是不会坐视不管的。
2-1-2. 新技术闪亮登场:主题性页面级别技术(Topic-Sensitive PageRank)
2002年,斯坦福大学的一名博士生塔赫尔。哈维利瓦拉(Taher H. Haveliwala)发表了一篇非常有意思的论文,名为“Topic-Sensitive PageRank(主题性页面级别计算系统)”。而更加有趣的是,一年之后哈维利瓦拉成了Google的一份子。
“主题性页面级别计算系统”通过对随机查询用户的随机运动增加一个“偏差”来处理基本的页面级别计算系统所存在的问题。这个新的随机查询用户具有明确的查询目的,并更感兴趣于跟进那些具有某个特定主题的相关网页上的相关链接。这是一个相对而言较为新颖的思路,它解决了搜索结果的质量性方面的一系列关键性问题。
毫无疑问,哈维利瓦拉将成为搜索引擎业界中一个举足轻重的角色。他已经在搜索技术的其它领域方面进行了一些实质性的研究工作,包括如何更有效计算页面级别方面的一些比较有趣的研究。
在最初的研究论文中,哈维利瓦拉描述了他是如何利用斯坦福大学的网络数据库,对应于ODP(开放目录)的16个顶级目录的16个主题来计算“主题性”页面级别得分。虽然该研究的主题和数据数量(8千万个网页)十分有限,但能够看出这种新系统可改善搜索结果,且具备对查询用户感兴趣于何种主题的理解能力。
就在去年,当我回过头来再阅读这篇论文时,我注意到哈维利瓦拉所描述的这种系统对搜索引擎来说还存在着两个问题。不过下面我们将会看到,这两个问题现在都能得到妥善解决了。
第一个问题是充分拓展主题的数量。要想改善搜索结果,16个主题自然是远远不够的。但由于Google的页面级别计算系统的代价非常之高,因而除非新系统能够提供一些改进的措施,否则Google不大可能实施这个新系统。但随着这一领域在过去的一年中的深远发展,因而我相信现在在主题数量上已不是大问题了。
第二个问题就是如何决定一个查询条件可能对应的主题–- 当用户输入诸如“自行车”一类的查询条件时,这个用户是想买自行车呢,还是想骑自行车旅游呢?下面我将为大家简单阐述一下Google可能会怎样匹配一给定查询条件以最恰当的主题,以及为什么一些查询条件更容易受到影响的原因。
2-1-3. 关于Applied Semantics公司及其专利技术CIRCA
Applied Semantics网络广告软件公司是互联网广告方面的专家,于2003年4月份被Google收购。Google此举旨在加强搜索和广告功能。如今该公司的技术已对Google产生了深远的影响。例如在Google的Adwords关键词广告系统中,为PPC广告客户提供基于内容的广告就是采用了Applied Semantics的AdSense技术。
事实上Google在这次收购中获利的还不止AdSense技术,AdSense的后台技术其实就是Applied Semantics公司所拥有的专利技术CIRCA。
CIRCA技术所基于的是一个独立语言并具有高度扩展性的本体论,这个本体论中包含了上百万词语,词语含义及这些词语与其它自然语言中的词语之间的概念性关系。由复杂的搜索技术所支持的本体论是对词语的多样性含义的概念性理解的基础,它能够使计算机对信息进行更加有效的管理和检索,从而为搜索用户更好的提供探索知识的机会。
CIRCA技术的作用就在于它可以确定对特定词语或短语的相关概念。该技术目前被用来从众多内容中为广告客户提供相关广告服务,亦可应用于Google的关键词词根还原系统。
尤其值得一提的是:CIRCA能够计算“短语A”对“概念B”的相关程度。例如,如果用户查询“Colorado bicycle trips”,CIRCA能够将其与“Colorado”地域,“骑车”,“旅游”等主题概念性地联系起来。这意味着它们能够计算其数据库中不同的概念与用户查询条件之间的“距离”。这一点十分重要。
2-1-4. 二者的有机结合:主题性搜索引擎的实现
现在我们对主题性页面级别和CIRCA都有了一定的了解,那么接下来的问题就是:这二者之间是如何有机联系的?换言之,Google如何结合这些技术来产生一个更好的搜索引擎呢?
首先,让我们来设想一下:假如对于大量的(上百直至上千个)主题或概念,Google已然解决了如何计算其主题性页面级别的问题。
在Google过去所使用的页面级别系统中,计算结果的精准性是相当重要的。但随着主题性算法的发展,不久我们就可能看到,也许速度快而且效果良好的近似计算结果才是他们所需要的。从上述论文中我们不难看出这一点已然颇具可行性。
现在,如果用户再查询的话,则查询条件中的词语将至少与CIRCA数据库中若干主题紧密匹配。Google完全能够基于用户所使用的查询条件及数据库中所包含的主题之间的“距离”来提供“主题性页面级别”得分,从而向用户提供更好的搜索结果。查询与主题的关系越密切,则主题性页面级别得分效果越佳。
由于一个给定的搜索查询条件有可能与数据库中的多个主题匹配,所以页面级别计算中出现的任何小错误都将由影响该查询条件的多个主题性页面级别得分平摊,因而只需近似的主题性页面级别得分就足以提供高质量的搜索结果了。
当数据库中无任何主题与用户的查询条件匹配时,则Google可使用原来的页面级别系统。若与查询条件匹配的主题太多,则仍使用新系统计算主题性页面级别得分,尽管新算法可能会与原算法得出的分数相似。如果匹配主题与查询条件之间的相关度很低,则效果亦会大打折扣。
2-1-5. 安然接受和理解算法的改变
可能某些查询条件返回的搜索结果有较大的变动-–但原来在搜索结果中排名在前100位的网页全都被刷下去的情形却少之又少。
有效数据所面临的一个大问题在于:对于发生搜索结果改变较大的报告呈上升趋势。从这些“自述”数据之中我们可以看到Google的很多搜索结果发生了彻底的改变。而造成我们看到这种局面的原因恰好在于,这些“自述”数据中的绝大部分都是由那些排名被刷下来的网站提供的。
我们并未从这些“自述”变化着手,而是采用了另外一种途径,即从若干可用的网上资源中记录下最近时间内发生的搜索,然后观察搜索结果中的变化。
我们随机(没有任何成见地)研究了上百个人们日常使用的真实存在的查询条件,并标识出其中每个查询条件的改变总数,然后我们发现改变的程度在总体上仍保持着一贯的干净局面。在实际生活中,这种根本性的改变只是发生的例外,把它当成规则就大错特错了。
2-1-6. 主题并非关键词... 亦并非十全十美
千万不要把“主题”和“关键词”相混淆。主题代表的是一个综合性题目,例如“计算处理”、“网络营销”等等。而特定的查询条件(关键词),如“笔记本电脑租赁”,“电子邮件营销”等,将与更多的综合性主题联系起来。
但从Google目前所提供的一些搜索结果来看,不难发现其中的部分搜索结果所匹配的主题是错误的。例如对”laptop rental”,用户搜索“笔记本租赁”往往是想租赁一台笔记本电脑,但在Google返回的搜索结果中,排在前面的却是大学里面的笔记本租赁信息-- www.google.com/search?sourceid=navclient&q=laptop+rental。
这是怎么回事呢?只要看看链接到这些网页上的链接,就可以发现这些链接大都具有相似的主题性,如Computing,Housing(学生在校园里出租住处),等等。大家可以用其它词语进行查询,然后分析排名靠前的那些页面上的外部链接,就会更容易理解为什么“laptop rentals”会有如此的搜索结果了。
Google仍有可能提供不够理想的搜索结果,当然也有可能再次受到蒙骗,只是这种机率越来越小而已。同时我们相信Google会多花一些时间来修正这些问题。
2-1-7. 为什么只有部分搜索结果页发生了根本的改变?
我们不必理会那些对Google新算法的非议,只要再来看看真实的数据,你就不难理解为什么有些查询条件较其它查询条件更易受到影响。
我们以“Real Estate”为例,依照Scroogle.org的方法论,有77个原来排名在前100位的网页排名降到了100名之后。而对于更为具体的查询条件“Colorado Real Estate”,有24个排名在前100名的网站受到了影响。
而在那些被刷下来的网页中,我第一个看到的是一个标题为“Southern California Real Estate”的页面。有趣的是,倘若用“Southern California Real Estate”进行更具体的查询,你会发现它排名高踞第二位。换言之,这些网页并不是受到了Google的处罚,而只是由于缺乏对查询条件的相关主题性而使排名掉下来罢了。
也有极少数竞争性很强的查询关键词对搜索结果的排名没有造成什么影响。这种现象已被用作对Google排名算法的各种猜测的正确性与否的一个依据。但我认为对这种现象的解释其实也很简单--以“search engine optimization”为例,在返回的搜索结果中,前30个网页列表几乎没什么变化。如果对排在榜首的页面进行分析的话,就可以发现这些网页上的外部链接都具有良好的相关性,这样的网页在一个主题性页面级别的计算系统下也会做的很好。
可能Google采用的新算法与我的猜测大相径庭,不过目前为止我尚未发现比这更好的猜测。不过这些并不重要,我们只要清楚一点:不管Google怎么改变它的算法,成功的秘诀其实相当简单--胜出的往往是那些拥有大量内容和大量相关链接(包括导入链接和导出链接)的站点。而那些使用门页(Doorway Page)和链接交换的网站就不会再这么好运气了。
Google PageRank排名新算法三
原著:Dan Thies 编译:Karen
第三部分: 如何在Google新算法中拔得头筹
如何应对Google的新算法?大家可以根据下面所列的一些要点采取相应的措施。
3-1. 关键词的研究:扩大覆盖面
搜索引擎策略的中心思想是确定恰当的关键词来锁定目标群体。但有很多网站管理员却在这一步上掉以轻心,只在屈指可数的几个平平常常的关键词身上铆足了劲,却不知这种策略失之偏颇。关键词研究的主要目标应该是确定目标群体所有可能使用的关键词,其中包括了品牌名称、地理位置及修饰语等“修饰成分”。
尽管对网站的每个页面只能围绕两到三个关键词进行关键词优化,但通过关键词和修饰成分的有机结合,亦可大幅提高网站对搜索结果的覆盖率。对于Google在去年11月15号所做的更新,有很多实施了有效关键词策略的网站管理员压根就没有注意到。原因很简单:他们锁定的是所有可能相关的关键词,覆盖面极广,所以虽然个别一般性的关键词的排名下降了,但网站的整体访问量并未受到什么影响。
若只针对少数关键词,而且这些关键词都有很好的排名,这种策略看起来似乎也蛮不错。可是一旦搜索引擎改变了排名算法,就象Google这次一样,这种缺乏灵活性的策略可就撞上南墙了--正确的做法是锁定所有可能相关的关键词,扩大对搜索结果的涵盖面,给自己的搜索引擎策略打下一个坚实的基础。
3-2. 网站结构的有效性
为保证“广泛的关键词”策略的有效性,网站需要进行组织,让搜索引擎可以顺利地遍历或检索网站内的所有网页。为了更好的理解这一点,让我们先来看看搜索引擎的Spiders是如何遍历网站的。
在对网站的第一次造访中,Spider首先会取得一个叫做Robots.txt的文件来决定是否允许它检索。
当Spiders从另外一个站点发现你网站的链接时,若Robots.txt文件里并未声明不允许它访问该页面,则Spiders会把这个页面保存下来。它不一定就是主页,也可能是你网站的其它页面。
Spider在对这一页进行检索时,它会从中摘录一些关于内容方面的信息和页面上的所有链接,并将其放入搜索引擎的数据库里面。如果它所认为你的网站十分重要,它稍后会检索这些链接页面。
如果你在网站的每个页面上都放了一组指向网站主要部分的链接(网站全局导航链接),那么接下来这些链接页极有可能得到Spider的检索。假设网站上的每个页面上都依次放有指向网站主要内容的链接,那么搜索引擎要想遍历整个网站真是易如反掌。
因而,最有效的网站结构当属自顶而下(Top-Down)或金字塔型设计结构。规模较大的网站(至少十几页)应设立一个网站地图页,用以列出网站的所有内部链接页。SUN微电子公司的网上大师级人物杰可布.尼尔森(Jakob Nielsen)认为:一个网站设计的精良与否的一个重要标志就是是否有网站地图。
许多人对文本链接方式的网站导航持排斥态度(可能因为它不那么漂亮吧),而是热衷于Flash或动态网页(DHTML)形式的菜单。使用这种导航方式的人要当心了,因为搜索引擎目前尚无法很好地支持这种导航系统。不过别担心,只需将文本导航链接放到网页的最下方,这样既保持了你喜欢的网站风格,又向搜索引擎提供了更对它们口味的东西,可谓皆大欢喜。
内容清楚的文字性链接不但可使你的网站很容易得到Spiders的检索,而且对我们这些真实的访问者来说亦一目了然。做文字链接时需注意一个问题:尽量让网站的内容只需最多两三次点击就可以打开,可创建一个网站地图把这些链接放到一起。
3-3. 创建大量优化网站内容
网站的结构就象一个框架。我们已经知道了如何构建一个友好的网站结构,接下来该向结构中填加内容了。
先记住完成步骤一(3-1)后找到的所有相关关键词以及相应的修饰语,现在我们可以在每一页的内容上,在下面几个地方放上相关的主要关键词,并予以恰当的修饰:
1. 网页的
搜索引擎的十大秘密
在所有网络推广的方法中,搜索引擎是大家谈论最多的,我们的推广之旅也将从这里开始。 确实,搜索引擎是网络推广的一个非常强大的武器,而且免费——但是我们首先必须了解它们。
我们要了解它们是如何工作、如何分类、如何查询……的,而且搜索引擎就像人一样各不相同,所以对于特别重要的引擎,我们还需要了解它们的个性。
1、两个最基本的词汇:搜索引擎(SearchEngine):通过运行一个软件,该软件在网络上通过各种链接,自动获得大量站点页面的信息,并按照一定规则进行归类整理,从而形成数据库,以备查询。这样的站点(获得信息==>整理建立数据库==>提供查询)我们就称之为“搜索引擎”。而所使用的软件一般叫做“Spider”、“crawlers”等。分类目录(Directory):通过“人工方式”将站点进行分类而建立数据库,以提供查询,这样的站点叫着“分类目录”。典型的搜索引擎如AltaVista、Excite、HotBot、Inktomi等,而最重要的分类目录就是Yahoo。
实际上无论“搜索引擎”还是“分类目录”,目标都一样:获得网站资料,建立数据库提供查询。只不过使用的方法不同。
“搜索引擎”因为依靠软件自动进行,因此,其数据库的容量非常庞大,但是伴随着查询结果往往不够精确;而“分类目录”由于依靠人工分类,查询得到的信息要准确些,但收集的内容非常有限。
我们平时把这两类统称为“搜索引擎”,在下面的讨论中我们将以“自动”的搜索引擎为主,至于“人工”的如Yahoo,我将会在“中文Yahoo”中单独讨论。
2、主要的搜索引擎:
七个最主要的搜索引擎及各自包括的页面数:引擎AltaVistaNorthernLightInktomiExciteLycosInfoseekWebCrawler页面数(百万页)1501251105550452(以上数据为1999年2月1日统计值)
3、搜索引擎工作的三步:
第一步是“Spider”软件访问一个站点,并通过其中的链接阅读该站点的页面,而且“Spider”会不时的自动回访该站点以检查变化情况;该“Spider”获得的站点信息形成一个巨大的网络信息库,如同整个网络上已经访问站点的备份,当然记录的不是所有的内容。这也就是我们所说的数据库。第三步是查询服务。这是通过查询软件实现的,当你输入查询内容,该软件就会在其数据库中找到相关内容,然后按照“它的”规则进行排序。
4、搜索引擎在查询时是如何排名的:最主要是根据一个站点的内容与查询词的关联程度,但是一个站点的内容搜索引擎又是如何确定的呢?——标题(Title)、关键词(Keywords)、描述(Description)、页面开始部分的内容以及这些内容本身之间的关联程度。而且现在绝大部分搜索引擎都支持MetaTag。
另一个主要因素是一个站点在整个网络上的关联程度,也就是说一个站点在网络中其他站点出现的次数(LinkPopularity)。
虽然不同的搜索引擎有各自的“游戏规则”,但是请记住“关联程度”这个词,包括站内和站外的(整个网络)。
http://www.google8.net/archives/000049.html
阿葱和他的好哇!网上导航 http://www.howow.net
如何在搜寻结果名中名列前茅
想象自己完成设计一个世界上最棒的吉他网站。这个网站有交互式的界面,有各式吉他从屏幕前飘过。网站里有你收集了一百多种吉他名琴的详细介绍资料,也有一系列最完整的吉他曲谱、技巧,甚至和旋/即兴乐里。你也已经用不同的操作系统,不同的浏览器完成测试你的网站。 为了昭告世人这个网站的诞生,你在几个著名的搜寻引擎站上也注册过了。终于,你可以松口气,坐下来等着大量吉他迷涌入你的网站。但是,事情真有这么简单?试试上 Openfind 搜寻关键词「吉他」,你会得到几百个相关网站,而且你的网站还不在列表的前十名,而且连前五十名都排不进去。到底哪里出错了?
关于这个问题,CNET 帮你向Danny Sullivan请教。Sullivan是Search Engine Watch(英文网站)网站的创始人。这个网站是网络上最具代表性的搜寻引擎信息来源。在接下来的问与答里,他将先跟大家分享关于搜寻引擎的秘密。
问:搜寻引擎是如何决定相关网站间的排名?
答:这取决与于很多因素。一般来说,要让一个含有关键词的网页会有很高的排名时,此一关键词必须出现在网页的TITLE卷标(tag)、META卷标(tag)的Keywords区段、Description区段,当然还必须出现在网页内容里。要记得搜寻引擎是看不懂图形的,也就是说最关键的文字必须出现在HTML内容本身。
越来越多的搜寻引擎都将网站连结的受欢迎程度列入排名决定因素。也就是说,如果你的网站成为很多网友连结的对象,而且这些连结里或是连结的附近文句含有一些特定的文字,那这些文字能让你的网站有较好的搜寻排名。就拿那些有连结到Amazon.com(英文网站)的网站来说,会有多少的连结本身或邻近的文句含有「书」(books)。现在上大量利用网站欢迎程度来排名的搜寻引擎Google.com搜寻「书」(books),看到排名第一的Amazon.com了吗?现在你知道原因了。
想要提升网站的欢迎程度的唯一办法就是到网络里建立起你的连结。让其它的网站连结到你的网站,并且请他们用你所希望的关键词来描述你的网站。当然了,你的网站也可以放其它网站的连结来当作是一种「回馈」。
问:网站制作者如何提升网站的排名?
答: 如果你的排名不太理想,你甚至可以回头重新设计你的网页。但老实说,我并不建议这么做,尤其是对那些设计网页的人。换个角度来看,如果网站就某个相关字搜寻的排名很不理想时,我建议增加与关键词有关的新网页。你可以增加些不同但相关的内容,也许会提高排名。我建议除非你发现从没有人透过这个搜寻引擎上站浏览,或是从这个搜寻引擎来的浏览数骤降,不然不要主动更新你在搜寻引擎上的网页。也就是,除非真的有问题,否则就别乱动。
问:有哪些网页设计因素可让网页较容易被搜寻引擎发现?
答:让 每个网页都拥有不同的网页标题(TITLE),而且每个标题都含有你所希望的关键词。让这些关键词和一些网页内容里常用的字词也出现在META卷标的Keywords区。最好每一页的META Discription 都不一样(如果时间很赶,你可以摘录每个网页的第一段)。最重要的,让你想要的关键词以相当程度的频率出现在网页的内容中。没有必要为了提高频率而重复上百次相同的词句,但就是要让关键词有出现的机会。当然了,能很自然地重复关键词是再好不过的。
问:从网页设计的角度来看,不当的设计会导致较差的搜寻结果吗?
答:是的。一个网站最重要的网页就是首页。如果你有个炫丽花俏的首页,但首页里没有文字内容,TITLE卷标内不含关键词,没有META卷标,那你真的是彻底的浪费了搜寻引擎给你的免费通行证。把那些太花俏的页面拿掉;增加文字内容而不是图形,你的网站使用者会很感谢你这样的改变。最后,只有将你所期望的前10个最佳搜寻关键词列出之后才开始设计你的网站。一旦决定好了哪些关键词,就使用这些字来制作网页并且利用他们来延伸你的内容。
问:你觉得网站设计者是否该花钱透过中介服务来帮他们的网站向各个搜寻引擎注册?
答:中介服务基本上能帮你大量注册于480个不值得你一个个去申请的搜寻引擎(那些搜寻引擎大概也不会带给你大量的浏览量)。至于前20名的搜寻引擎,我强烈建议你一一去注册。
问:对于一些注册需收费的搜寻引擎,你的看法是甚么?
答:从网站设计者或推销网站的角度来看,这是很好的选择。这能很简单的就让你的网站名列前矛而不用去考虑META或其它的卷标。从使用者的角度来看,这种搜寻结果也不全然是不好的,因为很有可能他们挑选出来的内容真的还不错。现在市场上主要的搜寻引擎中,只有GoTo.com是采用这种收费方式。
问:对那些不透过软件(bot)自动搜集而使用人工搜集分类的分类搜寻网站,你觉得网页设计者需要考虑些甚么?
答:向分类搜寻网站注册时,你需要先花些时间思考如何用15至25字来简述你的网站。把重点放在将你心目中的关键词很自然地陈述于说明里,并且避免一些广告用语。然后到该分类网站,搜寻你的关键词,之后会列出不同的相关类别,将你的网站注册到与你相关而且排名最好的类别里。简单地说,能正确的做这个步骤,你可以期望有好的结果。如果第一次成果不理想,用点耐心多试几次。此外你应该去买一个自己的网域名称,还有就是一定要具备丰富的内容。
http://www.google8.net/archives/000047.html
阿葱和他的好哇!网上导航 http://www.howow.net
搜索引擎与spam的戰爭
亂世用重典,搜索引擎在与spam的長期戰爭中總是處于不利地位(這很容易理解,搜索引擎公司真正考慮搜索結果相關性和排序的只有几個人,而互聯网上整天琢磨怎么對付搜索引擎的有几万几十万webmaster),所以對spam的懲罰很嚴厲,事實上,所有的搜索引擎對它們認定的spam行為,通常只有一种懲罰:永久屏蔽。現在流行的太極鏈、鳳凰鏈這些超鏈群,就存在被當做spam的可能性。國內的搜索引擎注冊還沒有形成市場,但在國外是很發達的產業,每年以200%的速度增長,它們叫SEO,即search engine optimization 從某种角度來說,几乎是spam在推動著搜索引擎的進步,很久很久以前的一天,搜索引擎們為了搜索結果能更准确,為了能把最相關的搜索結果排在前面,發明了meta tag。起初,meta tag是很好用的,那時候,誠實的webmaster們如實的填寫网站摘要,如實的列出跟他的网站最相關的關鍵字,搜索引擎們抓取、索引、檢索這些誠實的meta tag,并作為搜索結果排序的重要依据,然后,是一段相安無事的甜蜜時光。
歲月迅速流逝,甜蜜時光擋不住資本的力量。“一旦有适當的利潤,資本就大膽起來……有50%的利潤,他就鋌而走險;有100%的利潤,他就敢踐踏一切人間法律;有300%的利潤,他就敢犯任何罪行,甚至冒絞首的危險。” 越來越多的网站開始追求收入追求pageview,它們開始欺騙搜索引擎,它們在meta tag中塞進成堆的關鍵字,塞進跟自己的网站內容無關的但是流行的關鍵字。群眾的力量是巨大的,搜索引擎的相關性被破坏了。。。
搜索引擎們對作弊者開始第一輪反擊,但是無力的,它們的做法是:在排序時更多的依賴网頁正文而不是meta tag。
作弊者以進為退,開始第二輪攻擊,他們在正文中大量使用与网頁背景相同顏色的關鍵字,在image tags中塞進關鍵字,在网頁代碼加入“看不見的注釋”。
搜索引擎開始第二輪反擊,它們找到了有效的方法來過濾這些看不見的文字,取得了小小的胜利。
善良是善良者的墓志銘,卑鄙是卑鄙者的通行證”,作弊者眼見常規武器無效,開始利用搜索引擎的真誠。搜索引擎的spider是互聯网上的謙謙君子,它們訪問任何网站都會自報身份,并且查閱网站的訪問規定,完全按照各网站的規矩來辦事。于是,作弊者精心制作了兩個网站,一個專供网友訪問,一個專供搜索引擎訪問,每當發現訪問請求來自搜索引擎時,就返回專供搜索引擎看的能令搜索引擎滿意的网頁,而正常訪問者只能看到另一個截然不同的网站。這种方法叫做cloaking。這第三輪攻擊,作弊者大胜。
1998年3月1日,分別在AltaVista、Excite、HotBot、Infoseek、Lycos搜索當時的熱門詞匯“Monica Lewinsky”,各搜索引擎首頁居然分別有50%、30%、30%、10%、50%的搜索結果是spam。由此可見當時作弊者們猖獗至何等程度!
搜索引擎們,因為它們道德上的弱點,因為有些手段不愿用,所以無法完全辨別cloaking网站,也就無法完全對付作弊者。搜索引擎能做的只是嚴厲的懲罰被發現的spam,以警告作弊者,發展到今天的結果是,所有的搜索引擎對它們認定的spam行為,只有一种懲罰:永久屏蔽。
但是,嚴厲的懲罰從來只是無能者推卸責任的借口,而不能真正的改善狀況。“一旦有适當的利潤,資本就大膽起來……有50%的利潤,他就鋌而走險;有100%的利潤,他就敢踐踏一切人間法律;有300%的利潤,他就敢犯任何罪行,甚至冒絞首的危險。” 作弊者從來就不怕懲罰,當互聯网狂潮來臨,追求pageview的作弊者們更是肆無忌憚。
無可奈何的搜索引擎,只有去尋找新的相關性排序依据,只有去尋找作弊者不能控制的排序依据,只有去网站以外尋找排序的依据,搜索引擎,真的別無選擇。
于是,開始出現了超鏈分析,出現了Pagerank。一個网頁,說它自己是什么,它就是什么嗎?物以類聚,如果它說的是真的,那么指向這個网頁的鏈接應該來自具有同類內容的网頁,所以指向這個网頁的鏈接可以被用來驗證這個网頁的相關性。
誰,最不可能出于貪婪而作弊?誰,最可能如實提供网頁內容?是政府网站,和教育网站。所以,在超鏈分析中,gov和edu网站通常被賦予較高的排名,來自gov和edu的超鏈也有更高的价值。
但是PageRank也帶來了一些不請自來的錯誤排序因素:新站不如舊站,小站不如大站,專業站不如通俗站。一個新网站,一個小网站,一個專業网站,它的內容再好,因為不可能迅速得到大量的超鏈,所以無法得到合适的排名,即使它的內容是無与倫比的。而一個歷史悠久的老网站、大网站、通俗网站,即使它已久不更新,或者內容遠不如某些小网站,卻可以獲得很高的排名。
當超鏈分析剛出來時,SEO界一片悲觀論調,認為這是無法作弊的,SEO業完蛋了(就象近期各搜索引擎紛紛收費,SEO業更覺得自己前景慘淡,其實雖然搜索引擎排名市場的大頭要給搜索引擎們,但SEO還是有錢賺的,畢竟,只有勞動模范有下崗的可能,從來沒听說騙子會失業的),但是,道高一尺魔高一丈,很快SEO們發現了對付超鏈分析的方法:你不是喜歡鏈接么,好,我就做大量的网站,准備大量的鏈接,哪個客戶出錢,我所有的网頁都給它一個鏈接。這种SEO方法被稱為link firm。這种方法剛出現時還算有效,不過很快就不行了,因為一個网站是否有大量來自內容不相干网頁的鏈接,或者一個不是搜索引擎的网站給出大量不相干的鏈接還不難判斷。而每當發現一個link firm,那些使用了該link firm的网站就全部死翹翹。我在wmw的論壇上看過一個家伙的帖子,說他的网站被封了,但他覺得自己很干淨,沒有做spam,所以主動去問Google封他网站的原因,原來僅僅是因為他用了一個link firm,真是可怜。
一种搜索結果的排序算法,如果更多的是基于概念、主題、基于网頁內容的質量,而不是网絡上互相鏈來鏈去的超鏈的重要性,那么搜索結果的相關性在本質上會更好。
只是,讓計算机學會理解和評价网頁內容嗎?好像還是很遙遠的事情;花大量的人力一個個网頁評估么?這肯定是虧本的商業行為,只有靠志愿者。ODP庶几近之,但也只能點擊,用關鍵字搜索時還是無法跟超鏈分析的結果相比。
http://www.google8.net/archives/000046.html
阿葱和他的好哇!网上导航 http://www.howow.net
“桥”页之道!
作为一个网站的经营推广人员,难免要和搜索引擎打交道。我们也知道真正要搜索引擎能为我们带来访问量,需要排名在前。除了正常的丰富内容、经常递交外,我们也知道要修改META标签,知道多多在网上到处链接……等等。
当然,经常在网上转悠,我们还学到了一些“邪门歪道”,比如说把关键词放在隐藏的INPUT表单中、使用非常小的字号或和背景相同颜色的文字,一大堆的TITLE标签等等。
可惜这些方法我们知道得太晚!搜索引擎大哥们比我们学得快多了,现在几乎所有的搜索引擎都能分辨出这些作弊的“窍门”。所以如果你现在再使用这些方法,不仅没用,还会弄巧成拙,搜索引擎会惩罚你:根本就不收你这个站点。
但是有一种“邪门歪道”却一直都有效,而且搜索引擎大哥们还纷纷表示不会封掉这种方法(实际上,也很难封)。是什么办法呢?哈哈,不要急,我得先问您一个问题: 您觉得一个站点和一本书有什么不同?是啦,一个站点有点像一本书:大量有组织的信息内容,而且任何一个好站点也都有很清晰的导览系统,就如同一本书有自己的目录、索引一样。但是网站不是书,它的每一页之间其实是平行的,实际上整个网络中的每一个文件都是相互交错链接在一个平面上,而不像书,从封面、第一页再到后面每一页是纵向的。 另外虽然我们在规划、设计制作站点时总是假想有一个首页,仿佛人们都是从这儿进入我们的站点的,但在网络上,每一页都可能成为人们的首页,人们能从任何一页进入站点,页与页之间的进入量区别来自于我们宣传它们的区别,而不是因为他们自身的不同。我们设计首页一方面是因为“人固有的对逻辑结构的喜好”,另一方面也是为了减少宣传工作的强度,我们只要宣传“这个假想的首页”就行了。 总结而言,一个网站就是一系列互相平行的文件,然后我们人为的赋予它们结构和不同优先级。
有了这样的概念,我们就能比较容易了解所谓的“桥页”啦。英文中应该叫“Entry Page”或“doorway pages”,直翻是“进入页面”、“门页”,但是我觉得叫“桥页”可能更便于理解。严格说全称应该是“search engine entry doorway pages”,也就是说“桥页”主要是为搜索引擎做的。这些页面都指向你站点的主要页面,同时每个“桥页”还专门针对某一个搜索引擎做了优化,以保证能迎合该搜索引擎的一些特别要求(算法)而在该引擎中获得高的排名。很多情况下,搜索引擎没办法检索你的站点时,就需要使用这种“桥页”。比如说,当你的站点是通过数据库动态生成的,或者站点中使用了大量的框架和JavaScript时; 还有些情况,即使能检索,结果也很差时,比如,你的首页是一个形象图片、FLASH动画等,由于页面上没有与关键词相关的内容,搜索引擎的检索结果会让你的站点排名很低。这个时候,也需要使用“桥页”。 我们会根据站点的内容、关键词,按照引擎的特点制作页面,这些页面本身一般没有什么图片、动画等,完全是文本,而且是以关键词为基础选定的文字,然后有一个或多个链接指向你真正的主要页面。
“桥页”一般围绕一个主题/关键词展开,以增加该页面与该主题/关键词的关联性。 举个例子,如果你的站点同时销售海尔和TCL的家电产品,由于站点的关键词中同时包括了“海尔”和“TCL”,这就会降低站点的关联性,无论用户使用“海尔”还是“TCL”查询,该站点的排名都不会高。 在这个时候,我们就可以设计两个“桥页”,一个围绕“海尔”,一个以“TCL”为核心,再将这两个桥页递交给搜索引擎,这样能大大提高排名。同时,如果我们要递交到2个不同的引擎(对关键词的算法不同),那么对每一个关键词(上例中的“海尔”和“TCL”)就应该有不同版本的“桥页”分别针对2个引擎。
下面是我们实现的具体步骤: 以“海尔”这个关键词为中心,针对各种搜索引擎新建页面,取名为haier.html、haier-tv.html、nice-haier.html等之类的名字。这些页面可以链接到实际站点中的任何地方,如“海尔产品”、“海尔服务”部分; 同样的方法为“TCL”这个关键词也创建相关页面; 把这些页面放在的站点下一个独立的目录里,然后将不同的页面递交到不同的搜索引擎。 这样如果你想强调M个关键词,针对N个引擎,你就需要创建M*N个“桥页”。
注意:所有这些页面都只有链出的链接,不需要任何链入。这里说的“搜索引擎”是指那类使用搜索机器人收集站点资料的真正的搜索引擎,不包括如YAHOO这一类的“分类目录”。
http://www.google8.net/archives/000065.html
阿葱和他的好哇!网上导航 http://www.howow.net
Google已成为一种文化
(原名《敬佩Google》)
Google是一个搜索引擎的名字,所以它是名词。Google是一种常见的网络动作,所以它是动词。Google还是对网站地位的一种客观评判,所以它是形容词。去Google,Google一下,看看你的网站有多Google。在今天,Google几乎成了人们使用互联网的一种重要方式,用《新闻周刊》的话说,Google已经成为一种文化,它使每个人与任何问题的答案之间的距离只有点击一下鼠标那么远。我们可以不去看新浪的新闻,可以不使用Hotmail的免费邮箱,也可以不安装QQ,但我们无法不Google。
在互联网已经成为一种瘟疫,让曾经热衷的人避之惟恐不及的时候,在很多网络企业为了拉升股价,纷纷去掉企业名称中的.COM的时候,在大家争先恐后地回归传统,淡化自己的网络色彩的时候,Google无疑是一个异类。Google因互联网而诞生,因互联网而存在,因互联网而荣耀。在整体沉沦的互联网企业中,Google的专注和执着,使它成为一种信念的化身,成为客观、公正的代表,成为技术改变生活的一个实例。通过Google干净得近乎呆板、朴素得近乎老土的页面,我们让自己成为无所不知的博学的人,明察秋毫的缜密的人,满腹经纶的高雅的人。
如果互联网对我们仍是一个有价值的东西,那么在多大程度上我们应该把我们的敬佩献给Google呢?
Google不是第一家做互联网搜索技术的公司,之前的搜索引擎公司,包括AltaVista、Lycos、Excite、Infoseek、Inktomi在内,大都借互联网泡沫的东风,成功上市、融资,迅速膨胀,兼并或被兼并,很多公司后来转型做起了门户网站。这些曾经风光一时的互联网公司,今天大部分仍在亏损的深渊中挣扎。尽管曾经有过很多名声显赫的搜索引擎,但在Google之前,没有一家公司把搜索引擎做得如此有用,如此体贴。在接受PC World采访时,Google的CEO埃里克·施密特说,Google从其他同行那里吸取了两个教训,第一个就是不要过早上市,第二个就是要集中精力于搜索业务。“一些网络搜索公司总是试图在同一时间做很多事情,他们几乎把自己的本行都忘记了。不过,正是他们的‘不务正业’,Google才会有今天的成绩。”
今天,全世界访问量最大的4个网站中,3家采用了Google的搜索技术,80%的互联网搜索是通过Google或使用Google技术的网站完成的。目前Google每个月接待来自世界各地的超过2800万独立访问者,全球网民通过Google可以使用86种语言,搜索30多亿个网页及其网页快照,以及4亿多张图片,每个月Google被用户使用的时间为1500万小时左右。
面对一个如此强大的Google,有人认为,应视Google为公共事业,因为它实际上控制了互联网访问的自然资源。他们认为,Google正在成为互联网上的上帝,就像微软成为PC机上的上帝。Google可以轻易决定一个网站是否能被别人找到,决定这个网站的访问量,甚至决定着这个网站是否有存在的必要。但毫无疑问,Google这个上帝是一个信仰技术的上帝。与人的灵活性和主观能动性相比,Google宁肯相信机械的算法和程序。人通过设计程序来制定规则,然后把履行规则的事情交给程序去做。人很难做到客观,但程序却无法做到不客观。每一个搜索结果,都是程序按照规则自动排出的,对Google来说,这个结果是神圣不可侵犯的,这是对自己技术理念的坚持,对技术先进性的自信,也是对用户的尊重。施密特说:“我们承诺在我们的广告业务中决不以任何方式影响我们的搜索。”因此对于那些为了金钱而改变搜索排名的行为,Google十分不齿。
我们曾听说过搜索引擎的“自信心定律”,即客户对自己有信心,才会花钱购买搜索结果,而花了钱的客户,也会给用户以信心。以Overture以及国内的百度为代表的一批搜索引擎,像发现金山一样地发现了可以被出卖的搜索结果。事实上,他们所谓的自信心与其所推崇的先进技术是相互抵触的。一个原本搜索排名就名列前茅的网站,不会为获得一个更高的排名而付费,肯付费的,一定是排名落后的网站。落后的网站通过付费获得的较高的排名,让再先进的技术都变得毫无意义。出卖搜索结果,实际上是在出卖用户对搜索结果公正性和科学性的信任,或者说,是金钱对技术的嘲弄。交互媒介SiteLab的创始人戴纳·托德说:“任何东西都可以卖钱。作为消费者,我很震惊,但作为广告客户,我很高兴。”
在互联网受宠的时候,概念比技术更吃香,因此专注于技术的人看起来像傻瓜;在互联网被冷落的时候,转型比技术更紧迫,因此专注于技术的人看起来更像傻瓜。好在上帝是公平的,今天那些聪明的网络公司挖空心思不择手段地赚钱,甚至把广告伪装成搜索结果,伪装成新闻标题,却仍旧赚不到钱。技术傻瓜们却在不经意间开始赚钱了。与聪明人的方式不同,Google拒绝任何据说回报率更高的图片、流媒体和弹出式广告。Google认为,只有很好地服务于自己的用户,才能很好地服务于自己的广告客户。施密特说:“互联网将使广告发生改变,是因为它可以被跟踪,而不是因为它更漂亮。”Google低调推出自己的广告服务,即AdWords服务。这一服务根据客户购买的关键字,以纯文本方式将广告安置在相关搜索页面的右侧空白处,每个页面最多放置8个这样的文字链接。Google的广告坚持不打扰、不误导、不恐吓用户,不增加用户加载页面的时间。据AdWords的客户反映,Google广告的点击率高达2%,超出传统条幅广告的5倍。目前Google每年销售额超过1亿美元,利润1500万美元,三分之二来自广告。
早在两年前,Google击败著名的Inktomi,成为雅虎搜索技术的提供者时,就有人质疑Google的商业模式,认为这家单纯提供搜索技术的公司,缺乏长期的赢利模式。很多人确信,就像Inktomi最终成了另一个AltaVista一样,Google也终将成为另一个Inktomi。Inktomi的股价从最高的234美元,跌到不足1美元,恍若南柯一梦。但仅仅一年后,Google就宣布实现了赢利。
基于对技术的敏感和对技术的尊崇,Google相信,凭借出色的技术,在很多方面他们一定可以比人做得更好。不久前,Google发布了news.google.com测试版,开始提供新闻服务。这是一个不雇佣一名新闻编辑的新闻网站,全部新闻的采集和编发,都是由程序自动完成的,其工作原理与搜索引擎完全一致,是其搜索业务的一种自然延伸。紧接着,Google又把它的技术触角伸到了电子商务领域,通过正在测试的Froogle,开始向用户提供商品检索服务。很多人早就担心,Google不断扩大自己技术领地的做法,终将使雅虎、美国在线等客户,将它视为竞争对手。据最新统计,Google已经超过雅虎,成为市场份额最高的搜索引擎,27%的搜索用户访问Google而不是雅虎。不断长大的Google,正面临越来越多的危险和不测。
12月23日,雅虎宣布以2.35亿美元收购Inktomi。业界普遍认为,雅虎必将为捍卫自己的领地,而与Google开战。这将让Google上市的问题变得迫切。
尽管施密特多次声称,Google不需要上市,不上市日子过得也不错。但用户还是很担心,毕竟优秀的技术企业被资本玩儿死的惨剧,已经上演过无数次。《连线》杂志就认为,Google也许有可能向投资者证明,用户长期的满意度比短期利润更为重要,但《连线》对此很悲观,认为这样的可能性微乎其微。在大量企业都热衷于资本运营,热衷于多元化,热衷于从用户兜里抢钱的时候,作为一家没有赢利压力的纯技术公司,是轻松的,也是危险的。Google总要长大,今天它凭借两位创始人布林和佩吉的努力,得以坚守的信仰,在投资人的压力下究竟还能坚守多久,殊难预料。高级分析师杰福里指出,Google可以靠网页搜索技术发展成一家杰出的小企业,但不可能靠它发展成企业王国。也许有一天,它会变得像我们熟悉的那些公司一样贪婪,一样肮脏。既然我们无法拒绝资本,既然我们拿不出更好的办法帮助Google,我们也只好坦然接受另外一个Google,就像接受其他的上了市的网络公司一样。
不过眼下,Google仍是商业化的互联网上最不商业的一个大型网站,这已足够令人敬佩。
来源:洪波 原创-IT
阿葱和他的好哇!网上导航 http://www.howow.net
第1页,共2页