2004年04月30日

Google上市将改写全球富豪榜
2004-04-28 16:20:10 posted by Lela






  你很难想象咱们这个星球上居然有像Google这样的公司:上千名穿着休闲服的软件工程师可以尽情享用公司提供的免费的丰盛午餐,甚至免费的按摩服务;而不经意之间,你就会发现这个公司的大老板、创办人之一佩奇穿着溜冰鞋在你身边呼啸而过;更刺激的是,这些工程师不会被固定在一个团队里,从事一项固定的工作,他们可以为了一项自己感兴趣的课题而自由组合,半年甚至几个月,再继续寻找下一个“自由组合”。


  如果这还不够令人惊讶,那么一个更令人惊讶的事实是,正是这么一个作风“散漫”的公司,从1998年建立开始,到去年它的五岁生日,资产已经从100万美元迅速扩张至2亿多美元。这意味着,按八小时工作日计算,这个公司每秒钟就有6美元的资生诞生。现在,全世界每秒钟就有超过3000台电脑通过Google发送查询指令。


  市值超过200亿美元


  有媒体披露,Google将在本月底宣布本年度初最重大的首次公开募股(IPO)。


  Google在去年的销售额高达9亿美元,纯利润高达1.5亿美元。早在去年9月,就有人把它和其他的网络公司相比。根据当时公布的数据,雅虎的市值是380亿美元,亚马逊和eBay分别是200亿美元和540亿美元。有分析师据此认为,Google的市值至少应该在200亿美元以上。


  毫无疑问,这个消息足以让整个华尔街疯狂。


  按创始人佩奇和布林最早的想法是,Google并不急着上市。“他们之所以要在今年4月进行IPO,”一位媒体同仁说,“主要是美国证监会的一些要求促使它尽快作决定。”


  根据美国证监会的规定,拥有超过500名股东、资产高达1000万美元以上的公司必须公开其商业信息,而且应该在财政年度结束后的4个月内,公开他们的财务状况。这个条款曾经激发了不少美国公司干脆开展IPO的热情。而Google也符合这一规定:他有1000多员工拥有公司的股票选择期权,而资产早已过亿。


  这样一家公司上市后,会不会对其他 搜索引擎公司造成较大冲击?


  目前,Google在国外的主要竞争对手是雅虎在中国内地,Google正面临着 百度、 新浪、 搜狐、中国搜索联盟等的挑战。


  雅虎的中国区总裁周鸿祎认为,Google的上市对雅虎在中国区的业务不会造成什么冲击,“如果Google要来中国开展业务,就会涉及到本土化问题,届时将需要有本土化的人才、技术和营销渠道。”周说,“这些需要时间和经验,当初雅虎在这方面也是交了学费的。”


  但事实上,Google的搜索现在覆盖了89种语言和方言,这代表了82个国家,它至少说明Google不会放弃海外市场。特别是中文版的Google和中文版中出现的广告更是表明,Google已经涉足中国市场。Google是否有在中国做大的计划?当记者致电Google总部时,Google的全球公关弗斯特女士没有回答这个问题。


  投行吞食1亿美元


  如果Google的IPO获得成功,它将是美国有史以来金额最大的IPO之一,投资银行可以从中获取近1亿美元的费用。


  早在几个月以前,大家就在谁会成为“幸运儿”进行了长期的猜测。但近期一位消息人士向媒体透露,Google将请瑞士信贷第一波士顿和摩根士丹利作牵头银行协助上市,从而结束了外界连续几个月以来的种种猜测。


  对瑞士信贷第一波士顿来说,Google肯定是“天上掉下来的馅饼”。虽然瑞士信贷在辅导高科技公司IPO方面享有较高的声誉,但是由于几年前的一桩IPO丑闻,其原雇员Frank Quattrone迄今仍受审查,这对该公司的名誉造成了一定的影响。另外,两年前,该公司还花了1亿美元消除了一项不利于它的违规指控,该指控认定它为了多收取额外佣金,而向一些投资机构提供了一些热门IPO公司的股票。然而有媒体披露,由于Google雇用了该公司的一位前网络股票分析师Lise Buyer担任业务主任,所以这个投资银行获得了Google的合同。


  不过,也许摩根士丹利才是Google上市合同的最大赢家。摩根士丹利聘请了全美最著名、最具影响力的网络分析师Mary Meeker。有媒体认为,这位被美国传媒界誉为“网络股女皇”的著名分析师对摩根士丹利获得Google的IPO合同起到了重要的作用。


  熟悉内部情况的人士透露,花旗集团、高盛也有可能在此次IPO中扮演重要的角色,而JP摩根和雷曼兄弟也会介入。这些均被Google列入第二波考虑的银行名单。


  但是记者致电Google总部时,Google的一位发言人拒绝对上述情况作出评论。而瑞士信贷第一波士顿和摩根士丹利两家投资银行在香港办事处的工作人员也均对此事表示“不知道”或是不予置评。


  然而,上述自称熟悉内幕的人士介绍说,Google在选择投资银行方面显得异常小心。去年,它和10多家投资银行进行了接触,然后筛选掉一半左右。“这些银行自去年第一次和Google接触之后,就很少再从Google方面得到消息,直到今年3月份。现在,有关IPO的细节仍是个谜。


  有关IPO的规模以及价格等信息被视为高度机密,其中有一些条款也许仍在商讨之中。”这位人士说,“甚至本周他们宣布IPO时会公开多少信息也是个未知数。”


  据一家海外媒体分析,高盛本来也是有力争夺者之一,但是Google管理人员对高盛和微软、雅虎的紧密关系感到担心。而且高盛对Google高层人员提出的通过网上竞购的IPO方式持保留意见,这也限制了它的成功入选。


  Google在IPO方面的确不是个慷慨的企业。那位熟悉内幕的人士透露,Google的高层官员实际上并不看重投资银行的圈子,也不愿意为这个圈子内的银行交钱。


  为了能绕过华尔街直接向投资者售股,从而与丑闻不断的投资银行保持距离,同时得到数量众多的小股东,Google的高层管理人员还探索了网上拍卖的可能性,据悉,Google创始人布林和佩奇对此非常支持,他们总是寻求以技术手段解决问题。


  改写富豪排行榜


  Google IPO将使其创始人一夜之间亦将跨入巨富行列。


  首当其冲的是Google的创始人——布林和佩奇。现在两人持有的Google股份占到了总数的1/3-1/2。Google上市之后他们的身价将超过现在的雅虎总裁杨致远。以雅虎市值380亿美元计,杨致远身价为20亿美元。


  作为Google的首位外部投资者,Sun公司创始人之一Andy Bechtolsheim1在1998年投资了20万美元购买Google的股票。尽管现在仅持有1%的股份,但其投资也将飙升到3亿美元以上。


  1998年,美国在线以2200万美元和1000万投入Google。另外,Kleiner Perkins Caufield&Byers和Sequoia Capital两家风险投资基金也曾于1999年6月投资刚刚出生的Google,每家各自拥有约11-14%的股份。这些股份价值将增值为数十亿美金。


  Google的其它投资者包括创始人佩奇和布林的母校斯坦福大学,Sun公司创始人Andy Bechtolsheim、网景创始人Marc Andreessen、eBay创立者Pierre M.Omidyar、风险投资基金Kleiner Perkins Caufield&Byers和Sequoia Capital以及Google现在最大的竞争者雅虎。他们当初投入到Google的钱都将升值几百倍。


  现年31岁的佩奇是一位计算机教授和数据库顾问专家的儿子,30岁的布林是一位数学教授的儿子,这两个美国斯坦福大学计算机学系的博士生在中途退学后创办了Google。1998年,他们为新创的搜索引擎公司命名时,取的其实是数学名词“googol”(10的100次方,意为巨大的数字)的谐音。


  显然,他们心底蕴藏着的是一个野心勃勃的梦想。来源: 21世纪经济报道









Google最新推出拼音汉字自动转换功能






  目前,中文Google已经推出最新的拼音汉字自动转换功能,只要在搜索框中输入汉语拼音,Google可以自动转换为同音词进行提示,进一步精确搜索请求。由此,Google在中文搜索领域迈出具有重大意义的一步。

  拼音汉字转换功能是Google 运用智能软件系统对拼音关键词能进行自动中文转换并提供相应提示(需用简体中文界面)。 例如:搜索“shang wu tong”, Google 能自动提示 “您是不是要找:商务通”。 如果您点击“商务通”, Google 将以“商务通”作为关键词进行搜索。对于拼音和中文混和关键词, 系统也能做有效转换。 对于拼音“lü”, “lüe”, “nü” 或 “nüe”,您可输入 “lv”, “lve”, “nv” 或 “nve”. 如果拼音中没有空格, 例如 “shangwutong”,Google 也会做相应处理,但是在多个拼音中加空格能提高转换准确率和速度。

  据报道,Google将于本月底公开上市,目前已经选定瑞士信贷第一波士顿及摩根士丹利两家投资银行为其上市承销商。华尔街人士认为,Google的IPO可能成为美国股市历史上最大规模的一次上市发行。如果发行成功,将引发科技企业新一轮上市热潮。分析人士预计,Google的年利润大约在1.5亿到3.5亿美元之间,营收则大约为每年5亿到10亿美元,而Google上市后的市值将达到120亿到200亿美元之间。届时Google将成为世界上最具价值的 搜索引擎

  此次专门针对中国市场做的这项技术升级只是Google无数次技术升级中的小小一次,加之其最著名的AdWords关键词广告推出中文版,已经充分反映了Google对中国市场的高度重视,同时也是对国内搜索引擎的一次不小的冲击。国内搜索引擎要想超越Google,守住中文搜索的本土领地,势必应该首先加强自己的技术实力。

  北京奕天锐新科技有限公司曾对Google的拼音汉字转换功能进行过测试,并同国内中文搜索引擎 百度的中文搜索结果作以比较,认为两者拼音搜索效果不相上下。

 Google可读取Flash文件


虽然Google可以在其数据库中存储Flash文件已经不是什么新鲜事了,但是你听说过它可以读取二进制格式文件吗?


  以下所片断是从搜索结果中截取的,很显然,它们出自Flash文件:


  0% LOADING 5% 10% 15% 20% 25% … Loading. Please wait. SKIP BACK Intuitive Intuitive Friendly …


  如果你还是不能确定的话,可以尝试搜索“Kingdom Ceramics enter”,然后你会发现以下的结果:


  0% LOADING 5% 10% 15% 20% 25% 30% 35% 40% 45% 50% 55% 60% 65% 70% … Enter Virtual Tour Enter Exhibition (Exit Virtual Tour) “Welcome to the Kingdom Ceramics Virtual Tour!” “How may I help you today?” “Please show me the…


 把以上的截取片断与该站点上的Flash文件进行比较后,你就会得出结论:这些是文件中的信息。


   Google未对是否可以读取Flash二进制格式文件发表正式评论。但是以上的观测至少提醒Flash设计者们,是时候学些SEO方面的知识了。


  相关链接:FLASH技术在网页设计和网络广告中的应用非常广泛,有些网站为了追求美观,甚至将整个首页全部用FLASH方式设计,但是由于Flash的先天缺陷使得 搜索引擎无法识别FLASH中的信息,因而不能被搜索引擎正确检索,从而使得网站被检索到的几率大大下降;另一方面由于FLASH网站可能存在部分浏览方面的问题,使网站推广的效果大受影响。


去年,为AllTheWeb.com及 Lycos提供搜索技术的公司FAST Search宣称可以检索到使用Flash的网页,Google也可以利用标准Macromedia开发工具包实现在某些方面检索到Flash文件中的链接。但总体来说,在目前情况下,Flash网站被搜索引擎检索还有很多问题,因此,如果决定要采用Flash网站时,应该首先考虑到搜索引擎优化(SEO)设计问题。

如何在服务器之间移动网站而不影响排名 


  原著:Serge Thibodeau
编译:Karen    






  


如果出于种种原因,例如宕机时间过于频繁,服务器超载而且速度奇慢, 总之您对目前所使用的网络托管服务供应商感到不甚满意,或者是发现了一个能够提供更多特性化服务的供应商,而想把站点从一台服务器上迁到另外一台服务器上去,这并非什么难事,但在迁站过程中需谨记以下几点:
 联系新服务商—不可操之过急
自然你是不会希望在你的网站宕机时间内搜索引擎的Spiders凑巧会来访问你的网站。要避免这种情况,最好的方式当然是不要宕机。如果能够确保在服务器之间迁站操作正确无误,宕机问题应该可以避免。
在考虑取消原来的服务提供商之前,务必先找好新的供应商。在决定下来要使用新供应商的服务后可先与他们联系开个帐号,然后一定要确保所有的文件都正确无误地传到他们的服务器上了。这一步完成后,再仔细检查一下有无问题,做好这一切工作后,而且必须是在确保网站在新服务器上运行无碍后再联系你的原供应商,告之你将于“不久”后终止与他们的合作。切记不要让他们现在就关闭你的帐号,因为你还需要更换你的域名服务器,否则客户无法访问你的网站。
 
 联系域名注册商—变更域名服务器(DNS) 
把整个网站的文件都上传到新供应商的服务器上,再通知原来的供应商“不久”后要终止和他们的合作。这一切工作完成后,接下来需要做的就是联系您的域名注册商,对域名解析(DNS)服务器做相应的变更。具体步骤是把网站在域名注册商处先前使用的域名服务器改成新网络新托管服务供应商提供的新域名服务器。一旦更改完毕,那么在未来24小时到 48小时内,最迟不会超过72个小时,该变化就可奏效,客户就可以象原来一样访问到你的网站了。
要知道,互联网是依靠域名解析服务器(DNS)来运做的。域名服务器负责把域名转换成计算机能够理解的数字IP地址。比如,如果有用户要访问你的网站www.168mms.com,那么域名服务器会把www.168mms.com转换成IP地址如“210.110.75.*”,这样就可以找到存放你的网站内容的网络服务器了。域名服务器的数量因互联网的高速发展而不断递增。
 
 “新”网站运行良好后再关闭旧帐号 
现在,如果搜索引擎的robot程序,象Google的Googlebot或是雅虎的Slurp来访问你的站点,无论是从旧IP地址还是新IP地址,它们都不会发现有任何异样,所以仍然会和以往一样来检索你的网站。
现在可以理解为什么我要建议您先开好帐户,并确保所有文件都先安全准确地迁移到新服务器上了吧!—因为这样作就可以避免网站出现不必要的宕机问题。


在网站迁到新服务器上后一个星期之后,如果运行情况良好,而且没有出现任何后遗症,这时候就可以联系原来的服务供应商要求关闭您在他们服务器上的帐户了。
 
 其它注意事项: 
在如今这个高速发展的互联网时代,更换网络托管服务就象换衣服一样轻而易举。只要遵循上面的步骤来操作,绝对没问题。不过还是要提醒大家一点:在选择新的网络托管服务商时,不要只考虑谁的服务价格更便宜。除了价格最低廉外,还需要考虑其它很多因素,诸如实用性、可靠性、稳定性,以及是否有高效迅速的客户支持,是否有经验丰富的技术人员等等,都是需要考虑的重要因素。还有象否有免费的服务电话,这可以为你节省一大笔电话费用。
另外一个需要考虑到的重要因素就是紧急后备电源的问题。98年1月,在加拿大奎北克省的蒙特利尔地区和其它大部分地区遭受到有史以来最大的一场冰暴袭击,造成了该省一些地区停电时间长达6周之久。在这些地区中,只有那些装备了柴油发动机作为后备发电装置的网络供应商没有因为这场灾难受到任何影响和损失,他们的客户自然也安然地置身于这场灾难之外。

2004年04月23日

不知道是个什么日子,google英文版换了个logo,但google中文还没有开始换.


google开始dance了?


Earth Day 2004

2004年04月21日

TSPR理论-如何应对Google PageRank排名新算法(三)



 原著:Dan Thies
编译:Karen







第三部分: 如何在Google新算法中拔得头筹


如何应对Google的新算法?大家可以根据下面所列的一些要点采取相应的措施。


3-1. 关键词的研究:扩大覆盖面


搜索引擎策略的中心思想是确定恰当的关键词来锁定目标群体。但有很多网站管理员却在这一步上掉以轻心,只在屈指可数的几个平平常常的关键词身上铆足了劲,却不知这种策略失之偏颇。关键词研究的主要目标应该是确定目标群体所有可能使用的关键词,其中包括了品牌名称、地理位置及修饰语等“修饰成分”。


尽管对网站的每个页面只能围绕两到三个关键词进行关键词优化,但通过关键词和修饰成分的有机结合,亦可大幅提高网站对搜索结果的覆盖率。对于Google在去年11月15号所做的更新,有很多实施了有效关键词策略的网站管理员压根就没有注意到。原因很简单:他们锁定的是所有可能相关的关键词,覆盖面极广,所以虽然个别一般性的关键词的排名下降了,但网站的整体访问量并未受到什么影响。


若只针对少数关键词,而且这些关键词都有很好的排名,这种策略看起来似乎也蛮不错。可是一旦搜索引擎改变了排名算法,就象Google这次一样,这种缺乏灵活性的策略可就撞上南墙了–正确的做法是锁定所有可能相关的关键词,扩大对搜索结果的涵盖面,给自己的搜索引擎策略打下一个坚实的基础。


3-2. 网站结构的有效性


为保证“广泛的关键词”策略的有效性,网站需要进行组织,让搜索引擎可以顺利地遍历或检索网站内的所有网页。为了更好的理解这一点,让我们先来看看搜索引擎的Spiders是如何遍历网站的。


在对网站的第一次造访中,Spider首先会取得一个叫做Robots.txt的文件来决定是否允许它检索。


当Spiders从另外一个站点发现你网站的链接时,若Robots.txt文件里并未声明不允许它访问该页面,则Spiders会把这个页面保存下来。它不一定就是主页,也可能是你网站的其它页面。


Spider在对这一页进行检索时,它会从中摘录一些关于内容方面的信息和页面上的所有链接,并将其放入搜索引擎的数据库里面。如果它所认为你的网站十分重要,它稍后会检索这些链接页面。


如果你在网站的每个页面上都放了一组指向网站主要部分的链接(网站全局导航链接),那么接下来这些链接页极有可能得到Spider的检索。假设网站上的每个页面上都依次放有指向网站主要内容的链接,那么搜索引擎要想遍历整个网站真是易如反掌。


因而,最有效的网站结构当属自顶而下(Top-Down)或金字塔型设计结构。规模较大的网站(至少十几页)应设立一个网站地图页,用以列出网站的所有内部链接页。SUN微电子公司的网上大师级人物杰可布.尼尔森(Jakob Nielsen)认为:一个网站设计的精良与否的一个重要标志就是是否有网站地图。


许多人对文本链接方式的网站导航持排斥态度(可能因为它不那么漂亮吧),而是热衷于Flash或动态网页(DHTML)形式的菜单。使用这种导航方式的人要当心了,因为搜索引擎目前尚无法很好地支持这种导航系统。不过别担心,只需将文本导航链接放到网页的最下方,这样既保持了你喜欢的网站风格,又向搜索引擎提供了更对它们口味的东西,可谓皆大欢喜。


内容清楚的文字性链接不但可使你的网站很容易得到Spiders的检索,而且对我们这些真实的访问者来说亦一目了然。做文字链接时需注意一个问题:尽量让网站的内容只需最多两三次点击就可以打开,可创建一个网站地图把这些链接放到一起。


3-3. 创建大量优化网站内容


网站的结构就象一个框架。我们已经知道了如何构建一个友好的网站结构,接下来该向结构中填加内容了。


先记住完成步骤一(3-1)后找到的所有相关关键词以及相应的修饰语,现在我们可以在每一页的内容上,在下面几个地方放上相关的主要关键词,并予以恰当的修饰:
1. 网页的<TITLE>中
2. HTML源码中的关键词和描述元标识(META Keywords & Meta Description)
3. 页面上的主标题文字<heading>和各部分的标题文字<headings (H1– H6)>
4. 网页正文中的段落(<P></P>)和列表(<List></List>)之中


不必太担心象“关键词密度”这样“深奥”的东西。只需自然地使用关键词,利用不同的单词变化形式,并辅以恰当的修饰语。而且只需在页面上可以看见的文本内容中出现若干次关键词,并将这些关键词放在页面上较为突出的位置上就OK了。没必要再向其它毫不相干的地方“填塞”关键词。


假设你已经为要建设的网站拟定了大量内容––建设一个内容相当多的网站着实是一项有些让人望而生畏的任务。实际上也确有一些人望而却步,转而使用诸如机器自动生成的“门页”等这样一些廉价的伎俩,大家千万别相信这些投机取巧的方法,它们只会增加你遭到搜索引擎处罚的可能性而不是你想要的排名。况且,网站内容的开发工作并没有那么难。


如果你是自己做这项工作,你完全可以把工作分做几步来开展,这样就轻松多了。例如,若将工作分做10个步骤,且每个步骤中需创建10个页面,你就可以每天只完成一两页内容,等一个步骤完成后再继续下一个步骤。


花上两三个月来构建一个既实用又兼具丰富内容的站点是值得的。别忘了要经常给网站补充新鲜的内容––即使一个星期只补充一点内容,时间长了之后,用户总会看到内容上的质的飞跃。而且网站的内容越多,搜索引擎用户发现它的机会也就越大。


3-4. 链接策略


现在你的网站不但漂亮而且实用,不但内容丰富,而且关键词完美涵盖了所有用户可能用到的查询条件。每个页面都是一个优化的典范,且被极佳地相互链接起来… 现在可以松口气了吗?别急,革命尚未成功。若现在你就停滞不前了,那你一定会得失望。搜索引擎不会对一个没有任何外部链接的网站青睐有加。因为外部链接往往意味着业内其它网站对你的认知程度。要想得到理想的排名,你还需要花时间来进行网站推广和逐步建立网站的导入链接。


如果想在“新”Google中取得成效,就需要锁定那些来自相关站点的相关链接。数量当然是多多益善了。问题是:怎么去找这样的链接呢?


首先,向所有能找到的相关目录提交你的网站。象DMOZ这种大型目录当然是首选目标了,不过一些规模相对较小的分类目录也是理想的提交对象,如GoGuides,Skaffe,Gimpsy,WebSavvy,等等。


其次,可从相关站点群体获得相关链接。以所有主要目标关键词为查询条件,从Google上查找那些排名位居榜首的网页。排名前20到30名的网页一般来说相关度最高,因而都可能是理想的目标。再依次访问其中的每个网站-–若这些网站提供有链接页,或链接到相关站点,可以向他们请求交换链接。然后再看看有哪些网站链向它们,再设法同这些网站交换链接。


尽量控制链接的放置位置。即使是一个罗列了大量链接的“资源”页的相关链接也是不错的。若链接位于访问量较好的页面,可使你赚进显著的访问量。找一找这样的网页,和他们进行互惠链接。


一般情况下,链接页上都会放置自己的首页作为到自己网站的链接。但也不尽然。在建立链接时,也可以为网站的“内部”页面寻找链接的机会。


3-5. 不要“见好就收”!


大多数人很容易步入的一个误区是:一旦他们的网站在搜索引擎中的排名效果显著上升,并由此而使访问量得到可观的增加后,他们就开始忙于应付新访问者了,而不再为网站的内容、链接花心思了,甚至没有心思再去看他的网站排名了。


不久之后,倘若Google或任何一家搜索引擎把他们的排名给刷下来了,他们就开始牢骚满腹,说什么搜索结果不公正,搜索引擎在迫害他们…等等等等。


对此,我的建议很简单-–不要因为排名上去了就停止努力,继续寻找新的相关关键词,继续创建链接,继续为网站添加新鲜“血液”,保持网站的最新状态。记住:无论是排在你后面还是前面的竞争对手,没有人会停止和你竞争的。


你的努力往往需要过上几个月才会在搜索结果中体现出来。可是有些人在几个星期之后就因为没有看到直接的效果而放弃了。如果在网站的搜索引擎排名上掉以轻心,等发觉问题时,你已经落后至少好几个月了。


假如你已经为网站开展了搜索引擎策略,并已投入相应的人力、物力和财力,这时候一定要记住:贵在坚持。不要轻易放弃,也不要“见好就收”。

TSPR理论-如何应对Google PageRank排名新算法(二)



 原著:Dan Thies
编译:Karen






第二部分: 探索Google PageRank新算法(上)
—对Google的新排名算法有多种猜测。此文仅做抛砖引玉之用。


2-1. Google的主题性趋向


2-1-1. 关于页面级别(PageRank)及Google的旧算法出现问题的原因


页面级别(PageRank)计算系统所遵循的思路是:通过一个经由互联网的“随机运动”来告诉你哪些站点是最重要的。该系统模拟的是一个随机冲浪者跟进点击某页面上的随机链接,至最深层页面时按“返回”按钮这一过程。页面的等级越高,则随机网络冲浪者发现它的机率亦越高。


这种思路其实相当富有创意。一个网页的外部链接越多,则对任意网络冲浪者来说,发现它的机会也就越大。同时,在页面级别算法系统中,页面越流行,则其导入链接就越能从链接中受益—这是由于任意网络冲浪者发现这些链接的机会就越大。


在特定领域的研究论文查询方面,页面级别系统几乎无可挑剔。例如,如果用户查询关于素粒子物理学研究方面的论文(或网页)文献集,则对于一个给定条件的查询,页面级别的算法可以很快告诉你,哪些论文才是与该特定查询条件最相关及最重要的论文,其原因就在于这些论文较其它论文的引用次数要多。


若互联网上的资源具有同一主题性,那么这种工作可说是尽善尽美了。但正如我们所知道的,互联网上的资源涵盖了上百万甚至更多的主题,而且在人们的实际生活中,查询用户所寻找的往往是一些具有特定主题的信息。所以虽然页面级别系统考虑了所有链接,但却忽视了链接页面的主题性。


Google已试图将链接的文本内容计入排名算法来克服这一局限性。但精明的搜索引擎营销商却通过在网络上到处建立充盈关键词的链接来欺骗Google的排名算法。一种新的作坊式行业也随着PageRank应运而生—即有偿交换和交易一些来自较高“页面级别”页的链接。


如果网站能够从毫不相关的站点购买或交易导入链接而使网站排名得到提升的话,那么页面级别技术已然无法为绝大多数查询条件提供高质量的搜索结果了。我们有理由相信,当Google这个世界最顶级的搜索引擎一旦发现其搜索结果的质量开始恶化时,它是不会坐视不管的。


2-1-2. 新技术闪亮登场:主题性页面级别技术(Topic-Sensitive PageRank)


2002年,斯坦福大学的一名博士生塔赫尔。哈维利瓦拉(Taher H. Haveliwala)发表了一篇非常有意思的论文,名为“Topic-Sensitive PageRank(主题性页面级别计算系统)”。而更加有趣的是,一年之后哈维利瓦拉成了Google的一份子。


“主题性页面级别计算系统”通过对随机查询用户的随机运动增加一个“偏差”来处理基本的页面级别计算系统所存在的问题。这个新的随机查询用户具有明确的查询目的,并更感兴趣于跟进那些具有某个特定主题的相关网页上的相关链接。这是一个相对而言较为新颖的思路,它解决了搜索结果的质量性方面的一系列关键性问题。


毫无疑问,哈维利瓦拉将成为搜索引擎业界中一个举足轻重的角色。他已经在搜索技术的其它领域方面进行了一些实质性的研究工作,包括如何更有效计算页面级别方面的一些比较有趣的研究。


在最初的研究论文中,哈维利瓦拉描述了他是如何利用斯坦福大学的网络数据库,对应于ODP(开放目录)的16个顶级目录的16个主题来计算“主题性”页面级别得分。虽然该研究的主题和数据数量(8千万个网页)十分有限,但能够看出这种新系统可改善搜索结果,且具备对查询用户感兴趣于何种主题的理解能力。


就在去年,当我回过头来再阅读这篇论文时,我注意到哈维利瓦拉所描述的这种系统对搜索引擎来说还存在着两个问题。不过下面我们将会看到,这两个问题现在都能得到妥善解决了。


第一个问题是充分拓展主题的数量。要想改善搜索结果,16个主题自然是远远不够的。但由于Google的页面级别计算系统的代价非常之高,因而除非新系统能够提供一些改进的措施,否则Google不大可能实施这个新系统。但随着这一领域在过去的一年中的深远发展,因而我相信现在在主题数量上已不是大问题了。


第二个问题就是如何决定一个查询条件可能对应的主题–- 当用户输入诸如“自行车”一类的查询条件时,这个用户是想买自行车呢,还是想骑自行车旅游呢?下面我将为大家简单阐述一下Google可能会怎样匹配一给定查询条件以最恰当的主题,以及为什么一些查询条件更容易受到影响的原因。


2-1-3. 关于Applied Semantics公司及其专利技术CIRCA


Applied Semantics网络广告软件公司是互联网广告方面的专家,于2003年4月份被Google收购。Google此举旨在加强搜索和广告功能。如今该公司的技术已对Google产生了深远的影响。例如在Google的Adwords关键词广告系统中,为PPC广告客户提供基于内容的广告就是采用了Applied Semantics的AdSense技术。


事实上Google在这次收购中获利的还不止AdSense技术,AdSense的后台技术其实就是Applied Semantics公司所拥有的专利技术CIRCA。


CIRCA技术所基于的是一个独立语言并具有高度扩展性的本体论,这个本体论中包含了上百万词语,词语含义及这些词语与其它自然语言中的词语之间的概念性关系。由复杂的搜索技术所支持的本体论是对词语的多样性含义的概念性理解的基础,它能够使计算机对信息进行更加有效的管理和检索,从而为搜索用户更好的提供探索知识的机会。


CIRCA技术的作用就在于它可以确定对特定词语或短语的相关概念。该技术目前被用来从众多内容中为广告客户提供相关广告服务,亦可应用于Google的关键词词根还原系统。


尤其值得一提的是:CIRCA能够计算“短语A”对“概念B”的相关程度。例如,如果用户查询“Colorado bicycle trips”,CIRCA能够将其与“Colorado”地域,“骑车”,“旅游”等主题概念性地联系起来。这意味着它们能够计算其数据库中不同的概念与用户查询条件之间的“距离”。这一点十分重要。


2-1-4. 二者的有机结合:主题性搜索引擎的实现


现在我们对主题性页面级别和CIRCA都有了一定的了解,那么接下来的问题就是:这二者之间是如何有机联系的?换言之,Google如何结合这些技术来产生一个更好的搜索引擎呢?


首先,让我们来设想一下:假如对于大量的(上百直至上千个)主题或概念,Google已然解决了如何计算其主题性页面级别的问题。


在Google过去所使用的页面级别系统中,计算结果的精准性是相当重要的。但随着主题性算法的发展,不久我们就可能看到,也许速度快而且效果良好的近似计算结果才是他们所需要的。从上述论文中我们不难看出这一点已然颇具可行性。


现在,如果用户再查询的话,则查询条件中的词语将至少与CIRCA数据库中若干主题紧密匹配。Google完全能够基于用户所使用的查询条件及数据库中所包含的主题之间的“距离”来提供“主题性页面级别”得分,从而向用户提供更好的搜索结果。查询与主题的关系越密切,则主题性页面级别得分效果越佳。


由于一个给定的搜索查询条件有可能与数据库中的多个主题匹配,所以页面级别计算中出现的任何小错误都将由影响该查询条件的多个主题性页面级别得分平摊,因而只需近似的主题性页面级别得分就足以提供高质量的搜索结果了。


当数据库中无任何主题与用户的查询条件匹配时,则Google可使用原来的页面级别系统。若与查询条件匹配的主题太多,则仍使用新系统计算主题性页面级别得分,尽管新算法可能会与原算法得出的分数相似。如果匹配主题与查询条件之间的相关度很低,则效果亦会大打折扣。


2-1-5. 安然接受和理解算法的改变


可能某些查询条件返回的搜索结果有较大的变动-–但原来在搜索结果中排名在前100位的网页全都被刷下去的情形却少之又少。


有效数据所面临的一个大问题在于:对于发生搜索结果改变较大的报告呈上升趋势。从这些“自述”数据之中我们可以看到Google的很多搜索结果发生了彻底的改变。而造成我们看到这种局面的原因恰好在于,这些“自述”数据中的绝大部分都是由那些排名被刷下来的网站提供的。


我们并未从这些“自述”变化着手,而是采用了另外一种途径,即从若干可用的网上资源中记录下最近时间内发生的搜索,然后观察搜索结果中的变化。


我们随机(没有任何成见地)研究了上百个人们日常使用的真实存在的查询条件,并标识出其中每个查询条件的改变总数,然后我们发现改变的程度在总体上仍保持着一贯的干净局面。在实际生活中,这种根本性的改变只是发生的例外,把它当成规则就大错特错了。


2-1-6. 主题并非关键词… 亦并非十全十美


千万不要把“主题”和“关键词”相混淆。主题代表的是一个综合性题目,例如“计算处理”、“市场营销”等等。而特定的查询条件(关键词),如“笔记本电脑租赁”,“电子邮件营销”等,将与更多的综合性主题联系起来。


但从Google目前所提供的一些搜索结果来看,不难发现其中的部分搜索结果所匹配的主题是错误的。例如对”laptop rental”,用户搜索“笔记本租赁”往往是想租赁一台笔记本电脑,但在Google返回的搜索结果中,排在前面的却是大学里面的笔记本租赁信息– www.google.com/search?sourceid=navclient&q=laptop+rental


这是怎么回事呢?只要看看链接到这些网页上的链接,就可以发现这些链接大都具有相似的主题性,如Computing,Housing(学生在校园里出租住处),等等。大家可以用其它词语进行查询,然后分析排名靠前的那些页面上的外部链接,就会更容易理解为什么“laptop rentals”会有如此的搜索结果了。


Google仍有可能提供不够理想的搜索结果,当然也有可能再次受到蒙骗,只是这种机率越来越小而已。同时我们相信Google会多花一些时间来修正这些问题。


2-1-7. 为什么只有部分搜索结果页发生了根本的改变?


我们不必理会那些对Google新算法的非议,只要再来看看真实的数据,你就不难理解为什么有些查询条件较其它查询条件更易受到影响。


我们以“Real Estate”为例,依照Scroogle.org的方法论,有77个原来排名在前100位的网页排名降到了100名之后。而对于更为具体的查询条件“Colorado Real Estate”,有24个排名在前100名的网站受到了影响。


而在那些被刷下来的网页中,我第一个看到的是一个标题为“Southern California Real Estate”的页面。有趣的是,倘若用“Southern California Real Estate”进行更具体的查询,你会发现它排名高踞第二位。换言之,这些网页并不是受到了Google的处罚,而只是由于缺乏对查询条件的相关主题性而使排名掉下来罢了。


也有极少数竞争性很强的查询关键词对搜索结果的排名没有造成什么影响。这种现象已被用作对Google排名算法的各种猜测的正确性与否的一个依据。但我认为对这种现象的解释其实也很简单–以“search engine optimization”为例,在返回的搜索结果中,前30个网页列表几乎没什么变化。如果对排在榜首的页面进行分析的话,就可以发现这些网页上的外部链接都具有良好的相关性,这样的网页在一个主题性页面级别的计算系统下也会做的很好。


可能Google采用的新算法与我的猜测大相径庭,不过目前为止我尚未发现比这更好的猜测。不过这些并不重要,我们只要清楚一点:不管Google怎么改变它的算法,成功的秘诀其实相当简单–胜出的往往是那些拥有大量内容和大量相关链接(包括导入链接和导出链接)的站点。而那些使用门页(Doorway Page)和链接交换的网站就不会再这么好运气了。


第二部分: 探索Google PageRank新算法(下)
—对Google的新排名算法有多种猜测。此文仅做抛砖引玉之用。


2-2:传言止于智者


关于Google新算法的种种猜测和谣言已是满天飞。其中大多数都倾向于Google使用了“过滤系统”或“处罚”了某些类型的站点。对Google来说,“过滤掉”一些太过SPAM的站点并不是什么新鲜事。Google早在几个月前就开始着手抓捕那些使用隐藏文本技术的站点。但我却看不出这些过滤系统或惩罚措施,或者甚至两者的结合如何解释Google目前的搜索结果的变化。


正如上面的研究所表明的,如果Google筛除了前100名的一些站点,那么这些网站的位置将被原来排名紧随100名之后的网站取而代之。但我们看到的却并非如此。跃居前十位的反而是那些过去名不见经传(1000位之后)的网站。 显然,并非过滤系统在作怪,而是Google采用了一种全新的网页排名机制。


2-2-1. 传言一:Google开始使用词典对号入座


去年的11月15号,几乎就在Google的更新一开始,这方面的传言就出炉了。这也是出现的第一个试图解释新搜索结果的猜测。其思路是:Google有一个查询词条名单,并以此对商业站点进行”惩处”或类似于此。


若简单如一个商业词条”词典”,那么将会有过多的搜索词条被牵涉进来。更为可能的是:Google拥有一个主题名单,并以此计算网站的主题性页面级别得分。这些主题旨在提供更好的搜索结果而不是要去处罚任何网站。


2-2-2. 传言二:Google意图施压使商业站点使用Adwords广告服务


在众多传言中,它当之无愧属头号谣传。这类传言认为:Google把那些未使用其Adwords广告服务的网站的排名拉下来。另一种说法则是Google把那些使用了它的Adwords广告服务的网站的排名拉了下来。


这两种观点不但自相矛盾,而且很难使人信服。实际上,我们都知道,Google并没有理由这么做,它在对待“付费广告”和“免费搜索结果”这两种服务上的态度一向很审慎,而且分得很清楚。Google也无需“强迫”任何人来购买它的广告服务。


缺乏足够商业经验的人可能会相信这类传言。一个生意人购买广告服务的前提是这个服务必须能够使他获利。如果Adwords服务能够使他们有利可图,他们自然会选择Adwords。客户决定是否使用Adwords服务和他的网站是否出现在Google的免费搜索结果之间没有必然的联系。


我不会因为我的网站出现在Google的免费搜索结果中而停止使用Adwords服务,也不会因为我的网站没有出现在Google的免费搜索结果中而使用Adwords服务。即使我的网站在免费搜索结果中的排名掉下来我也会使用Adwords广告服务。因为我做生意是为了有利润可赚。我选择Adwords广告服务是因为它能给我带来利润而无它。


2-2-3. 传言三:Google开始使用“基于贝叶斯定理的SPAM过滤系统”


贝叶斯过滤法是对付垃圾邮件的一个绝妙办法。无可否认这是一项相当完美的技术。 但并无证据表明Google会实施“贝叶斯式‘过滤系统来识别’搜索引擎垃圾”,而且我也相信Google的众多高智商的工程师也无意于此。


Google并无意图去“惩罚”或“筛掉”任何东西,它所力求的是建立一个识别最相关网页的系统。Google使用过滤系统只是为了避免被隐藏文本技术或其它恶意欺骗技术所操控。贝叶斯式过滤法与其初衷不符。


2-2-4. 传言四:Google开始处罚互惠链接


该猜测认为:Google已开始处罚那些与其它网站交换链接的网站。但从莱斯利.罗德(Leslie Rohde)发表的一篇非常精彩的分析报告中,向我们显示了这种传言和其它类似一些传言根本站不住脚。莱斯利甚至用Scroogle.org的点击列表来查阅那些”遭到处罚”的网页,但从中亦没有发现在互惠链接和Google排名之间有什么新的对应关系。


2-2-5. 传言五:Google开始处罚那些”经过优化”的网页


该猜测认为:Google正试图把那些“经过优化”的网页排名给降下来。这种猜测不但经不起推敲,而且也是毫无道理的。因为“优化”网页可以被描述为“一种结构良好的网页,清晰表明了相关主题。”


至于Google是否会处罚那些使用了诸如隐形文字,过度充斥的HTML元标识等肮脏伎俩的网页,答案当然是肯定的。但千万别把这些伎俩跟优化混淆起来,它们只是一些Spamming技术,本来就应当受到惩戒。


2-2-6. 传言六:Google开始处罚“链接文本”


绝对不是。 如果一个站点因链向其其链接文字中使用了误导性的内容而可能遭到惩罚的的话,现在早就一片怨声载道声了。


如果一个网站纯粹出于创建与关键字相关的链接的目的而创建大量链接站点,可能会瞒过过滤系统,但这种做法属于Spamming技术,本来就应当受到惩戒。


2-2-7. 传言七:Google加害于我,它是针对个人的


我虽然并未进行详尽的研究来证实这一点,但是我敢保证,它绝不会针对个人。搜索引擎以向用户提供高质量的搜索结果为己任。也许是你提供给搜索引擎的东西并不对它们的胃口,但这并不能说明你的网站就不好,也许你需要做的只是另辟蹊径而已。

TSPR理论-如何应对Google PageRank排名新算法(一)



原著:Dan Thies
编译:Karen

第一部分: 最新消息! Google的主要变化


Google的主要变化始于2003年11月的16号,从那时候起,网上论坛就开始对此议论纷纷并产生了形形色色的推测。这种更新对一些人是坏消息,而对另外一些人却是好消息(不过大多数猜测都来自于那些认为这是坏消息的人)。Google对其变化只字不提,当然我们也别指望它会说点什么。因此,这篇文章代表了我个人的部分推测,希望它至少为读者您提供了一些“较为可靠的推测”。


除了在对搜索结果的排名方式上有一些显著变化外,Google在搜索结果的格式上亦有一些根本的改变,在我看来,这些变化在极大程度上展示了Google的整体发展方向。


我首先会回顾Google最近的变化,然后提出我对Google新策略的一些探索,并对一些不好的传言进行澄清。最后为如何在“新”Google中取得成功献上我的个人建议,供大家参考。


1-1. 总观Google新变化


现在,Google确定无疑是在进行一些新的及与以往完全不同的改变,并使得如此多查询条件受到影响,使它们的搜索结果与以往完全不同。让我们在深入挖掘其“巨大变化”之前,先来看看并未引起人们太多关注的一些较小的变化。于用户而言,这些小变化加起来产生了许多新的特性



1-1-1.关键词词干法(Keyword Stemming)


Google的另外一个变化是开始采用词干法进行搜索服务。换言之,如果在搜索框中键入“dietary”,那么也会得到一些基于“diet”的搜索结果。关于这一点还是请大家看看Google的解释–“Google目前使用了词根还原技术”。也就是说,它不再拘泥搜索与输入查询完全相同的词语,亦会向用户提供与部分或所有查询词语相近的搜索结果。例如,对于查询词语“pet lemur dietary needs”,Google也会显示“pet lemur diet needs”及其它词性变化形式的搜索结果。而且对于搜索结果页上出现的查询词本身及其不同的变化形式,Google会以粗体突出表示。”


实际上词干法的介入已有一段时间了,只是在此之前我们没法确定它到底是属于玩票还是试验性质的,不过现在看来,Google已在其搜索技术中正式引入了词干法。


1-1-2. 信息第一位了吗


在“新”Google的搜索结果中,我们很多人注意到的第一件事情就是,即使用纯粹商业性质的词语进行查询时,位于页首的却往往并非一些相关的商业性站点,而是被大量含有“信息”和“资源”的性质的页面所占据。但我却并不认为它必然地说明了Google对商业站点存在着偏见。


我反而觉得,Google目前的搜索结果的变化揭示出一些原来排名很好的网站的“真实面目”,它们虽然赚取了较高的页面级别,但却只是徒有虚名,本身并没有提供什么有份量的网站内容。而且在过去,一个网站要想排名在前十位并非什么难事,只要对页面进行优化,获取足够的外部链接数量(不管这些链接是否具有同一主题甚至是否相关),然后您再瞧––排名效果立竿见影。

如果一个网站本身的内容就很少,而且相关的外部链接又少,并且所有外部链接都是通过链接交换而得到的,这种网站的排名在Google这次的更新中往往首当其冲受到显著的影响。Google的新算法似乎对那些含有大量实用内容的主题性站点极其有利,用户喜欢的也是这样的站点。


1-1-3. 随时调整排名算法


自从去年11月15号以来,Google始终在对排名算法进行调整,有很多原来排名大幅下降的网站现在不但恢复了排名,而且位置较以往有了显著的提升。我们可以期待,Google会坚持不懈地对算法进行调整和改变来提高搜索结果的质量。


1-2. Google的发展战略


倘若搜索引擎能够理解用户的查询本意,那么向用户提供高质量的搜索结果也并非难事。但是,当用户键入“DVD PLAYER”这几个字时,你知道他到底想要什么吗?是想买DVD播放机呢,还是想知道怎么把DVD和电视相联?是想看关于DVD播放软件方面的评论呢,还是要找能够在计算机上播放DVD的软件?


Google的发展战略与其它搜索门户网站不同,其目标是向不同类型的搜索用户提供不同的搜索服务类型。“新”Google的一个有趣之处是在其主要搜索结果中开始揉合使用其它搜索工具。


《搜索引擎观察》杂志的资深编辑丹尼-苏利文(Danny Sullivan)发明了一个叫“invisible tabs”的术语,用来描述搜索引擎可能会怎样来试图提供更贴近用户本意的搜索结果。

他认为:搜索引擎(例如Google)已然能够使用多种资源(象Google就提供了网页、目录、网上论坛、新闻、在线购物、图书搜索等多种服务形式),这些资源信息将被引入搜索引擎的主要搜索结果


1-2-1. Google的商品购物搜索引擎Froogle


2002年12月,Google推出了商品购物搜索引擎Froogle测试版。用户登陆froogle.google.com后即可在网上找到想购物的网站,然后可以比较世界各地同类产品的价格。


此外,在用户进行普通查询时,若查询术语与商业相关,则Google将从Froogle获得相关商品信息,并将其展现在普通搜索结果的顶端。


对网上购物站点来说,Froogle实在是个不错的选择。不但免费收录你的网站,提交步骤亦相当简单


1-2-2. Google的目录搜索服务


Google Directory依据的是网上最大的人工编辑网络目录DMOZ,再结合Google的“网页级别”技术,让网页根据重要性来排列,并通过网页列表前的绿色横线长度来标明网页的重要程度。


在Google提供的普通搜索结果中,若一个网页已被DMOZ收录,则Google会列出该网页在DMOZ中的描述及相应的目录信息。此外,在普通搜索结果页的最上方位置,大家也可以看到与查询条件相符合的目录链接。


Google的目录搜索服务可满足那些想要浏览某特定主题下相关信息的用户。如果你的网站还未被DMOZ收录,那就赶紧行动吧。


如果你还在质疑目录列表对网站的重要性,我建议你去读一读Google搜索小贴士上的最后一段:
“当无法确定查询条件时,我们推荐用户使用Google网页目录。它可有效限定搜索范围,不会向用户显示其它类似但无关的网页。例如,若在“天文学”目录下查找“土星”,则返回关于土星的信息。而在汽车目录下搜索“土星”时,则返回通用公司“土星车”方面的信息资讯。当搜索范围涵盖太广时,使用目录服务可有效缩小搜索范围。”


Google欲自用户处了解他们想在目录下查找什么样的信息。等我讲到“主题性页面级别”的时候,你就可以明白,Google是怎样来提供与目录主题匹配的搜索结果的


1-2-3. Google的新闻搜索服务


Google新闻保留了三十天内所发生的较有价值的报道和头条新闻,用户可使用其新闻搜索系统查找当前事件的新闻。新闻报道依照发布日期,相关报道数量和新闻来源的受欢迎程度进行排序。


在一般性搜索中,我们可以看到搜索结果页顶端的部分新闻搜索结果,当用户进行一般性查询时亦可看到相关的新闻内容。


目前尚为测试版的Google News与其它搜索服务稍有不同,其新闻来源并不仅限于象“纽约时报”这样的大型传媒。目前Google新闻搜索服务已有4,500家传媒来源。尽管其它大型ICP网站也提供了重要新闻网站的链接,但在涵盖面和消息来源上往往不如Google


1-2-4 Google的图书检索服务


继亚马逊网站之后,Google也推出了其测试版图书搜索服务Google Print。用户可找到图书的简要节选,评论及作者简介等,甚至可能找到图书的外观照片。搜索结果中还提供了在哪里可以买到这本书的相关链接以及Google的相关广告。Google一直都在探索如何进一步提高搜索服务的水平,这次推出的图书搜索服务的测试正是该公司不断改进搜索服务努力的一部分。目前该项服务所提供的印刷图书数量仍十分有限,不过Google这个搜索巨人是不会让我们失望的,让我们拭目以待吧。

1-2-5. Google会推出更多搜索服务吗?


Google不断地推出新的搜索服务,其目的无外为用户提供更好的搜索体验。这不但对用户来说是个好消息,因为他们可以更加便捷地找到自己所需的信息,而且对网站也是好事情。可能不久以后网站就只需针对目标群体来有的放矢,而无须在日益庞大的搜索结果中喊破嗓子来招揽生意了。

Google PageRank 算法解析
2004-04-20 14:48:22 posted by Lela



  什么是PageRank?


PageRank是Google衡量网页重要性的工具,测量值范围为从1至10分别表示某网页的重要性。在Google工具栏可以随时获得某网页的PageRank值。在这里我们将透视PageRank的一些特殊之处,从而对其能够获得较为深入的了解,使广大用户能够更好的使用和了解Googel。


  网站 排名的历史渊源


  上世纪90年代早期网络刚刚兴起之时,每天都有大量的含有特别行业内容的站点发布于网上。网上冲浪者却没有相应的工具定位这些他们认为存在的,但是却没有办法找到域名或网址的站点。到了1993年,雅虎诞生了。雅虎的诞生为网民减轻了这些烦恼。雅虎最初将每一个它所找到的网站,按照所属的分类目录进行划分组织,建立起一个整洁的、可以逐级查找的数据库,雅虎同时也在网站上置入一个 搜索引擎可以根据数据库中存在的“关键词”搜索到网站。接着其他搜索引擎如Altavista ,Excite, Lycos等也相继推出供用户使用的搜索工具。他们中的大多数是根据找到的元标识中的关键词来识别网站的相关性。
  
  事情好像发展地很顺利,但是当站主及网管意识到可以在元标识中插入行业关键词或其他站点代码,就可以巧妙的得到搜索结果页面上的较高的位置的时候问题来了。有一段时间,搜索引擎的结果被这些垃圾网站搞得乱七八糟,他们用某些相关的关键词充斥于网站的各个角落,可是展现在用户面前的实际内容确实糟糕透顶。那些信用较高、地位重要的搜索引擎开始受到挑战,他们必须采取更好的措施精确为用户输出的搜索结果。


  Google网页级别详解


  Google意识到了传统搜索引擎所面临的这种问题。如果相关性有网管来控制的话,那么排名结果必将被他们人为安排的大量相关关键词所污染,掩蔽了真正的相关性。


  网络的本质就是超链接。我们从逻辑上分析,每个人都让自己的网站与某些重要的站点相链接,那么,本质上,这个站点就投了对方的一票。当上百上千个站点链接到这个站点时,我们认为这个站点是一个很好的很重要的站点也就非常符合逻辑了。


  就是在这样的逻辑推理下,Google的两位创始人Sergey Brin及Larry Page建立了一个搜索引擎算法公式,即将排名比重转移到了网页意外的因素上。他们的公式被命名为“PageRank”(以创建人Larry Page的名字命名)。Google就是利用这一公式计算链接到某一网页的网站数量,然后按照从1-10分别给予表示重要度的分数。链接到网页的站点越多,PageRank的分数越高。


  Sergey Brin和Larry Page在1998年把PageRank技术配置进Google一同推出。结果出乎的成功。Google这种难以认为控制的算法公司得出的出众的相关结果大大超过了竞争对手。这种新的算法不仅有助于提供出权威的高质量的信息,而且使得站主即网管很难利用作弊手段取得较高排名。


  Google的PageRank之所以如此重要,就是因为影响网页排名的因素主要是依赖于网页意外的因素,而非能够认为操纵的因素。


  Google对PageRank的解释


  在Google网站上有一个专门的域名介绍PageRank(http://www.Google.com/technology/


  PageRank完全依靠的是网络的民主特性,利用大量的链接结构表明某个单独页面的价值。本质上来说,Google把链接转换为一次投票,当从网页 A 链接到网页 B 时,Google 就认为“网页 A 投了网页 B 一票”。 Google 也不是纯粹考虑投票的数量,还对投票的网页进行分析。本身很重要的网页的投票有助于增强其他对方网页的重要度。


  重要的是,Google会记录每次的搜索行为,高质量的网站能够获得较高的PageRank分值。当然,重要的网页如果不能匹配你的查询就没有任何价值。所以,Google把PageRank技术及文本匹配技术进行结合从而搜索出既重要又相关的的结果。Google的匹配技术不是只考虑词条在网页上的出现次数,而是检查网页内容(及链接网页的内容)的所有方面,从而决定该网页是否匹配你的查询。


  更多信息访问Google PageRank介绍:


  http://www.Google.com/webmasters/4.html
  
  http://www.Google.com/technology/



  搜索引擎排名与PageRank的关系


  虽然每个搜索引擎都严格保密各自的明确的搜索算法,但是搜索引擎分析人士相信搜索引擎结果(排名列表)是“Page Relevance”与“PageRank”因素综合承继的结果。


  Ranking = (Page Relevance) x (PageRank)


  PageRank逻辑算法无疑是具有重大意义的,而且这种算法不能够被网管人员轻易操纵。Google的搜索结果能够显示出如此高的相关性无疑也是它能够获得彻底成功的重要原因之一。大多数其他搜索引擎已经完全采用同类模式作为自己的搜索算法,而有的搜索引擎将这种算法在决定结果排名中的重要程度进行定义后应用与自己的搜索结果中。
自网络发展的初期,搜索引擎就一直不断的努力试图开发出可以排列相关网页的搜索算法。大多数搜索引擎重视于“链接流行度”(link popularity),作为评价网页重要度及用于索引的标准


  Google 工具栏


  Google工具栏供人免费下载安装,除了某些有用的功能外,比较显著的一个特点就是它可以告诉用户目前正在访问的每个网页的PageRank值。


  下载后的Google工具栏位于浏览器窗口下部,可随时随地进行网上搜索。工具栏显示出每个页面从1-10不等的PageRank分值。对于Google未索引的网页,工具栏不会显示出该页的PageRank分值。需要提醒的是,该分值是针对网页而言,而非网站。


  注:PR值越高,说明营销人员要针对相应的搜索词条获得较高的排名位置就有更多的竞争。所以,我们建议根据关键词优化你的网页PR值。


  什么是链接流行度?


  “链接流行度”系统是基于网页获得的链接的数量及质量而定的。也就是说,指向你的网页的链接数量越多,你的网页将被搜索引擎认为越重要。数量并不是决定网站重要度的唯一因素,重要度还取决于其他因素,包括被链接到本站点的站点的质量、他们的内容的质量及与本站点的行业相关性等。


  链接到本站点的网页会把PageRank的部分分值分配到本站点。所以链接页面的PageRank分值越高,分配给本站点的分值也就越高。


  PageRank也会被链接页面商店所有导出链接所瓜分。譬如,同样PR为5的链接网页,导出链接只有15个的网页会比导出链接为100个的网页分配给你更多的分值。


  所以重要的是要从PR值较高并且总体导出链接数量较少网页才能获得安全链接。


  如何检测链接流行度


  最简单的检测网站流行度的方法就是利用Google搜索,方法如下:


  link:www.yoursite.com


  其它主要搜索引擎在搜索你的链接流行度时都有不同的规则。


  建立链接流行度提高PageRank


  建立链接流行度是搜索引擎营销的一个重要方面。尽管认为的提高PageRank不是意见容易的事,但是你通过改善链接流行度就可以不难做到。通过长期不懈的关注建立链接的工作,你就会提高站点的PageRank,大大改善自己的站点排名。


  就在不久前,Google及其他搜索引擎配制了某些类似与PageRank的算法成分(如TSPR”Topic Sensitive PageRank”,Hilltop“Links from expert documents”),进一步将决定排名的比重放置在页面以外因素上。
随着页面以外因素在网站排名中受到重视,所以提高加强这些因素的重视就变得越来越重要。当越来越多的网管意识到PageRank及链接流行度的重要性时,就不难在同行业中与其他站点进行链接交换了。(编译lela)



  作者Hariot Kaleka是www.seorank.com一位SEO广告文编写人,该公司是一家主要提供搜索引擎优化服务的公司。

Google Toolbar与RealPlayer捆绑 扩大分布范围
2004-04-21 11:05:50 posted by Lela 




  Google与美国网络媒体公司RealNetworks于当地时间4月20日宣布Google工具栏将与Real Player10捆绑,供用户同时下载使用。至此,双方的合作不仅使得Google搜索用户可以在浏览器窗口中安装Google工具栏,也可以使得该工具栏接触到每天大量下载新的RealPlayer10的用户。举措一出,Google工具栏肯定会每天出现在计算机用户的浏览器窗口中,而且极有可能使喜欢雅虎或其他 搜索引擎的用户看到。


  RealNetworks是美国著名数字媒体服务及软件开发商,最近发布的Real Player10是一款免费的媒体播放机,也是第一个可以在所有主要的媒体格式下播放内容的播放机,如:Real Video,Real Audio,AAC,Windows Media,Quick Time,MPEG4及MP3等。Google工具栏则是一种免费下载浏览器工具,可以进行Google搜索及阻止弹出广告等功能。


  在RealPlayer下载选择项中加入了Google工具栏的选择项,用户可以选择是否按照该工具栏。双方公司表示,此次合作将有助于提高全世界用户的网络体验。


  “RealPlayer的普及与Google工具栏组合后,我们希望全世界用户改善加强他们的媒体重放及网络搜索体验的效果,”RealNetworks公司负责北美销售工作的副总裁Carla Stratfold说。“我们与Google的合作关系表明我们要与最佳品牌的产品及服务合作,使我们能够接触到全球市场的每一个用户。”


  Google公司同样表达了他们对合作的满意,负责全球销售及室外操作的副总裁Omid Kordestani说:“RealPlayer10是为Google工具栏扩大分布范围的非常有价值的平台。我们希望使世界上的所有用户能够得到他们想要的所有信息,而且为RealPlayer10用户提供免费的弹出广告阻止器及自动填充器。Google将进一步丰富他们的网络体验。”


  由于MSN, Yahoo,Amazon A9,UCMore等及其他与搜索有关的工具不断出现于市场,相信在搜索引擎公司之间必将开始一场“工具栏大战”。(编译lela)