Google学习日志

Google是一个神话? Google搜索引擎/排名/推广/网络营销全记录

  DonewsBlog  |  Donews首页  |  Donews社区  |  Donews邮箱  |  我的首页  |  联系作者  |  聚合   |  登录
  113篇文章 :: 0篇收藏:: 0篇评论:: 0个Trackbacks

公告

Google学习日志在某网站的估价竟然是1,809,640 RMB,排行第三,不明白,不明白.




文章

收藏

相册

Google

Search

Web

存档


正在读取评论……


2004年04月


Google上市将改写全球富豪榜
2004-04-28 16:20:10 posted by Lela


  你很难想象咱们这个星球上居然有像Google这样的公司:上千名穿着休闲服的软件工程师可以尽情享用公司提供的免费的丰盛午餐,甚至免费的按摩服务;而不经意之间,你就会发现这个公司的大老板、创办人之一佩奇穿着溜冰鞋在你身边呼啸而过;更刺激的是,这些工程师不会被固定在一个团队里,从事一项固定的工作,他们可以为了一项自己感兴趣的课题而自由组合,半年甚至几个月,再继续寻找下一个“自由组合”。

  如果这还不够令人惊讶,那么一个更令人惊讶的事实是,正是这么一个作风“散漫”的公司,从1998年建立开始,到去年它的五岁生日,资产已经从100万美元迅速扩张至2亿多美元。这意味着,按八小时工作日计算,这个公司每秒钟就有6美元的资生诞生。现在,全世界每秒钟就有超过3000台电脑通过Google发送查询指令。

  市值超过200亿美元

  有媒体披露,Google将在本月底宣布本年度初最重大的首次公开募股(IPO)。

  Google在去年的销售额高达9亿美元,纯利润高达1.5亿美元。早在去年9月,就有人把它和其他的网络公司相比。根据当时公布的数据,雅虎的市值是380亿美元,亚马逊和eBay分别是200亿美元和540亿美元。有分析师据此认为,Google的市值至少应该在200亿美元以上。

  毫无疑问,这个消息足以让整个华尔街疯狂。

  按创始人佩奇和布林最早的想法是,Google并不急着上市。“他们之所以要在今年4月进行IPO,”一位媒体同仁说,“主要是美国证监会的一些要求促使它尽快作决定。”

  根据美国证监会的规定,拥有超过500名股东、资产高达1000万美元以上的公司必须公开其商业信息,而且应该在财政年度结束后的4个月内,公开他们的财务状况。这个条款曾经激发了不少美国公司干脆开展IPO的热情。而Google也符合这一规定:他有1000多员工拥有公司的股票选择期权,而资产早已过亿。

  这样一家公司上市后,会不会对其他 搜索引擎公司造成较大冲击?

  目前,Google在国外的主要竞争对手是雅虎在中国内地,Google正面临着 百度、 新浪、 搜狐、中国搜索联盟等的挑战。

  雅虎的中国区总裁周鸿祎认为,Google的上市对雅虎在中国区的业务不会造成什么冲击,“如果Google要来中国开展业务,就会涉及到本土化问题,届时将需要有本土化的人才、技术和营销渠道。”周说,“这些需要时间和经验,当初雅虎在这方面也是交了学费的。”

  但事实上,Google的搜索现在覆盖了89种语言和方言,这代表了82个国家,它至少说明Google不会放弃海外市场。特别是中文版的Google和中文版中出现的广告更是表明,Google已经涉足中国市场。Google是否有在中国做大的计划?当记者致电Google总部时,Google的全球公关弗斯特女士没有回答这个问题。

  投行吞食1亿美元

  如果Google的IPO获得成功,它将是美国有史以来金额最大的IPO之一,投资银行可以从中获取近1亿美元的费用。

  早在几个月以前,大家就在谁会成为“幸运儿”进行了长期的猜测。但近期一位消息人士向媒体透露,Google将请瑞士信贷第一波士顿和摩根士丹利作牵头银行协助上市,从而结束了外界连续几个月以来的种种猜测。

  对瑞士信贷第一波士顿来说,Google肯定是“天上掉下来的馅饼”。虽然瑞士信贷在辅导高科技公司IPO方面享有较高的声誉,但是由于几年前的一桩IPO丑闻,其原雇员Frank Quattrone迄今仍受审查,这对该公司的名誉造成了一定的影响。另外,两年前,该公司还花了1亿美元消除了一项不利于它的违规指控,该指控认定它为了多收取额外佣金,而向一些投资机构提供了一些热门IPO公司的股票。然而有媒体披露,由于Google雇用了该公司的一位前网络股票分析师Lise Buyer担任业务主任,所以这个投资银行获得了Google的合同。

  不过,也许摩根士丹利才是Google上市合同的最大赢家。摩根士丹利聘请了全美最著名、最具影响力的网络分析师Mary Meeker。有媒体认为,这位被美国传媒界誉为“网络股女皇”的著名分析师对摩根士丹利获得Google的IPO合同起到了重要的作用。

  熟悉内部情况的人士透露,花旗集团、高盛也有可能在此次IPO中扮演重要的角色,而JP摩根和雷曼兄弟也会介入。这些均被Google列入第二波考虑的银行名单。

  但是记者致电Google总部时,Google的一位发言人拒绝对上述情况作出评论。而瑞士信贷第一波士顿和摩根士丹利两家投资银行在香港办事处的工作人员也均对此事表示“不知道”或是不予置评。

  然而,上述自称熟悉内幕的人士介绍说,Google在选择投资银行方面显得异常小心。去年,它和10多家投资银行进行了接触,然后筛选掉一半左右。“这些银行自去年第一次和Google接触之后,就很少再从Google方面得到消息,直到今年3月份。现在,有关IPO的细节仍是个谜。

  有关IPO的规模以及价格等信息被视为高度机密,其中有一些条款也许仍在商讨之中。”这位人士说,“甚至本周他们宣布IPO时会公开多少信息也是个未知数。”

  据一家海外媒体分析,高盛本来也是有力争夺者之一,但是Google管理人员对高盛和微软、雅虎的紧密关系感到担心。而且高盛对Google高层人员提出的通过网上竞购的IPO方式持保留意见,这也限制了它的成功入选。

  Google在IPO方面的确不是个慷慨的企业。那位熟悉内幕的人士透露,Google的高层官员实际上并不看重投资银行的圈子,也不愿意为这个圈子内的银行交钱。

  为了能绕过华尔街直接向投资者售股,从而与丑闻不断的投资银行保持距离,同时得到数量众多的小股东,Google的高层管理人员还探索了网上拍卖的可能性,据悉,Google创始人布林和佩奇对此非常支持,他们总是寻求以技术手段解决问题。

  改写富豪排行榜

  Google IPO将使其创始人一夜之间亦将跨入巨富行列。

  首当其冲的是Google的创始人——布林和佩奇。现在两人持有的Google股份占到了总数的1/3-1/2。Google上市之后他们的身价将超过现在的雅虎总裁杨致远。以雅虎市值380亿美元计,杨致远身价为20亿美元。

  作为Google的首位外部投资者,Sun公司创始人之一Andy Bechtolsheim1在1998年投资了20万美元购买Google的股票。尽管现在仅持有1%的股份,但其投资也将飙升到3亿美元以上。

  1998年,美国在线以2200万美元和1000万投入Google。另外,Kleiner Perkins Caufield&Byers和Sequoia Capital两家风险投资基金也曾于1999年6月投资刚刚出生的Google,每家各自拥有约11-14%的股份。这些股份价值将增值为数十亿美金。

  Google的其它投资者包括创始人佩奇和布林的母校斯坦福大学,Sun公司创始人Andy Bechtolsheim、网景创始人Marc Andreessen、eBay创立者Pierre M.Omidyar、风险投资基金Kleiner Perkins Caufield&Byers和Sequoia Capital以及Google现在最大的竞争者雅虎。他们当初投入到Google的钱都将升值几百倍。

  现年31岁的佩奇是一位计算机教授和数据库顾问专家的儿子,30岁的布林是一位数学教授的儿子,这两个美国斯坦福大学计算机学系的博士生在中途退学后创办了Google。1998年,他们为新创的搜索引擎公司命名时,取的其实是数学名词“googol”(10的100次方,意为巨大的数字)的谐音。

  显然,他们心底蕴藏着的是一个野心勃勃的梦想。来源: 21世纪经济报道




Google最新推出拼音汉字自动转换功能



  目前,中文Google已经推出最新的拼音汉字自动转换功能,只要在搜索框中输入汉语拼音,Google可以自动转换为同音词进行提示,进一步精确搜索请求。由此,Google在中文搜索领域迈出具有重大意义的一步。

  拼音汉字转换功能是Google 运用智能软件系统对拼音关键词能进行自动中文转换并提供相应提示(需用简体中文界面)。 例如:搜索“shang wu tong”, Google 能自动提示 “您是不是要找:商务通”。 如果您点击“商务通”, Google 将以“商务通”作为关键词进行搜索。对于拼音和中文混和关键词, 系统也能做有效转换。 对于拼音“lü”, “lüe”, “nü” 或 “nüe”,您可输入 “lv”, “lve”, “nv” 或 “nve”. 如果拼音中没有空格, 例如 “shangwutong”,Google 也会做相应处理,但是在多个拼音中加空格能提高转换准确率和速度。

  据报道,Google将于本月底公开上市,目前已经选定瑞士信贷第一波士顿及摩根士丹利两家投资银行为其上市承销商。华尔街人士认为,Google的IPO可能成为美国股市历史上最大规模的一次上市发行。如果发行成功,将引发科技企业新一轮上市热潮。分析人士预计,Google的年利润大约在1.5亿到3.5亿美元之间,营收则大约为每年5亿到10亿美元,而Google上市后的市值将达到120亿到200亿美元之间。届时Google将成为世界上最具价值的 搜索引擎

  此次专门针对中国市场做的这项技术升级只是Google无数次技术升级中的小小一次,加之其最著名的AdWords关键词广告推出中文版,已经充分反映了Google对中国市场的高度重视,同时也是对国内搜索引擎的一次不小的冲击。国内搜索引擎要想超越Google,守住中文搜索的本土领地,势必应该首先加强自己的技术实力。

  北京奕天锐新科技有限公司曾对Google的拼音汉字转换功能进行过测试,并同国内中文搜索引擎 百度的中文搜索结果作以比较,认为两者拼音搜索效果不相上下。



 Google可读取Flash文件

虽然Google可以在其数据库中存储Flash文件已经不是什么新鲜事了,但是你听说过它可以读取二进制格式文件吗?

  以下所片断是从搜索结果中截取的,很显然,它们出自Flash文件:

  0% LOADING 5% 10% 15% 20% 25% ... Loading. Please wait. SKIP BACK Intuitive Intuitive Friendly ...

  如果你还是不能确定的话,可以尝试搜索“Kingdom Ceramics enter”,然后你会发现以下的结果:

  0% LOADING 5% 10% 15% 20% 25% 30% 35% 40% 45% 50% 55% 60% 65% 70% ... Enter Virtual Tour Enter Exhibition (Exit Virtual Tour) "Welcome to the Kingdom Ceramics Virtual Tour!" "How may I help you today?" "Please show me the...

 把以上的截取片断与该站点上的Flash文件进行比较后,你就会得出结论:这些是文件中的信息。

   Google未对是否可以读取Flash二进制格式文件发表正式评论。但是以上的观测至少提醒Flash设计者们,是时候学些SEO方面的知识了。

  相关链接:FLASH技术在网页设计和网络广告中的应用非常广泛,有些网站为了追求美观,甚至将整个首页全部用FLASH方式设计,但是由于Flash的先天缺陷使得 搜索引擎无法识别FLASH中的信息,因而不能被搜索引擎正确检索,从而使得网站被检索到的几率大大下降;另一方面由于FLASH网站可能存在部分浏览方面的问题,使网站推广的效果大受影响。

去年,为AllTheWeb.com及 Lycos提供搜索技术的公司FAST Search宣称可以检索到使用Flash的网页,Google也可以利用标准Macromedia开发工具包实现在某些方面检索到Flash文件中的链接。但总体来说,在目前情况下,Flash网站被搜索引擎检索还有很多问题,因此,如果决定要采用Flash网站时,应该首先考虑到搜索引擎优化(SEO)设计问题。




如何在服务器之间移动网站而不影响排名 

  原著:Serge Thibodeau
编译:Karen    


  

如果出于种种原因,例如宕机时间过于频繁,服务器超载而且速度奇慢, 总之您对目前所使用的网络托管服务供应商感到不甚满意,或者是发现了一个能够提供更多特性化服务的供应商,而想把站点从一台服务器上迁到另外一台服务器上去,这并非什么难事,但在迁站过程中需谨记以下几点:
 联系新服务商—不可操之过急
自然你是不会希望在你的网站宕机时间内搜索引擎的Spiders凑巧会来访问你的网站。要避免这种情况,最好的方式当然是不要宕机。如果能够确保在服务器之间迁站操作正确无误,宕机问题应该可以避免。
在考虑取消原来的服务提供商之前,务必先找好新的供应商。在决定下来要使用新供应商的服务后可先与他们联系开个帐号,然后一定要确保所有的文件都正确无误地传到他们的服务器上了。这一步完成后,再仔细检查一下有无问题,做好这一切工作后,而且必须是在确保网站在新服务器上运行无碍后再联系你的原供应商,告之你将于“不久”后终止与他们的合作。切记不要让他们现在就关闭你的帐号,因为你还需要更换你的域名服务器,否则客户无法访问你的网站。
 
 联系域名注册商—变更域名服务器(DNS) 
把整个网站的文件都上传到新供应商的服务器上,再通知原来的供应商“不久”后要终止和他们的合作。这一切工作完成后,接下来需要做的就是联系您的域名注册商,对域名解析(DNS)服务器做相应的变更。具体步骤是把网站在域名注册商处先前使用的域名服务器改成新网络新托管服务供应商提供的新域名服务器。一旦更改完毕,那么在未来24小时到 48小时内,最迟不会超过72个小时,该变化就可奏效,客户就可以象原来一样访问到你的网站了。
要知道,互联网是依靠域名解析服务器(DNS)来运做的。域名服务器负责把域名转换成计算机能够理解的数字IP地址。比如,如果有用户要访问你的网站www.168mms.com,那么域名服务器会把www.168mms.com转换成IP地址如“210.110.75.*”,这样就可以找到存放你的网站内容的网络服务器了。域名服务器的数量因互联网的高速发展而不断递增。
 
 “新”网站运行良好后再关闭旧帐号 
现在,如果搜索引擎的robot程序,象Google的Googlebot或是雅虎的Slurp来访问你的站点,无论是从旧IP地址还是新IP地址,它们都不会发现有任何异样,所以仍然会和以往一样来检索你的网站。
现在可以理解为什么我要建议您先开好帐户,并确保所有文件都先安全准确地迁移到新服务器上了吧!—因为这样作就可以避免网站出现不必要的宕机问题。

在网站迁到新服务器上后一个星期之后,如果运行情况良好,而且没有出现任何后遗症,这时候就可以联系原来的服务供应商要求关闭您在他们服务器上的帐户了。
 
 其它注意事项: 
在如今这个高速发展的互联网时代,更换网络托管服务就象换衣服一样轻而易举。只要遵循上面的步骤来操作,绝对没问题。不过还是要提醒大家一点:在选择新的网络托管服务商时,不要只考虑谁的服务价格更便宜。除了价格最低廉外,还需要考虑其它很多因素,诸如实用性、可靠性、稳定性,以及是否有高效迅速的客户支持,是否有经验丰富的技术人员等等,都是需要考虑的重要因素。还有象否有免费的服务电话,这可以为你节省一大笔电话费用。
另外一个需要考虑到的重要因素就是紧急后备电源的问题。98年1月,在加拿大奎北克省的蒙特利尔地区和其它大部分地区遭受到有史以来最大的一场冰暴袭击,造成了该省一些地区停电时间长达6周之久。在这些地区中,只有那些装备了柴油发动机作为后备发电装置的网络供应商没有因为这场灾难受到任何影响和损失,他们的客户自然也安然地置身于这场灾难之外。




不知道是个什么日子,google英文版换了个logo,但google中文还没有开始换.

google开始dance了?

Earth Day 2004




TSPR理论-如何应对Google PageRank排名新算法(三)


 原著:Dan Thies
编译:Karen



第三部分: 如何在Google新算法中拔得头筹

如何应对Google的新算法?大家可以根据下面所列的一些要点采取相应的措施。

3-1. 关键词的研究:扩大覆盖面

搜索引擎策略的中心思想是确定恰当的关键词来锁定目标群体。但有很多网站管理员却在这一步上掉以轻心,只在屈指可数的几个平平常常的关键词身上铆足了劲,却不知这种策略失之偏颇。关键词研究的主要目标应该是确定目标群体所有可能使用的关键词,其中包括了品牌名称、地理位置及修饰语等“修饰成分”。

尽管对网站的每个页面只能围绕两到三个关键词进行关键词优化,但通过关键词和修饰成分的有机结合,亦可大幅提高网站对搜索结果的覆盖率。对于Google在去年11月15号所做的更新,有很多实施了有效关键词策略的网站管理员压根就没有注意到。原因很简单:他们锁定的是所有可能相关的关键词,覆盖面极广,所以虽然个别一般性的关键词的排名下降了,但网站的整体访问量并未受到什么影响。

若只针对少数关键词,而且这些关键词都有很好的排名,这种策略看起来似乎也蛮不错。可是一旦搜索引擎改变了排名算法,就象Google这次一样,这种缺乏灵活性的策略可就撞上南墙了--正确的做法是锁定所有可能相关的关键词,扩大对搜索结果的涵盖面,给自己的搜索引擎策略打下一个坚实的基础。

3-2. 网站结构的有效性

为保证“广泛的关键词”策略的有效性,网站需要进行组织,让搜索引擎可以顺利地遍历或检索网站内的所有网页。为了更好的理解这一点,让我们先来看看搜索引擎的Spiders是如何遍历网站的。

在对网站的第一次造访中,Spider首先会取得一个叫做Robots.txt的文件来决定是否允许它检索。

当Spiders从另外一个站点发现你网站的链接时,若Robots.txt文件里并未声明不允许它访问该页面,则Spiders会把这个页面保存下来。它不一定就是主页,也可能是你网站的其它页面。

Spider在对这一页进行检索时,它会从中摘录一些关于内容方面的信息和页面上的所有链接,并将其放入搜索引擎的数据库里面。如果它所认为你的网站十分重要,它稍后会检索这些链接页面。

如果你在网站的每个页面上都放了一组指向网站主要部分的链接(网站全局导航链接),那么接下来这些链接页极有可能得到Spider的检索。假设网站上的每个页面上都依次放有指向网站主要内容的链接,那么搜索引擎要想遍历整个网站真是易如反掌。

因而,最有效的网站结构当属自顶而下(Top-Down)或金字塔型设计结构。规模较大的网站(至少十几页)应设立一个网站地图页,用以列出网站的所有内部链接页。SUN微电子公司的网上大师级人物杰可布.尼尔森(Jakob Nielsen)认为:一个网站设计的精良与否的一个重要标志就是是否有网站地图。

许多人对文本链接方式的网站导航持排斥态度(可能因为它不那么漂亮吧),而是热衷于Flash或动态网页(DHTML)形式的菜单。使用这种导航方式的人要当心了,因为搜索引擎目前尚无法很好地支持这种导航系统。不过别担心,只需将文本导航链接放到网页的最下方,这样既保持了你喜欢的网站风格,又向搜索引擎提供了更对它们口味的东西,可谓皆大欢喜。

内容清楚的文字性链接不但可使你的网站很容易得到Spiders的检索,而且对我们这些真实的访问者来说亦一目了然。做文字链接时需注意一个问题:尽量让网站的内容只需最多两三次点击就可以打开,可创建一个网站地图把这些链接放到一起。

3-3. 创建大量优化网站内容

网站的结构就象一个框架。我们已经知道了如何构建一个友好的网站结构,接下来该向结构中填加内容了。

先记住完成步骤一(3-1)后找到的所有相关关键词以及相应的修饰语,现在我们可以在每一页的内容上,在下面几个地方放上相关的主要关键词,并予以恰当的修饰:
1. 网页的<TITLE>中
2. HTML源码中的关键词和描述元标识(META Keywords & Meta Description)
3. 页面上的主标题文字<heading>和各部分的标题文字<headings (H1– H6)>
4. 网页正文中的段落(<P></P>)和列表(<List></List>)之中

不必太担心象“关键词密度”这样“深奥”的东西。只需自然地使用关键词,利用不同的单词变化形式,并辅以恰当的修饰语。而且只需在页面上可以看见的文本内容中出现若干次关键词,并将这些关键词放在页面上较为突出的位置上就OK了。没必要再向其它毫不相干的地方“填塞”关键词。

假设你已经为要建设的网站拟定了大量内容––建设一个内容相当多的网站着实是一项有些让人望而生畏的任务。实际上也确有一些人望而却步,转而使用诸如机器自动生成的“门页”等这样一些廉价的伎俩,大家千万别相信这些投机取巧的方法,它们只会增加你遭到搜索引擎处罚的可能性而不是你想要的排名。况且,网站内容的开发工作并没有那么难。

如果你是自己做这项工作,你完全可以把工作分做几步来开展,这样就轻松多了。例如,若将工作分做10个步骤,且每个步骤中需创建10个页面,你就可以每天只完成一两页内容,等一个步骤完成后再继续下一个步骤。

花上两三个月来构建一个既实用又兼具丰富内容的站点是值得的。别忘了要经常给网站补充新鲜的内容––即使一个星期只补充一点内容,时间长了之后,用户总会看到内容上的质的飞跃。而且网站的内容越多,搜索引擎用户发现它的机会也就越大。

3-4. 链接策略

现在你的网站不但漂亮而且实用,不但内容丰富,而且关键词完美涵盖了所有用户可能用到的查询条件。每个页面都是一个优化的典范,且被极佳地相互链接起来... 现在可以松口气了吗?别急,革命尚未成功。若现在你就停滞不前了,那你一定会得失望。搜索引擎不会对一个没有任何外部链接的网站青睐有加。因为外部链接往往意味着业内其它网站对你的认知程度。要想得到理想的排名,你还需要花时间来进行网站推广和逐步建立网站的导入链接。

如果想在“新”Google中取得成效,就需要锁定那些来自相关站点的相关链接。数量当然是多多益善了。问题是:怎么去找这样的链接呢?

首先,向所有能找到的相关目录提交你的网站。象DMOZ这种大型目录当然是首选目标了,不过一些规模相对较小的分类目录也是理想的提交对象,如GoGuides,Skaffe,Gimpsy,WebSavvy,等等。

其次,可从相关站点群体获得相关链接。以所有主要目标关键词为查询条件,从Google上查找那些排名位居榜首的网页。排名前20到30名的网页一般来说相关度最高,因而都可能是理想的目标。再依次访问其中的每个网站-–若这些网站提供有链接页,或链接到相关站点,可以向他们请求交换链接。然后再看看有哪些网站链向它们,再设法同这些网站交换链接。

尽量控制链接的放置位置。即使是一个罗列了大量链接的“资源”页的相关链接也是不错的。若链接位于访问量较好的页面,可使你赚进显著的访问量。找一找这样的网页,和他们进行互惠链接。

一般情况下,链接页上都会放置自己的首页作为到自己网站的链接。但也不尽然。在建立链接时,也可以为网站的“内部”页面寻找链接的机会。

3-5. 不要“见好就收”!

大多数人很容易步入的一个误区是:一旦他们的网站在搜索引擎中的排名效果显著上升,并由此而使访问量得到可观的增加后,他们就开始忙于应付新访问者了,而不再为网站的内容、链接花心思了,甚至没有心思再去看他的网站排名了。

不久之后,倘若Google或任何一家搜索引擎把他们的排名给刷下来了,他们就开始牢骚满腹,说什么搜索结果不公正,搜索引擎在迫害他们...等等等等。

对此,我的建议很简单-–不要因为排名上去了就停止努力,继续寻找新的相关关键词,继续创建链接,继续为网站添加新鲜“血液”,保持网站的最新状态。记住:无论是排在你后面还是前面的竞争对手,没有人会停止和你竞争的。

你的努力往往需要过上几个月才会在搜索结果中体现出来。可是有些人在几个星期之后就因为没有看到直接的效果而放弃了。如果在网站的搜索引擎排名上掉以轻心,等发觉问题时,你已经落后至少好几个月了。

假如你已经为网站开展了搜索引擎策略,并已投入相应的人力、物力和财力,这时候一定要记住:贵在坚持。不要轻易放弃,也不要“见好就收”。




TSPR理论-如何应对Google PageRank排名新算法(二)


 原著:Dan Thies
编译:Karen



第二部分: 探索Google PageRank新算法(上)
---对Google的新排名算法有多种猜测。此文仅做抛砖引玉之用。

2-1. Google的主题性趋向

2-1-1. 关于页面级别(PageRank)及Google的旧算法出现问题的原因

页面级别(PageRank)计算系统所遵循的思路是:通过一个经由互联网的“随机运动”来告诉你哪些站点是最重要的。该系统模拟的是一个随机冲浪者跟进点击某页面上的随机链接,至最深层页面时按“返回”按钮这一过程。页面的等级越高,则随机网络冲浪者发现它的机率亦越高。

这种思路其实相当富有创意。一个网页的外部链接越多,则对任意网络冲浪者来说,发现它的机会也就越大。同时,在页面级别算法系统中,页面越流行,则其导入链接就越能从链接中受益—这是由于任意网络冲浪者发现这些链接的机会就越大。

在特定领域的研究论文查询方面,页面级别系统几乎无可挑剔。例如,如果用户查询关于素粒子物理学研究方面的论文(或网页)文献集,则对于一个给定条件的查询,页面级别的算法可以很快告诉你,哪些论文才是与该特定查询条件最相关及最重要的论文,其原因就在于这些论文较其它论文的引用次数要多。

若互联网上的资源具有同一主题性,那么这种工作可说是尽善尽美了。但正如我们所知道的,互联网上的资源涵盖了上百万甚至更多的主题,而且在人们的实际生活中,查询用户所寻找的往往是一些具有特定主题的信息。所以虽然页面级别系统考虑了所有链接,但却忽视了链接页面的主题性。

Google已试图将链接的文本内容计入排名算法来克服这一局限性。但精明的搜索引擎营销商却通过在网络上到处建立充盈关键词的链接来欺骗Google的排名算法。一种新的作坊式行业也随着PageRank应运而生—即有偿交换和交易一些来自较高“页面级别”页的链接。

如果网站能够从毫不相关的站点购买或交易导入链接而使网站排名得到提升的话,那么页面级别技术已然无法为绝大多数查询条件提供高质量的搜索结果了。我们有理由相信,当Google这个世界最顶级的搜索引擎一旦发现其搜索结果的质量开始恶化时,它是不会坐视不管的。

2-1-2. 新技术闪亮登场:主题性页面级别技术(Topic-Sensitive PageRank)

2002年,斯坦福大学的一名博士生塔赫尔。哈维利瓦拉(Taher H. Haveliwala)发表了一篇非常有意思的论文,名为“Topic-Sensitive PageRank(主题性页面级别计算系统)”。而更加有趣的是,一年之后哈维利瓦拉成了Google的一份子。

“主题性页面级别计算系统”通过对随机查询用户的随机运动增加一个“偏差”来处理基本的页面级别计算系统所存在的问题。这个新的随机查询用户具有明确的查询目的,并更感兴趣于跟进那些具有某个特定主题的相关网页上的相关链接。这是一个相对而言较为新颖的思路,它解决了搜索结果的质量性方面的一系列关键性问题。

毫无疑问,哈维利瓦拉将成为搜索引擎业界中一个举足轻重的角色。他已经在搜索技术的其它领域方面进行了一些实质性的研究工作,包括如何更有效计算页面级别方面的一些比较有趣的研究。

在最初的研究论文中,哈维利瓦拉描述了他是如何利用斯坦福大学的网络数据库,对应于ODP(开放目录)的16个顶级目录的16个主题来计算“主题性”页面级别得分。虽然该研究的主题和数据数量(8千万个网页)十分有限,但能够看出这种新系统可改善搜索结果,且具备对查询用户感兴趣于何种主题的理解能力。

就在去年,当我回过头来再阅读这篇论文时,我注意到哈维利瓦拉所描述的这种系统对搜索引擎来说还存在着两个问题。不过下面我们将会看到,这两个问题现在都能得到妥善解决了。

第一个问题是充分拓展主题的数量。要想改善搜索结果,16个主题自然是远远不够的。但由于Google的页面级别计算系统的代价非常之高,因而除非新系统能够提供一些改进的措施,否则Google不大可能实施这个新系统。但随着这一领域在过去的一年中的深远发展,因而我相信现在在主题数量上已不是大问题了。

第二个问题就是如何决定一个查询条件可能对应的主题–- 当用户输入诸如“自行车”一类的查询条件时,这个用户是想买自行车呢,还是想骑自行车旅游呢?下面我将为大家简单阐述一下Google可能会怎样匹配一给定查询条件以最恰当的主题,以及为什么一些查询条件更容易受到影响的原因。

2-1-3. 关于Applied Semantics公司及其专利技术CIRCA

Applied Semantics网络广告软件公司是互联网广告方面的专家,于2003年4月份被Google收购。Google此举旨在加强搜索和广告功能。如今该公司的技术已对Google产生了深远的影响。例如在Google的Adwords关键词广告系统中,为PPC广告客户提供基于内容的广告就是采用了Applied Semantics的AdSense技术。

事实上Google在这次收购中获利的还不止AdSense技术,AdSense的后台技术其实就是Applied Semantics公司所拥有的专利技术CIRCA。

CIRCA技术所基于的是一个独立语言并具有高度扩展性的本体论,这个本体论中包含了上百万词语,词语含义及这些词语与其它自然语言中的词语之间的概念性关系。由复杂的搜索技术所支持的本体论是对词语的多样性含义的概念性理解的基础,它能够使计算机对信息进行更加有效的管理和检索,从而为搜索用户更好的提供探索知识的机会。

CIRCA技术的作用就在于它可以确定对特定词语或短语的相关概念。该技术目前被用来从众多内容中为广告客户提供相关广告服务,亦可应用于Google的关键词词根还原系统。

尤其值得一提的是:CIRCA能够计算“短语A”对“概念B”的相关程度。例如,如果用户查询“Colorado bicycle trips”,CIRCA能够将其与“Colorado”地域,“骑车”,“旅游”等主题概念性地联系起来。这意味着它们能够计算其数据库中不同的概念与用户查询条件之间的“距离”。这一点十分重要。

2-1-4. 二者的有机结合:主题性搜索引擎的实现

现在我们对主题性页面级别和CIRCA都有了一定的了解,那么接下来的问题就是:这二者之间是如何有机联系的?换言之,Google如何结合这些技术来产生一个更好的搜索引擎呢?

首先,让我们来设想一下:假如对于大量的(上百直至上千个)主题或概念,Google已然解决了如何计算其主题性页面级别的问题。

在Google过去所使用的页面级别系统中,计算结果的精准性是相当重要的。但随着主题性算法的发展,不久我们就可能看到,也许速度快而且效果良好的近似计算结果才是他们所需要的。从上述论文中我们不难看出这一点已然颇具可行性。

现在,如果用户再查询的话,则查询条件中的词语将至少与CIRCA数据库中若干主题紧密匹配。Google完全能够基于用户所使用的查询条件及数据库中所包含的主题之间的“距离”来提供“主题性页面级别”得分,从而向用户提供更好的搜索结果。查询与主题的关系越密切,则主题性页面级别得分效果越佳。

由于一个给定的搜索查询条件有可能与数据库中的多个主题匹配,所以页面级别计算中出现的任何小错误都将由影响该查询条件的多个主题性页面级别得分平摊,因而只需近似的主题性页面级别得分就足以提供高质量的搜索结果了。

当数据库中无任何主题与用户的查询条件匹配时,则Google可使用原来的页面级别系统。若与查询条件匹配的主题太多,则仍使用新系统计算主题性页面级别得分,尽管新算法可能会与原算法得出的分数相似。如果匹配主题与查询条件之间的相关度很低,则效果亦会大打折扣。

2-1-5. 安然接受和理解算法的改变

可能某些查询条件返回的搜索结果有较大的变动-–但原来在搜索结果中排名在前100位的网页全都被刷下去的情形却少之又少。

有效数据所面临的一个大问题在于:对于发生搜索结果改变较大的报告呈上升趋势。从这些“自述”数据之中我们可以看到Google的很多搜索结果发生了彻底的改变。而造成我们看到这种局面的原因恰好在于,这些“自述”数据中的绝大部分都是由那些排名被刷下来的网站提供的。

我们并未从这些“自述”变化着手,而是采用了另外一种途径,即从若干可用的网上资源中记录下最近时间内发生的搜索,然后观察搜索结果中的变化。

我们随机(没有任何成见地)研究了上百个人们日常使用的真实存在的查询条件,并标识出其中每个查询条件的改变总数,然后我们发现改变的程度在总体上仍保持着一贯的干净局面。在实际生活中,这种根本性的改变只是发生的例外,把它当成规则就大错特错了。

2-1-6. 主题并非关键词... 亦并非十全十美

千万不要把“主题”和“关键词”相混淆。主题代表的是一个综合性题目,例如“计算处理”、“市场营销”等等。而特定的查询条件(关键词),如“笔记本电脑租赁”,“电子邮件营销”等,将与更多的综合性主题联系起来。

但从Google目前所提供的一些搜索结果来看,不难发现其中的部分搜索结果所匹配的主题是错误的。例如对”laptop rental”,用户搜索“笔记本租赁”往往是想租赁一台笔记本电脑,但在Google返回的搜索结果中,排在前面的却是大学里面的笔记本租赁信息-- www.google.com/search?sourceid=navclient&q=laptop+rental

这是怎么回事呢?只要看看链接到这些网页上的链接,就可以发现这些链接大都具有相似的主题性,如Computing,Housing(学生在校园里出租住处),等等。大家可以用其它词语进行查询,然后分析排名靠前的那些页面上的外部链接,就会更容易理解为什么“laptop rentals”会有如此的搜索结果了。

Google仍有可能提供不够理想的搜索结果,当然也有可能再次受到蒙骗,只是这种机率越来越小而已。同时我们相信Google会多花一些时间来修正这些问题。

2-1-7. 为什么只有部分搜索结果页发生了根本的改变?

我们不必理会那些对Google新算法的非议,只要再来看看真实的数据,你就不难理解为什么有些查询条件较其它查询条件更易受到影响。

我们以“Real Estate”为例,依照Scroogle.org的方法论,有77个原来排名在前100位的网页排名降到了100名之后。而对于更为具体的查询条件“Colorado Real Estate”,有24个排名在前100名的网站受到了影响。

而在那些被刷下来的网页中,我第一个看到的是一个标题为“Southern California Real Estate”的页面。有趣的是,倘若用“Southern California Real Estate”进行更具体的查询,你会发现它排名高踞第二位。换言之,这些网页并不是受到了Google的处罚,而只是由于缺乏对查询条件的相关主题性而使排名掉下来罢了。

也有极少数竞争性很强的查询关键词对搜索结果的排名没有造成什么影响。这种现象已被用作对Google排名算法的各种猜测的正确性与否的一个依据。但我认为对这种现象的解释其实也很简单--以“search engine optimization”为例,在返回的搜索结果中,前30个网页列表几乎没什么变化。如果对排在榜首的页面进行分析的话,就可以发现这些网页上的外部链接都具有良好的相关性,这样的网页在一个主题性页面级别的计算系统下也会做的很好。

可能Google采用的新算法与我的猜测大相径庭,不过目前为止我尚未发现比这更好的猜测。不过这些并不重要,我们只要清楚一点:不管Google怎么改变它的算法,成功的秘诀其实相当简单--胜出的往往是那些拥有大量内容和大量相关链接(包括导入链接和导出链接)的站点。而那些使用门页(Doorway Page)和链接交换的网站就不会再这么好运气了。

第二部分: 探索Google PageRank新算法(下)
---对Google的新排名算法有多种猜测。此文仅做抛砖引玉之用。

2-2:传言止于智者

关于Google新算法的种种猜测和谣言已是满天飞。其中大多数都倾向于Google使用了“过滤系统”或“处罚”了某些类型的站点。对Google来说,“过滤掉”一些太过SPAM的站点并不是什么新鲜事。Google早在几个月前就开始着手抓捕那些使用隐藏文本技术的站点。但我却看不出这些过滤系统或惩罚措施,或者甚至两者的结合如何解释Google目前的搜索结果的变化。

正如上面的研究所表明的,如果Google筛除了前100名的一些站点,那么这些网站的位置将被原来排名紧随100名之后的网站取而代之。但我们看到的却并非如此。跃居前十位的反而是那些过去名不见经传(1000位之后)的网站。 显然,并非过滤系统在作怪,而是Google采用了一种全新的网页排名机制。

2-2-1. 传言一:Google开始使用词典对号入座

去年的11月15号,几乎就在Google的更新一开始,这方面的传言就出炉了。这也是出现的第一个试图解释新搜索结果的猜测。其思路是:Google有一个查询词条名单,并以此对商业站点进行”惩处”或类似于此。

若简单如一个商业词条”词典”,那么将会有过多的搜索词条被牵涉进来。更为可能的是:Google拥有一个主题名单,并以此计算网站的主题性页面级别得分。这些主题旨在提供更好的搜索结果而不是要去处罚任何网站。

2-2-2. 传言二:Google意图施压使商业站点使用Adwords广告服务

在众多传言中,它当之无愧属头号谣传。这类传言认为:Google把那些未使用其Adwords广告服务的网站的排名拉下来。另一种说法则是Google把那些使用了它的Adwords广告服务的网站的排名拉了下来。

这两种观点不但自相矛盾,而且很难使人信服。实际上,我们都知道,Google并没有理由这么做,它在对待“付费广告”和“免费搜索结果”这两种服务上的态度一向很审慎,而且分得很清楚。Google也无需“强迫”任何人来购买它的广告服务。

缺乏足够商业经验的人可能会相信这类传言。一个生意人购买广告服务的前提是这个服务必须能够使他获利。如果Adwords服务能够使他们有利可图,他们自然会选择Adwords。客户决定是否使用Adwords服务和他的网站是否出现在Google的免费搜索结果之间没有必然的联系。

我不会因为我的网站出现在Google的免费搜索结果中而停止使用Adwords服务,也不会因为我的网站没有出现在Google的免费搜索结果中而使用Adwords服务。即使我的网站在免费搜索结果中的排名掉下来我也会使用Adwords广告服务。因为我做生意是为了有利润可赚。我选择Adwords广告服务是因为它能给我带来利润而无它。

2-2-3. 传言三:Google开始使用“基于贝叶斯定理的SPAM过滤系统”

贝叶斯过滤法是对付垃圾邮件的一个绝妙办法。无可否认这是一项相当完美的技术。 但并无证据表明Google会实施“贝叶斯式‘过滤系统来识别’搜索引擎垃圾”,而且我也相信Google的众多高智商的工程师也无意于此。

Google并无意图去“惩罚”或“筛掉”任何东西,它所力求的是建立一个识别最相关网页的系统。Google使用过滤系统只是为了避免被隐藏文本技术或其它恶意欺骗技术所操控。贝叶斯式过滤法与其初衷不符。

2-2-4. 传言四:Google开始处罚互惠链接

该猜测认为:Google已开始处罚那些与其它网站交换链接的网站。但从莱斯利.罗德(Leslie Rohde)发表的一篇非常精彩的分析报告中,向我们显示了这种传言和其它类似一些传言根本站不住脚。莱斯利甚至用Scroogle.org的点击列表来查阅那些”遭到处罚”的网页,但从中亦没有发现在互惠链接和Google排名之间有什么新的对应关系。

2-2-5. 传言五:Google开始处罚那些”经过优化”的网页

该猜测认为:Google正试图把那些“经过优化”的网页排名给降下来。这种猜测不但经不起推敲,而且也是毫无道理的。因为“优化”网页可以被描述为“一种结构良好的网页,清晰表明了相关主题。”

至于Google是否会处罚那些使用了诸如隐形文字,过度充斥的HTML元标识等肮脏伎俩的网页,答案当然是肯定的。但千万别把这些伎俩跟优化混淆起来,它们只是一些Spamming技术,本来就应当受到惩戒。

2-2-6. 传言六:Google开始处罚“链接文本”

绝对不是。 如果一个站点因链向其其链接文字中使用了误导性的内容而可能遭到惩罚的的话,现在早就一片怨声载道声了。

如果一个网站纯粹出于创建与关键字相关的链接的目的而创建大量链接站点,可能会瞒过过滤系统,但这种做法属于Spamming技术,本来就应当受到惩戒。

2-2-7. 传言七:Google加害于我,它是针对个人的

我虽然并未进行详尽的研究来证实这一点,但是我敢保证,它绝不会针对个人。搜索引擎以向用户提供高质量的搜索结果为己任。也许是你提供给搜索引擎的东西并不对它们的胃口,但这并不能说明你的网站就不好,也许你需要做的只是另辟蹊径而已。




TSPR理论-如何应对Google PageRank排名新算法(一)

原著:Dan Thies
编译:Karen

第一部分: 最新消息! Google的主要变化

Google的主要变化始于2003年11月的16号,从那时候起,网上论坛就开始对此议论纷纷并产生了形形色色的推测。这种更新对一些人是坏消息,而对另外一些人却是好消息(不过大多数猜测都来自于那些认为这是坏消息的人)。Google对其变化只字不提,当然我们也别指望它会说点什么。因此,这篇文章代表了我个人的部分推测,希望它至少为读者您提供了一些“较为可靠的推测”。

除了在对搜索结果的排名方式上有一些显著变化外,Google在搜索结果的格式上亦有一些根本的改变,在我看来,这些变化在极大程度上展示了Google的整体发展方向。

我首先会回顾Google最近的变化,然后提出我对Google新策略的一些探索,并对一些不好的传言进行澄清。最后为如何在“新”Google中取得成功献上我的个人建议,供大家参考。

1-1. 总观Google新变化

现在,Google确定无疑是在进行一些新的及与以往完全不同的改变,并使得如此多查询条件受到影响,使它们的搜索结果与以往完全不同。让我们在深入挖掘其“巨大变化”之前,先来看看并未引起人们太多关注的一些较小的变化。于用户而言,这些小变化加起来产生了许多新的特性


1-1-1.关键词词干法(Keyword Stemming)

Google的另外一个变化是开始采用词干法进行搜索服务。换言之,如果在搜索框中键入“dietary”,那么也会得到一些基于“diet”的搜索结果。关于这一点还是请大家看看Google的解释--“Google目前使用了词根还原技术”。也就是说,它不再拘泥搜索与输入查询完全相同的词语,亦会向用户提供与部分或所有查询词语相近的搜索结果。例如,对于查询词语“pet lemur dietary needs”,Google也会显示“pet lemur diet needs”及其它词性变化形式的搜索结果。而且对于搜索结果页上出现的查询词本身及其不同的变化形式,Google会以粗体突出表示。”

实际上词干法的介入已有一段时间了,只是在此之前我们没法确定它到底是属于玩票还是试验性质的,不过现在看来,Google已在其搜索技术中正式引入了词干法。

1-1-2. 信息第一位了吗

在“新”Google的搜索结果中,我们很多人注意到的第一件事情就是,即使用纯粹商业性质的词语进行查询时,位于页首的却往往并非一些相关的商业性站点,而是被大量含有“信息”和“资源”的性质的页面所占据。但我却并不认为它必然地说明了Google对商业站点存在着偏见。

我反而觉得,Google目前的搜索结果的变化揭示出一些原来排名很好的网站的“真实面目”,它们虽然赚取了较高的页面级别,但却只是徒有虚名,本身并没有提供什么有份量的网站内容。而且在过去,一个网站要想排名在前十位并非什么难事,只要对页面进行优化,获取足够的外部链接数量(不管这些链接是否具有同一主题甚至是否相关),然后您再瞧––排名效果立竿见影。

如果一个网站本身的内容就很少,而且相关的外部链接又少,并且所有外部链接都是通过链接交换而得到的,这种网站的排名在Google这次的更新中往往首当其冲受到显著的影响。Google的新算法似乎对那些含有大量实用内容的主题性站点极其有利,用户喜欢的也是这样的站点。

1-1-3. 随时调整排名算法

自从去年11月15号以来,Google始终在对排名算法进行调整,有很多原来排名大幅下降的网站现在不但恢复了排名,而且位置较以往有了显著的提升。我们可以期待,Google会坚持不懈地对算法进行调整和改变来提高搜索结果的质量。

1-2. Google的发展战略

倘若搜索引擎能够理解用户的查询本意,那么向用户提供高质量的搜索结果也并非难事。但是,当用户键入“DVD PLAYER”这几个字时,你知道他到底想要什么吗?是想买DVD播放机呢,还是想知道怎么把DVD和电视相联?是想看关于DVD播放软件方面的评论呢,还是要找能够在计算机上播放DVD的软件?

Google的发展战略与其它搜索门户网站不同,其目标是向不同类型的搜索用户提供不同的搜索服务类型。“新”Google的一个有趣之处是在其主要搜索结果中开始揉合使用其它搜索工具。

《搜索引擎观察》杂志的资深编辑丹尼-苏利文(Danny Sullivan)发明了一个叫“invisible tabs”的术语,用来描述搜索引擎可能会怎样来试图提供更贴近用户本意的搜索结果。

他认为:搜索引擎(例如Google)已然能够使用多种资源(象Google就提供了网页、目录、网上论坛、新闻、在线购物、图书搜索等多种服务形式),这些资源信息将被引入搜索引擎的主要搜索结果

1-2-1. Google的商品购物搜索引擎Froogle

2002年12月,Google推出了商品购物搜索引擎Froogle测试版。用户登陆froogle.google.com后即可在网上找到想购物的网站,然后可以比较世界各地同类产品的价格。

此外,在用户进行普通查询时,若查询术语与商业相关,则Google将从Froogle获得相关商品信息,并将其展现在普通搜索结果的顶端。

对网上购物站点来说,Froogle实在是个不错的选择。不但免费收录你的网站,提交步骤亦相当简单

1-2-2. Google的目录搜索服务

Google Directory依据的是网上最大的人工编辑网络目录DMOZ,再结合Google的“网页级别”技术,让网页根据重要性来排列,并通过网页列表前的绿色横线长度来标明网页的重要程度。

在Google提供的普通搜索结果中,若一个网页已被DMOZ收录,则Google会列出该网页在DMOZ中的描述及相应的目录信息。此外,在普通搜索结果页的最上方位置,大家也可以看到与查询条件相符合的目录链接。

Google的目录搜索服务可满足那些想要浏览某特定主题下相关信息的用户。如果你的网站还未被DMOZ收录,那就赶紧行动吧。

如果你还在质疑目录列表对网站的重要性,我建议你去读一读Google搜索小贴士上的最后一段:
“当无法确定查询条件时,我们推荐用户使用Google网页目录。它可有效限定搜索范围,不会向用户显示其它类似但无关的网页。例如,若在“天文学”目录下查找“土星”,则返回关于土星的信息。而在汽车目录下搜索“土星”时,则返回通用公司“土星车”方面的信息资讯。当搜索范围涵盖太广时,使用目录服务可有效缩小搜索范围。”

Google欲自用户处了解他们想在目录下查找什么样的信息。等我讲到“主题性页面级别”的时候,你就可以明白,Google是怎样来提供与目录主题匹配的搜索结果的

1-2-3. Google的新闻搜索服务

Google新闻保留了三十天内所发生的较有价值的报道和头条新闻,用户可使用其新闻搜索系统查找当前事件的新闻。新闻报道依照发布日期,相关报道数量和新闻来源的受欢迎程度进行排序。

在一般性搜索中,我们可以看到搜索结果页顶端的部分新闻搜索结果,当用户进行一般性查询时亦可看到相关的新闻内容。

目前尚为测试版的Google News与其它搜索服务稍有不同,其新闻来源并不仅限于象“纽约时报”这样的大型传媒。目前Google新闻搜索服务已有4,500家传媒来源。尽管其它大型ICP网站也提供了重要新闻网站的链接,但在涵盖面和消息来源上往往不如Google

1-2-4 Google的图书检索服务

继亚马逊网站之后,Google也推出了其测试版图书搜索服务Google Print。用户可找到图书的简要节选,评论及作者简介等,甚至可能找到图书的外观照片。搜索结果中还提供了在哪里可以买到这本书的相关链接以及Google的相关广告。Google一直都在探索如何进一步提高搜索服务的水平,这次推出的图书搜索服务的测试正是该公司不断改进搜索服务努力的一部分。目前该项服务所提供的印刷图书数量仍十分有限,不过Google这个搜索巨人是不会让我们失望的,让我们拭目以待吧。

1-2-5. Google会推出更多搜索服务吗?

Google不断地推出新的搜索服务,其目的无外为用户提供更好的搜索体验。这不但对用户来说是个好消息,因为他们可以更加便捷地找到自己所需的信息,而且对网站也是好事情。可能不久以后网站就只需针对目标群体来有的放矢,而无须在日益庞大的搜索结果中喊破嗓子来招揽生意了。




Google PageRank 算法解析
2004-04-20 14:48:22 posted by Lela


  什么是PageRank?

PageRank是Google衡量网页重要性的工具,测量值范围为从1至10分别表示某网页的重要性。在Google工具栏可以随时获得某网页的PageRank值。在这里我们将透视PageRank的一些特殊之处,从而对其能够获得较为深入的了解,使广大用户能够更好的使用和了解Googel。

  网站 排名的历史渊源

  上世纪90年代早期网络刚刚兴起之时,每天都有大量的含有特别行业内容的站点发布于网上。网上冲浪者却没有相应的工具定位这些他们认为存在的,但是却没有办法找到域名或网址的站点。到了1993年,雅虎诞生了。雅虎的诞生为网民减轻了这些烦恼。雅虎最初将每一个它所找到的网站,按照所属的分类目录进行划分组织,建立起一个整洁的、可以逐级查找的数据库,雅虎同时也在网站上置入一个 搜索引擎可以根据数据库中存在的“关键词”搜索到网站。接着其他搜索引擎如Altavista ,Excite, Lycos等也相继推出供用户使用的搜索工具。他们中的大多数是根据找到的元标识中的关键词来识别网站的相关性。
  
  事情好像发展地很顺利,但是当站主及网管意识到可以在元标识中插入行业关键词或其他站点代码,就可以巧妙的得到搜索结果页面上的较高的位置的时候问题来了。有一段时间,搜索引擎的结果被这些垃圾网站搞得乱七八糟,他们用某些相关的关键词充斥于网站的各个角落,可是展现在用户面前的实际内容确实糟糕透顶。那些信用较高、地位重要的搜索引擎开始受到挑战,他们必须采取更好的措施精确为用户输出的搜索结果。

  Google网页级别详解

  Google意识到了传统搜索引擎所面临的这种问题。如果相关性有网管来控制的话,那么排名结果必将被他们人为安排的大量相关关键词所污染,掩蔽了真正的相关性。

  网络的本质就是超链接。我们从逻辑上分析,每个人都让自己的网站与某些重要的站点相链接,那么,本质上,这个站点就投了对方的一票。当上百上千个站点链接到这个站点时,我们认为这个站点是一个很好的很重要的站点也就非常符合逻辑了。

  就是在这样的逻辑推理下,Google的两位创始人Sergey Brin及Larry Page建立了一个搜索引擎算法公式,即将排名比重转移到了网页意外的因素上。他们的公式被命名为“PageRank”(以创建人Larry Page的名字命名)。Google就是利用这一公式计算链接到某一网页的网站数量,然后按照从1-10分别给予表示重要度的分数。链接到网页的站点越多,PageRank的分数越高。

  Sergey Brin和Larry Page在1998年把PageRank技术配置进Google一同推出。结果出乎的成功。Google这种难以认为控制的算法公司得出的出众的相关结果大大超过了竞争对手。这种新的算法不仅有助于提供出权威的高质量的信息,而且使得站主即网管很难利用作弊手段取得较高排名。

  Google的PageRank之所以如此重要,就是因为影响网页排名的因素主要是依赖于网页意外的因素,而非能够认为操纵的因素。

  Google对PageRank的解释

  在Google网站上有一个专门的域名介绍PageRank(http://www.Google.com/technology/

  PageRank完全依靠的是网络的民主特性,利用大量的链接结构表明某个单独页面的价值。本质上来说,Google把链接转换为一次投票,当从网页 A 链接到网页 B 时,Google 就认为“网页 A 投了网页 B 一票”。 Google 也不是纯粹考虑投票的数量,还对投票的网页进行分析。本身很重要的网页的投票有助于增强其他对方网页的重要度。

  重要的是,Google会记录每次的搜索行为,高质量的网站能够获得较高的PageRank分值。当然,重要的网页如果不能匹配你的查询就没有任何价值。所以,Google把PageRank技术及文本匹配技术进行结合从而搜索出既重要又相关的的结果。Google的匹配技术不是只考虑词条在网页上的出现次数,而是检查网页内容(及链接网页的内容)的所有方面,从而决定该网页是否匹配你的查询。

  更多信息访问Google PageRank介绍:

  http://www.Google.com/webmasters/4.html
  
  http://www.Google.com/technology/


  搜索引擎排名与PageRank的关系

  虽然每个搜索引擎都严格保密各自的明确的搜索算法,但是搜索引擎分析人士相信搜索引擎结果(排名列表)是“Page Relevance”与“PageRank”因素综合承继的结果。

  Ranking = (Page Relevance) x (PageRank)

  PageRank逻辑算法无疑是具有重大意义的,而且这种算法不能够被网管人员轻易操纵。Google的搜索结果能够显示出如此高的相关性无疑也是它能够获得彻底成功的重要原因之一。大多数其他搜索引擎已经完全采用同类模式作为自己的搜索算法,而有的搜索引擎将这种算法在决定结果排名中的重要程度进行定义后应用与自己的搜索结果中。
自网络发展的初期,搜索引擎就一直不断的努力试图开发出可以排列相关网页的搜索算法。大多数搜索引擎重视于“链接流行度”(link popularity),作为评价网页重要度及用于索引的标准

  Google 工具栏

  Google工具栏供人免费下载安装,除了某些有用的功能外,比较显著的一个特点就是它可以告诉用户目前正在访问的每个网页的PageRank值。

  下载后的Google工具栏位于浏览器窗口下部,可随时随地进行网上搜索。工具栏显示出每个页面从1-10不等的PageRank分值。对于Google未索引的网页,工具栏不会显示出该页的PageRank分值。需要提醒的是,该分值是针对网页而言,而非网站。

  注:PR值越高,说明营销人员要针对相应的搜索词条获得较高的排名位置就有更多的竞争。所以,我们建议根据关键词优化你的网页PR值。

  什么是链接流行度?

  “链接流行度”系统是基于网页获得的链接的数量及质量而定的。也就是说,指向你的网页的链接数量越多,你的网页将被搜索引擎认为越重要。数量并不是决定网站重要度的唯一因素,重要度还取决于其他因素,包括被链接到本站点的站点的质量、他们的内容的质量及与本站点的行业相关性等。

  链接到本站点的网页会把PageRank的部分分值分配到本站点。所以链接页面的PageRank分值越高,分配给本站点的分值也就越高。

  PageRank也会被链接页面商店所有导出链接所瓜分。譬如,同样PR为5的链接网页,导出链接只有15个的网页会比导出链接为100个的网页分配给你更多的分值。

  所以重要的是要从PR值较高并且总体导出链接数量较少网页才能获得安全链接。

  如何检测链接流行度

  最简单的检测网站流行度的方法就是利用Google搜索,方法如下:

  link:www.yoursite.com

  其它主要搜索引擎在搜索你的链接流行度时都有不同的规则。

  建立链接流行度提高PageRank

  建立链接流行度是搜索引擎营销的一个重要方面。尽管认为的提高PageRank不是意见容易的事,但是你通过改善链接流行度就可以不难做到。通过长期不懈的关注建立链接的工作,你就会提高站点的PageRank,大大改善自己的站点排名。

  就在不久前,Google及其他搜索引擎配制了某些类似与PageRank的算法成分(如TSPR”Topic Sensitive PageRank”,Hilltop“Links from expert documents”),进一步将决定排名的比重放置在页面以外因素上。
随着页面以外因素在网站排名中受到重视,所以提高加强这些因素的重视就变得越来越重要。当越来越多的网管意识到PageRank及链接流行度的重要性时,就不难在同行业中与其他站点进行链接交换了。(编译lela)


  作者Hariot Kaleka是www.seorank.com一位SEO广告文编写人,该公司是一家主要提供搜索引擎优化服务的公司。




Google Toolbar与RealPlayer捆绑 扩大分布范围
2004-04-21 11:05:50 posted by Lela 



  Google与美国网络媒体公司RealNetworks于当地时间4月20日宣布Google工具栏将与Real Player10捆绑,供用户同时下载使用。至此,双方的合作不仅使得Google搜索用户可以在浏览器窗口中安装Google工具栏,也可以使得该工具栏接触到每天大量下载新的RealPlayer10的用户。举措一出,Google工具栏肯定会每天出现在计算机用户的浏览器窗口中,而且极有可能使喜欢雅虎或其他 搜索引擎的用户看到。

  RealNetworks是美国著名数字媒体服务及软件开发商,最近发布的Real Player10是一款免费的媒体播放机,也是第一个可以在所有主要的媒体格式下播放内容的播放机,如:Real Video,Real Audio,AAC,Windows Media,Quick Time,MPEG4及MP3等。Google工具栏则是一种免费下载浏览器工具,可以进行Google搜索及阻止弹出广告等功能。

  在RealPlayer下载选择项中加入了Google工具栏的选择项,用户可以选择是否按照该工具栏。双方公司表示,此次合作将有助于提高全世界用户的网络体验。

  “RealPlayer的普及与Google工具栏组合后,我们希望全世界用户改善加强他们的媒体重放及网络搜索体验的效果,”RealNetworks公司负责北美销售工作的副总裁Carla Stratfold说。“我们与Google的合作关系表明我们要与最佳品牌的产品及服务合作,使我们能够接触到全球市场的每一个用户。”

  Google公司同样表达了他们对合作的满意,负责全球销售及室外操作的副总裁Omid Kordestani说:“RealPlayer10是为Google工具栏扩大分布范围的非常有价值的平台。我们希望使世界上的所有用户能够得到他们想要的所有信息,而且为RealPlayer10用户提供免费的弹出广告阻止器及自动填充器。Google将进一步丰富他们的网络体验。”

  由于MSN, Yahoo,Amazon A9,UCMore等及其他与搜索有关的工具不断出现于市场,相信在搜索引擎公司之间必将开始一场“工具栏大战”。(编译lela)




1、Google链接广泛度检测器:
直接在Google搜索栏中输入  link:你的域名

2、Google排名监测工具:
(
http://www.cleverstat.com/google-monitor.htm)

3、相似页面检测工器:
(
http://www.webconfs.com/similar-page-checker.php)

4、Google Dance工具:
(
http://www.seonet.net./seo-tools/google-dance-checker.htm)

5、查询关键字使用频率工具:
(
http://inventory.overture.com/d/searchinventory/suggestion)

6、含蜘蛛模似器等:
http://www.seotoolkit.co.uk

Google链接广泛度检测器(Google Backlink Checker):http://www.webconfs.com/google-backlink-checker.php 输入你的网站URL,程序将搜索到Google中有哪些网站链接了你的站点,以及链接所用的文本标题。由于不支持中文字符,中文文本内容是乱码,但链接的URL一目了然。

搜索引擎抓取内容模拟器(Search Engine Spider Simulator):http://www.webconfs.com/search-engine-spider-simulator.php 输入你要查询的URL,获知Google可以抓取到的该页文本内容和链接。不妨对比测试一下使用大量文本和大量图片的页面所获得的内容悬殊的抓取结果。网络营销人也可以利用此工具来检测优化后的页面质量。支持中文字符。

 搜索引擎抓取页面数量统计器(Search Engine Saturation):http://www.marketleap.com/siteindex/ 输入你的网站URL和随机显示的进入代码,你将获得搜索引擎AllthewebAltaVista Google/AOL、HotBot/Inktomi所抓取到的你的网站页面数量。你也可以同时输入3个竞争对手网站URL以进行对比,了解自己在竞争中所处地位。

链接广泛度检测器(Link Popularity Check):http://www.marketleap.com/publinkpop/ 输入你的网站URL和随机显示的进入代码,你将获知在搜索引擎Alltheweb AltaVista Google/AOL HotBot/Inktomi MSN 中有哪些网站链接了你的网站,以及同一URL在Dmoz、Excite、iWon、Lycos、Overture等搜索引擎中的详细链接资料。你也可以同时输入5个竞争对手网站URL以进行对比,了解自己在竞争中所处地位。 同样的工具还有http://www.trafficzap.com/linkpopularity.php,可检测网站在Yahoo、Google、MSN、Lycos和Altavista的链接总数和具体链接的网站。

Google排名监测工具(Free Monitor for Google):http://www.cleverstat.com/google-monitor.htm 需要下载使用。该工具可以报告你的网站以某关键词在Google中的排名情况,以及同一关键词下排名前N位(自己设定位数)的网站URL。

 相似页面检测器(Similar Page Checker):http://www.webconfs.com/similar-page-checker.php 众所周知,Google会对拷贝页面内容进行排名惩罚。该工具可以检验两个页面的相似度,来判断是否会受到惩罚。如http://www.sitepronews.com/freebooks.htmlhttp://www.allbusinessnews.com/freebooks.html,相似度达到80%,后者在Google中的PageRank排名值通过工具栏显示为0.




关于Google搜索引擎作弊的解释  

编译:Karen  


Google排名的意义:
根据Jupiter MediaMetrix 2002年公布的统计数据,79%的互联网用户依靠搜索引擎获取信息,信息搜索成为仅次于电子邮件的互联网第二大应用。而在众多搜索引擎当中,Google以其庞大的搜索量,快速而精准的搜索结果和极高的知名度成为搜索引擎的代名词,因此自然成为企业网站推广的首选。
Google排名优化:
优化的方式形形色色,一般无外乎按照一定的关键词,通过对网站结构,页面因素和外部链接的优化,使网站得到最佳的搜索引擎排名。但事实上我们发现,有一些网站由于采取了不正确的优化策略,不但未能有效提升网站的排名,反而使网站排名惨跌甚至遭到搜索引擎删除。在此我们列出被Google明令禁止的属SPAM性质的优化技术供大家借鉴。

一:隐藏文本/隐藏链接
一般指网页专为搜索引擎所设计,但普通访问者无法看到的文本内容或链接。在形形色色的隐藏技术中,最常见的就是把文本或链接文字的字体颜色设置为与背景色相同或十分接近。

隐藏文本内容(Invisable/hidden text)
  意欲在不影响网站美观的前提下通过包含大量关键词的网页提高关键词相关性得分,从而达到改善搜索引擎排名的目的。

隐藏链接(Invisable/hidden links)
  意欲在不影响网站美观的前提下通过在其它页面添加指向目标优化页的隐形链接,通过提升链接得分而改善搜索引擎排名。
现在大多数搜索引擎都能检测隐藏技术,并视为作弊。因而包含隐含文本的网页面临被搜索引擎降低排名甚至删除列表的惩罚。虽然在Google上不乏使用隐形技术而侥幸逃脱的网站,但多数人还是认为不值得冒这个险。其实通过添加可视文本内容并保证一定的关键词密度可达到相同的优化效果。

二:网页与Google描述不符
一般发生于先向搜索引擎提交一个网站,等该网站被收录后再以其它页面替换该网站。“诱饵行为(Bait-&-Switch)”就属于此类偷梁换柱之举--创建一个优化页和一个普通页,然后把优化页提交给搜索引擎,当优化页被搜索引擎收录后再以普通页取而代之。

三:误导性或重复性关键词

误导性关键词(Misleading Words)
  在页面中使用与该网页毫不相干的误导性关键词来吸引查询该主题的访问者访问网站。这种做法严重影响了搜索引擎所提供结果的相关性和客观性,为搜索引擎所深恶痛绝。

重复性关键词(Repeated Words)
  这种作弊技术也被称为“关键词堆砌欺骗(Keyword Stuffing)”,它利用搜索引擎对网页正文和标题中出现的关键词的高度关注来对关键词进行不合理的(过度)重复。类似的其它做法还包括在HTML元标识中大量堆砌关键字或使用多个关键字元标识来提高关键词的相关性。这种技术很容易被搜索引擎察觉并受到相应惩罚。

四:隐形页面(Cloaked Page)
对实际访问者或搜索引擎任一方隐藏真实网站内容,以向搜索引擎提供非真实的搜索引擎友好的内容提升排名。

五:欺骗性重定向(Deceptive redirects)
指把用户访问的第一个页面(着陆页)迅速重定向至一个内容完全不同的页面。

“鬼域(Shadow Domain)”
这是最常见的欺骗性重定向技术,通过欺骗性重定向使用户访问另外一个网站或页面。一般利用HTML刷新标识(Meta Refresh)来实现。大多搜索引擎都不会索引使用该标识的页面。如果你使用刷新标识来检测浏览器或分辨率,那么就请使用Javascript,且尽可能延长重定向时间。如果一定要使用重定向功能,那么请务必确保刷新周期不少于10秒钟。

还有一种情况就是当用户打开一个网站,该网站声称其网站已移至新域名下,并请用户点击新域名链接进入网站。但当用户进去后才发现,这个链接是一个“会员”链接。这也属欺骗性重定向行为。

六:门页(Doorway Page)
也叫“Bridge/Portal/Jump/Entry Page”。是为某些关键字特别制作的页面,专为搜索引擎设计,目的是提高特定关键词在搜索引擎中的排名所设计的富含目标关键词的域名,且重定向至另一域名的真实网站。搜索引擎的Spiders往往忽略对那些自动重定向到其它页的页面的检索。

七:复制的站点或网页
最常见的当属镜象站点(Mirror Sites)。通过复制网站或卬页的内容并分配以不同域名和服务器,以此欺骗搜索引擎对同一站点或同一页面进行多次索引。现在大多数搜索引擎都提供有能够检测镜象站点的适当的过滤系统,一旦发觉镜象站点,则源站点和镜象站点都会被从索引数据库中删除。

八:作弊链接技术/恶意链接(Link Spamming)
典型的作弊链接技术包括:

  • 链接工厂(link farms)
  • 大宗链接交换程序(bulk link exchange programs)
  • 交叉链接(Cross Link)

“链接工厂”(亦称“大量链接机制”)指由大量网页交叉链接而构成的一个网络系统。这些网页可能来自同一个域或多个不同的域,甚至可能来自不同的服务器。一个站点加入这样一个“链接工厂”后,一方面它可得到来自该系统中所有网页的链接,同时作为交换它需要“奉献”自己的链接,籍此方法来提升链接得分,从而达到干预链接得分的目的。如今搜索引擎发现它们已然不费吹灰之力。只要发现,不管属有意还是无意,“链接工厂”中的所有站点都难逃干系。

九:其它

日志欺骗行为
  通过对一些页面等级较高的站点进行大量的虚假点击以求名列这些站点的最高引用者日志中,从而获得它们的导入链接。Google已然意识到这种行为并将对利用这种途径获得导入链接的站点采取相应措施。

门域(Doorway Domain)
  专为提高特定关键词在搜索引擎中的排名所设计的富含目标关键词的域名,然后重定向至其它域名的主页。由于搜索引擎一般忽略自动重定向至其它页的页面的检索,所以不提倡使用这种技术。

google学习日志
 




Google泄密 充当黑客又一“利器”


大家都知道,Google毫无疑问是当今世界上最强大的搜索引擎。然而,在黑客手中,它也是一个利器,它能搜索到一些你意想不到的信息。下面,我来教大家如何利用这个武器。


  ★搜索URL

  比如我们提交这种形式:wwwboard/passwd.txt这种提交形式如图所示。

  总共搜索到了139个结果。太不可思议了!wwwboard这些字符是一个CGI的留言板。它的默认密码文件是"passwd.txt"。虽然这个留言板已经很久了,但一些基于CGI/PHP/ASP类型的留言板还存在这种问题。我们得到密码甚至还是明码的!管理员太不负责了。即使我们得到经过DES加密的密码,我们可以通过John the ripper来破解。

  我们继续提交这种字符:passwd.txt site:virtualave.net

  这次我们能得到包含密码的文件。“site:virtualave.net”意思是只搜索virutalave.net的URL。virutalave.net是一个网络服务器提供商。

  同样,我们可以搜索一些顶级域名,比如:.net .org .jp .in .gr

  config.txt site:.jp

  admin.txt site:.edu

  ★搜索首页的目录

  首页是非常有用的,它会提供给你许多有用的信息。

  我们提交如下的形式:

  "Index of /admin"

  "Index of /secret"

  "Index of /cgi-bin" site:.edu

  你可以自己定义搜索的首页字符。这样就可以获得许多信息。

  ★搜索特定的文件类型

  比如你想指定一种文件的类型,可以提交如下形式:

  filetype:.doc site:.mil classified

  这个就是搜索军方的资料,你可以自定义搜索。




搜索引擎排名优化的方向—链接还是内容?(二)

编译:Karen

Dan Thies谈搜索引擎优化方向—

1.你是否在失去一半互联网市场

下表是网站流量分析提供商OneStat.com分别于2003年4月底和2004年2月初发布的数据:
数据日期: 2003年4月29日
查询所用单词个数: 1 2 3 4 5 6 7
使用比例(%): 24.76 29.22 24.33 12.34 5.43 2.21 0.94
数据日期: 2004年2月2日
查询所用单词个数: 1 2 3 4 5 6 7
使用比例(%): 19.02 32.58 25.61 12.83 5.64 2.32 0.98
趋势:

统计结果显示:搜索用户在查询时越来越喜欢使用更长,而且更复杂的查询词语。在过去一年中,全球范围内使用两个单词进行查询的比例从原来的29.22%升至32.58%,上升了3.4个百分点;用三个单词查询的比例从原来的24.33%升至25.61%,上升了1.3个百分点,而用一个单词查询的比例则从原来的24.76%降至19.02%,下降了5.7个百分点。
支持链接优化策略的一方应该感到比较安慰,因为全球有过半数的网民(51%)只用一到两个单词来查询。但同时我们还要看到:在不到一年的时间内,用一两个单词来查询的用户的比例已经从54%下降到了51.6%,这也就意味着,全球还有接近半数的网民(48.4%)是在用三个和更多个单词来查询,而且这个比例还在上升。不难想象,使用更多的查询词语进行查询的网民将会越来越多。

结论很简单,如果仅仅定位在一两个单词长度的目标关键词身上,也就是我们前面提到的那些竞争较为激烈或太过普通的查询词语,则势必意味着你将失去全球互联网近一半网民的市场。

2.决定你的优化策略

一般说来,对于那些竞争较为激烈,或较为热门,或者太过普通的查询词语(目标关键词),若没有高质量的导入链接支持或这些链接的文本内容中没有包含该目标关键词,则几乎不可能得到很好的搜索引擎排名。

反之,对于那些范围特别明确的查询词语(关键词),由于它们的竞争性相对来说要小得多,如果采用链接策略来达到理想排名的目的,又嫌小题大做了些。这时候你就要保证在你的网页上包含了所有目标关键词。假如只包含了部分查询者使用的查询词语,那么也别指望网站能出现在搜索结果中了。

很显然,无论是内容策略还是链接策略,单凭任一方来做网站推广都是有失偏颇的做法。一个网站优化推广策略的制订明智与否,要看你想怎样来分配你的资源,换言之,在制订优化策略前,应先评估你网站的”目标关键词空间”,并核算网站的导入链接及对网站上现有内容进行评审。

 评估网站的“关键词空间”

每个网站都有其特定的自然符合其目标客户群的关键词,主题及内容。而为了制订一个行之有效的网站优化推广策略,首先我们需要对网站的所有关键词进行逐一的评估和分析。

这时需注意避免这样一个误区:查询频率越高的关键词越好。固然,这确实是一个需要考虑的因素,需要考虑的另外一个同样重要的因素是关键词对所提供产品或服务的相关程度如何。对关键词的相关性的评估和分析可以帮助我们挑选出那些有价值的关键词语。事实上,对关键词相关性的实际考察更加有利于我们从极具竞争性的关键词中找出真正有价值的目标关键词。

找出那些真正有价值的关键词后,我们就需要对这些目标关键词的竞争激烈程度逐一进行评估和衡量。那些无论是链接还是相关性上都具备很高内在价值的目标关键词才是我们的理想目标。

 评估网站的内容

如果网站内容较为单薄,则需先实际考察开发新的网站内容的成本大小,然后决定需要开发多少网站新内容。此外,新内容的开发应基于使网站本身的内容得到补充和丰富,同时又可以增加网站对访问者的吸引力的双重目的。可以站在客户的角度进行换位思考,来审视网站的整体内容,看看它是否达到了预期效果。这样一来有倍增的销售业绩作为回报,足以弥补网站对此工作的投入成本了。

其实,如果留心一下,还是有很多非常有价值的信息可以补充进网站的。例如可以把来自客户的问题和解答这些内部信息放进FAQ页里。在外部信息的采集上要注意合法性,只有在征得信息所有人的同意后才可以把该信息放到你自己的网站上来。此外,如果能对这些“外来”信息加上自己的评述,那就更棒了,不但可以为访问者提供极有价值的信息资源,而且使这些信息具有了本网站特色。

如果网站本身已经提供了大量真实而有意义的内容,那么可能只需要对网站内容进行简单优化,并进一步改善网站对搜索引擎的友好性,就可以达到很好的效果。可以对网站上的任何一个单独页面针对至多一到两个目标关键词分别进行优化,这样就可以锁定更多的范围和市场目标都明确清晰的目标关键词。

网站开发所适用的一个通用规则是,从主页上最多点击两次就可以看到网站的内容,而且任何需要在URL中包含 cookies,JavaScript,或“session id”的导航都可能导致错误。因而为了保证搜索引擎能够顺利检索网站的所有内容,可能需要采取一系列措施和技术,例如将结合使用改写URL和创建网站地图来克服这些问题。

 核算网站的外部链接

如果网站没有什么高质量和相关的外部链接,尤其是仍未获得来自业内相关站点的链接,则应努力改善这种“被动”局面。正如往内容“单薄”的站点中添充内容可使站点运行更为高效一样,从与产品或服务相关的地方争取到的链接也可以为网站带来有的放矢的访问量,而且勿容置疑,拥有大量导入链接的网站会受到大多数搜索引擎的欢迎。

例如,可以把网站提交到主题性及普通的网上分类目录,可以向消费性质的网站请求产品评审,也可以在其它站点上发布“来访内容”等等,这些都是建立链接的既简单又有效的方法,不但有助于网站的排名,而且可以增加网站的访问量。

如果网站已经拥有了一定数量的高质量和高度相关的外部链接,那么只需对内容进行适当优化即可达到事半功倍的效果。不过对于竞争较为激烈的关键词,只是内容的充分优化还是远远不够的,还必须保证相当数量的高质量的外部链接。这时候就需要瞄准一些最为合适和相关的网站来友情交换链接,并尽可能地控制导入链接的文本内容。只有确保了链接文字中包含目标关键词,才能确保链接策略的高效实施。

3.揉合上述各因素

一旦明白了这些问题,网站推广应采取什么策略的问题就可以迎刃而解了。可以针对网站在内容和链接这两方面的薄弱环节下手,尤其当网站在其中一方面尤为欠缺。例如,如果网站几乎没有实质性的外部链接,那么就需要尽快建立和发展链接策略来弥补这一不足;不过,如果网站内容少的可怜,则应先对网站内容进行必要的充实,然后再考虑链接策略。换个角度想想:如果一个网站内容非常贫乏,谁会愿意和他友情交换链接呢?

简言之,倘若一个网站拥有成功的链接策略并已建立和发展了良好的链接结构,那么只需在内容上稍做努力就可以得到即良好又稳定的排名。但如果目标关键词极具竞争性,那么还需把优化重心更多的放在外部链接的建立和发展上。

拿我自己的网站来说,它已经成功运行了非常良好的链接优化策略,但在内容上仍稍嫌单薄。接下来对我来说最迫切的任务就是构建一个比较完善的信息资源网站,以此拓宽网站在搜索引擎中的曝光率。此外,我将把链接策略作为一个长期的重点项目来实施,并锁定更多更流行的查询词语。


参考文献:
http://www.internet-marketing-research.net/forums/ftopic5547.html
http://www.onestat.com/html/aboutus_pressbox27.html
http://www.onestat.com/html/aboutus_pressbox20.html
http://www.lilengine.com/google-search-engine/google-ranking/

相关:搜索引擎排名优化的方向—链接还是内容?(一)




搜索引擎排名优化的方向—链接还是内容?(一)


编译:Karen


最近,国外论坛和博客网站上,对于搜索引擎排名优化究竟该何去何从,是侧重链接优化策略呢,还是该侧重于网站自身内容的优化策略,在搜索引擎优化业界引起了不小的争论。下表对双方各执观点进行了详细比对:

  持链接优化策略论方 持内容优化策略论方
策略内容:
  • 围绕较具竞争性的关键词语,建立和推广网站的外部链接,并对外部链接文字进行目标关键词优化,以增加网站在行业中的“权威性”及搜索引擎中的“重要性”,进而提高网站的搜索引擎排名。
  • 围绕范围明确的关键词语,对网站内容进行建设和推广,保证内容的高度信息化和质量,并对网站内容进行充分优化来改善网站对目标关键词的相关性,从而获得较好的搜索引擎排名。
观点:
  • 认为由于现今搜索引擎对链接文字越来越重视,因而可将目标锁定于竞争较为激烈或太过普通的少数目标关键词(查询结果一般多达上百万之多),并建立大量外部链接,同时确保在这些链接文字中包含上述目标关键词,则目标关键词极有机会得到较好的搜索引擎排名。换言之,网站要想凭借竞争激烈的关键词获得理想排名,则须大力建设和发展网站的导入链接,并应确保在这些链接的文本内容中均包含目标关键词。
  • 认为把目标锁定于那些极富竞争性或太普通的关键词并非搜索引擎优化的最佳目标。推荐使用一种被称作“搜索引擎优化文案策划”的方法来强化网站的信息内容,并将目标关键词的范围高度明确,进而在目标关键词的选择上更为拓宽,力求涵盖更多数量的关键词。虽然其中各关键词的竞争性有所降低,但由于关键词的高度目标明确化,所以很容易捕获高度目标化的客户群体。
目标关键词:
  • 竞争较为激烈或极普通的查询词语
  • 范围更为缩小和明确的查询词语
关键词数量:
  • 一个或若干个
  • 多个
支持根据:
  • 2004年3月举办的“搜索引擎策略研讨会”上,Google首次公开肯定了他们对导入链接的重视。他们表示:虽然Google也会把URL中出现的关键词计算在内,但其重要性亦不如链接中所包含的关键词。
  • 竞争极为激烈的关键词语想要获得并保持好排名十分困难。
  • 极为普通的关键词在市场定位及锁定上亦明显不足,例如查询“Computers”的网民不一定都是潜在客户,也有很多是在网上查资料写论文的在校生。
  • 长度为一两个单词的关键词在市场定位上未必就不如单词多的关键词的准确,例如查询“Web Hosting”的网民就绝对不会是奔着芝加哥干洗机去的。
  • 由于一个全面广泛的链接优化策略所费不訾,所以大多数网站对那些竞争激烈的关键词还是有心无力,只能望而兴叹而已。
支持例证:
  • 关于这方面的例子很多:排名在前十名,但打开后你会发现这些高踞榜首的网页中内容很少或者根本就没有什么实质性内容,甚至有很多排名很高的网页中压根就找不到查询词语。这种情况一般主要发生在Google身上。
  • 支持者们也能举这样的例子出来:网站内容经过专业组织和构建,虽然并无将重心过分倾向链接策略,但对竞争性关键词还是获得了非常令人羡慕的搜索引擎排名。
相关名词解释:
  • 什么是导入链接?
    导入链接也叫后链,逆向链接,指从其它网站上指向你网站上某一页的链接,也就是我们一般所说的“外部链接”。

 

相关:搜索引擎排名优化的方向—链接还是内容?(二)




2004年搜索引擎预测

原著:Serge Thibodeau
编译:Brian shi

对于搜索引擎行业,笼统地说2003年是一个好年。尽管有些人在11月份受到Florida更新的致命打击,总的来说这一年是好的。

我估计2004年会更好,虽然你可能期望发生更显著的变化。如果在快速变化的这个行业中发生这样一件事情,2004年将会是合并之年。而在2003年,有些搜索公司比如Looksmart和Espotting存在很多的问题,尤其是Looksmart的案例,我认为还会有一些新来者。

2004年将会是一个每天都有新闻冲击这个行业的年度。在2003年,几乎每天都不得安宁,不是这家公司就是那家公司发生了一些什么事情。希望2004年会更忙。

另外,在2004年中奖金会变高----更高,而且不仅仅是Google!搜索引擎之间的竞争水平会更激烈,会达到被我称之为“眼珠瞪眼珠”的地步。

它将会是GOO, GOG, GLE, GGG 或仅仅是GO吗?

或许到现在为止你可能已经见到或者听到,2004年可能也是大家期望已久之年----Google应该将自己转成上市公司,带着必须承担的自己的优势和缺陷。在2004年Google除了走向上市公司而别无选择。出现这种情况的原因是因为很少有人知道的美国SEC规则,一旦他们的雇员——股东数量超过了某个门槛,它就可以迫使美国公司公布季度资料。

据估计大约有超过700到800名雇员目前是股东,在事实上迫使Google变成上市公司,无论她喜欢与否。至少通过转变成上市公司她可以接收数十亿的新钱,用来在Googleplex进行大规模的、持续的项目研发工作。许多人期望已成立5年的公司能在3月份的晚期或者4月初发行IPO。

Microsoft通配符

对于Microsoft,在2004年中不会有任何的MSN搜索引擎研发活动。Microsoft仍然处于自己搜索引擎的早期研发阶段,许多人简单地认为它将集成到Longhorn之中,Windows的新版本有可能在2005年底、2006年初上市。然而,如果现在主要的搜索对手仍然维持他们的主导地位,迫于这种紧迫性Windows新版本的上市或许也会提前。

Yahoo的因素

无论在Google马厩中发生了什么,Yahoo都是一个不可忽视的主要对手。实际上昨天,我的一家很大的加拿大公司的CEO和客户还问我对Yahoo的看法以及她会采取什么措施来反击曾经来势汹汹的Googlemania?

我深信Sunnyvale California公司应该被视为是“沉睡巨人”,但不会持续太久。在2003年购买以及“消化”了Overture以及所有网络之后,Yahoo在网络上成为世界1号搜索目录和2号搜索引擎(尽管我更倾向于称之为搜索目录)。Yahoo现在还是AltaVista的拥有者。

在2004年,每次点击付费(PPC)毫无疑问地将成为极其受欢迎的搜索衍生物,并且在2005年和2006年将茁壮成长。Overture和Google,通过他们目前的关键词广告项目具有两个最好的PPC搜索道具。

2004年将诞生的新搜索引擎

2004年还会产生几个新的搜索引擎。有些可能属于PPC范畴,其他的可能是付费索引,另外的可能是人们先前曾使用的传统风格的搜索引擎。

2004年将是新闻之年,由于我期望更多的兼并、重组、出资购买和相似的方式出现。另外,其他不在搜索领域的公司可能会直接进入,或者通过购买现有的搜索引擎或者通过和他们组成伙伴关系进入。

总体上我对SEO的看法

在Florida更新和许多站点受到这个过程惩罚之后,我深信SEO行业可能会“容忍”她在2004年出现的最大波动。我感觉搜索引擎优化公司会认真起来,那些总是并且一直为所有客户产生好的结果以及那些在技术和新改进方面不断追随所有变化的公司在2004年将会更加努力。

其他那些采取为搜索引擎所禁止的不道德的做法或者技术将会消失。Google和其他众多的主要搜索引擎都持续不懈地开发新的技术和运算法则,以便侦测到这一类的活动,搜索引擎spammers将会在自己的游戏中自投罗网。作为所有这一切的结果,我认为SEO的和SEM公司将在经历震动之后变得更为强壮,并且将代表今天一家公司可做的最好的在线广告宣传项目的市场投资。

结论

总体上对于搜索引擎他们自身和SEO团体2004年将是一个很有意思的年份。不会再出现第二个更好的结果。公司和商业将具有他们经过专业优化、利润丰厚的站点。公司、站点拥有者和他们的网管们会继续为其用户推出更好的内容,也会继续被搜索属性比如Google和其他的所查看并且会产生比平均ROI更高的投资回报。




搜索引擎优化之链接广泛度(Link Popularity)全攻略(二)

编译:Karen
  • 友情/互惠链接
  • 决定链接得分的其它因素
  • 链接是否会造成PR值的流失
  • 链接分析机制的弊病
  • 对链接分析的一点补充

友情链接/互惠链接

友情链接的对象:
怎样才能找到那些和你网站内容相似并且公认质量较好的网站呢?究竟什么样的页面对搜索引擎来说是有分量的?--再没有比搜索引擎更能知道这个答案的了。用你网站上最最重要的关键词(就是你最想被访问者找到的那个搜索词)在那些主要的搜索引擎上进行搜索。在搜索结果的前两到三页列出的就是搜索引擎认为与你键入关键词最相关,同时又是最流行的一些网站。而且,由于这些页面拥有很高的排名,所以一般访问量也很大。如此一来,如果你能让这些页面链向你的站点,不但能使你的广泛度得到提升,还有可能得到一些来自这些网页的访问者。反之,大量无关的或者低质量网站的链接非但无益于你的网站,反会降低你的链接得分

互惠链接页的好处:
想要得到,总是需要付出的。如果你想要“导入链接”,就必须付出你的“导出链接”作为交换。所以最好在你的网站上放一个互惠链接页。你可以把它叫做“相关链接页”,“资源页”等等。

如果你向别的网站请求互惠链接时,你可以先把对方加上去,然后在这封邮件中告诉对方你已经将他加入你的互惠链接页,并附上详细信息,包括URL、网站标题及描述,这样一来,你的互惠请求不但不会被怠慢。反而会得到更加认真的对待。

记住:你的互惠对象应该是那些PR值高而且导出链接数又少的网站。只有这样的链接才能真正提升你在搜索引擎中的地位。如果只是注重链接的数量,无异于舍本逐末,你的互惠页也将是形同虚设

注意事项
1) 保证链接网站的质量和相关性
每个链接对象都应视做一个合作伙伴。切忌舍本逐末,只求数量不求质量。勿向FFA站点提交,远离那些被搜索引擎视做“坏邻居”和质量低劣的站点。理想链接对象应该是那些与你的网站有一定相关性或互补性的高质量的网站。这样的链接不但相当于获得了一个网站的推荐,从而增加了访问者的可信度,而且一定程度上也表明了业内的认知和认可

2) 尽量使链接简单化和易操作
应使链接步骤尽可能简单明了。可以在邮件中提供链接代码,对方只要简单的拷贝和粘贴就OK了。同时还应该提供你网站的URL,网站标题及