2004年08月27日

Google双重列表(Double-Listing)探析

  编译:Karen

大家在Google中进行搜索时可能会注意到这样一个有趣的现象:有的网站在搜索结果上可以被连续列出两次(如下图所示):

 WHAT
对上述例子,当我们将Google默认的每页显示10项搜索结果改为每页只显示4项后,就可以发现这两个来自同一地址的网站现在一个排在第一位,另一个则排在了第二页的第一位上(第四位)。

我们都知道,对于任一关键词查询,无论一个网站有多少网页与该查询密切相关,Google也只允许搜索结果中最多只能出现其中的两个页面列表。那么,是否当这两个网页的排名较为接近时或出现在同一搜索结果页上时Google将对数据有什么再处理?

为了验证我们的观察,我们挑选了下面这两个来自同一网站且排名分别为3和17的两个网页。当使用Google默认的每页显示10项搜索结果时它们分别位于搜索结果的第一和第二页上,但在我们将选项改成每页显示20项搜索结果后,这两个网页出现在了搜索结果第一页的第3位和4位上(如下图所示):

由此不难得知,这种情形不太经常出现的原因只是由于虽然可能Google列出了某网站上的两个网页,但往往排名相去甚远,比如一个在第9位上,而另外一个则在156位上,所以无法出现在同一个搜索结果页上。

但是,如果同一域名下的两个网页列表同时出现在Google的同一搜索结果页上,譬如一个在第2名,另一个在第10名,Google就会把这两个来自同一站点的列表整合到一起显示给用户。结果呈现给用户将是第2名和第3名。

注意:这只是我们观察到的一个现象,谁也不知道Google为什么允许同一网站可以在搜索结果中出现两次,而且谁也无法保证这种做法将保持多长时间。

 WHERE
Google在其“高级搜索”项中提供有现成的选项,分别为每页可显示10项/20项/30项/50项/100项搜索结果,如想自己来设定一个随意值,只须在Google的搜索URL中的”search?”后加上”num=xx&”(没有引号)即可。例如”http://www.google.com/search?num=9&hl=en&lr=&ie=UTF-8&c2coff=1&q=SEO”
 HOW
我们知道,把最重要,同时也是与用户的查询条件最为相关的搜索结果返回给用户是Google的一贯方针。遵循这一方针,我们为大家提供了一些可以增加网站被Double-Lisiting的方法:
1.确定网站有明确(具体)主题。避免关键词太笼统。关键词明确,则主题容易突出,容易为搜索引擎所理解。
2.我们都知道,在对整个网站做优化的时候,应该对不同网页根据其实际内容分别按不同关键词进行优化。但如果整个网站都是关于某一特定主题的,则应注意围绕该主题进行优化,并确保围绕主要的网站主题提供有数量可观的相关内容页面。
3.不要只为首页建立外部链接,可以考虑为个别重要的内部网页建立一些外部链接。
4.注意上述建议中始终强调的一点:内容和主题性。 比方说,某网站中有一关于汽车保险方面的网页,而且如果查询“汽车保险”,这个页面排名很高。但如果该网站总体上是关于“汽车美容”的,而且围绕“汽车美容”提供了大量相关和高质量的网页,那么当用户查询“汽车美容”时,Google可以从这个网站上找到多个符合其要求的网页。所以“汽车美容”被列出两次的可能性最大。
2004年08月19日


a

a

a

a

a

2004年08月06日

探讨Google的筛滤工具(Filters)及如何规避

  编译:Karen
探讨Google的筛滤工具(Filters)及如何规避

据说Google为了保证其搜索结果的质量和相关性,在搜索技术中采用了多种工具来筛滤并从搜索结果中剔除那些不合要求的网页。本文将探讨的问题是:Google究竟采取了一些什么样的筛滤工具,采用这些工具的目的何在,以及如何规避其任何可能存在的筛滤工具,或避免受到任何可能导致的惩罚。

Google所采用的多种所谓的“Filters”是许多搜索引擎优化专家较为关注的问题之一。他们认为Google这个搜索引擎巨人已在其搜索算法中放置了大量阻尼和锁闭装置,并将这些装置统称为“筛滤工具”。

对于“Google采用了多种筛滤工具”这种说法的依据,我们尚不得而知。而且即使对究竟是否有筛滤工具这一点也并未在搜索引擎优化业界达成共识。然而对“Google在其搜索算法中内置了一些阻尼类筛滤工具”这种说法,绝大多数搜索引擎专家还是表示认同的。使用筛滤工具的迹象依情形而定,但这些迹象在Google的整个搜索结果页(SERPs)中却非常明显。

既然在Google的搜索算法系统中涉及了大约一百个系数和变量,那么完全可能其中有一些是用作筛滤功能的。虽然一些业界专家们否认存在所谓的“筛滤工具”,但有句老话说得好,小心驶得万年船。即使将其作为一种可能性,积极采取措施来规避这种风险亦不失为上策。而且无论您是否认同筛滤工具和阻尼效果的存在,我们仍有办法来消除任何可能的影响。

我们将检查一下一些搜索引擎优化技术。这样的话,不管是否真有筛滤工具,还是只是巧合,我们都可以保证网站安然无恙,不会遭受任何可能的“筛除”甚至惩罚。

 
Google的“筛滤工具”有哪些?

搜索引擎优化业界已经注意到一些筛滤工具和阻尼效果的现象。例如众所周知的“沙盒现象”,以及所谓的“过度优化筛滤工具”。

下面的名单并不全面,也没有包含所有假定的筛滤工具。同时请大家注意:在本文中所提到的“假定的筛滤工具”纯粹只是猜测,我们的主要目的还是力求向大家展示这种可能导致网站遭到惩罚的筛滤和阻尼的普遍可能性。

虽然有一些搜索引擎优化专家不同程度地否认确实存在这种假定的筛滤工具,我们还是应该意识到确实存在着这种可能性。而且事实上有很多用来规避筛滤工具的技术同时也是使网站获得较高排名方法之一,这样就能为我们带来双倍的效益。

下面我们就来具体谈谈一些假定的“筛滤工具”,以及如何避免的一些可能的方法。

 
与链接相关的可能的筛滤工具
1 相同锚文字筛滤机制
Identical Anchor Text Filter
解决方案
这是为搜索引擎优化业界普遍认同的一个筛滤工具。大多数搜索引擎专业人士都已经注意到这样一个现象:如果一个网站均采用完全相同的外部链接文字,则不但不会提高网站的排名,反而会增加一些“危险信号”– 网站很可能因为这种链接而遭致搜索引擎惩罚。这是由于搜索引擎会怀疑这些链接并非都是自然创建的,并怀疑该网站这样做是出于为获得更高排名和链接度的目的而人工操纵链接。我们上面提到的“沙盒”就是这样一个搜索引擎业界所公认的Google针对外部链接的筛滤机制。 对这种筛滤机制的防御措施非常简单,其中一个方法就是在链接文字的措词上稍微下点工夫,只消保证链接文字内容中80%不变,20%为选择性内容即可避免这类问题的发生。
2 “links.htm”筛滤机制
Links.htm Filter
解决方案
这种观点认为:如果一个网站专门创建一个页面来放置所有其它网站的链接,也就是我们所说的导出链接,而且这个页面又被命名为“links.htm”,则该页面容易触发筛滤机制。有迹象显示这种类筛滤机制可能存在,不过这只是我们的猜测而已。因为有很多站主都已经发现其“links.htm”页面不但没有为他们自己的页面等级带来任何改善,而且也没有为其链接伙伴带来任何页面等级或链接上的收益。 为确保万无一失,可把相关的链接页改一下名。事实上,我们建议大家根本不要使用“链接”或“LINK”这样的词。此外,将这些链接按主题进行分类,然后分几个页面放置,也不失为一个好办法。
3 互惠链接筛滤机制
Reciprocal Link Filter
解决方案
关于互惠链接是否会触发Google的筛滤机制,也是大家比较关心的问题之一。有迹象显示互惠链接页可能不如其它页面那样受到搜索引擎的重视,但这可能是links.htm筛滤机制的一个副作用。例如博客站点往往包含了大量的互惠链接,但看起来却丝毫无损其外部链接和页面等级。 其中一个方法是在网站总的导入链接中,保持非互惠链接(只进导入链接)的数量占绝对优势。
4 交叉链接筛滤机制
Cross-Linking Filter
解决方案
同一服务器下大量站点的交叉互链,尤其是位于同一C类IP地址块中的大量网站的交叉互链(例如在IP地址123.123.ccc.123中的“ccc”就是C类地址 ) ,往往容易被搜索引擎当作一种“作弊”手段。有些人认为只要超过20个链接站点就会触发这类筛滤机制。Google一旦发现这样的链接形式,尤其是没有来自相同主题的其它外部权威站点的链接,则会忽略这些外部链接。要么降低网站排名,要么直接从搜索结果中筛掉。 在交叉互链时应注意避免此类问题。首先要避免来自同一主机站点的大量互惠交叉互链,其次在交叉互链时可采用三角链接结构,即A链向B,B链向C,C链回A。切勿使用其它任何组合形式。
 
其它潜在的多原因筛滤工具
5 过度优化筛滤工具
Over-Optimization Filter
解决方案
所谓的过度优化筛滤工具看起来好象是多个筛滤程序起作用的最终结果,而非某一原因下的产物。虽然尚无法确定这种筛滤工具是否确实存在,但在去年对大多数网站来说如梦魇般的Google Florida更新以及后来的 Austin更新中,却掀起了其冰山一角。罪魁祸首似乎当属现在独立出来的锚文本筛滤工具,以及因滥用h1和h2标识,以及关键词堆砌所导致的形形色色的页面问题。 过度优化筛滤工具看来对因为热门而充斥了大量作弊手段的关键词语反应最为活跃。处于竞争较为激烈的关键词范围内的网站应注意在内容中保证最为合理的关键词使用率。关键词密度最好不要超过3%。关键词自然恰当的使用不但易博得搜索引擎的好感,而且亦可为访问的销售转化率增色。注意:即使只是滥用关键词这一项亦可能激发Google的筛滤程序。此外还应切忌滥用h1和h2标签,并确保每个页面的网页标题不但应与该页的实际内容相关,且具唯一性。
6 沙盒筛滤工具
Sandbox Filter
解决方案
一些人认为Googgle专门针对新建的外部导入链接设置了一个阻尼装置,所以新建立的外部链接无法获得和那些“老”链接相同的重要性。人们对该猜测的讨论往往会和颇具知名度的沙盒筛滤工具联系起来。
据说沙盒筛滤工具的运作方式与此相同。一个新站点在Google中的排名先是一升再升,然后又会一跌再跌。人们猜测这种现象就是沙盒发挥作用后的产物。
一旦网站被“请进”沙盒,在两到四个月内它在搜索结果中的排名还会持续攀升, 达到较为理想的排名。但是在沙盒期内,无论这个网站的外部链接数量多么可观,质量多么上乘,也无论其页面等级多么高,这个网站的排名也会一落千丈。所以有人认为:网站的外部链接在短短时间内“暴富”未必就是好事,它可能是引起沙盒现象的其中一个原因。
对新网站而言,一方面应注意不要过于迅速地创建大量外部链接,其次,先建立一些外部链接后再发布网站可能有助于完全避免沙盒现象。
7 内容雷同筛滤工具
D uplicate Content Filter
解决方案
不止是雷同的网站内容可以激发筛捡程序,而且那些含有大量相似内容网页的网站也会导致筛捡程序的启动。倘若确实如此,则站应仔细修改网站的内容,并保证每个网页都与其它页面明显不同。当然了,即使是从搜索引擎优化的观点来看,大量内容不同的网页,每个网页均有其单独的标题和主要关键词,这样作也会导致更多的网页将在搜索引擎中获得好排名。 避免网页内容发生雷同的可能性的最好办法还是确保所有页面均包含独特不同的内容。通过不断地内容更新以及增加不同的网页,网站不但能够避开“内容雷同”之嫌,亦可因保持新鲜的网站内容而博得搜索引擎的好感,从而增加提升搜索引擎排名的机会。
 
结束语

如文章开始所说,这些假定的筛滤工具中有很多都是基于不完全的观察,因而我们所说的筛滤工具和阻尼工具并不一定完全正确。但从另一方面来说,无风不起浪,事出必有因。

避免筛滤或阻尼工具的最好方法是使用大家所公认的搜索引擎优化技术。调制外部导入链接的文字内容,为每一个页面撰写自然而有说服力的独特的内容,避免堆砌关键词。避免内容的雷同。切忌使用仅仅出于企图欺骗搜索引擎的任何可疑的优化技术。