2005年11月09日
小林 | 杂念 | 出处:原创-IT| 2005年05月09日 00:23 | 阅读 3443 次

        

尊敬的Google公司相关负责人:
  您好!我是Google的一名忠实用户,本人是中国一家IT企业的CTO。最近,我一直使用的一个叫做“驽兽下载”(www.swzn.com)的网站,再次遭受到贵公司的一些不公正待遇,其站长求助于我,加之此前也有其他一些网站的站长向我反映过类似的问题,而Google这样一家大型互联网企业在中国至今都没有一个公开的本地化机构,这使我不得不以公开信的形式将我和一些个人网站站长的质疑传达给贵公司,希望此举能够得到Google的理解!
  我希望通过这封公开信给Google的高层管理者敲一个警钟,今天的Google虽然如此壮大,但却在某些地方存在着越来越多的漏洞和隐患。
  首先我想提的是关于所谓的“作弊”问题,任何一个搜索引擎,无论是Google、Yahoo或是Baidu,都无一幸免会遭遇SEO(搜索引擎优化)的问题,然而“优化”与“作弊”之间是有一定界限的,一家成功的搜索引擎公司应该是通过改善搜索引擎算法等技术手段,来区分内容质量,进而防止作弊,而不是靠人为的操作来界定“作弊”。因为只要涉及人为操作的情况,就难免会出现不公平的问题,而且人工处理的效率也非常低,我想Google是这方面的专家,应该懂得这个道理。
  针对Google的“作弊”问题应该源于Google的PageRank技术,该技术的发明真的很伟大,它就像E-Mail和HTML一样使互联网上的每一个用户都受益。不过,每一项伟大的发明都难免被一些别有用心的人利用,比如充斥在互联网的垃圾邮件,还有我们今天说的针对搜索引擎作弊的网站。
  PageRank是一项非常复杂的技术,本人也曾研读过PageRank的一些技术细节,从SEO的角度上来阐述,离不开几个重要因素:Link链接、Title标题、Alt文字、Domain Name域名、Directory目录、Filename文件名、Keywords关键字、Descriptions描述以及Content Related内容相关度等,这些项目越全、与网站内容契合的程度越大,被Google搜索到的概率就越大,或者说其网站在Google上的排名也就越高。
  假如互联网上没有作弊行为,那么由PageRank的算法决定Google的自然排序将是很公正的事情,然而那只是一个梦,无论是在现实社会中还是在互联网上,“作弊”都是难以避免的事情。只不过在现实社会中,我们有相关的法律法规来制裁作弊者,而在互联网这个所谓的最公平、开放、自由、民主的平台上,直至今天,尚没有发现任何好的方法来对付作弊网站。
  事实上,垃圾邮件的历史比搜索引擎作弊更长久,至今也没有人能完全解决垃圾邮件的困扰。在包括Google在内的搜索引擎中,也没有哪一家能够采用过硬的技术手段来排除垃圾信息或过剩的内容,恰恰相反,搜索引擎提供商们往往是以收录页数之“大”为自豪,Google早已收录了80亿张网页,Yahoo也提供对数十亿网页的检索、中国的Baidu则收录有近十亿中文页面,就连推出不到一年的中文搜索引擎提供商Sogou都声称自己收录了8亿张网页,在这场“收录”膨胀的竞赛中,谁会去主动排除垃圾信息呢?
  目前,中国互联网圈里流行一个说法:两三年前,当你使用Google以自己的姓名或家乡名称搜索到相关信息时,你会很兴奋,这么细的信息都能有条有理的查找出来;而今天,再次搜索同样的信息时,你不但不兴奋,反而还会很失望,上面充斥着大量的垃圾信息。所谓垃圾信息,就是你点进去后看到的并不是你想要的,而是布满了一堆广告或让你再次搜索的骗局。
  区分“作弊”与“优化”的界限在于,如果搜索的内容完全不符合你的需求,只是一堆你不想要的信息,那么几乎100%可定义为“作弊”。反之,无论网站是否通过“SEO优化”得到现有的排名次序,只要其内容确实符合客户的需要,就不应该被定义为“作弊”,甚至受到“封杀”、“屏蔽”或“过滤”等待遇。
  目前的Google正在采用极其愚笨的方法——使用人工干预的手段来处理所谓的“作弊”问题。以已经在市场运营了多年的网站www.swzn.com来说明,该站点提供常用的软件下载,其内容符合中国互联网用户的习惯,其中多数的常用软件(如网际快车FlashGet、网络蚂蚁NetAnts、AcdSee、魔法兔子、优化大师等)的搜索结果曾经在排名中处于前三位,这有赖于早期中国一些类似Yahoo的中文目录服务网站,如www.hao123.comwww.265.com等,收录了该站点上的软件链接。因此,www.swzn.com曾经每天有1/3的访问量是经由中文网址站和Google等搜索引擎的搜索结果页而来,但这并非SEO的结果,而是经过数年的积累而自然产生的结果。在我周围同样从事互联网工作的朋友中,有不少都是该网站的忠实用户。
  大概在一个月前,Google抛弃了一贯的“以精确而公正的算法来优选网页搜索”的原则,开始采用人为干预搜索结果的策略,将www.swzn.com在Google的搜索结果中删除了。究其原因,Google客服人员的回答几乎是公式化的,那种千篇一律的回复不应该发生在具有先进的技术背景和追求客观公正的Google身上,更不应该以种种借口掩盖自身因技术上的不足和漏洞,甚至由于工作人员的疏忽而导致的不公正。
  中国有个成语叫“自相矛盾(Antinomy)”,正在Google身上体现得淋漓尽致,请看以下这个网页上的描述:http://www.google.com/intl/zh-CN/why_use.html
  “客观公正”:
  Google 以其复杂而全自动的搜索方法排除了任何人为因素对搜索结果的影响。虽然我们也在搜索结果旁刊登相关广告,但没人能花钱买到更高的网页级别,从而保证了网页排名的客观公正。作为您的忠实助手,Google 可以方便、诚实、客观地帮您在网上找到有价值的资料。
  “客观公正”的搜索结果,以及本人所信仰的互联网上的自由、平等、开放等原则,一直是我认同并喜欢用Google来搜索的原因,但现在看来我要改变我的看法了,请看看另外两个网页上正在矛盾地呈现着什么:
  http://www.google.com/intl/zh-CN/webmasters/seo.html
  http://www.google.com/intl/zh-CN/webmasters/guidelines.html
  请问Google,什么是“排除了任何人为因素对搜索结果的影响”?什么又是“尽量减少人为的干预”?这样的指导思想是否前后不符?这是否意味着Google已经完全背离了以“技术手段”避免“人工干预”的精神?
  即便我们暂时认定该网站为“网上恶邻”或定义为“作弊网站”,那么Google搜索引擎是否将不再是无所不能、无所不包(包容)呢?
  当用户们由于使用习惯或没能记住大量的网址或由于没添加进书签等原因,而不得不求助于搜索引擎,再次在Google上输入网站名称“驽兽下载”进行搜索时,用户看到的却不是该网站的网址;当用户再次以“www.swzn.com”输入使用Google Toolbar的搜索框时,他们看到的却是“对不起,找不到网址 www.swzn.com的信息”;当用户再次使用熟悉的“指定网域”搜索方法,输入“site:swzn.com”进行搜索时,出现的却是令人失望的“找不到和您的查询‘site:swzn.com’相符的网页”。
  我相信这完全违背了Google创始人之一Larry Page说过的话:“完美的搜索引擎需要做到确解用户之意,切返用户之需”。
  这样的搜索结果,真的令人很失望,这样的结果,就连早期以Yahoo目录服务为代表的门户网站都不如,Google所号称的收录了80亿的页面就是如此的不能包容?连一家中等规模的网站的名称和网址都不能找到?
  需要说明的是,这绝非个别现象,例如www.gjj.ccwww.imobile.com.cn这样的网站,在中国的“站长圈”里流传的还很多,在此我无法一一列举,相信在Google的人工“黑名单”里可以看到不少这类被“冤枉”的网站。当然,确实有一些作弊的站点被删除,诸如www.playcomputer.comwww.entsou.com等,原因是其提供二次搜索结果,并非用户之所需,但www.swzn.com与这些网站不同,其提供的恰恰是用户真正需要的信息。
  根据“驽兽下载”站长提供的日志显示,现在每天依然还有GoogleBot到www.swzn.com的网站来抓取页面,但该网站却在Google用户的视线中完全消失了,这种人工干预而导致不公正待遇的问题,不仅发生在Google的搜索引擎服务中,同样的悲哀在Google AdSense服务中也存在!
   在www.swzn.com网站被Google删除后不久,支持www.swzn.com部分收入的Google AdSense给站长发来了一封电子邮件,声称其注意到www.swzn.com网页上的广告产生了“无效点击”,因此而终止了该站的Google AdSense帐户。
   百思不得其解的站长终于在“站长圈”的朋友中打听到了一则消息,有站长(Webmaster)称,收到此类关于“无效点击”而停用账户的原因,通常是因为站长自己或引导用户点击广告后而造成的。其中有位站长,自己曾经花了一个晚上的时间,点击而产生了两千多块的收入,后被停用了账户,其受到这样的待遇是应当的,因为确实损害了广告客户的利益。
  可是www.swzn.com网站确实没有做过如adsense-adclicks-zhs@google.com邮箱发来的邮件上说的“无效点击”,其他在Google AdSense声明网页上所描述的“透过重复手动点击、煽动他人点击、透过漫游器、自动化点击工具、或其它欺骗软件”等问题都不曾发生过。相反,www.swzn.com网站一直遵守Google的相关规定,并且曾经长期维持着稳定的广告收益。
  Google发来的邮件上称“我们理解您希望获得有关我们所调查的无效点击的具体信息。由于我们监控系统的专有性,我们不能透露这些点击的任何具体细节”,经早期被停用账户的站长证实这根本就是一封模版邮件,但“我们认为停用您的帐户是确保贵网站不再发生无效点击的必要措施”这样的言辞看上去更像是Google掩盖自身技术不足及工作人员的疏忽等问题的借口。
  对于www.swzn.com站长的疑问,难道Google不能有正面的回答吗?正如下面邮件中提到的,我们唯一能想到的情况可能就是“陷害”。
  Google之所以不正面回答,大概不会是因为美国文化里没有发生过“陷害”这种事情吧?但“Snare”这个词却提醒我们,美国也有。当然,也可能是因为Google已经将这个词完全从自己的数据库里删除了!
  如果正在看这封信的Google的员工们真的生活在一个没有“陷害”的世界里,我在羡慕你们的同时更愿意进一步举例说明一下这种情况的存在:
  如果有站长A,因为作弊,自己点击或误导用户点击Google Adsense而产生了大量的“无效点击”,为自己赚得了收入,却让广告客户的利益受到了损害,那么A站被判定为无效点击并停用账户当属正常。
  如果有站长B,自己一直悉心维护着自己的网站,既没有自己点击也没有误导用户点击,当他的网站经营数年后,每月通过Google Adsense的收入已达到数百美元(这已经是中国工薪一族中不菲的收入),这完全可能引起站长C的嫉妒(不知道Google是不是也搜索不到“嫉妒”这个词),而站长C从Google的页面上得知,如果站长B的网站产生“无效点击”就能使其账户被停用,站长C完全可以通过很简单的办法“帮助”站长B产生大量“无效点击”,这样,站长B的账户很快就被停用了。
  很显然,站长A被停用账户是正常现象,但站长B得到“Google AdSense小组”的人员相同的回答,真的有些不可思议,按这个理论,某个心态不正常的人或站长,看到谁的网站不顺眼或是看到谁的收入比自己多,就可以将别人辛辛苦苦所做的网站所应得到的收入化为乌有。而Google AdSense的处理就是人工干预来停用帐户,那么,Google是不是正在客观上帮助了某些别有用心的网站来达到泄私愤、铲除竞争对手的目的?
  更不可思议的是,在Google“错杀良民”的同时,却有大量的“漏网之鱼”,真正意义上的作弊网站,诸如:www.xrea.comwww.xatk.com等,只是可能由于他们的作弊手段超出了Google的技术识别能力而消遥法外,甚至也可能是由于我们不愿去相信却不得不考虑的一个原因——恰恰是Google在保护他们,因为Google已经将排除“作弊”网站的工作部分交给了某些员工。
  实际上,对Google来说,更加公正、客观的做法应该是不断提高、升级改进自身技术手段,将裁判权交给完善的算法和机器,而尽量避免人为的干预。比如,对于内容符合、长期耕耘的网站出现“无效点击”情况时,应该进行相应调查,对其“无效点击”所得的收益扣除,并给予警告,而不是现在“Google AdSense小组”所采取的“一刀切”处理。
  虽然在发现新问题时往往要先经过人为的判断,但最终还是应该在研究后形成算法再交给机器去处理,而不是草率地采用人工干预的方法。如果Google越来越多地依赖人工处理,只能说明Google的技术能力在衰退,而精确公正的搜索算法曾经是Google最赖以自豪和自信的,我非常怀疑逐渐失去技术自信心的Google是否还能给予它曾经的用户们以持续的信心。
  人工干预的现象,必将使互联网变得不平等、不公正、不客观、不开放、不自由。这与Google一直崇尚的公正、客观形象显然背道而驰,更与互联网精神格格不入。造成这一切的原因,我坚信是“人工”而非“技术”的不公正、不客观。
  不同的情况,相同的答案,愚弄用户,愚弄站长,这样的问题正在Google身上一步步蔓延,这真是一件很可怕的事。
  最后我要说的是,倘若Google忽视中国的本地化问题,它也会像ICQ一样,在中国市场上消失,后者已经让所有IM用户投入了QQ的怀抱。
  如果拥有数千名精英员工的Google连这些都不能理解,那么我也只能很遗憾地对它说:再见Google,中国互联网的明天不属于你!但那并不是我希望看到的结果。
 
附:停用Google AdSense账户的来往邮件
发件人 :  Google AdSense <adsense-adclicks-zhs@google.com
发送 :  2005年4月16日 1:01:03 
收件人 :  linxingzhen@msn.com 
主题 :  Re: [#24587764] Google AdSense 帐户已被停用 
MIME-Version: 1.0
Received: from 66-102-14-1.google.com ([66.102.14.1]) by mc4-f27.hotmail.com with Microsoft SMTPSVC(6.0.3790.211); Fri, 15 Apr 2005 10:04:13 -0700
Received: from tkk-fe2.corp.google.com (tkk-fe6.corp.google.com [172.25.0.25])by piru.smo.corp.google.com (8.13.3/8.13.3) with ESMTP id j3FH13wC009207for <linxingzhen@msn.com>; Fri, 15 Apr 2005 10:01:03 -0700
Received: by tkk-fe2.corp.google.com (Postfix, from userid 5701)id A3E24B609C; Fri, 15 Apr 2005 10:01:03 -0700 (PDT)
X-Message-Info: JGTYoYF78jEHjJx36Oi8+Z3TmmkSEdPtfpLB7P/ybN8=
User-Agent: Neotonic Trakken/0.0-DEBUG
Return-Path: bounce-20-24587764@google.trakken.com
X-OriginalArrivalTime: 15 Apr 2005 17:04:13.0229 (UTC) FILETIME=[261315D0:01C541DD]
 

您好!
 
非常感谢您发来电子邮件。
 
我们认为停用您的帐户是确保贵网站不再发生无效点击的必要措施。
 
我们理解您希望获得有关我们所调查的无效点击的具体信息。由于我们监控系统的专有性,
我们不能透露这些点击的任何具体细节。但是,我们愿意再次向您保证,收到您的回信后,
我们重新彻底审核了您的帐户数据,并再次确认贵网站的广告确实存在无效点击问题。根据
我们对此问题的政策,我们停用了您的帐户,以维护广告客户的利益。
 
按照我们计划条款的规定,Google 保留随时取消任一发布商的参与资格的权利。
 
 
 
Google AdSense 小组敬上
 
Original Message Follows:
————————
From: "lin xingzhen" <linxingzhen@msn.com>
Subject: RE: Google AdSense 帐户已被停用
Date: Thu, 14 Apr 2005 15:57:01 +0800
 
您好!
 
我保证自己没有做任何点击,更没有使用漫游器、自动点击工具或任何其他欺诈性软件
产生的点击,唯有可能的是一些竞争对手嫉妒我做的google
adsense赚到钱,他们没有
,知道google adsense会检查异常点击而将我"害死"。一定有人嫉妒,所以存在有人
把我点击死的可能。希望Google再度审批,谢谢!
 
     礼
 
林兴真
http://www.swzn.com
 
 
 
 
 

>From: Google AdSense <adsense-adclicks-zhs@google.com>
>To: linxingzhen@msn.com
>CC: Google AdSense <adsense-adclicks-zhs@google.com>
>Subject: Google AdSense 帐户已被停用
>Date: Wed, 13 Apr 2005 13:55:10 -0700
>MIME-Version: 1.0
>Received: from 216-239-45-4.google.com ([216.239.45.4]) by
mc1-f29.hotmail.com with Microsoft SMTPSVC(6.0.3790.211); Wed, 13 Apr 2005
 
13:56:53 -0700
>Received: from spb56.corp.google.com (spb56.corp.google.com
[10.32.41.56])by nappa.corp.google.com (8.13.3/8.13.3) with ESMTP id
j3DKtAl0017467;Wed, 13 Apr 2005 13:55:14 -0700
>X-Message-Info: JGTYoYF78jHkH+G4JopKU884uXpenYsfCNlSaNMpDbk=
>X-Google-AdSense-Message: ads-status
>Return-Path: adsense-adclicks-zhs@google.com
>X-OriginalArrivalTime: 13 Apr 2005 20:56:53.0672 (UTC)
FILETIME=[52522280:01C5406B]
>
>XingZhen Lin:
>您好!
>
>我们已经注意到您的网页上的广告产生了无效点击。因此,我们停用了您的
>Google AdSense 帐户。请您理解,我们采取这一步骤是为了尽力保护 AdWords 广
>告客户的利益。
>
>发布商不得在网站上对任一广告进行无效点击,这包括但不限于由发布商在自己的
>网页上产生的点击,使用漫游器、自动点击工具或任何其他欺诈性软件产生的点
>击。
>
>这些做法都有违 Google AdSense 的条款和计划政策,可以在以下网址查看这两
>者:
>
>https://www.google.com/adsense/localized-terms?hl=zh_CN
>https://www.google.com/adsense/policies?hl=zh_CN
>
>Google 小组敬上

Spam?最初是SPAM,一个罐装肉的牌子。对于这个牌子名字的来源有很多解释,官方版本说,它是”Specially Processed Assorted Meat”特殊加工过的混和肉。这种SPAM肉有段时间非常普及,到了无处不在,令人讨厌的程度,后来(1970年)Monty Python剧团有个很流行的Sketch comedy(一种短小的系列喜剧)叫Spam,剧中两位顾客试图点一份没有SPAM的早餐,但不能得逞。于是,许多年后,Spam被用来称呼互联网上到处散布垃圾广告消息的现象。在搜索引擎上的Spam通常也称为作弊。

在全球著名搜索引擎百度或者是Google上搜索“塑料”二字,前数百个搜索结果均是一个叫114b.com网站的页面,而且还都是塑料毫无关系的垃圾页面。更为恶劣的是,“塑料”二字仅仅只是被114b.com疯狂作弊所影响的词中的一个而已。当然,这也就意味着114b.com有可能把这些在Google和百度上的位置进行高价销售。114b.com这一手法严重的影响了百度、google用户的使用体验,更多人认为,114b.com利用他们的“小伎俩”强奸了百度、google用户的搜索意愿。

百度在检测到这一情况之后,当即屏蔽了114b.com;而Google,随即也追随百度,屏蔽了114b.com。

作弊是一件低成本的事

中国互联网发展处于高速增长阶段,国内的个人网站已经成为中国网络一个非常重要的补充力量,具备非常好的市场前景。

但是对于一些个人网站站长而言,流量可能就意味着收入。用正规手段获得流量,广告成本太高,而通过长期的网站建设以搜索引擎获得较高排序,获取高访问量,人力和时间成本都相应加大。

出于对流量的看重,一些想走捷径的个人网站站长开始通过技术或非技术手段骗取用户点击,或恶意操纵搜索引擎的查询结果,以提升网站流量。尤其是针对搜索引擎的算法,采用各种作弊手段,期望短期内达到流量目标,并因此获得利益。

一些作弊的站长往往抱有侥幸心里,因为他们知道,搜索引擎获得流量成本低廉,即便被封,也只是一个域名费用,不足百元。

百度Google 刮骨疗毒

然而作弊网站给搜索引擎的用户体验却造成越来越大的伤害,这些网站不仅用堆砌关键词,大量制造链接等手段欺骗搜索引擎,更关键的是当用户点击这些作弊链接时,通常会有上当受骗的感觉,长此以往,搜索引擎在人们心目中的形象就会大大折扣。所以我们就不难理解以上不仅仅是百度和google之间偶然的一次默契合作,这两家公司很有可能在面对相同的遭遇下抛开门户之见,联手更多的搜索引擎,开展全球反Spam运动。

在近段时间,由于百度和google加大了惩治作弊网站的力度,又一次不约而同地充当了“警察”,又一次不约而同地因维护所有网民的利益站在了作弊站长的对立面上。

由于涉及到站长自身利益,这些个人网站站长表现出强烈的不满,一些站长甚至开始利用各种各样的民间组织,对这些搜索引擎的“执法行为”开始谩骂攻击,Google远在美国,基本不会理睬作弊站长的攻击,但是百度在国内,还有客服人员可以作出一些解释,但随着作弊现象的日益普遍,这种解释反而招来了更多的漫骂。

但这些谩骂终究要面对现实道德的拷问,百度和google也纷纷表示,为了维护网民的搜索体验,决不会对这些作弊者手软,即使是刮骨疗毒 ,也要SPAM网站予以强有力的打击。

公道自在人心

百度、Google为何要冒天下之大不韪和这些中小网站为敌呢?

业内人士认为,作为搜索引擎的首要目的就是为更多的网民提供优质的搜索服务,让人们最快、最方便的找到他们想要的信息,作弊网站已经成为人们寻找信息的一大障碍,严重伤害了网民的搜索体验。

一些作弊站长滥用了搜索引擎排序原理,背离了搜索引擎设计的初衷,致使网民看到的搜索结果,是被站长人为操纵的搜索结果,大量的垃圾信息存在,严重损害了用户的上网体验。

反作弊类似警察维护治安,属于不得已而为之。它的作用,将垃圾信息或作弊网站打入黑名单,以维护搜索引擎终端用户的根本利益,确保网民较高的搜索体验。虽然这会招来网上一些最活跃的站长的不理解,但普通用户的利益才是最根本的利益,公道自在人心。

联手

国际级搜索引擎的不谋而合,使得这次打击作弊网站活动更加彻底。一些作弊网站如再不警醒,势必面临搜索引擎更大规模的清理与惩罚。

2005年11月08日

http://blog.donews.com/gentelmancommoner/archive/2005/11/08/618988.aspx