2005年05月07日

  听说Google出了Web Accelerator,就赶紧去安装了测试。原先就有习惯去一些GNU的网站淘宝贝,尤其是sourceforge.net找些Free而且有原代码的软件,一直因为访问速度慢如蜗牛,所以往往扫兴而归。这次因为有了Google的加速,在sourceforge.net似乎已经被镜像到国内。研究了下Google Web Accelerator,应该是一个代理服务器,在网页打开速度较慢以后,Google Web Accelerator 就会开始工作,同时系统会显示通过Google Web Accelerator访问节省了多少时间。对于用户来说尤其经常需要访问国外网站的用户来说,这个工具非常值得推荐。

  Google当然不是雷锋,Google在为用户提供免费代理服务的同时收集了用户的访问纪录,这个才是Google想要得到的。与其相信Google通过该软件来收集用户的访问习惯来推广他的AdWords业务,我更相信Google是用这些数据作为他PageRank算法的替代品。Google的蜘蛛无法知道他访问的一个网页到底有多少流量,所以他只能通过网页上的联接关系PageRank来评判一个网页的重要性。虽然PageRank是一个非常有创意的想法,但是他无法非常准切的判断一个网站的实际重要性,因为它不知道这个网页一天到底有多少的点击率。PageRank可以很容易通过一些SEO技术得到提高,更加要命的是因为它依赖页面的关联关系所以有很大的延迟性(当然非常非常热的热点的事件Google会有所体现),当某一热点发生了一段时间后,该页面的PageRank才会提高,才会在搜索结果的排名有所体现。我一直认为如果Google有Alexa的数据的话,在搜索上完全可以比现在做得更好。聪明的Google采取了比alexa工具条更加聪明的方法。

  Google其实一直在采集用户对于检索结果点击情况,在用户在Google的检索结果里面点击一个页面的时候,就会激活鼠标onmousedown事件,Google跟踪了onmousedown事件,在用户按下搜索结果里面的某个联接的时候浏览器就会去请求一张图片,这个图片请求的时候带上了相应的点击参数。Google就通过这种方式收集了用户的点击情况,但这个还是被动的:因为只有用户在Google上检索时候才可以采集,而一些恶意SEO过的页面因为排名靠前还是容易被用户误点。所以Google采用了更加主动的方法:它通过Web Accelerator去跟踪了用户的访问行为。如果Web Accelerator的用户达到一定规模以后,Google只要通过采集的数据就可以估算出网页的实际访问量。那样排名的算法就有了比PageRank更科学的依据。

   当然Google可以通过Web Accelerator采集的数据来分析单个用户的喜好,但是这个计算成本估计还是非常高的。

加速器下载地址:http://download.enet.com.cn/html/010052005050801.html