3. 枚枚页:适者生存(Memecodes: Survival of the Fittest Web Pages

       枚枚页(Memecodes)是使用很多随机产生的文字生成的网页,这样的网页在生成后经过一段时间会自动消亡。那么这是如何实现的呢?方法是对这些网页使用一套进化规则:某个网页在google被搜索和点击的次数越多,它的流行指数就越高,同时由它生成的子网页也越多。

       枚枚页这个名字是从Richard Dawkins的书《自私的基因》<The Selfish Gene>)里面的一个单词“枚枚”衍生而来。他在书中写到:

 

       音乐、想法、宣传标语、服装时尚,制造壶壶罐罐的方式、或者建筑中的拱门等等都是枚枚的实例。就像基因在基因库中是从一个人的体内通过精子、卵子进入另一人体内来传播自己一样,枚枚也是在枚枚库中通过仿制行为,从一个载体跳跃到另一个载体。

 

       我在2004年初开始进行这个实验,看着它逐渐发展,得到了一些有趣的结果。下面是它如何进行运作的细节描述:首先,在一个词典的基础上,随机选择该词典内的单词,生一张网页。为了使得这张网页显得尽量自然,给它添加了诸如“这”或者“和”这一类的单词以及标点符号。下面是这样的一张包括了Jabberwockyish(1)段落的网页(这是一段毫无意义的混乱的英文单词,因此不做翻译):

 

       Cognac? Is sloth is waist is declare of bramble flood in of stoical. Footman... Hesitancy a for attention flabby wanton and calculate vtol cyclamate that paprika feign the aline fourth qualifications of in. Thatch, Saccharin hansom rationale in dine numbers.

 

       这张网页——或者称之为一组基因——是构成如生态系统般的网页集里面一张独特的网页,现在这张网页里面可能有某句话,或者一句话中的某些片断会被人拿来进行搜索。例如,若一个句子包含了“肥胖的鸽子”这个短语,人们是极有可能用此短语在google中进行搜索的。在本搜索行为发生且搜索者点击了枚枚页这张结果网页的同时,这个特殊的页面会自动生成子页面。任何一个网页的子页面都是其母页面经过替换某些单词这样轻微的改变后生成的,使用这种方式,“肥胖的鸽子”可能变成“肥胖的粉色鸽子”(当然,也有可能变成一个更加成功的基因),或者也可能变成“肥胖的塔鸽子”(几乎没有人会搜索这样的一个东西,所以它只有勇敢面对不久后将来临的灭亡了)。

       那么张网页又是如何消亡的呢?大约2,000页是所有页面的数量上线,当一个新的页面生成的同时,最旧的那个页面被删除(在枚枚实验首页上将指向该页面的链接删除)。如果某张网页在被删除的时候都没有能够成功的生成子网页,它的基因将不能继续成功生存,它因此不能继续存在下去了。

       其它基因(随机单词)则可能会比较成功,而且成功的页面一般都有可能会逐渐变得更成功。它们找到了一个自然的搜索规则并且与之相适应,从而诱使越来越多的搜索者去对它们包含的关键词进行搜索,继而生成越来越自然的语句。将来的某一天,这些页面甚至还可能会自动变成莎士比亚,并不需要“无限猴子”(Infinite Monkeys)。倒不如说,这是都是我的希望罢了!本实验使枚枚页自动进化后相当久的一段时间之后才得到结果,我在约一年多后终止了实验。然而到那时,很多人已经找到了这个网站并且生成了许多子页面,约有多达10,022张网页被生成(实验初始自动生成了约2,500张网页),有些枚枚页甚至到了第5代。

       某些流行的句子实在是相当奇怪,比如“感觉到对蘑菇吐口水以及使用微波炉来吃外国青蛙的暴怒”,又如“海鸥三明治”更是实际。其它一些句子则总是包括“种子”这个单词,因为近来“种子”一词成为了一种互联网上下载视频等文件的流行方式——BT下载的文件格式。然而,唯一可以被理智接受的成功基因则是包含了一些奇特单词的句子,我却无法在这里展示给你们,原因你们应该能够猜得到:它们全部和成人话题相关。也许吧,这些都是自然规律!

 

(1)     Jabberwocky是由Lewis Carroll写的无实际含义诗歌< Through the Looking-Glass and What Alice Found There >(1872)的别称,该诗的第一句话是:“Twas brillig, and the slithy toves/ Did gyre and gimble in the wabe.”(德语)

 

【本文翻译自<55 Ways to Have Fun With Google>
作者: Philipp Lenssen

中文翻译: 杨远骋 | 李子庆

ISBN: 1411693418

出版社: © 2006 Creative Commons Attribution-NonCommercial-ShareAlike 2.



Trackback: http://tb.donews.net/TrackBack.aspx?PostId=928005


[点击此处收藏本文]  发表于2006年06月27日 12:32 AM




正在读取评论……
大名
网址
验证码
评论