2005年10月19日

说到Google,很多人都会想到Google所说的“不作恶”和微软“帝国”的“作恶”。王建硕keso他们都有对Google各自的看法。一个公司如果成功了,最有可能的是引起人们的羡慕;但如果一个公司成功了,最有可能的是引起人们的愤慨。当这个公敌角色的,70~80年代的是IBM,90年代到现在的是微软,也许以后有机会是Google。不论这些公司到底有没有真的“作恶”,无可否认的是他们为我们开创了新的商业模式、带来了新鲜的思考方法。IBM做的事情解决了用户的计算需求,微软做的事情解决了用户的易用性需求。那么Google为我们带来了什么呢?

信息理论的鼻祖之一Claude E. Shannon信息(熵)定义为离散随机事件的出现概率。所谓信息熵,是一个数学上颇为抽象的概念,在这里不妨把信息熵理解成某种特定信息的出现概率。而信息熵和热力学熵是紧密相关的。根据Charles H. BennettMaxwell’s Demon的重新解释,对信息的销毁是一个不可逆过程,所以销毁信息是符合热力学第二定律的。而产生信息,则是为系统引入负(热力学)熵的过程。所以信息熵的符号与热力学熵应该是相反的。一般而言,当一种信息出现概率更高的时候,表明它被传播得更广泛,或者说,被引用的程度更高。我们可以认为,从信息传播的角度来看,信息熵可以表示信息的价值。这样子我们就有一个衡量信息价值高低的标准,可以做出关于知识流通问题的更多推论。

信息熵的计算是非常复杂的。而具有多重前置条件的信息,更是几乎不能计算的。所以在现实世界中信息的价值大多是不能被计算出来的。但因为信息熵和热力学熵的紧密相关性,所以信息熵是可以在衰减的过程中被测定出来的。因此信息的价值是通过信息的传递体现出来的。在没有引入附加价值(负熵)的情况下,传播得越广、流传时间越长的信息越有价值。例如说,Keso说的话就比我的更有价值。

Keso在最近一篇文章中提到IT doesn’t matterNicholas Carr认为传统的IT产业已经日用品化,也就是说,以制造机器为目的的IT产业已经步入了成熟的平台期,市场不再会有令人尖叫的高潮出现。电脑、网络已经成为了人们日常生活中与电话甚或是水电、煤气相仿的事物,大家已经习以为常。以机器制造为目的的IT企业逐渐淡出媒体的视野,就跟当年的DEC、IBM甚至是Cisco一样。其实这并不是说传统IT产业已经没有了市场,只是这个市场就像负责买菜做饭的家庭主妇一样,已经不可能引起投资者的兴奋感。

Google这个样板的意义,在于Google用一个简单的搜索框,为我们示范了如何在信息的汪洋大海中寻找信息和创造新的信息。上文提到信息的价值是可以通过传递来衡量的。Google是信息传递的推手,让原本价值很低的信息增加了被传递的机会,也就是变相增加了信息的价值。抓住信息传递的附加价值,就抓住了用户;抓住了用户,就抓住了广告商。换句话说,Google的营业额是由用户和广告客户共同创造出来的。所以Google“让用户尽快离开网站”的价值观并不是在做善事,而是有其商业理由的。因为用户离开网站得越快,信息传递就越迅速,单位时间内它的附加价值也就越高。为什么可以加快信息传递?1、Google降低了用户搜寻和获取信息的成本:用户学习使用工具的成本、用户搜寻和获取信息的时间成本。2、让信息尽快重新流通。

工业革命完成的标志是用机器制造机器,用信息创造信息可以看作是信息革命完成的标志。用信息创造信息并不是什么新鲜事,但当这个过程能够被极快速地完成的时候,它就有了更深刻的含义。因此不断通过搜索来创造附加价值的Google,以及其他类似的互联网公司的出现,标志着真正的信息时代的到来。为信息创造附加价值,加快信息流通的速度,这就是Google的成功之道。

(注:头痛欲裂,文章写得有点乱,以后再寻求整理。请诸位见谅。)

2005年10月13日

最近P2P的新闻很热,最多的是跟 WinMX 和 eDonkey 被RIAA控告而被迫关闭网站的消息,也有BitTorrent筹集到风险投资准备进一步发展的新闻。与P2P相关的焦点有二:一是经济学与法律的问题,在信息复制的边际成本几乎为零的互联网世界,现有的产权制度无法适用于“信息”这种物品,它的价值无法通过“处置权”的交易体现出来;二是P2P技术带来了新的信息传递方式,信息的传递拓扑从原来星型为主的结构,变成了从稀疏到紧密的网状结构。这两者看似无关,实际上却是紧密相连的。

传统的信息传递结构是星型广播结构。用这种传递方式的媒体有很多,例如报纸、杂志、电台、电视,都是以星型广播结构传递信息的,受众的特点是被动的接受信息,他们只能过滤自己不需要的信息,而不能搜寻自己需要的信息。报纸、杂志上登载的新闻、评论都是经过编辑加工的话语,代表了公权力、公共利益或者某个私人团体利益的意志。换言之,报纸、杂志的信息天然就是经过精心剪裁的盆栽,编辑权决定一切。电台、电视相对平面媒体而言,他们的时效性更强,与受众的互动和接收受众反馈的机会更多,但由于他们是信息的广播中心,电台的听众、电视的观众从来不曾拥有话语权,因此电视广播在本质上依然是盆栽。而门户网站,或者说新闻聚合站点,是星型广播结构在互联网时代的继任者。虽然他们时效性和互动性更强,但是“门户”的编辑特质,决定了门户网站不论玩什么新概念,他们都必然属于“推”的时代。

互联网带来的信息时代,是受众说话的时代。话语权重新归还到所有人的手上。用户需要的,他们可以自己去找。用户可以维护自己的信息路由,对自己的知识结构进行标记分类,而不一定需要一个高高在上的权威告诉他们应该怎么做应该如何去做。所以信息时代的特点是“拉”,用户的体验是“主动”。用户可以主动的搜索、主动的获取、主动的反馈。Google正是由于洞察到了信息时代的新传递方式,为用户提供了“主动”体验的搜索,用简洁的界面来适应低端用户的需求,以智能查察用户需求的AdSense来提供客户的广告,才能成为上网的必需品。

而P2P则是另一种信息传递的方式。就P2P的协议而言,有两个层次的网络。第一层次是需要中心结点的网络,中心结点作为信息发布源。BitTorrent协议所需要的tracker、eD2k协议所需要的服务器都是第一层次的中心结点。中心结点的存在,是为了维护用户信息的列表和提供更快捷的信息检索方式,然而这仍然免不了要中心化的技术。P2P的第二层次是DHT网络。DHT是分布式Hash表的缩写,这是一类在分布式网络中查找结点和结点信息的算法。利用DHT网络,用户可以通过多个“强”结点获得邻近结点的分布信息,继而接入网络。只要接入了网络中,任意一个结点再不需要链接任何中心结点或者强结点,而只需要往他们的邻近结点发出搜索和获取信息的请求,就可以获得相应信息。当然,纯粹的DHT网络搜索效率会低于有中心结点的网络,然而,DHT网络代表了一种更广泛而有效的信息传递方式——我们只依靠我们认识的人,就可以找到需要的信息。

P2P的信息传递拓扑不再是单纯的星型,而是星型网络与分布的网状网络同时存在。而后者的拓扑形式和动力学模型,与D. Watts & S. Strogatz提出的小世界网络的模型更为相象。而小世界现象,广泛存在于自然界和人类社会,可以说是我们整个世界的系统组织的基本原则之一。互联网的物理链接模型是符合小世界模型的,Web的超文本链接模型也是符合小世界模型的。可以预测,互联网上的信息传递,必然也会符合小世界模型。P2P信息传递的趋势,是不可阻挡的。

P2P的发展,带来的结果是互联网结点分散化和小圈子化,以及信息检索和获取成本的大幅降低。当信息复制的边际成本为零的时候,现有的物权法律将不再适用于“信息”。因为对信息的处置权不再具有交易的意义。如果我们做生意,我们应该向Google学习,把用户搜索的成本,转嫁到广告客户上。用户搜索信息免费,有价的是搜索的行为,用户的搜索关键词提供的信息,对广告商有价值。这也是为什么Google在这个信息时代能成功的原因之一。

因此不要妄图用人类的道德和法律来阻止P2P的发展,因为物理世界的准则是不可违反的。如果商业巨头们以法律来宣布战争,那么P2P就是人民战争的汪洋大海,法律终究是会被改写的。

2005年10月11日

根据路透社消息,eBay 用3亿7千万美元的价格收购VeriSign的付费服务。这是eBay继收购Skype后的又一收购行动。

eBay的这一行动很有可能是因为收购Skype带来的高昂代价而引起的,收购VeriSign(付费服务)带来的收益可以对冲收购Skype所需的现金。

2005年10月10日

Dave Winer说他要等待一个Major Site Launch,我还在疑惑那是什么。现在谜底终于解开了,是Yahoo Podcasts。不知道这是不是和Google Reader一样的Web 2.0年会的献礼,或者是在凑巧的时间、碰上了凑巧的对手、做了凑巧的事。不管如何,门户巨头之一的Yahoo也开始做Podcast了,这到底是好事还是坏事呢?

Ping back:
http://blog.donews.com/keso/archive/2005/10/08/580067.aspx
http://blog.donews.com/laobai/archive/2005/10/09/581935.aspx

说到去中心化,我们不能不从最基本的问题入手:究竟什么样的软件算是去中心化软件,什么样的用户行为可以定义为去中心化行为;又有什么样的网站算是中心化的网站,什么样的用户行为可以定义为中心化语境下的用户行为。

以下举几个常见的应用为例子。

Google 提供的搜索服务看上去是中心化最剧烈的服务。这几乎是所有人在internet上开始进行资料查询的起点。然而Google所秉持的信念却是“让用户尽快离开网站”。虽然我们并不能分清楚这是真正的价值观,还只是Google的宣传语,但我们从Google的简洁的界面设计和功能设计可以看到,Google搜索服务的核心在于为用户提供一个信息的通道。Google就是信息世界的中心路由,我们通过Google而到达世界。所以Google在技术上是中心化的,但却把话语的选择权交给了用户。换言之,如果Google宣称的价值观是真实的,那Google在意识形态上更接近自由世界、更草根和更去中心化,极大地帮助它的用户掌握了话语的选择权。在这个前提下,Google用户的关键字选择是自主的,搜索的结果是数学的选择而不是人工的筛选,搜索的过程是无人参与的。用户的脑海中形成的概念转化为关键词的过程,是自由的;所以话语选择权在用户。

门户网站。门户网站的本质是话语的编辑权。不论是国内还是国外的门户网站,实际上都是信息的聚合器。然而这与RSS聚合(后文详述)有本质的不同,RSS是用户自由选择拼凑而成的信息中转站,而门户则是信息的终点站,所有门户都没有外向链接。因此技术上来说,门户本身就是中心化的。而从另一个角度看,海量信息的本身并无价值,信息的价值是通过知识挖掘体现出来的。门户网站信息的价值,则是通过编辑体现出来的,所以门户网站体现的是编辑的意志,而非用户意志。也正是由于这样的原因,我们可以说门户的本身就是话语霸权,所有的评论、调查、报告都必须符合编辑意志。门户网站的意识形态也是中心化的。用户选择门户网站,只是从一个霸权,归顺到另外一个霸权。话语的选择权和话语权永远不在用户手上。用户在门户网站,只能被动的接收信息。

RSS聚合器是另外一种到达世界另一端的中途站。RSS用户可以自由选择需要的信息,加到自己需要的信息列表中去,也可以随时编辑、删除自己的信息列表。为了到达信息世界的另一端,用户可以点击外向链接,到达信息来源处。在信息来源处,用户可能可以发现更多的外向链接源。RSS聚合器实际上起到了信息世界的路由作用。我们自己维护一个路由表,当需要的时候可以增删修改,我们可以通过这个路由表找到自己需要的信息,或者找到通往自己需要的信息的途径,我们也可以公布这个路由表,让其他人参考。换一个角度,我们可以认为在管理个人知识的实践中,RSS聚合可以起到信息中转的作用。RSS的用户体验很明显的表达了一点,(被挖掘的)知识是信息世界的核心,为了寻找知识,我们需要通往特定知识的路由。这个路由可以是公共的(例如Google),也可以是私人的(例如RSS聚合)。小世界网络的动力学研究表明,只要用户进行“就近”搜索(通过不超过2个链接寻找信息),就可以寻找到他们需要的大部分知识。

Blog与RSS不同,Blog是知识表达的工具,是不完全的信息中转站。Blog的用户行为更加自由,他们可以随意表达自己的思想,增加自己想要的Ping back、链接,可以接受反向链接、Track back、comment。因此Blog表现为用户个人思想的集散地,它维护了用户的思想历程(按日期排列的blog内容)、知识的来源(Blog的ping back、链接)、知识的影响程度(blog的track back、comment、反向链接),为用户建立了知识结构(分类、关键词、标签),也为用户提供了信息路由表(blogroll)。私人的blog是个人的知识管理工具,而公开的blog则是信息世界里的公共路由结点,连结着整个世界。

上述例子可以有以下结论:

  1. 话语权是每一个人的,而人都是有自由意志的,所以思想表达的去中心化是必然趋势;
  2. 要发现去中心化的思想,信息世界必须要有路由;
  3. 我们既需要有技术中心化的中心路由,也需要有技术去中心化的公共路由;

如果把第二条,也是最重要的一条结论用现实的情况表达,就是:

让我Google,我可以发现世界

Ping back:
http://zheng.wordpress.com/2005/10/06/web-pc/
http://blog.donews.com/keso/archive/2005/07/24/478314.aspx
http://blog.donews.com/keso/archive/2005/07/23/477336.aspx
http://blog.donews.com/keso/archive/2005/09/01/536068.aspx
http://www.mengyan.org/blog/archives/2005/09/01/61.html

2005年10月05日

以前去同学家的时候,因为他家在儿童福利院旁边,所以曾经顺路经过进去了一次。我进去福利院的理由很简单,是因为从前没去过觉得好奇吧。儿童福利院这个名词很中性,看香港连续剧看得多的人,一定知道它的更广泛而通俗的称谓——孤儿院。福利院的结构很简单,一幢四层高的房子、一个不大不小的操场,加上看管小孩子的老师、被看管的小孩子,就是它的全部。福利院里的孩子也不全是失去双亲的孤儿,有的只是单亲、或者父母没有能力抚养而遗弃的孩童。他们并不如我一向认为的生活苦闷,可能他们都还是孩子,没有过多的对生活五彩斑斓的遐想,也没有太多对父母的留恋。对他们来说,福利院的天空跟外面的天空一样,是蓝色的。孩子看见生人来了,都很活泼的冲过来,然后围着我嚷着我所不知道的方言。其实我当时很不爽,脑子里在转的是,这帮死小孩,怎么一看见我就以为我是会发礼物的圣诞老人。我很无助的把目光转来转去,试图寻找来自大人们的帮助。结果是在小孩子们的簇拥下,我半推半就的进了他们的教室,然后在他们老师的带领下唱着不知所谓的儿歌,试图用我的不幸带给他们欢乐。总的来说,他们是成功的,毕竟制造了他们的欢乐。

我不能违心的说,这些小孩子很可爱;我也不觉得他们很忧郁,因为事实上他们看起来一点都不忧郁。我只是觉得,这些小孩子在年纪这么小就失去了父母的照顾,换来的是一个更大的家庭和更多的兄弟姐妹,也许并不是一件非常不幸的事情。小孩子的快乐总是一件很美丽的事情,他们欢笑着的时候会让你觉得世界上有了最美好的希望。当我们在成人的世界沉浸得太多的时候,就会想让自己变得孩童一点,然而现实却没有小孩子眼中世界的清晰度,像浆糊一样,现实总是各种乱七八糟的东西的复合体,永远纠缠不清。

好了,不跑题了。

我写这么多的小孩子,其实目的只有一个,我想说小孩子眼中的世界很简单,但是却也很清晰。他们可以超脱了现实,在自己想象构筑的世界中自由自在的活着,也可以用很洞察的目光来看这个现实的世界,发出皇帝新衣的疑问;而不需要理会大人们的勾心斗角和风霜血泪史。小孩子心灵上的自由是一件很值得大人们羡慕的事情。当我们在现实世界中发现没有灯、没有光的时候,大人们总会去寻找开关的位置,当发现实际上是停电了的时候,就会去咒骂发电厂;然而小孩子可以在黑暗里也很开心的在扮鬼捉迷藏。要知道,你咒骂发电厂也于事无补,他们实际上比你还急呢。可是大人们跟小孩子在一起的时候,没有去学到小孩子身上的优点,反而会去骂小孩子说,你们这帮死小孩,怎么还在玩!原来他们觉得自己烦恼还不够,还要让小孩子跟他们一起烦恼才心理平衡。可是,怎么他们不会跟小孩子一起玩呢?欢乐不是更美好的事情吗?

李敖在复旦说,我已经老了,未来是你们这些年轻人的事情。虽然虽然我还很想当一个小孩子,可是现实并不容许。我们眼中,世界很复杂;小孩子眼中,世界很简单。我们试图用复杂世界的话语来概括简单世界的美丽,可是,这是徒劳的。我们试图用简单世界的话语来解构复杂世界的权力,可是,这是枉然的。现实里我们每个人在心灵上都是孤独的,人的原罪在桎梏着我们。然而我们可以把现实世界的话语权解放出来,交给每一个想说话的小孩子,让他们去说自己想要说的话。小孩子的话可能没有逻辑,可能没有标点,可能会太冲动,可能会太放肆,可是他们说的话一定是单纯美丽的。他们说错了,也许并不会反思自己的过错。同样的,我们说错了,也许并不会反思自己的过错。可是,罪在自身。多反省自己的错误,多原谅别人的错误。失败了反省自身,成功了感念他人。我们每个人都渴望自由的空气,我们每个人都渴望被爱,我们每一个人都希望被宽容地对待;所以我们要体谅他人的自由,我们要爱这个世界和爱他人,我们都要学着宽容地对待别人。小孩子是单纯的,大人们是复杂的。所以大人们更要学会。

好了,我想说的话说完了。该睡觉的睡觉,该玩的玩,该工作的工作。我说的话,能留那么一点印象,我就心满意足了。

2005年10月03日

Google的脚步终于迈向了接入服务。Google
在10月1日向San
Francisco市政府提交了一份建立社区宽带网络的建议,为用户提供免费的接入服务。Google的发言人说,在SF的服务将会试验targeted
advertising服务。与Google同时提交建议的还有Earthlink和Feeva。


Google已经有了Search/Blog/Mail/Talk/Map等一系列提供信息的服务。Google的目的在现在似乎还是暧昧不明。我曾经恶
意的猜测Google是要建立一个全球的信息垄断服务,当信息被垄断了,针对性地提供任何广告和其他个人服务将不会再是难事。Microsoft建立的只
是一个软件垄断的帝国,而Google似乎还要更进一步,他们要建立一个垄断的信息世界。虽然Google的价值观是Don’t be
evil。但信息极权的降临看样子是不可避免的。


Google Search有针对关键字的广告,Gmail也有针对关键字的广告,Google
Talk不知道会不会有针对语音关键词的广告,blogger虽然现在没有广告,但吸引别人用ad
sense,Map有广告。不知道Google布道下的地球会不会像少数派报告里面的科幻城市一样,变成了一个去到哪里都有针对私人信息的广告存在的世界。


2005年09月29日

http://boke.name/c/guangzhou-crime

Blogosphere的构词法是blog-o-sphere,翻译过来就是博客圈子。中国人最讲究圈子。中学的同学聚会,那是一个圈子;大学同学聚会,那是一个圈子;工作了接触到了同事、合作伙伴,那又是一个圈子。圈与圈之间可能因为几个人重合了,也可能因为你重合了。圈子的故事不但中国人有,外国人也有。外国人采取了更为直接的方法,例如LinkedIn。中国人则喜欢更为含蓄的方法,一般来说,他们不喜欢太过于暴露自己的朋友圈子。所以UU地带带给我们的是另外一种行为模式。

博客的圈子则不同,博客需要的是思想之间碰撞擦出的火花。Keso的Blog有无数的人订阅,也有无数的blogger连入blogroll中。Keso说他每天要阅读600个blog更新的信息,试图用圈子内的声音概括整个世界。小圈子的思想碰撞中,可能可以擦出火花。但相似或者相近的思想,永远造不出可以遍野的火焰。思想的近亲繁殖,出来的只能是精神的畸胎,当然,也可能会有概率很小的情况出现想象的天才。然而小圈子,毕竟是不能看全整个世界的。

思维的火焰要烧起来,就要有争辩与吵闹。吹皱一池春水只是诗人无奈的慨叹,而不是实干家的目标。实干家们要干的事情是把一池春水倒掉,然后换上桌子,让认识的不认识的人坐在一起,骂街的骂街、胡说的胡说、吹牛的吹牛。整个博客圈子盛开毒舌花的果实,让该骂娘的骂娘该滚蛋的滚蛋。灵感的火焰才会烧起来。

2005年09月28日

关于中文,我们有永远停不了的话题。从搜索引擎的汉语学、中文语义语用学,到走火入魔的中文基因学,我们总会为世界上最后一种象形文字的二进制化和数学化伤透了脑筋。当年创造五笔输入法的王永民,解决了汉字的象形输入问题,而发明汉字激光照排技术的王选,则为文字输出的工厂化创造了充分条件。中文信息解决了输入问题,也解决了输出问题,然而如何在浩如烟海的信息中挖掘出有价值的信息,那是Google们需要解决的问题。

第一代搜索引擎,那是在前Google时代。信息检索主要依靠关键字和主题词。通常我们获得的是杂乱无章的信息。Google是第二代搜索引擎,利用超大容量的数据库进行超文本链接分析,获得了网页所在的网络节点特征。更为重要的网页优先输出,信息经过了整理。Google时代仍然是关键词搜索。而后Google时代,搜索引擎将会利用庞大的语料库对整篇文章的语义学和语用学进行分析,归纳出我们想要搜索的内容来进行搜索。在更为往后的年代,搜索引擎将可以根据常识库和语料库推断我们真正的信息搜索目的。

在拉丁语言巨大的语料库和先天的逻辑性面前,汉语在信息时代的竞争显得相当无力。汉语的无规则、多义性和不稳定造成了机器阅读的困难。朱邦复提出要通过汉语来理解世界,写下了关于中文基因理论的鸿篇巨著。然而,很多情况是曲高和寡,人们并不习惯接受新的理论,更多的是嘲笑小孩子眼中的美丽新世界。中文的困境在于机器阅读的理解和意义延伸,如果没有汉语的基础逻辑体系,单靠实用主义的语义学和语用学分析,是无法找到解构汉语的方法的。