2005-01-31

在《信息组织方式的未来》一文后面,were针对huipk的留言回复说:

>机器什么时候能代替人工!??
>3年,5年,还是10年!

按照目前的情况看,大概在 2030 年左右

>机器真的代替了人工,他会有感情吗?

机器有机器的“感情”。什么意思呢?就是说,机器可能会写出一篇无聊长文来赞美电源插座,但是很难理解什么叫痛。

和人不一样,也没有必要一样。重要的是谁更强,更好地适应环境。我赌机器 :)

>算法不是一切,机器会进步,人会止步吗!?

人花了几百万年才达到的进步,机器每年可以来一次。人的头颅基本上定型了,智力也就大致上封顶了。机器没这回事。

>不正式因为人的进步才有了更好的机器吗/

以前是,将来不是。当一群智慧的机器出现,就是人类没落的开始。人类不能没有机器,但是机器完全不需要人类。对它们来说,一个纯机器的世界更理想。

>对于新闻我更喜欢有人工组织的而不是机器!

一个智商 50,000 的专门为你服务的机器(是的,没写错)会让您满意的。

这个回复很好玩,有点儿科幻的味道。were把出现的时间定在2030年,距离现在还比较遥远,远到让我无法看清。回到新闻,新浪新闻跟Google News有一点是大致相同的,即它们都不是原创新闻,更近似于新闻超市。对他们来说,新闻就是商品,他们所做的,就是以不同的方式来摆放这些商品。Google让机器决定哪条新闻出现在哪个位置,新浪则是让人决定。

我在那篇文章中说:“实际上,新浪新闻的绝大部分工作确实可以被分解、被量化,之所以看上去它还没遇到什么危机,仅仅是因为现在机器的算法还不足够好。如果让陈彤去给Google News中文版设计算法的工程师讲讲课,他们一定可以做得更好。”

Google目前的做法,按它自己的说法,是这样的:“Google 新闻中显示的头条新闻完全由计算机算法选择,具体取决于该报道在网络上其他地方出现的频率和位置。 Google 在选择头条新闻或对头条新闻进行分类时,完全不经人手,也没有任何人来决定各则报道的排列先后。因此,偶尔会出现一些离题千里,叫人感到莫名奇妙的文章。”

实际上,决定一条新闻重要性的,还有很多其他因素。比如新闻涉及的人物、企业或产品是否知名,是否是近期某个热点事件的最新进展,等等。比方说,有关联想的新闻,重要性通常要高于有关8848的新闻,而8848能够成为重要新闻的主角,通常要让自己跟某个知名企业或某个热点事件发生关联,如遭受一家知名企业的攻击。这些因素都可以被量化,并纳入机器的算法中。“微软在中国打击盗版”这样的消息,包含了两个权重比较高的因素:微软和盗版。因此,这样的新闻就自然拥有比较高的重要性。“周璇发行新专辑”不重要,但“周璇被‘皇阿玛’索要性贿赂”就很重要。现在Google News没有这么做,所以看起来它的质量就不如新浪。

新闻超市类的网站,完全可以被机器代替。也就是说,机器可以像人一样,判断新闻的重要性,其中包括这条新闻在其他网站出现的位置,以及这条新闻本身的权重。但机器不会采写新闻,所以,人应该去做更具创造性的工作,而不是做机器也能做,甚至做得更好的工作。

至于那个智商50,000的机器,我想,也同样不可能跑到伊拉克去报道大选,或者去挖8848被攻击的内幕。这样的事儿只能由人来干,不管是记者还是blogger。但新浪编辑所做的那些复制、粘贴、排序的工作,恰好是机器最擅长的。

2005-1-30

365Key-天天网摘自动生成

更多新闻,请访问我的365KeyRSS),你可以通过365Key订阅,或者通过Bloglines订阅

2005-01-30

我前天提到,最近Tag非常热。这种类似于关键字的Tag,被认为是弥补搜索引擎不足的一个重大进展。正好,Jeremy Wagstaff前天贴出了他跟Del.icio.us作者Joshua Schachter聊天记录,让我们有机会了解,Del.icio.us如何引爆了Tag概念。

据Joshua介绍,1998年他在做一个网站时(类似后来的网志),手头有大量链接需要保存,最初这些链接是被保存在一个文件中。随着保存的内容越来越多,为了更快捷地找到某个链接,他开始在链接后面加上一个单词的备忘,这就是后来的标签(Tags)。大约在2002年的时候,Joshua创建了一个基于Web的数据库,来存放他的书签。这个网络书签已经具备了Del.icio.us的一些特性,只是不支持多用户。它最初版本的域名是muxway.org,我们从Archive.org的存档中,可以清楚地发现,它跟后来的Del.icio.us之间的渊源。

2003年,Joshua重写了这个系统,开始支持多用户,这就是现在的Del.icio.us。Joshua说他这么做的动机,“主要是因为我解决了一个我遇到的问题,那么我就解决了每个人都遇到的问题”。Del.icio.us果然大受欢迎,Joshua认为这是因为它不仅对个人有用,而且还能“让你从其他人那里发现很多有趣的东西”。

Joshua透露,Del.icio.us目前拥有5万注册用户,但他对用户数字并不感兴趣,“我不去考虑数字的多少,紧盯着这个不是一件好事。”

Joshua还表示,他没有考虑过利用Del.icio.us挣钱,“我做这个是由于好玩,还因为它确实有趣。”他甚至认为,Del.icio.us对个人有用就足够了,“在我做delicious的时候,是我设计了它因而它应该对我有用,即使没有任何别的人加入。”“即使别无他人使用,我也会觉得这个网站有用。”

“这里的挑战性在于,要去了解它跟搜索有什么不同,是什么促使人们使用它。这两者之间似乎有些彼此对立,就像镜子。”他说,“我希望借助电脑的帮助,把存储和取回分成两个独立的行为,因此当你给你存储的东西加上标签,你就可以更容易地取回它们。在这么做的时候,你取回其他人存储的东西也会变得更简单。标签促进并放大了这一点。”

“搜索跟取回的关系更大,而标签跟存储的关系更大。”

从这个访谈中我发现,Del.icio.us为人们所津津乐道的社会软件特性,似乎并未在Joshua最初的考虑之中。换句话说,他不是按照社会软件的概念,去设计这个系统的,他惟一考虑的,是有用。与此同时,今天的大热门Tag,最初也只是被作为一种便于记忆的东西设计出来的。当人们发现,Tag的价值,不仅仅在于方便记忆,就有越来越多的服务吸收了Tag,并让它成为一种最能体现社会性的功能。

与之相反,很多概念先行的社会网络服务,由于在“有用”这一点上极为欠缺,所以最终就只剩下了一个概念。

2005-1-29

365Key-天天网摘自动生成

更多新闻,请访问我的365KeyRSS),你可以通过365Key订阅,或者通过Bloglines订阅

2005-01-29

Awei说,keso没参加10 Places of My City这个活动,是“大忙人没有凑这种‘命题作文’式的热闹”。呵呵,冤枉也。

没参加,不是因为忙,实在是因为没啥可写的。如果让我写北京的10个地方,估计会是这样:

  1. 卧室(睡觉的地方)
  2. 客厅(上网、吃饭的地方)
  3. 洗手间
  4. 紫金大厦(公司所在地)
  5. 苏州桥加油站(加油)
  6. 炫特区(GF)
  7. 北土城路XX汽修(洗车)
  8. 我家马路对面的烟酒店(买烟)
  9. 物美超市(买咖啡)
  10. 上面9个地方以外的地方(极偶尔)

看上去很无趣,但是很真实。生活本身就是这么单调,我没法让它看起来不单调,更没法把它写得多姿多彩。有些常常会去吃饭的地方,我说不出饭馆的名字,也给不出准确的位置。如果让我写10个网站,我想可能比10个地方要好写得多。

2005-1-28

365Key-天天网摘自动生成

更多新闻,请访问我的365KeyRSS),你可以通过365Key订阅,或者通过Bloglines订阅

2005-01-28

Ben忽然跟我提起很多年以前的一种网络服务——Third Voice,他曾经写过一篇文章对此进行介绍。不过,这家公司后来死在了互联网的寒冬中。“为什么就办不下去呢?多好的应用啊,”他说。我去年的一篇文章也提到过Third Voice,这家1999年的《财富》酷公司,起来得快,倒下去得也快,在互联网上曾经留下的痕迹,如今也难以寻觅。

之所以会提起Third Voice,是因为Ben觉得,完全可以把这个东西改造成一种团队协作的工具,可以对某个网页共同参与评论等等。听起来好像很有趣,很好玩,当初Third Voice也是因为有趣,很快就吸引了大批用户。可是,一种应用不能光停留在有趣上,倘若不能提供真正的使用价值,有趣的东西很快就会变得无趣。Third Voice的想法固然很酷,可用户的新鲜劲儿过去以后,他们马上就会把这玩意儿抛到脑后。Third Voice这种模式,除了网络图鸦,除了帮新浪新闻做校对,我问Ben,“你还能想出几个典型应用吗?”

实际上,Third Voice的继任者Gibeo,也仍然是停留在网络图鸦这个“有趣”的层次,如果不能产生出有价值的应用,我同样不看好它的未来。

最近,Tag忽然成了一种很热门的东西,Del.icio.usFlickr43 ThingsTechnorati等,都支持Tags这种自由标注。Owen专门介绍了“Folksonomy”(分众分类)这个新概念,并且发起了一个“10 Places of My City”的活动,迅速得到了很多响应。不过,我的疑问仍然存在,有趣之后呢?

我所说的使用价值,是一种超越了好玩、有趣的长期价值。比如当ICQ第一次出现在互联网上,它很好玩,但好玩之后,你发现你越来越离不开这种IM工具。Del.icio.us也是这样,它不但好玩,而且确实有用。很多颇有创意的应用,常常因为不能从好玩进化到有用,最终趋于沉寂乃至消失,十分可惜。

“10 Places of My City”这个活动,表面上看,与社会网络(Social Network)的关系非常密切,可以被当作社会网络应用的一个实例。但进一步考虑又开始动摇,这与同题作文的区别在哪儿?网上流传的很多东西,比如一份有趣的答卷,并不涉及Tag,并不涉及社会网络,同样可以流传很广。是分众分类激发了大家的兴趣,还是这类活动本身?有多少参与活动的人真正利用了社会网络工具?还是仅仅是参与完了就完了?

当然,有趣的东西能够激发人们参与的热情,但如何把这种热情转变成更具价值的东西,可能就不能仅仅满足于有趣。兴趣会衰退,但有用会让兴趣保持下去,比如blog。

2005-1-27

365Key-天天网摘自动生成

更多新闻,请访问我的365KeyRSS),你可以通过365Key订阅,或者通过Bloglines订阅

2005-01-27

前程无忧这家公司,尽管在纳斯达克上了市,尽管有个很不错的股票代码(JOBS),但我一直觉得,这家公司其实归根结底是一家非常中国的公司。尤其是当我听说,前程无忧因涉嫌误导面临诉讼,市值缩水近半,我一下子就觉得特亲切。他们瞒和骗的伎俩,在中国股市上俯拾皆是,诚实经营反倒会让自己成为异类。

你要说他们故意欺骗投资者,我觉得倒也未必,他们是在瞒和骗的环境中长大的,即使到了一个不允许瞒和骗的环境中,有时候下意识地就把恶习给暴露出来了。网易瞒报广告收入的丑行并不遥远,最近又爆出前网易高管因涉嫌内幕交易被罚款100万美元的丑闻。被发现并被处罚的,可能只是很小的一部分,大部分瞒和骗没被发现,得手后他们还会说:美国股市,也就那么回事,跟中国人斗心眼儿,他们还嫩。

瞒报”是一种很中国的景观,从瞒报经济数字,到瞒报政绩,从瞒报死亡人数,到瞒报传染病疫情,几乎没什么不能瞒的。有人说,越是中国的就越是世界的,所以在这个全球化时代,越来越多的中国人,就要把瞒和骗发扬光大到全世界去。

中国市场的勃勃生机,让全世界为之动容,为之动心,可中国人瞒和骗的恶习,也让全世界为之担心,为之警惕。与之相关的一件事是最近Alexa的排名问题。

1月24日,中国网站在Alexa的排名突然出现整体大幅下滑,一大批网站的访问数据甚至被清零。这一下就成了中国互联网的一件大事,很多人如丧考妣一般,还有人愤愤不平。一个美国网站的统计数字的变动,如此深刻地影响着中国互联网,Alexa打个喷嚏,中国互联网全体感冒,这事儿是不是非常荒诞?

两年前我就写过一篇文章《网站排名:咱也权威一把》,是想告诉大家,警惕对Alexa的炒作。可当时我未曾料到,中国的Alexa情结后来能走火入魔到何种程度。就算Alexa曾经是一个有用的参照,今天它也早就被中国人毁得毫无价值了,挂在那儿,不过是国民劣根性的一个直观展示而已。

中国人对Alexa的情感,从病态发展到变态,互联网实验室功不可没,弄到后来,它几乎成了Alexa的中国独家代理。每月来一次的那个C什么什么榜,持之以恒地把自己的变态传染给网站、VC乃至普通用户。而“04年底进入全球前100名,05年进入全球前10-20名”这样的胡话,甚至已经不能用变态来解释了。

我的看法,Alexa应该把中国网站全部剔除,这才是最大的善行。至少,这样可以让部分中国人,把自己的小聪明用到正地方。

2005-1-26

365Key-天天网摘自动生成

更多新闻,请访问我的365KeyRSS),你可以通过365Key订阅,或者通过Bloglines订阅