信息噪音的罪与赎:论web 2.0的信息过滤与提纯

Posted by 鲁公子 | 未分类 | 星期四 13 03月 2008 12:03 am

近来有点忙,每天都奔波着,弄得实在没时间扫荡未读rss,更别提坐下来好好写点字了。之后的更新频率的确不敢保证,但鲁公子不会停下思考和记录的步伐,这一点可以保证:)

说说信息噪音。从RSS阅读器说开来。我想诸位大多都很苦恼,好不容易用N多小时扫荡干净的rss,在第二天又多出了几百个未读项,因此每天背负着巨大的心理压力打开Google reader或者del.icio.us或者鲜果抓虾,知道自己鼓起勇气开始下一轮扫荡为止。

这个,笔者归其为信噪问题。其实严格说来,信噪的指向应该是我们所说的垃圾信息或者为公共信息所排斥的那一类。但在愈加精准化的信息化进程中,即便那些我们平素认为正常的信息,一旦对于自己没有价值,那么也倾向于将其归于信息噪音,终究,这不是我想接受到的。

RSS阅读器本身就是一个消除信噪的优化服务,设定我们关注的内容供应平台并主动推送。而事实上,我们似乎对于信息推送的心理负担比从前反而更重了。从前我们不知道自己错过了哪些有价值的内容,所以只从当下看到的页面寻找所需要的信息;现在我们能看到错过了哪些内容了,而且还用令人心悸的数字提醒你:兄弟您现在欠了3000个条目没看,谁都会比从前更抑郁的。

事实上,我们真的欠下了3000个条目么?当然不。我们如何添加关注的网站?一般都是由于其中很多文章很喜欢才会添加。但“很多”是否意味着“很大比例”?答案应该也是否定的。比如我订阅了新浪体育国际足球频道,但是其实我想看的不过是国际米兰的新闻而已,因为我没办法定制化地订阅“国际米兰相关新闻”,所以我只能从一堆国际足球新闻中自己再筛选出国际米兰的新闻。当然还有一个原因,就是我们希望自己不要错过一些偶遇的精彩。比如我是想看国际米兰的信息,但是我也想看看AC米兰最近输球了没有,所以我就必须扩大自己原本需要的订阅范围,强忍着自己当搜索引擎。

鲜果抓虾必然已经注意到了这个问题。抓虾笔者已经有段时间没用过了,不知道调整了没有;鲜果是强行将一个内容平台的更新最大值设定为200,超过200条就自动挤掉最早的信息。Google reader和那时候的抓虾对于未读总计的对策相同,给出一个模糊上限,比如告诉你你现在未读的条目有100+,但是想知道有多少条,抱歉不能告诉您,要不您心理负担该大了。这样的设置当然有很多问题值得指摘。

跑个不太远的题,对于鲜果的200条上限,笔者还有一个很羞愧的习惯:在一个条目快到200的时候,实在没时间了,又不想让系统顶替掉后面的文章,就开始狂点击那些看题目就知道对我没用的条目,这样有用的条目得以“存活”下来多撑几天,等自己有时间再看。后来常常这样做,也常常没时间,条目照样被挤掉,而我真正看过的只是那些一眼就知道是对我没用的东西。劣币驱逐良币居然能在这里运用,恰恰证明了这种设置的问题。

说回来。信息过滤和提纯在当下做得不是很好,这一点毋庸置疑,笔者也不打算对此症结着墨过多。笔者认为另一个问题很重要,就是我们只注重了信息筛选,却忽略了用户的阅读习惯和阅读心理。互联网用户有一个很重要的心理机制:一切决定由自己来做,别人替代自己做决定了,就有种强奸民意的感觉。RSS阅读器的条目系统给我设定了自动排除,我认为这不是我排除的而是你不让我看的;你把未读条目总计模糊化,我认为你这是不尊重我的知情权,因为我不知道什么时候是尽头。而这一切我们在没有RSS阅读器的时代就不曾遇到过吗?我们几乎每天都遇到,只是因为我们能够更轻易地原谅自己,却不能原谅服务商。我自己可以向回追溯那些条目我没读过,但现在没读过被highlight出的条目同那些同样没读过却没有黑体的条目相比,我们就会觉得有一种被bias的感觉。

其实,RSS阅读器的信噪仍然是1.0的级别,因为RSS的信息来源大多是主流媒体和集成UGC的网站,我们在阅读的过程中基本不涉及内容生产。实则,2.0的网站信噪同样很严重,尤以SNS为甚。海内网对信噪消除的呼吁已经有些日子了。海内的用户群体以IT为主,关注点常常集中聚合,这就使得在某一时间段大量内容重复。而其余的一些动态更新同样会产生信噪,比如谁谁谁加好友或者谁谁谁退群一类的消息。海内对此的处理方法和鲜果颇为相似,也是一刀切,只让好友动态更新保持在三到四屏左右(没细算过,估摸的)。这样也会产生大量对自己无用的信息挤兑有价值的信息,而一刀切的做法让用户没办法回溯从前的有价值信息。除此之外,由于SNSUGC为主,信息更迭速度惊人,用户常常无法找到曾经认为对自己有用的信息。这就导致,SNS中有用的信息无法随时递送到用户面前,而无用的信息却只能徒加诟病。海内诸位达人多次提出质疑和建议,关于解决方法请看海内信息过载问题解决办法(需登录)。

 

唠叨如何解决。

对于前面提到的心理机制的问题,解决方式也绝不是技术性而是战术性的。Zurkberg不是说了么,对用户的赋权不够。我们其实可以将其理解为这是一个踢皮球的过程,在于谁被赋予既定权力后就应当承担相应责任。那么RSS阅读器首先应该赋予用户自责和自我原谅的权力。阅读器一旦代替用户的武断割舍,就成为用户的讨伐对象。让用户自己选择是否要设定上限并选择上限数字,自己选择是否显示未读条目的总数,自己选择能否原谅自己再一次“标记所有为已读”。这个是多少有些tricky的做法,但这种做法至少不会让网站担负上本不是自己错误的罪责。

 

想要提高阅读的效率,筛选有效信息,终究还是需要提高信息甄别技术。下面的方法都还算比较正道,虽然笔者不知技术实现的可行性,但多少是一种放心,姑且列之。

首先是对收藏功能的强化。豆瓣的产品很多,我们觉得杂乱的主要原因是学习成本过高,而不是信息排列混乱。事实上,豆瓣对信息的多重矩阵式排列很漂亮,我们可以通过多种渠道找到我们希望看到的信息。比如我要找《蓝莓之夜》,我可以在电影这一栏里面找到,可以在某个人的豆列里找到,可以在王家卫的小组里找到,可以在我的收藏里找到。这是一个节点散发出的多条矩阵线,而这些很有规律的矩阵线都能够降低用户的搜索成本。

RSS阅读器的条目却只能有几种用户参与度很少的渠道找到:收藏、推荐、搜索和在原来的种子中按照时间顺序一页一页翻。RSS阅读器的条目确实相当之多,而且不断更新,这是它的劣势。因此,让用户多去编辑条目的排序,会更有效果。这种排序并不是指的简单的tag,而是类似于豆列一样的顺序,按照重要性进行排列。我们需要对不同的条目赋予不同的权重,以决定自己有多容易能够在同等序列中找到它。当然这同样会引发一个问题,我们怎么知道后来的条目不如现在看到的条目重要?我们赋予了现在的条目很高的重要性,是否会影响到未来的条目不易被找到?但这个问题是用户教育的问题,下面会提到。功能上的赋权应该提到首位。

其次,是RSS阅读器同RSS托管商高度合作。我们需要高度提纯阅读的效率,就意味着我们订阅的内容源需要高度匹配阅读需求。比如上面所的国际米兰的例子,RSS托管商如果能够提供很相关的RSS,直接命中“国际米兰”这个纯度很高的源,就可以得到很好的匹配。之所以需要RSS阅读器和托管商的共同合作,是因为RSS阅读器能够提供读者的阅读习惯,据此归纳出读者需要的种子以供选择;而同内容提供方的协调工作,则由RSS托管商来做。

Google收购Feedburner真的是件很聪明的事,二者的协助问题in-house解决了,Google本身又具有很强的谈判力,不知能否在Google Reader上先实现这个设想。

第三是搜索功能。这个有豆瓣为例,搜索功能很全面。校内在几个月前曾经大力发展过搜索功能,这应该是Web2.0网站在信息几何级增长后必须面对的一个问题。鲜果同样有自己的搜索,但确实UE不如前面两个网站。

第四是相关性的探索。对于阅读器而言,最智能的方式还是利用从前用户提交的阅读偏好来推送用户会喜欢的条目。这里和现在的豆瓣猜其实很相似,把范围限定在特定的条目上,而非现在阅读器所做的,限定在频道上。这无疑是很艰巨的任务,需要在抓取频道更新的时候同时进行频道内内容的分析,并匹配阅读历史的相关性。鲁公子确实是技术文盲,不知道是否有点太过科幻,如果是,那只能表示遗憾了。

最后一个方法,也是我在海内中和一个朋友讨论时提到过的,用户教育。中国的互联网产业基本上属于暴发类型,还没习惯1.0的做法呢就有了2.0,所以我们很多2.0的用户都在沿袭着1.0的方式去消费2.0网站。很多用户在用阅读器的时候,肯定会觉得这个频道很精彩那个也不能错过,其实是典型的1.0方式,大而求全,却不估计自己的时间以及精力预算。事实上,包括IT圈内人士都仍没有培养出适合2.0的网络消费习惯,以至于我们是第一批因为RSS阅读器而导致抑郁症的人:)

用户教育的重中之重并不是教他们如何学会创造内容如何参与互动,而是要让他们学会如何节制。Web2.0的重要特征在于将自己限定在一个小范围内的高效率沟通协作,而非1.0时代的大范围被动接受。用户需要明白,web2.0的世界里,少即是多。当然,这个教育的成本必然很高,而谁去承担,也是很麻烦的问题。

 

我们可以说web2.0把用户宠坏了,但这种精准化的信息传递,也正是宠坏用户后能够得到利益回报的利基点。无论多大的成本,或者多科幻的甄别技术,都可能是未来在web2.0世界某一领域中的杀手锏。

 

鲁公子 于悉尼

 

2008-3-13

鲁公子的海内:http://www.hainei.com/user?r=108816

鲁公子的邮箱:vincent0715@gmail.com

 

—————————————————

版权所有,转载请注明作者及原文链接