量化用户信息,还原用户性格——豆瓣,回头是岸!

Posted by 鲁公子 | 未分类 | 星期二 12 02月 2008 9:47 pm

央视的春节晚会隔了一个大洋都能把我恶心得够戗,弄得我这都初七了才缓过来点给大家拜个晚年,罪过罪过。。。幸好27日春节214日情人节222日元宵节,这期间说句节日快乐都不会不合时宜,呼。。。

 

说说豆瓣。鲁公子喜欢豆瓣,但是豆瓣确实给鲁公子添堵了。大过年的本来不该写唱反调的文章,不过还是觉得有唠叨唠叨的必要。自从豆瓣疯狂上线一系列产品之后,鲁公子就慢慢从豆瓣的重度贡献者退化到了一周都不见得去一次的地步。理由其实大家都明白,豆瓣上线了很多针对SNS的产品,让这地方立刻开始鱼龙混杂,评论和小组文章质量明显下降,让我不得不把这个网站当成了纯粹的收藏夹。从同城到豆瓣英文版,又出来了个全站推荐,然后好友和关注终于分开了,再加上原先的N多产品,我发现我想找到广播都要试探很多地方才能看到。不知道是不是大家都和我一样还是因为我愚钝,在豆瓣的各种产品线中有一种找不到北的感觉,反正鲁公子在里面有点晕。

一下子上了很多SNS的应用,这的确让人觉得有些蹊跷。也许豆瓣到了SNS用户增量的关卡,可能想将用户量级加速度提高吧。但是上了产品后,为什么互相的关系并不如想象中那么紧密呢?很多网评人都说过,豆瓣应该将已有的数据整合一下。这篇文章就是想说说这个。笔者也是这样想,豆瓣当务之急绝不是再上其他的新产品,不是说产品越多你的用户群就会越广,而是产品的关联性和数据挖掘决定了网站的兴盛与否。

 

先说推荐。豆瓣上线推荐的目的是什么,让我有些不解。为了在广播里引起别人的注意?那么在推荐上线3个月的时候,之前的这些推荐会为豆瓣带来什么样的信息呢?换句话说,豆瓣如何利用用户主动提交的这些信息,换算成用户的偏好呢?还是说只是为了在当时能够奏效,形成digg或者互动的效应?此外,从另一方面说,我推荐了,就代表这是我喜欢的?我推荐20items,这20items我喜欢的程度完全一样?如果我当时喜欢现在不喜欢呢?我们可以观察一下诸位好友的广播,常常有这样的情况:“某人读过了《北京,北京》”,紧接着就是“某人推荐了《北京,北京》”。这件事让人觉得甚是蹊跷。这是否能够说明,推荐本身在一定程度上是和“读过”这个应用功能重合呢。你或许会说,不是,因为有可能不喜欢,不喜欢就不会推荐。没错,那么那个打分的功能干嘛用呢?如果我给这个item打了5分,我是不是就会有很大几率会在收藏后再推荐呢?同理,如果豆瓣的初衷是用于Digg的话,那么打分这个功能一样可以取代。在豆瓣秀里豆瓣团队自己都默认,四星和五星的可以被highlight出来;那么同样的,四星五星就可以作为digg的依据。我的确预先假设了豆瓣团队的目的是用推荐达到digg这种协同合作的效果和SNS这种互动推送的效果。那么,用评分这个豆瓣原先有的功能完全能够达到这两个目的。除此之外,对于减少数据冗余和提高数据相关这两点也有很明显的效果。因此,豆瓣完全可以取消推荐功能,将评分功能改变成如同imdb一样细化的评分功能。

笔者参与过一个调研项目,教授将评分标准设计成一个没有刻度的评分条,用鼠标在上面点击以给出每一项的分数,这样,以视觉效果取代生硬的思辨效果,会更加直观,而且也会使数据更加细化,至少比现在的五星评分制要有价值得多。即便不是五星评分,我们在自己打分的时候,也很容易打出70分这样的整数来;而73分这种数字,是我们的固有思维很少允许我们做出的判断。笔者提到的这种评分条可以很轻易地达到精确评分的目的,使得评分更忠实于我们的直观判断。(当然,这个说法需要有研究作依据,笔者会去试着搜索一下相关研究文献)

其二,豆瓣可以设定一个下限,比如80分。只要高于80分的item就可以被默认为推荐项目,在广播中可以被highlight出来,比如:“某人为《北京,北京》打了86分”。Digg功能也可以在80分以上的情况下被当作默认推荐。当然,在隐私设置也同样需要有允许用户不显示这些的选项,或者在收藏的对话框中就给出选项。这样,推荐被完全量化的标准记录下来,成为用户的未来选择的重要参考指标而有了数据价值。如果只是不断地点击推荐,首先,推荐的推送成本不高,只需要两下点击就可以,那么推荐很容易泛滥,反而失去意义。第二,推荐本身没有了数据价值,我们只知道用户推荐过,但用户对于推荐的item抱着什么样的态度,这件item同其余items的关联度,我们都不能从中获得更好的回馈。我们可以用很精确的用户量化态度衡量用户的偏好,而不是像现在一样用5个档来隔断偏好标准。这些精确的用户态度作为具体的参数,加权到items相关性中去,会得到众多itemsroadmap,这样的相关性对于挖掘用户偏好来说很有价值。这些价值的体现,在下文中会重点提及。

 

说说书籍、电影和音乐的相关性。这是豆瓣最早建立起的三个拳头产品,是豆瓣得以当下之兴盛的最大功臣。现在的豆瓣将精力倾尽到了好友和小组,却对于这三个最能够获得用户偏好的功能没有太多改善。说个最简单的例子,比如我看了最近豆瓣上极热门的电影《Once》,在这部电影的profile下面居然没有《Once》这部电影原声音乐的profile,因为豆瓣将这几种描述“物”的主要产品仍然以划隔的方式操作,不同产品类别的相关性并没有得到充分的考虑。

笔者以为,豆瓣今后的更多相关产品不是在横向产品线上不断扩容,而是在现有的产品线上建立多重垂直联结。没错我们有豆列可以将这三个产品的很多items重新排列。但这样的排列需要耗费的成本比起现在豆瓣给出的个人profile的显示要大出很多,至少我是不太愿意花2天时间整理那1000多个items的。况且,这样的组合方式是由用户提供,并且豆瓣并未给出严格的格式,想从中获得信息挖掘,可行性不大。

我想,豆瓣有一件事一直没有做到位,那就是豆瓣对用户的定位。我们可能都会认为豆瓣是个文化社区,即便最近慢慢开始向生活社区转化。我们将豆瓣当作阅读收藏夹,当作文化用品的Wikipedia,当作谈天论地的聊天室。我们在豆瓣留下了诸多我们在文化领域的痕迹,这些痕迹以我们收藏的items、好友等等形态表现出来。我们其实是在豆瓣留下了自己独特的性格。那么豆瓣应该做的,恰恰是将用户的性格利用这些数据信息还原出来,以作为其运作的基石。遗憾的是,豆瓣对于三大主要产品都没有打破它们之间的间隔,更不要说九点同城这样的产品了。理想的文化社区应该什么样?每一种item代表的都是某种鲜明的性格,比如一篇写交响曲的九点文章和JAVA技术类书籍就代表了截然不同的性格,而一个人也可能同时兼具这两种性格。理想的社区应该是利用用户对items的评价辨识出不同的item物群,这些物群可以指代不同的性格。也就是说,我们可以利用一组相关的items组成一块数据云,利用这种数据云去识别用户的性格。笔者建议将items看做是对某种性格的投票,比如我喜欢看关于google的书,那么在互联网行业这一个性格集群中就应该有我的一票,而我在这一个集群中投票多少,决定了我在这种性格中的投入程度。然后将不同的性格按照一定的权数集合起来,形成一个数据性格。豆瓣其实在做这件事,比如也会推荐给我有可能志趣相投的好友,但我并不以为这样很完善,因为对于items之间的界限并没有完全的开放,那么这样的相关性判断也是值得质疑的。比如我自己的profile中,因为我收藏了415张音乐唱片,结果豆瓣给我推荐的人一水儿的摇滚或者古典乐爱好者,可我实际上对音乐唱片打分普遍不高,对于我看的电影和书籍打分很高,好友中却没有明显体现。

 

第三,时间轴的引入。我们可以看到,前两点都突出了对于豆瓣产品间的数据整合。而时间轴的引入,意味着另一维度的数据整合。刚才其实笔者提了一句,对于item的推荐,如果我原来喜欢现在不喜欢了呢?是否可以将我看过的所有items都赋予相同的权重?我不这样认为。经验,如果我需要加强的话,我会自我持续加强。比如我喜欢看齐泽克的书,我就会不断地看他的书以在这一维度加强自己,比如我看了10本齐泽克的书。但是我们在时间的进程中会发生关注点的转变。比如我突然不喜欢齐泽克了我开始喜欢看基督教的典籍了,那么我在添加了3本关于基督教的书之后,豆瓣给我的推荐仍然是齐泽克的书目占据更靠前的位置,并不符合我现在需求,这样就是不恰当的。也许大家会说,这是你自己提供内容的问题而不是豆瓣的问题。我不这样认为。不能够了解用户的网站不是好网站。豆瓣给予了我们一个静止的文化平台,没有提供变化的驱动力,甚至不能够对变化有精确的判断,这就是网站的问题。

时间轴的引入可以解决这样的问题。比如,我们可以将新近添加的items赋予更高的权数,让我过去的评分变相降低权重,辅以第一点中笔者提及过的精确化评分作为参数联合比对,以更贴合我最近关注的items选择。再比如,豆瓣可以在收藏中添加何时阅览这一项。因为填写这一项所需成本比较高,可以让用户自己选择填写与否,并注明如果填写会有更好的用户体验。比如我小时候巨喜欢看成龙的电影,但现在我不喜欢了。我要添加这些items作为自己的收藏,但它们很可能会影响到豆瓣为我推荐items的排序,也许我会直接被推荐李小龙的电影,而实际上我不喜欢动作片了,这样的推荐就让人很无奈,并且会降低用户收藏过去观阅记录的积极性。那么如果加入了时间轴,比如我可以写我看成龙的电影是在10年前,这些电影的权重就理应远低于现在的items,不会影响到我最近的推荐。大家或许会说,这些对于用户来说没有意义,因为用户未必需要记录过去的观阅历史。那么,对于新用户呢?一般的新用户大多需要迅速扩充自己的观阅记录以获取适合自己的推荐,没有时间轴,添加顺序必会造成一定的紊乱。再比如,我就是怀旧,我加了机器猫铁臂阿童木,但因此就给我推荐了很多给学龄前儿童看的动画片,就实在很让人哭笑不得了。

 

豆瓣是不折不扣的文化社区,文化中必然会有很强的性格包容性。如果能够用豆瓣的长项——items——来定义并识别文化中的多种性格,这样的核心竞争力是豆瓣利于不败之地的基础,远比一时的SNS用户量级重要得多。同城、英文版豆瓣先不提,主要的数据挖掘都有这么多事情可做,豆瓣切不可贪多贪大,稳扎稳打提高用户体验,才是上策。

终究,这是我们都寄予厚望的网站。愿豆瓣越来越好。

 

也祝诸位最后一天放假快乐,呵呵。

 

鲁公子

2008-2-13 于悉尼

 

鲁公子的海内:http://www.hainei.com/user?r=108816

鲁公子的邮箱:vincent0715@gmail.com

 

—————————————————

版权所有,转载请注明作者及原文链接

7条评论

  1. 条评论 作者: Davies — 02月 13, 2008 @ 11:34 pm

    豆瓣的推荐是考虑了时间轴的,以添加收藏为准,还不够完善

  2. 条评论 作者: thebigforest — 02月 15, 2008 @ 5:23 pm

    你真是一个挑剔的用户!

    用户总是希望豆瓣更智能,而豆瓣却希望用户更智能。

  3. 条评论 作者: meiguanxi — 02月 18, 2008 @ 3:06 am

    very thoughtful analysis

  4. 条评论 作者: manjusaka — 02月 20, 2008 @ 1:56 pm

    站在用户的角度来说,我希望豆瓣能如文中所述,因为喜爱,所以苛刻.

    如果站在开发人员的角度来说,我希望我的用户们都很聪明,就是很智能

    关于时间轴的定义,除了应用在豆瓣,还有其他很多地方也用的上,蛮好,学习了

  5. 条评论 作者: 匿名 — 02月 20, 2008 @ 6:03 am

    你自我感觉良好

    加浪费了我的时间

  6. 条评论 作者: 图书城 — 02月 29, 2008 @ 11:40 am

    很多人对豆瓣最近的改版向sns的转换有自己的看法,其实我觉得这是豆瓣发展路上的必经之路,豆瓣由一个纯书评网站发展为现在国内首屈一指的社区网站,而且拿到了数百万的投资,如果仅靠卖书的那点提成,在收入上很难形成快速的增长。还有,我向你推荐一个新的书评网站:图书城(www.TuShuCheng.com)。图书城是专业的图书搜索和比价网站,还结合了各大网站的书评内容。有些类似豆瓣,但在图书方面更加专业化,页面更快速简洁,希望大家去看看,也可以注册一下试着建立你的读书档案:)

  7. 条评论 作者: franksxiong — 03月 6, 2008 @ 4:18 pm

    很赞同这篇文章对豆瓣的建议:“推荐”确实可以用打分代替,用户自己喜欢的可以粗略等同于要向别人推荐的,何苦让用户作额外的事情;物品之间的联系确实可以发掘的更多;用户的喜好会随时间变化,“时间轴”很有必要。

    感觉豆瓣是有点贪多了。推荐系统可以做的事情其实很多,不是所有网站都得SNS一把的。

评论 RSS Feed。

抱歉,评论已被关闭。