论隐私的模糊概念和互联网隐私碎片化

Posted by 鲁公子 | 未分类 | 星期三 30 01月 2008 12:43 am

许久没有更新,甚至连我的鲜果都已经退化到了15%阅读率的地步,难道鲁公子在悉尼也因为春节临近懈怠了不成!?不能够不能够。

今儿写的主题其实有点过时,因为前一阵甚嚣尘上的海内实名制事件我一直关注,似乎也在海内留过一次言。之后和菜头又让spokeo着实火了一把,IT界就开始把隐私这档子事给拎起来猛捶了。我算后知后觉,而且一直没什么时间写东西,就拖到了这会。
隐私这事该捶么?当然应该。互联网对生活的侵入已经到了让人快乐并痛着的地步。笔者同样是坚定的人权至上主义者,尤其我在的城市赋予了我更多权利,让我更愿意为人权做出应有的呼吁。但隐私这种事,我思前想后,实在觉得,互联网中的隐私在最基本的层面就没有确定。没有稳固基础的人权如何争取其权益?互联网的隐私,我们其实无法真正拥有。

在我们观察的时候,大多数容易辨认某件事属于隐私,但隐私究竟是什么?它的特征如何归纳?再退一步讲,是否有统一的特征?我们无法言说。就如同红色。我们看到红色,大多能归纳出这是红色的,但是你如何用语言精确定义红色?当然你可以用色谱一类的科学工具概括,然而那些是另一种语言系统,不属于讨论范围。隐私这个概念和红色这个概念有些像,我们能从太多层面给出不同的解释,但没有一种解释能够给我们一种豁然开朗的感觉。

我查了wiki上关于隐私的定义,懒得找人权组织的定义了,大家将就着看。
Privacy is the ability of an individual or group to seclude information about themselves and thereby reveal themselves selectively.(Wikipedia)
这个定义很明确,是从行为角度的一种概括,亦即我们怎么样做了,就能够使隐私保护显性化。然而,seclude如何实现?reveal的标准是什么?这个才是问题的症结。是否我们能够找到一个标准作为reveal的上限?这个上限是否能够适用于所有情况所有人?seclude的做法又是如何?从行为角度来解释这个概念,在我们起初的认知判断上就有了障碍。

然后我又随手拿了本书查了查关于隐私的定义:
Privacy is the claim of individuals to be left alone, free from surveillance or interference from other individuals or orgnizations, including the state.( Laudon, K.C. and Laudon, J.P. (2007). Managing the Digital Firm, 10th Ed , Upper Saddle River, New Jersey: Prentice Hall.p.155)
和之前行为角度的定义完全反了过来,这个定义有着很强的认知色彩。但是问题同样突出:claim和left alone的标准。如何就算作claim?left alone,那么距离多远?对什么样的“individuals or orgnizations, including the state”保持距离?还是说对所有的这些都保持距离?

这样说太空泛。说个例子,spokeo.com,用一个注册邮箱就搜罗来了所有相关联系人在诸多网站的一切动态。大家最近大约都访问过这个网络服务了,故不再多加介绍。
在对是否触及隐私这个初始的判断上,我们几乎把所有判断依据都放在了一纸协议上,而且这个协议我们几乎不会去看。我们看到隐私的解决方式已经变成了协议式而非模板式。对于其他领域来说,通常我们都是有了相应的规范(无论是法律还是道德),然后将行为嵌入其中来判断其是否正确。而互联网业的隐私问题则相反,成了我先做出事来,然后咱们商量商量你看这样成不成。为什么?因为定义不明确。按照上面的定义来说,spokeo.com根本没有一个常规的对于left alone或者reveal的一个参照系。我们left alone的标准是指我们只能在固定的一个网站群体面前reveal?还是我们能够在我用公开ID注册的所有网站群体中reveal?何况,我们如何在这种本身很有价值但有道德瑕疵的服务中获取应该被赋予的权利?或者,更基础的,我们如何定义哪些权利应该被赋予?我们是否能在隐私这个定义的内涵里穷尽其所有权利的选项?
spokeo.com做的最牛的事就是在原客户方和原服务方中间生生的插了一脚,不,应该是插了N脚。首先是邮箱服务商,然后是众多web2.0服务商,然后是用户。这样一来,多个原本的协议方因此在用户使用spokeo.com的时候都只对spokeo.com产生责任和权利,虽然双方仍然在彼此的契约中继续着权利义务。spokeo.com的服务因此在对双方的协议中各自产生新的协议,但各方原来有的协议中并未包括spokeo.com,这个和菜头也提到了
这个问题值得追究。spokeo.com的问题在于,这种聚合行为是否是一种对隐私的侵犯。各网站的信息公开就意味着我在所有网站的轨迹都可以对同一群人公开?这个概念偷换得没有技巧。研究表明,人们在互联网上是倾向于多人格的,在不同的群体面前人们的行为会截然不同。这取决于人们自身的性格取向,而受众群体对人们的行为也有很大的引导作用。对于不同的受众群体来说,这种多种信息的聚合本身就是对多种人格并存的否定,进而成为了对隐私的侵犯,因为多人格一般而言是不相融合的。spokeo.com很显然得成为融合各种人格的工具。这样的工具可以被第三方受众欢迎,但对于被搜索到的用户来说,无疑被侵害了隐私权。
邮箱针对的是邮箱服务商,各web2.0网站本身已经是一种衍生行为,即利用邮箱的功能实现自己的运营功能。而spokeo.com则是在衍生上的衍生,让权责变得难以界定,进而隐私的权责也无从谈起。在概念上的模糊让隐私问题的根似乎追不到任何人身上,最后反而变成了用户不小心,这样的结论是很荒谬的。然而,我们的确没有能力厘清隐私的精确概念。
补一句,我对spokeo没有任何敌意,这样的服务和我一贯主张的轨迹整合很相似,有价值的东西都有存在的必要。

隐私在我们目前的网站运营中据说被赋予了很多选择的权利。请注意,是选择!隐私不是我们说出我们应该拥有什么,而是被赋予观看一堆选项并拒斥打钩的权利。这就是隐私的赋予么?远远不够。隐私的特征,我以为,最重要的一点,就是其碎片化。互联网不但带来了信息的碎片化,而且捎带手带来了隐私的碎片化。应该说,隐私本身就是碎片化的,只是从前没有像互联网这种显性的表达方式使其碎片特征凸显出来。

最基础的隐私碎片化的表现形式就是个人化,也就是定义中left alone的标准。我们如何界定这个标准?至少现在我看不出途径,因为个人化本身就是离散的,去标准化的。比如海内最近我有几个朋友说自己在海内的文章被转载出去了而且居然著者标的是朋友的原名。后面有很多评论,有几个朋友说发在封闭系统里的文章就是给海内里的人看的不应该贴出去;另几个人说其实自己很喜欢别人分享,但是不喜欢原名出镜;还有人说自己是不是原名无所谓,只是觉得自己应该有选择的权利——也就是说,为了人权而人权。我们可以发现,这种小设置里就已经隐含着若干标准,那么如果是很多小设置呢?
我们在不同网站的隐私设置也不相同,因为我们面对着不同的群体。我可以在海内上公布我的手机号,但我绝不在google profile里贴出来我的真人相片。我可以在donews里让大家任意转载鲁公子的文章,在海内里发的东西我就是不想让外面的人看到。甚至,我在海内和在校内的隐私设置都是有区别的。
时间维度上,我们对隐私的判断同样时刻发生变化。比如我一个朋友在facebook,他女朋友加他好友了,他就得重新设置隐私,把所有和其他女生的敏感对话都屏蔽掉。
除此之外,还有一点更糟:用户往往不知道自己为什么要屏蔽掉一些,或者显示一些信息。全球网民对隐私不可能像海内这种比较高端的用户群一样敏感。笔者在设想,如果调查一下各大网站的隐私设置情况,会有多少仍处于default的状况。当然很多人也会改动,但对隐私的改动,是否真的是因为他需要这么做而修改呢?还是只是为了在修改中获得一种隐私赋权的体验?
作为网站运营者,怎么观察并捕捉这种用户带有明显漂移性质的行为?这样的规律只能当事人一人明晰,他人无从洞察。但这种无从洞察,让网站的隐私赋权实现起来更困难。

碎片化的另一个表现形式就是处理方式的不同。在定义里,就是如何claim的问题。
针对个人化的问题,我们如何对这么多种隐私处理方式的需求提供足够的赋权?我们能够统一它们吗?也许可以,我们可以出一堆选择题,问你到底想不想让别人转载,选项若干。那么其他方面呢?一个网站设计的隐私选项可能穷尽所有和我们切身的隐私权么?这就是我在文章开头提到的,我们可以说出哪些是红色,但是红色都有什么,我们没这个本事说尽。就算我们能说尽,连隐私协议都懒得看的我们,有耐心填那张长长的隐私设置表格么?具体而言,现在的很多SNS网站都没有提供给我足够的隐私赋权。比如我更希望我的出生年月日只被我真正熟识的几个人看到,而不是所有我加为好友的人看到,这个问题在上一篇中我也提到过,就是好友分级的问题。网站的设置将我的信息提供给了我不想提供的人那里,这种责任如果归咎成了用户不谨慎的话,对用户体验这四个字是很大的冒犯。

实则,隐私碎片化的最好解决途径是非结构性的互动。当我需要一种隐私服务时,我的语义编码能够被技术所理解并完成操作。这样的途径在于用一种互动的方式规约,而非在框架下规约。然而这样高度的人工智能能否实现,我不清楚。因此挂起,不论述不知道的事。

隐私应该是碎片化的,非结构化并且能够被识别的。而矛盾的是,碎片化本事就是难以定义的,难以规约的。这就是隐私为什么这么难以界定,只能用协议这种很事后诸葛的方式规约的症结所在。没错我们是在为隐私发出呼吁,但是我们知道我们发出呼吁的那个终点,是什么么?

文之将毕,为了像老外们一样critical,我也唠叨几个驳论,作为我和诸位为了隐私保护并肩作战的佐证,只是不再展开说了。

1. 前两天看见一句话,说我们用隐私换取自己的satisfaction。这句话一半对,但仍然发人深省。可惜忘了出处,知道的朋友麻烦告知一声。
2. 我们是永远在向隐私保护的终点靠近的,即便我们永远不可能到达那个令人满意的状态,就像西西弗一样。但这也告诉我们,不能到达不是不继续追寻的理由。
3. 当前的中国特色,使得太多权利先于隐私权亟待完善。我们这群先被满足了某些权利的人,隐私权在中国真的没有其他那些权利那么迫切,甭着急。

鲁公子
2008-1-30 3:18

SNS中的信息整合:再论海内校内

Posted by 鲁公子 | 未分类 | 星期日 13 01月 2008 3:31 pm

SNS的信息整合

 

近来的海内和校内都有新产品推出,很有趣。

海内推出了自己的新功能——照片圈人。这一点是海内对真人网络概念的一个实践。海内的病毒式推广在新产品上也立刻得到了体现。如同起初IM的病毒效应一般,我的好友动态上被来势凶猛的圈人信息所覆盖。很多朋友圈人很狂热啊,而且极大丰富了相册库的内容。照片上传的motivation使得海内的真人性质得到了进一步的推动,这一招漂亮。

校内终于推出了二手市场功能,这一点非常非常赞。我一直认为校内网的杀手锏绝对在电子商务,因为校内用户的关系对支付宝这样的第三方信用保障的需求和对物流运输的需求不如淘宝这种地域覆盖面极广的C2C网站那样迫切。马云眼中的电子商务三大关键——信息流、物流和资金流有两点被明显弱化,这不得不说是C2C的一个改良契机。当然,对于信用体系的需求并非完全忽略,在学生这样的关系中,存在这样的信用体系仍然可以减少很多麻烦。谢谢马云吧,支付宝没准可以帮校内打开电子商务的一片市场。此外,校内电子商务化的结果是,不但成为了C2C平台,同时成为了分类网站的对手。在狭小的空间内,校内有机会从各种分类网站那里得到更贴近于需求的信息,并且有着高度的可信性。这一点回头慢慢论。

 

说了好多估计大家都不知道今天鲁公子想说什么。其实这两种应用的另一角度才是今天的主题:信息整合。

校内诸多论坛都有各种的二手资讯,比如考研教材比如打口CD比如自行车等等。二手市场的本质的确是C2C,但更是对C2C要求的信息流重新排列与整合。

而海内圈人运动将相册这种无法用搜索引擎算法充分检索的信息,用人肉方式建立了索引。而且新功能上线的时间掌握得也不错,恰恰是在海内用户量增长迅猛并且原始信息并未达到让人无力编辑的数量级之时。

海内的功能的确没有校内这个更贴合用户。也许王兴老大的考虑是先巩固海内的用户群取向,等海内的用户群已经能够满足其定位——完全真人出镜并且成为真实生活的社交圈的虚拟化后,再来考虑满足用户群的需求。况且,如果相片可以检索,这对于各SNS来说都是一个难以复制的优势。搜索图片并且找到真人,这个应用在现在的SNS中确实不常见;何况是将与一个人有关的照片都搜索出来。

这就是SNS的信息整合的具体体现。SNS里的信息当然不只限于这样的新功能,因为新功能往往还需要数据和信息的原始积累阶段,并不一定有很迫切的信息整合需求。很多已经很成熟的功能产品有更迫切的需求,而且其实已经很显性,只是没有很具体的解决举措。

比如看到一个朋友在王兴老大的海内里留言,说一堆朋友的更新实在太过频繁,比如照片圈人,基本什么时候去海内都被类似信息狂刷屏。我想这个就是如何将碎片化信息重新整合的问题。如何能够让过度的信息不烦扰用户,并且推送用户需要的。

好友动态更新如同rss一样,可以直接被推送。所以我们一旦有了百十来号好友之后就很头疼了,但凡30个好友更新几条就能刷屏,这怎么能确保被推送的好友动态能够让我们接收到?又怎么能保证我们接收到的信息是我们想看到的?

我想看到《自投罗网》的朋友们一般都是互联网从业者或者爱好者,那么大家都有个相似的烦恼:rss阅读器里的未读怎么这么多,什么时候看得完。这样的推送形式和SNS的信息推送其实是相同的,只是这些问题需要feedsky和鲜果抓虾从一个准2.0媒体的角度考虑。正因为此,这些网站不敢将items主观筛选甚至屏蔽,因为这侵犯了用户的主动选择权利。但如果不删除,对于我们阅读来说的确造成了很多障碍,阅读变成了一件很疲劳的事。用户自己是没有理由抑止自己的阅读欲望强行删除订阅的,然而实际上,我们就是在这么做。

扯远了,rss阅读器的问题我也以后单独说。

SNS也是同样。对于王兴老大而言,海内的信息量远未到富足甚至过量的地步,终究海内起步不长。但是我们对信息的选择和删节就不是问题么?当然不是。比如圈人,我第一次看到的时候觉得圈人这玩意是海内新家伙不错玩玩吧,第二次看到的时候觉得圈人真火王兴居然能让这么多人一起以圈人为乐真牛,第三次看到的时候就无语了心想这玩意怎么刷了这么多屏。校内其实也用同样的问题。论坛里的文章我想看,可是一旦订阅了,几乎5分钟蹦出来一篇,还都是我不想看的。这样的扰民行为已经成为了心头大患,不只SNS,包括很多很多web2.0网站都深受其害。

有解决的办法么?我不懂技术,只能随便提几个,姑且作为设想。

1.校内有个很好的功能但是没有被合理应用:特别好友。其实特别好友是件挺傻的事,我被人列为特别好友时我会觉得那是应该的;我觉得我会被特别好的朋友列为特别好友时却在那一排list里没找到我的名字,那我就失望了。特别好友的确在现实生活中存在,但是这样的级别不应该如此表面化。

我的建议就是将好友分级。其实鲜果已经提供了类似的服务,将rss分为必读、一般等等的级别。在SNS中,分成几级由用户自己确定,这个级别不用来炫耀我有几个死党,而是实实在在地在动态等等功能中优先推送。而被我列为一般级别的好友,消息在一周或者一个月后没有查看就可以直接自动清空。这样可以节省许多时间。

这并不是对互联网的平等精神提出挑战,因为每个人都有分级别的权利,而这种分级别的心理症候也的确存在,网站要做的只是模拟其功能,提供其所需而已。

特别好友在我们的心中其实都有比较明确的分野界限,就像我们想起周围的一个朋友他究竟和我有多深的交情我自己心里相当清楚。但是这种东西是不会逢人就说的,我对朋友的分野用途在于我在这个社会中的信息采取和行为方式的选择上提供一个模式化的解决方案。比如我最好的哥们向我借钱我二话不说,但是一个有过不还钱恶劣历史的家伙做同样的事我不一定会用相同的举措。理由呢?因为分野的标准早已将我采取的态度和措施规约清楚了。

因此,特别好友的应用恰恰是最不能显示在每个人的主页上,而是显示在自己的欢迎界面。我可以很清晰地得到我最关注的朋友的信息,因为他们被highlight了出来并且区别于其他信息放于最前。一部分有很和谐关系但并未交好到如此程度的朋友次之,一般的朋友再次。以此类推。

好友分级的用处在于确实的用户行为上,只作为摆设,太可惜了。如果能按照行为方式来进行充分模仿,信息的重排和整合会有很多改善。

2.话题。强烈建议在SNS网站中引入tag功能,这是对话题分类的最好方式。比如校内,在今年的1月份中,必然有很多人在写或者在分享关于考试的相关日志。考试的时候是需要吐苦水的,那么我可以将tag为考试的所有我的好友文章列出来,和他们比比谁难分享一下考试资料,这就是利用信息的重新排序来满足需求的方式。海内也同样。“很黄很暴力”、胡紫薇事件最近必然是朋友们的主力谈资,咱们搜一下有这样tag的文章图片甚至留言,比我们从长篇累牍的动态更新里找出来要好很多了吧。

其实海内的圈人功能本身就是图片的tag,用来在整个网站中序列化图片信息。重新序列化有什么用途么?比如我崇拜麦田兄了,我就搜索一下麦田都出现在哪些照片里过,然后我就能够看到不只麦田的相册,还有和麦田有过交往的人们的相册,我就可以对这家伙的生活有更多了解,进而任由崇拜之情如滔滔江水连绵不绝。这样的重排,我们可以发现,不只是简单得对相册一个功能的重排,而是为诸多信息提供的一种新的索引模式。我可能通过这个功能看到麦田同事的profile,甚至麦田家人的profile

海内本身所具备的可视化关系网也是类似的信息重排。这个比雅虎的那个像家谱一样的人物搜索有一个先动优势:所有的关系定义由当事者本人做出,节省人力物力而且不会有任何争议。这样的信息重排对我们自己也可以有一个清晰的认识,和某人初识与何年何月在什么地方,也对我们的关系本身也会有相应的加强或弱化。只是有一点,海内主动将类别定义为几类,然后下面由任意的tag进行分类。难道是海内想通过此进行统计以确认其用户的网络真实性吗?虽然无伤大雅,但我仍认为任意的tag会比强行的分类更优。

3.语义网的发展。这一点是我对语义学和语义搜索寄予的厚望。话题的识别和对SNS中人们关系的识别都是很困难的问题。Tag的出现对于新站而言是个好的选择,但是语义网的发展能够更智能更便利地解决相关问题。郑昀兄是专业人士,可以对此做出比我专业许多深刻许多的评论,故不再妄言。

4.当然,我并非只主张对我的选择不断提纯直到加强到我想要4items更新你就给我4条的地步。Web 2.0其中一个为人所诟病的问题,就是封闭。

没错用户定制化本身对于企业而言是一种碎片式的泛化。但是对于我们每个人而言,我现在不想要的不代表我以后都不需要。当我做出了我要做的选择,这些选择就源源不断地进入我的领域并不断加强,但我本身的视野却因为我的选择而得到了弱化,因为选择本身也意味着屏蔽。

我对饭否的一个功能很喜欢,就是随便看看。这是一个拒绝闭塞拥抱偶然的好途径,但是不够智能化,只能提供给我偶然性却不能提供给我我需要的。另一个常见的拒绝闭塞的功能就是rss阅读网站中常见的热文。菜头在一篇文章中也提到,鲜果的热文点击率很高,也就是说相关度很高。

如果饭否或者SNS也有对某句话或某篇文章的类似于digg的打分机制,那么这个网站可以很大程度避免封闭。这也是我常常觉得协同工作和社交网络应该有充分结合的原因。社交网络在具备一定规模的时候往往会有信息过剩的问题,而协同性本身就是对信息筛选的一种,如果能够辅以tag作为相关性的参考,使得信息筛选不会太过偏离我的关注领域,又能够是我订阅范围内的信息,SNS应该能具备更强的黏性。终究,人们用SNS最普遍的理由是打发时间,如果让人觉得在SNS上没事可作,本身就是SNS的失败。

当然这不是对海内说的,海内在最后这一点上,仍需要更多信息的原始积累。

 

鲁公子

 

2008-1-13 341 于悉尼