很难真正建立起一个完全反应现实的社会网络的电子网络。除非是另一个
MATRIX。这应该是所有SNS的难点吧。并且,对于针对不同的SNS需要建立
不同的模型出来。如下,电子邮件和大学中的网络模型,以及像ORKUT这样的
网络的模型显然有本质区别。
3.搜索一个社会网络(NETWORK OF FRIENDS)
电子邮件的数据提供了一个比较完整的一个组织内部的人和人之间的交流的视图
并且这是可以被自动分析。在这里将讨论另外一种网络,手工建立的网络,仅仅
由友谊组成的网络。电子邮件网络并不总是表明两个人联系的紧密,因为这中间
有很多业务交流的影响。同时,对于一般得到社会网络,两个互为朋友的两人之间
并不一定有频繁的邮件交流。
我们从CLUB
NEXUS哪里拿到了朋友网络的数据,这个网络可以让STANFORD的学生清楚的列出
他们的朋友。大概有2000个毕业的和没有毕业的学生加入了这个俱乐部并且作为
注册过程的一部分,列出了他们的朋友。在线的社区为每一个用户提供了丰富的
个人描述,包括他们的在校年龄,专业,住所,性别,个性,习惯和兴趣。丰富
的个人描述使得详细的社会网络分析得于进行,包括坚定活动性和友谊的形成的
主要影响因素。
CLUB NEXUS在几个方面和HP LABS邮件网络不同。这些不同使简单的大规模搜索
策略不能应用到这个网络。最大的不同就是关系展示的自然性,朋友仅仅是一个
人的联系人的一个子集。CLUB NEXUS的发展受到了数据不全的限制:用户的列表
仅列出了很少一部分或者没有他们的朋友,或者没有互相的连接。大约209个用户
没有朋友。238个用户列出了一个朋友。另一方面一些用户的伙伴列表包含了成打
成打的朋友,导致了平均数达到了8.2。这是部分用户有很多朋友带来的一个结果。
但还是有一些用户更加希望列出他们所有的朋友的名字,或者列出那些不是最亲近
的朋友在网站上。完整的分布如下图所示。

再一次,我们想使用目标的信息来加速搜索过程。但是不像电子邮件中存在的位置
信息和组织结构信息,像宿舍和专业变成了CLUB NEXUS数据中的微弱的线索。在一
个宿舍中的两个学生仅仅有5%的可能程序NEXUS的"BUDDIES",甚至一个人制定另外
一个人是见过面的。住在不同地方的两个人仅仅有0.3%的可能性称为BUDDIES。
--还没有考虑他们的居住记录的远近。因此简单的地理位置搜索在STANFORD校园
的居住地图中并不适用。
可以放到两层结构中的属性是系和在某一专业学习(SCHOOL??)的年限。我们需要观察
用户是否属于同一一个系和他们是否属于同一个专业课程。比如两个学生都属于
工程专业,但是一个是化学工程,另一个是医药工程。图9说明了两个在校生在CLUB
NEXUS中注册为朋友和他们在专业中的年数之间的函数。对于毕业和没有毕业的,两个
同一年的人有1%的计划程序NEXUS的BUDDIES。因此搜索到目标的可能性实在太小了。
其他变量如体育爱好是难于精确匹配的。比如很难说清游泳者和踢足球的人的相似性。
我们最成功的策略就是建立起用户的描述并比较5个目标用户的属性然后传递消息给
下一个人。可能的属性包括:
×都是没有毕业或者都是毕业的。
×相同或者不同年份的
×都是男的或都是女的。
×相同或者不同的住所
×相同或者不同的专业/系
然后我们计算两个人互相认识的可能性-基于所有上述这些变量的可能组合。
这个模拟约定一个个客厅可以判断,利润,同一年的某一个人可能制定目标。相对
的在同一宿舍但是不是同一年的。包括其他属性,像共同的兴趣和爱好或者其他活动
并无助进一步的搜索次数。我们先去掉了网络中最高和最低关联度的个体。删除低
关联度的节点有助于缩短平均的最短路径,去掉最高关联度的节点又损害了搜索的
完整路径。
Trackback: http://tb.donews.net/TrackBack.aspx?PostId=82972