BLOG聚合机制收集
摘要:聚合机制文摘:互联网感悟点滴:tag和搜索 (全文共4818字)——点击
此处阅读全文
摘要:Attention.XML-RSS延伸技术 (全文共2955字)——点击
此处阅读全文
关于网页(Blog)评论的思考 [2005-3-16] | |
互联网最重要的特征之一就是“交互”。
这不同于传统的电视、报纸、电影、杂志等,你只有“看与不看”的选择,“看什么”的选择并不是很多。只能通过写信这种方式来提意见,然后是虚无缥缈的等待...
从最早的 mirc、个人主页留言板,到后来以论坛为核心的网站,再到现在的各种社会软件(书签等),无不是为了解决这个“信息交互(流)”的问题。
Blog 对自我体现得很淋漓尽致,但交互就显得不足。我常有在自己的 blog 提问题的冲动,但考虑到看的人太少,所以还是选择了 搜索引擎+论坛 的方式。
而且在某个blog内的留言只存在这个站点之内,别人必须到你这里来才能看到。一旦站点挂掉, 很多有益的讨论也就不复存在。你在许多别人的站点留言也难以统计复查,你也不知道后面还有没有更精彩的回复,而这正是论坛的长处。因为人多,所以总会有你需要的信息。
但除非是
keso 的blog,
很难有那么多人愿意在你个人的站点来讨论某个问题。
trackback
从某种程度解决了这个问题。你可以通过它来建立一个以自己的blog为中心的信息门户。所有回复在自己站点发表,然后pingback
回去。但仍然有一些问题。比如,很多时候回复只是一两句话,并不值得专门开一篇新的日志,这会让你blog站点的阅读者感到很困惑。我每天都要看几十上百
的页面,那岂不是每天都要发表几十篇日志?这反而浪费了你自己和大家的时间。
再者,现在的blog软件或者平台都还没有一个专门的类别,这个类别就是所有你所有曾经发出 pingback 的文章。(也许我可以改一下这个blog程序...)
在这里,你可以一目了然地查阅所有自己曾经写的,对别人哪些页面的评论或引申。感谢 geneboy 对我这篇
改进 365key sidebar 方便查看评论的留言,使我再次想到了
tagsurf 和
opine-it。而
igooi 的 group 也是为了解决类似的
信息交流的问题,但很遗憾 igooi 目前不支持评论。

opine-it 没有个人账户的入口。你无法查阅所有自己评论过的页面。只能察看最新和最热的—哪些页面受到了评论。tagsurf 就好得多,不仅可以就某个 tag 评论,而且它把所有的网页地址本身也看作是一个 tag,这样,我们也可以
通过它(tagsurf)来发表对某个网页的评论。在tagsurf,你可以通过这个tag(这时候实际上是同一个页面地址),来察看所有关于它的评论。也可以
以自我为中心查阅所有你曾经评论过的页面!而后者,正是现在所有blog以及社会软件最薄弱的环节。还可以建立 watchlist,关注你希望关注的内容。
我添加了 haloscan 的评论和trackback 系统,明后天会加入 opine-it 以及 tagsurf 链接。这个blog本来就是我研究 用户交互的试验场。haloscan 的相关功能还没有仔细研究,
观察+使用 肯定还会有更多的发现。另:伴随着这个 blog 近几日关闭(狼又来了?¥……%—%—%—),我不想仅仅因为关掉这个blog就失去自己获取信息的门户,所以建立一个发散的个人信息门户对我来说就有了更深一层的含义。
[JOHNKUANG]>>>[从善如登,从恶如崩] 说:
tag可不可以这样呢?
比如
blogs.it blogs.software
王翌@社会网络的前夜 说:
这个方式在国外已经有研究,国内还没有,365key很可能会是第一个尝试的。
王翌@社会网络的前夜 说:
你可以把这个想法再深化,想想,如果Tag不是完全固定的一个值,而是可以加权的,那就好玩了。比如你可以给我的Blog链接加4个加权的元素:社会网络60%,IM50%,搜索50%,新闻20%,这样就更好地描述出我的Blog了。
[JOHNKUANG]>>>[从善如登,从恶如崩] 说:
是啊 真的很有趣
[JOHNKUANG]>>>[从善如登,从恶如崩] 说:
这样就可以实现排序
如果能够做到多层次的tag那么我们就可以建立一个和google网页目录一样的东西.
当然事实上这种技术的应用不仅仅如此..........
Tomz 的相关想法
回应:
将blog、wiki、论坛等整合的知识管理系统。
象,现在的各个系统都各有优缺点,
却不考虑更高级的知识整理方法,令人费解。
....
嗯,我的系统是知识交换系统,不是企业内部的知识管理系统。(另外,我头脑中知识管理系统的概念是知识整理系统,也可能和你的不一样。)因此,如
果是企业内部的知识管理系统只要有评分系统就可以了,因为企业可以对高分作出奖励。而在交换系统中,只有知识的购买者才能作出奖励,因此,是一个商品的交
换过程,一个交易达成的过程。在知识交换中,阅读都是要付出的。对于评注,当然要奖励,知识的出卖者也会用他的所得分一部分给有价值的评注者。这也是知识
交换系统存在的价值之一---------鼓励评注。
在知识交换系统中,没有价值评定的问题,只有交易达成的问题。对于文章的内容是否和题目相符,质量是否过关,目前只有通过举报来解决,另外,可以推出作者的信用评级。还可以做一个随机抽取内容的功能,公布部分文章内容,来评估文章的价值。
而如果对于单纯的评价系统,我不赞成设置专门的评价人员,而是大家都是评价人员,读者可以设定他所信任的评价人员,对评价人员形成竞争机制。我喜欢一个大家都平等的氛围,以免造成评价和被评价的矛盾。造成评价的低效。
www.csdn.net www.xdcad.com
都对如何鼓励用户发言做了很多成功的尝试。我的文章交换系统和社区、和人气都无关,和它们的不同。我的系统只是一个功能性的东西,可以自己用,也可以大家
用。如果别人不用,至少我会使用它来做一些交换活动。我做这个系统的最初的想法也是给自己用的。目前只是把这个系统开放了。
至于选择开放的问题,我认为,如果自己作出的对自己很重要的成果,还是开放的好,因为对自己重要的东西,不是用金钱能够衡量的,开放了,能使成果
发挥更大的作用,比如我的文章、和我的blog,对我很重要,所以我免费提供给大家。而对于那些对自己不很重要,需要花力气去完成,而对别人可能比较重要
的东西,则可以采用交换的形式,这样各得其所,而不是单方面作出牺牲。
我的文章交换系统有商业化的打算,目前,我选择封闭。
至于开放和封闭,那种商业模式好,要区分不同的情况,具体分析。不要一味的开放,也不要一味的封闭。这在我以前对GPL的讨论中说了很多了。重要
的是对商业模式的可行性做出正确的判断。zope的开放我感觉有很多股东的感情因素在里面,并不是单纯的商业考虑。在中国,选择开放也可以,但要有认真的
权衡,而不能冲动。在开源软件的基础上进行公司的商业化运作,前途应该也不错,但需要好好考虑获利模式。开源获得的支持,很多都是用户的贡献,用户作出贡
献对自己也是有利的。和商业运作无关。
开放确实也是一个市场宣传活动,目前大量的商业运作是免费和收费混合的。
也有公司是开放一部分用来交流,封闭一部分用来获利,比如sendmail。
我是很赞成开源的,在我的文章交换系统中,初始币值和最终币值的设计,就是为了既能保证贡献者的利益,又能为开源输送资源。
中国用户在乎是否开源的比较少。确实需要普及教育,凭一个公司的力量要普及观念比较费劲。只能慢慢来,不能着急。我想,用户最终会认识到开源的好处的。目前,可能不好过分强调开源,还是要站在用户的角度,从用户关心的地方和其它软件公司竞争。
可能你没有理解我的整合的含义。blog和wiki等整合的事情已经有人在做了。我知道的是tiki,tiki原来是一个wiki系统,目前发展
成了一个综合的门户系统。有forum、blog、wiki、PIM、faq、bug
trace、vote等很多模块。它所作的整合工作就是:其中的很多模块都具有了catalog功能,都具有了comment功能。我的意思是有很多通用
的知识整理的功能,各个模块都具有才好。
...
我所说的知识管理功能不够的意思是:
比如如果是一本书,那么就有树状结构(篇、章、节、小节),还有顺序结构(有先后顺序的第一节、第二节、第三节,各个章节的前后顺序是确定的)。
而在wiki系统中,是一个平面结构(我知道zwiki有层次结构,具体不清楚,但应该实现不彻底,比如没有顺序结构)。一个wiki页没有前、后、上的
属性,(手工添加的链接不算。)而如果有了这些属性,wiki的浏览操作会方便很多。比如blog也没有书那样的完善的结构,forum也没有这样的整理
功能。可能有czug那样的操作,先在forum讨论,比较成熟后放到blog上,规模大了,放到wiki上,成熟了放到知识库中。而我的想法是,不管什
么信息类型(blog、wiki、forum等)都具有”可管理性“,都有一些统一的操作,比如版本、评级、评价、结构、作者、分类、时间。一个信息可以
有多种表现形式,同时存在于各种容器中(blog、wiki....),而不是各有一个复制品在各个容器中,造成信息的分裂,手工的在各个容器收集反馈。
信息越具有可管理性,就越能发挥作用,而不至于造成信息的浪费。如果能够通过各个途径、依照各种线索都能够发现同一个信息,将同一个信息的各种反馈和整理
和更改都在一处发现,那么信息能够发挥更大作用。
另外,网站的“开放互连”能力,比如,能够发现一个wiki字是否在其它wiki网站上已经出现了。比如,一个人能够用同一个网站的认证在多个不同的网站上发表信息,而且在一处能够发现作者在不同网站上发表的所有信息。(而不必依赖不可靠的网站搜索功能)
这种知识管理能力其实也就是“语义web”的概念,只是我的设想更具体。要实现我说的知识管理功能,也要建立在xml基础上,就是要求网站的功能都具有xml界面,并且数据库能够相互链接。(就像多个关系数据库的合并。)
这些想法只能通过软件的实现完善、提纯。知识管理的想法在我网站上提到的“记事本”项目也有所表述。
“可管理性”和“开放互连”可能已经在某些软件中有所体现了,但我认为目前的发展水平远远不能满足要求。
象天网的燕储把多个分散的ftp网站互连起来,blog心得集的blog搜索功能,都是一种“开放互连”的尝试。我的bookmark缓存的想法也是一种互连的企图。ldap和passport也是一种互连的实现。
其实,对知识管理的说明用“用户故事”的方式来说明是最明白的,只是目前思路比较混乱,只能在理论上大概说一下。
...
补充:
网站的“缓存友好”,指如果缓存一个目录,那么目录下面的各个章节、评论等都能被同时缓存。如果内容有发展或更改,那么能够主动通知缓存网站更新
内容,而不是总要机器人来询问。信息是细粒度的,各章节、评论都是独立的信息片断,而不是都在一页上,这样便于归档和检索,当然,在被人浏览的时候可以放
到一页上。信息都是xml加xlt的,这样信息能够同时被人读和机读。不止是最终版,而且所有版本都要放到xml上去。xml能兼容各种xml规范,比如
RDF、RSS、都柏林核心等,最好wiki、forum、book都有自己的xml规范。
这种“缓存友好”是“开放互连”的基础。
评级的重要性:比如访问一个blog,blog中有几百个条目,我没有时间全部阅读,希望作者能够告诉我,最有用的前10个blog条目是什么,我要把时间花到最重要的内容上去。对论坛、wiki等其它形式也有同样的需求。
...
旧贴摘录:
==记事本项目理论==
我的“记事本”和你的“人机对话”好像研究目标相同,下面说说我的“记事本”的构想,而构想的核心就是对“知识”的研究。
知识有两个粒度级别:
第一级是“词”,数据库就是把词作为存储对象,词典等也是数据库。对于人机对话来说就是从自然语言中抽取数据,人机对话并不能从对话中抽取“关
系”,因为所有的语句中的词的关系都是程序事先预料到的,并且分别处理的,所以说人机对话是从语句中抽取“词”。从语句中抽取词的过程涉及到语义学:区分
名词、动词、形容词、助动词。另外,也要借助于“同义词”等语义学的概念。从语句中抽取词就是区分词的性质,然后获得所需要的词的过程。数据库就是存储的
词和词之间的关系,数据库可以是关系数据库,也可以是prolog那样的有多种特定关系的可推理的数据库。我认为人机对话目前首要是具有能接受各种数据库
数据的能力。数据库的形式有关系数据库、xml数据、RDF数据,这些以标准格式存在的的细粒度的知识是最有组织、最有语义概念的知识,应该是人工智能首
要的消化对象。以网络形式相互联系的各个独立的数据库的联合是人类知识的最佳载体,这应该是目前最需要做的事。现在已经有很多人在呼吁建立一个全球统一的
知识库,我认为应该从增强对现有的细粒度的知识的消化能力入手,一方面是消化现有的细粒度数据,另一方面是用网络的形式吸收人头脑中的知识。
wordnet是一个吸收和存储人类的细粒度知识的尝试。象词典、输入法等也是以细粒度知识为基础的。我的记事本就是先从作为关系数据库的一个接口入手,
比如一个通讯录。使用人机对话的形式可以方便的输入数据,比如输入一句“某某的电话是XXXX”,而不用调出相应的输入界面,也不用被迫按照输入界面的顺
序输入,并且能将多个数据库的输入混合在一起,不用考虑先后顺序。在“词”这个粒度级别中,语法分析是关键,而语法不外乎表现这四种关系:抽象和具体、整
体和部分、基本和衍生、对象和属性,这正是四种思维形式的表现。
第二级是“语句群”,语句群的形式可以是论坛的一个帖子,FAQ的一个回答,howto的一个回答,或结构化文本的一个最小的单位,一个“小
节”。就是由一个或几个段落组成的解决单一问题的语句群。这个语句群的概念比段落含义更明确。语句群的存储和检索就涉及到了思维的四种形式,一般的语句群
的组织形式是以目录的形式出现的,比如结构化文本的“章”、“节”等,或网站的目录检索,或文件的目录,这就是“树状思维”。关键词的检索方式可以看作目
录检索的一种比较灵活的形式,也可以看作“离散思维”的一种形式。象文章的属性,比如作者、语言、网站等,象“都柏林核心”,这种类似关系数据库的方式,
属于“对应思维”的形式。象全文,标题的检索属于“离散思维”的形式。html、wiki、info那样的超链接的形式则属于“延伸思维”的表现,以一种
延伸的形式找到最关心的知识。掌握了思维的四种形式,也就掌握了“语句群”级的知识的全面的检索方法。结构化文本是组织知识的工具,tex、html、
xml、wiki等都是结构化文本。新闻组、论坛、RSS、BBS等都是对“语句群”级的知识进行组织的尝试。FAQ、howto、cookbook、归
档网络也是知识组织的形式。研究怎样使知识更有组织,更容易检索,研究各种知识的组织形式是一个非常有意义的工作。
我的记事本就是想综合两个粒度级别的各种检索方式,作出一个比较完善的知识管理软件。这个软件要有网络和本机两种交互界面,要兼容各种数据形式和
输入输出方法。但这是一个宏大的计划,最好有资金支持才好,否则就只能等待我花几十年的空闲时间慢慢来搞了。不知我所说的和你的项目的重合度如何。不知是
否有人或有资金来实现这个构想。我想先用scheme搞一个原型出来,确实有必要再用c语言等更高效的语言来实现。原来我曾经用lisp编了一个超链接系
统,架构比较乱,肯定要重新实现一遍,但这次我打算从一个“通讯录”这样的关系数据库入手,然后是一个类似wordnet的网络接口。现在已有的知识的组
织方式很多,各有特点,只有先构思一个更先进的架构才有开发的必要,而这种架构只有在一步步开发中逐渐找灵感。
...
另外,除了对信息进行管理,对人的信息进行管理也是非常重要的,比如招聘网站,专家库,俱乐部、和其它会员制的组织都设计到对人的信息的管理。人的信息也设计到一个分类和评级的问题。对人的信息的管理,“朋友的朋友”理论是一个开端。比如
www.yoyonet.cn
原文链接:Blogger们团结(串联)起来很
多人都和我一样,认为单个blog固然有价值,但是blog的发展需要众多blogger们能紧密团结起来,能够有效促进blog世界的网状结构。这背后
应该也找得到理论的支持,我们描述“数据”是“有关事件的一些离散的、互不关联的客观事实”,而“信息”则是具有“关联性和目的性的数据(彼得·德鲁克
语)”,同理,单个blog漂浮在网络的汪洋大海中是孤岛,而连接成美丽网络的blog世界才是信息道路畅通的。
现有促进blog相互联结的有引用(超链接、TrackBack),评论和友情链接等,还有一些其它的专门网站提供bloglist或者内容聚合,当别
论。还有一些其它方式,比如现在很多blog都在使用的“看天下blog文章集锦”,既将优秀blog文章聚合到自己的专门网页上,也提供语句让每个
blog的页面上能够出现这些文章列表。还有“blognow”,能够让你在自己的blog上及时看到其他blogger们最新文章列表。你会发现,能够
在自己的blog上直接了解其它blog尤其自己喜欢和经常阅读的blog的文章更新情况是很重要的,很方便,而且,如果这些内容和你的blog内容有重
叠,那样,对个人blog也是促进,因为提供读者进一步的阅读。 还有一些方式是值得争议的,比如富应用实验室
搜集了一些blog,将其内容直接聚合到专门网页上;比如yufeng的blog
,能够将他友情链接里面的blog直接读到自己的blog页面来(点击Read),也很好用……。这两个方式值得争议是因为从某种意义上说是将其它内容
“拖”到自己这里来了。
我们想在自己的blog上出现其它相关的blog文章列表除了紧密联系以外还有其它理由,比如我们希望更好地打造个人品牌,将blog视为一个个人平台,
体现更多——个人追求是长久地交流与共享地基础、动力。出于这两个目的,我们可以再继续开发更多的blog工具。
我曾设想过一个,类似一个定制型的blognow,定制意味着这个blognow列表是可控和可选择的,它又可以分为个人型和社区型。个人型是指我申请一
个定制blognow,手工输入我喜欢的若干blog或者我朋友们的blog或者和我主题相关的blog,然后可以及时将文章列表在我的blog上有所反
映,这样有利于我及时阅读他们的新文章——每个人都会更在意自己的blog,它甚至是很多人的首页。社区型是指我申请一个“笑话”blognow,然后所
有“笑话”blog可以自愿登记进来,然后大家都将相关语句写到个人blog里面,于是,他们就串连起来了。不知道哪位乐意提供这种服务,或者BSP们可
以考虑,这个本身也具有一定的商业潜质吧,适合那些有意blog创业的人们。 还有更多的创意吗?
其它一点想法,就是,类似我们对blog应用的讨论不是指导性的,而是寻求多样性,更了解blog的可能性,以及深入挖掘blog社会应用的潜力。
文心说“Business2.0的blog上传出Flickr将被Yahoo收购”,不过到今天为止还没有看到正式的消息。前些天Flickr上短暂的出现过奇怪的Logo,上面同时出现柯达、Yahoo、Google等的小标识,估计是Flickr对上述那则传言的回应:对Flickr有兴趣的很多,但是还都未订。
作为Picasa和Flickr的
用户,我倒是希望Google能够收购Flickr,之后打通Picasa和Flickr的通道。虽然Google有Picasa+Hello的组合,但
绝对没有Picasa+Flickr来的绝妙:我用Picasa管理本地的图片,通过Flickr发布和分享(Hello只是在IM的朋友间P2P的分
享,没有了Flickr社会性空间所带来的乐趣)。
当我在浏览图片的时候,我可以将它保存到一个Picasa监视的目录下,一旦该目录有变更,Picasa就会自动索引。同时可以使用email发送功能发布到Flickr。
在Picasa 2所嵌入的三种邮件发送方式中,有一个是使用Gmail。尝试了下,用它发布照片到Flickr给每个用户的email帐号,该图片很快就出现在Flickr中。遗憾的是Picasa还不支持中文。
这种组合的好处在于本地也可以有备份。另外,由于Picasa会自动缩减图片文件的大小,对于我这样免费的Flickr来说,可以最大可能的发布更多的图片。
Picasa到Flickr很方便,可是要从Flickr到Picasa就麻烦了。希望Picasa能有个插件,直接订阅Flickr中的图片,遇到中意的,直接保存,不仅保存图片,而且还保存该图片的注释、标签等。
Google快快买下Flickr吧。
这篇文章并非明确的表明blog的聚合机制,但是它至少说明了一个道理,blog聚合机制里面应该有一个非常重要的内容:主题聚合。
In SocialSoftware
(图
片来源:ajschu) Christo 和 Jeanne-Claude's
在纽约中央公园的Gates项目前些天已经结束,那些给寒冬带来阳光般温暖的橙色的门也都被拆除。这些在需要现场见证的时间中的艺术已经融入人们的记忆,
冬天的回忆。一个在百万人心中很温暖的回忆。 现在,Flickr和Institute for the Future of the
Book想要把这些散落的回忆重新拾回聚合,将时间中的作品以拼贴的方式重新呈现,延续它的艺术生命。 为此,他们发起了 THE GATES: AN
EXPERIMENT IN COLLECTIVE MEMORY 的项目。 到我去看的时候,Flickr上已经有了442张Gates的图片。
不同的人,不同的心态,不同的角度,给了门以多样化的生命。 艺术家创造了门,欣赏者养育了它。...
一直在使用del.icio.us、furl.net、flickr.com和Gmail.com。很喜欢他们,因为它们是以标签为基础的个人服务,我用它,不仅仅存储了我的内容,更重要的,我从那些个社群中,高质量的获得知识可见范围的扩展,丰富了我的学习内容。
从作为个人内容存储角度来讲,以标签的方式要比以目录的方式来管理更贴近个人因而也更加容易使用。再以目录为基础的存储体系中,目录结构必须要事前规划,否则积攒到后来会乱的一塌糊涂一致崩溃。但是在学习领域,面对未知的东西,怎么可能事先规划妥当呢,即便有了规划,并循着这种规划指导自己的内容管理,会失去很多。
另外,标签和关键词比起来,除了更近乎个人的知识体系之外,在功能上也强大的多。标签和目录在功能上一致,而关键词却不同于目录,因此也不同于标签。
但是在信息的索引找寻上,标签和关键词却有相通的地方。关键词标注内容的主题,而标签则是在对内容的个人理解上的私人标注,未必针对的是主题,比如我可能关注的是时间,或者是内容中某个和通篇主题无关的观点。因此标签的设定要比关键词自由的多,也要方便得多,就好像我把东西到处乱放,但我总能找到我需要的东西。因为那是我自己地盘的坐标。标签就是自己关注/存储内容的坐标。
虽然是私人地盘的坐标,但是因为共同的知识基础和语言上的特征,这些个标记会成为不同知识空间的耦合点,好比不同维度时间之间的联通点那样作用。
正是通过这些点的存在,发现了其他的个人知识空间,于是在他人知识空间中的漫游和学习成为可能。因为不同的人有不同的点集,这就和现有的WWW同构了,只不过站点-页面/超链接的结构变成了个人-知识/标签。它是一个遍及所有成员的网,并且网的拓扑结构在不断的变化,因此使得我的个人学习也变得更有挑战性。
标签不只超链接了作为知识空间主体的个人。它更重构了网络上的信息,不仅仅是静态的结果,而是在时间上流动的重构。我订阅了好些标签的每日更新RSS。感觉对某个主题的学习因此突破了个人(比如只能和几个人学,只能跟着编辑)的局限,我获得了一个学习群体的成果,同时我也参与了这个群体的活动。有时候我想,del.icio.us其实已经不是个人的书签的存储,而是所有成员的共同存储,我把他们的书签也当成自己的。这种有我无我的状态,让我很自由。
--------------
最近很感兴趣两个会:SXSW 2005和CeBit2005。借助technorati.com的标签搜索,除了看到许多Blogger的记录之外,同时看到了大量发自现场的照片(1、2)。
虽说这些信息不能取代商业媒体的报道,但也成为我或许会议情况不可获取的来源,甚至比后者更让我有兴趣。
这种借助标签所展现的参与性媒体产生的内容,也可以算是我从这些标签服务站中获得的第四层好处吧。
”个人感觉,标签是一个对主题聚集的变体,但是用了一个更加平易近人的名字。类似E=mx2
第1页,共1页