2009年03月18日

《Ken :用IM聚合Web信息的知识组织平台 》http://hi.baidu.com/ygzw_ksl/blog/item/9be44394e891f40f7af480b3.html

欢迎评测!

2008年12月26日

    引子:任何流行到如Web这样的社会基础设施程度的系统,都一定不是“莫名其妙的”,一定是有内在规律的。本文试图就Web的发展从社会性角度做一分析。

    有些计算机人很搞笑地以Web没有啥高明算法来否定Web系统的“科学”价值,也许可算做计算机领域的最大悲哀了。社会性系统要从社会角度,而不能算法角度来分析,Web因为符合了社会发展的规律性,所以才有了Web今天的伟大局面。

    简单来讲,社会发展包含2个方面:物质方面,如今天的商品极大丰富,意识方面,如今天的信息资料极其繁杂。从功能性角度讲,意识方面的社会作用和意义更大些,因此知识学习才成为现代人所必备,现代人花在知识学习上的时间与精力金钱也越来越多。Web在社会意识共享与发展方面所起的作用不容置疑,Web社会价值几乎无穷大,单单一个google公司就值几千亿。

1 Web之前

    现代社会,信息极大丰富,人们要花很长时间来学习和阅读信息。实现计算机数据通信的互联网已经成熟,文件共享服务器ftp很是盛行。当时人们是这样阅读论文的,从 ftp上下载论文,以及平均40篇的参考文献。理解一篇论文通常要在这41篇文章中不断地切换阅读界面。这个频繁切换的动作浪费了大量时间和精力,往往搞得读者痛苦不堪,无心看书。

    由于深受其苦,发明人搞出了Web系统,让人们摆脱掉“频繁切换”的麻烦。

2 Web1.0  

    Web1.0时期从Web诞生,到门户崛起。其描述性语言,让人们节约了大量的信息阅读时间。事实上,Web之后,人们花在阅读上的时间更多了,而阅读量也大大提高了。

    Web1.0时代,与报纸、杂志、图书一样,网上资源通常由记者、作者撰写,质量还有个保障。专业作家和记者人数有限,Web资源与信息内容的数量也就逐步增长。

    门户网站,是一个特大型的媒体,比一般的报纸杂志和图书包含了更多的信息内容,使得人们可以找到更多资讯。因此访问门户网站的人就很多。

   网络的即时性、低成本性,决定了Web的快速流行。前者节约时间,后者节约金钱。有人说只有“花花留着的”时间和金钱才是现代人所真正稀缺和追求的东西了。

3 Web2.0  

    在Web1.0时代,只有传统的作者和记者才有发言权,才可以撰写资源信息和内容。而发言权是人类社会文明的一个基本追求,人人都想要发言的,因此Web2.0就出来。

    在Web2.0里,人人都可以发言了,人人都可以上传资源信息和内容了。导致Web信息总量指数增长,质量也没有保障了。此时的门户网站呢,就不再聘用专职记者作者了,而改为聘用编辑了。编辑从大众贡献的Web资源里选择出高质量的内容,收录到门户里来,以吸引更大的访问量。

    Web2.0时代,因为人人可以共享资源,导致陷进多多,病毒横行,垃圾遍地,人们要找到适合自己的信息很难哦。

4 Web3.0

    在Web2.0时代里,人人都可以写文章发布资源了,社会发言权也就从传统的记者身上转移到了传统的编辑身上来了,因为只有网站编辑才可以决定门户里收录哪些内容。如同Web1.0时代作者数量有限,不能满足全社会所有人的阅读需要,Web2.0里编辑人数也有限,也同样地不可能满足全社会所有人的需要。

    所以有必要开放编辑权限给全社会的所有人,如同Web2.0里开发作者权给全社会的所有人一样。

    在我们的知识界系统里,人人都可以编辑自己的书包,添加自认为有价值的知识条目。这是发言权的表现。

    另一方面,人人可以阅读任何资源信息与内容,而这些内容收录在别人的书包里。因此,人人都可以订阅人人的书包。

    在这个系统里人人可以编辑和发布自己的书包,人人 可以订阅人人的书包。显然地,基于IM来实现就是再自然不过的事了。

    因此在Web3.0里,传统门户网站将演化为知识库系统了,人人都是知识的创造者,也是知识的分享者。网络将真正地发育到“个人门户”阶段。

5 Web3.0分析

   在Web3.0系统里,人人可以写文章发表资源到原Web2.0系统里,人人也可以收录自己所创造的信息到自己的书包里–称收录进书包的信息为知识条目,人人可以通过IM系统订阅别人的书包–称书包为知识载体,如同数据表是数据记录的载体一样。

    个人订阅了很多自己需要的别人所创造的书包以后,就组成为一个自己个人所特有的知识库系统了。而整个IM系统里的所有书包,所有个人知识库,就组成为一个单位“域”的知识库了。

    Web3.0本质上是一个IM知识库系统。在社会中,企事业单位是知识主体,Web3.0也应该是一个单位一个单位地部署的。知识界系统就是就是企业即时通信(EIM)的增值系统。

    事实上,企业不是IM主体,因此EIM没有大发展,企业是知识主体,因此企业知识库(EKB)必然大发展。

6 Web3.0后新技术

     Web3.0后,有2个技术将大发展:1是rss技术,rss将成为网络应用的基本数据结构,如同数据表树图那样。2是拟人化技术,现在的网络资源仍然是人写并贡献的,未来机器将更多地贡献网络资源,如汽车“黑匣子”即时传送实时状况数据给在线服务机构,病人检测传感器直接上传网络信息给医院等等。

    再往后,一个IM域,就是现在openfire(xmpp服务器)就是一个知识主体,一个自动驾驶汽车等都会部署一个知识库系统,域里面的众多计算机终端系统相互协作,对外表现出整体智能。这个系统也叫“知识分配”。如果有人知道UEFI项目的话,知识分配就是UEFI上的那个“操作系统”了。

   再往后,就到了我的“语用网”系统了,天下归一咯。

2008年12月16日

http://hi.baidu.com/ygzw_ksl/blog

2008年11月26日

http://jshope1.gicp.net/zinan.html,到这里来下个试用看看吧。

2008年06月22日

    我一直在思考着给自己的那本计算系统图书取个有意义的名字,今天想到了“智慧共享”应该可以概括我的图书名称,而“知识共享”则是狭义产品的名称。

    智慧共享是计算本质。人类发明计算机及网络系统,以及计算理论与技术的未来发展,其目标统统是为了更好实现人类自身的智慧共享。

    软件工程的目标是为了模块共享,模块不正是软件人所创造出来的智慧物吗?实际上,软件系统、计算器具,乃至人类的一切工具,都是人类智慧的产物,社会自身不也正是智慧共享的产物和场所吗?

    那么,计算理论就是人类智慧共享模型,而计算技术就是更方便实现智慧共享的系统方法论了。

    这里有2个密不可分相互依赖相互促进相互发展的问题:一个是“什么是智慧”,另一个是“智慧共享方法”。什么是智慧?百度里解释智慧(http://baike.baidu.com/view/2649.htm,有必要预先阅读下百度里的智慧解释)为知识体系,是指人类社会发展而来的全部智力成果。知识是智慧的凝结,知识表示与知识描述是其核心问题,也是计算机系统技术的主要问题。

    程序语言是人们发明出来的智力表示与表达方法论,而软件模块是软件工程师的智力成果,属于知识范畴了。

    集人类智慧之大成的Web系统也是智力表达方法。Web包括Web系统结构和Web上的信息内容2个部分,此时的智慧突出表现为Web信息资源。Web系统结构是“信息共享方法”,是计算机系统技术的突出成果。

    理解Web之后的计算模型发展,就得理解Web之后的智慧表达,以及适合该表达的共享方式。RSS与OPML正是基于Web信息资源的智慧表达,而我们的KSL系统正是RSS与OPML的共享方法、即系统模型。   

2008年04月21日
    物理世界里的人集聚成群包含由简单到复杂的这么5类:闲聊群、游戏群、交换资源群、交换知识群、协同工作群。群是社会单位的统称。
 
    群的组织形式越来越高级,群成员关系越来越密切。越复杂的群,其组织成本也越大。闲聊群的组织成本最低,协作群的组织成本最高。
 
    网络是人集群工具,可以极大地降低人们集群的组织成本。
 
    因此各种网络应用工具大行其道,社会价值无法估量。例如支持闲聊的QQ、msn,盛大、联众等各种网络游戏,阿里巴巴、eBay易趣等商务系统。
 
    网络里的资源都是信息,交换物质资源的电子商务系统,实际上就是网络信息的维护、组织与交换系统。
 
    电子商务系统极大地降低了人们交换物质资源的社会成本,因而具有很大社会价值。
 
    现代社会早已不是资源社会,而是进入了知识社会。知识是现代社会最有价值的部分,所以现代人一生中的大半部分时间、精力和金钱都用在获取知识上面了。比如你我,一般都用20年以上的时间来专门学习知识,还用尽一生来提高知识。所以说获取知识的代价极高,社会成本极大。
 
    因此,我们如果用网络来极大地降低人们交换知识的成本,那么该系统的社会价值自然要比电子商务等系统大出许多倍来了。
 
    这就是我的 ksl知识共享网络系统项目的初衷。
 
    知识是系统化了的信息,是先人们对信息千锤百炼后的有序状态。知识是对信息的一个加工,一个社会加工过程的结果。社会加工是一个有效性的过程,或者说社会加工是一个效益优先的过程,因此也可以说知识是有效信息的有序集合。
   
    社会加工过程的“千锤百炼”指的就是“Web资源–rss聚合Web资源成网书–opml个人聚合rss网书为知识–ksl人际间分享opml知识–个人创作发布Web资源”的不断往复循环。
 
    所以我说,我构造出ksl网络来的目的就是为了满足人们在访问Web信息时“远离恶意信息,避开垃圾信息,获取有用信息”的需求的。
   
    评论:这里的群不是指遵从惯性系统的计算集群,而是指现实社会里的人民群众–遵从相对论。群是社会的表现形式–模拟的是社会组织与社会单位,群是社会存在(society ontology),群与社会符合特殊与一般的哲学关系。计算机人翻译“ontology”叫“本体”,他们还叫“社会存在”为“本体论”。因此群是一个非常重要的概念。这个群就是QQ里的群概念,是ksl网络里的知识主体和知识的存在环境。“群 + 人际关系 = 社会”,是我定义的虚拟社会模型。
     “社会存在”是一个外来哲学词汇,理解它需要搞懂外国哲学,比较麻烦。汉语也有个类似的词汇,叫“典”。“典”除了有“社会存在”的“普遍适合”意思外,还有“公认权威”的意思。KSL将自然发展成语用学里的“语用单元典”。
2008年04月15日

        其中红色部分就是我所实现并在这里阐述的。

        经典物理观就是笛卡尔物理观,笛卡尔提出的以解析法实现的惯性参照系是近代科学的“始祖”。因此人们常称机械性思维叫惯性思维,笛卡尔坐标系是解析几何的核心。

        整个第一行的经典世界,应当算是完全已知的了,人们都叫程序语言为语义学语言。惯性空间解决的是人们所共有的一致性的问题,而相对论世界的辨证法则是解决个性化的问题,即所谓的个人偏好,如喜恶的适合性。在知识管理理论里,称适合性为“在最需要的时机把最需要的信息资源分配给最需要的人”。而在我之前的语用学还是未正式(完全)从哲学里分离出来的萌芽科学。

       问号部分就是前沿物理科学家们所探索的“量子论”世界。Petri老人家说网论是用计算机语言表达的相对论,那么用计算机语言表达的量子理论就是我下一步要阐述的内容了。

      评论:人类已知的物理世界模型,目前就只有笛卡尔物理时空观、相对论和量子论3个逐级抽象的系统。所有其他人的所谓系统,都只是它们的一个部分或子集,或者就仅仅是系统方法论的一个子集与方面。    居然当今还有人把系统分为线性科学(或数学)与非线性,该理解是错误的,分析如下:1、分不清数学与科学的关系;2、线性只是最简单的多项式模型,如此分法在原始人古时代或者情有可原;3、机械化、惯性系、形而上学,算术(或计算数学)、解析法、几何观,笛卡尔世界观、牛顿时空观,图灵机模型,算法分析与设计学,软件工程、程序设计,以及语义学等等的所有这些学科与概念,研究描述和揭示的统统统统统统统都是一个同一的事务(的不同方面);4、相对论,辨证法,语境与语用学,网论(世上只有Petri的网络对头,其它全是忽悠人的东西),知件工程,理论数学等等学科与概念又是另一个同一事务(的不同方面)的研究描述。

2008年03月23日

网络运营商的基本类型

互联网发展至今,已经有了多种不同抽象级别的运营商表现形式:

1、数据通信网络运营商:提供数据交换的硬件基础平台,就是三网合一的电信系统啦。电信服务商支持人际间的数据通信联系。这是一个p2p(人与人交换数据)支撑系统,核心是信号编码、数据格式和通信协议(如TCP/IP)。

    人际通信,顾名思义,是人与人之间沟通信息的手段,如手机短消息。有些如单位推广员的通信者发觉自己老是每天都在重复着回答几个固定的问题,不厌其烦哎!那么对于重复性的场合,计算机就派上大用场了!用计算机代替这个推广人员来提供给人们若干已知信息,是恰当的选择。如此就诞生了下面的信息运营商了:我们称这个代替推广人员提供公共信息的计算机系统为信息服务器,而拥有和维护信息服务器的机构就是信息运营商。

2、信息服务网络运营商:提供信息互联的Web运营商,就是所谓的“内容与应用为王”的Web服务系统。Web服务商收集人们发布的数据信息资源(如网页数据),提供给人们共享。特点是运营商往往有一个大的数据存储信息内容管理系统。信息运营商通常以数据信息的拥有量、及其访问的用户量(俗称点击率)为评价和衡量标志。Web系统目前正面临“垃圾信息淹没、恶意信息猖獗”的困境。

    基于信息服务器的Web系统就是所谓的B/S结构了。上面讲到,计算机可以代替数据通信系统里的自然人而成就了信息运营系统,此时是自然人来直接访问信息服务器的。我们也可以让计算机来代替自然人访问信息服务器的啊,当用计算机来代替自然人访问信息服务器时,我们就称这个信息服务器里的信息为服务–Web服务了。因此信息服务是很自然一体化的。

3、知识管理网络运营商:我们研究并提供的知识共享的KSL运营商,正是解决信息服务困境的,我们构造并提供给人们共享有用信息的系统平台。我们称这里的“有用信息”为“知识”,特点是运营商通常有一个大的RSS“网书馆管理系统”。这里又是一个p2p(人与人交换OPML)运营系统,核心将是规划Web资源的“本体论”,这里所指的“知识”所规划的内容恰就是Web系统里的数据信息资源(如网页)。“本体论”是“知识”的存在方式,或者说“本体论”即为“人文存在”。

    从信息服务系统发展到知识管理系统,是一个质的飞跃,不容易理解,如同从ftp系统发展到Web系统是一个质的飞跃不容易理解一样。Web用超链接来模拟实现了客观世界的普遍联系性,是其系统本质特征。人类的一切认识都可以表达进Web系统里。具体参见这里的“Web3.0综述”。不可避免,随着信息量的增多,“垃圾信息成灾,恶意信息泛滥”,具体参见上2篇博文。导致现在人们获取有用Web信息变得越来越困难了,知识管理系统就是解决人们的这个问题的,具体参见上1篇博文。知识系统的本质特征是模拟实现主观世界的普遍联系特性,将不可避免地导出“计算大革命”,如同几百年前的“工业大革命”。

    KSL知识管理系统实现“共享个人书架”功能,该个人书架将直接被集成进“个人书桌”里去。个人书桌由KSL知识系统和实现编辑功能的个人创作系统组成。给不同人群使用的不同书桌将包含有不同的创作工具,如Doc、音乐、影视等。创作工具也可以是一个车床机床系统,此时个人书桌将成为个人工程系统,而重复操作个人工程系统一定也很枯燥乏味,将不可避免地被计算机所取代,如此就诞生下面的“知识计算系统”了。

4、知识计算网络运营商:也叫聚合计算运营商,或者聚合计算操作系统,基于UEFI的实现全球自动化的那个操作系统,就是语用网系统平台。聚合操作系统可以把网络里的零碎计算力和数据碎片聚合起来“协作”成为一个整体计算机系统。聚合计算系统也是一个p2p(机器与机器交换各自程序运行所需要的数据)系统。聚合就是RSS与OPML里的聚合意思。

    如上所述,“知识计算系统”是由KSL知识管理运营系统自然发展演化而来。在我始于2003年底的不断推广之下,Intel于1998年即启动了的EFI项目被几大机构上升为UEFI联盟了,UEFI将直接支撑我这里所讲的知识计算操作系统,如同BIOS支撑现下的软件计算操作系统一样。

2008年03月19日
互联网具有以下特点:
1、网络上信息良莠不济,有效信息比重正趋于零。
好的正确的真实有用的信息约占5%,坏的错误的虚假有害的信息,比如虚假金融网站或虚假电子商务网站,也约占5%,更多的则是不起作用的过期垃圾信息,约占90%,随着时间推移,垃圾信息会越来越更多。
信息总是有时效的,有效期过后,有用信息就会变成垃圾信息。生产者知道信息已然失效,成为垃圾,但没有义务删除垃圾信息的制约因素;再者信息的存储方要追求拥有大量信息,因为网络财富的标志是信息拥有量、而非有效信息量,从而导致服务器往往拒绝删除垃圾信息。长此以往,互联网上的垃圾信息越积越多,有效信息必将被垃圾信息所淹没。
假设信息有效期为1,信息生产量随时间逐步增长,与时间有关,设为i,那么在第n个有效期时,有效信息量为n,垃圾信息量为1+2+…+n-1= nn-1/ 2。有效信息量占全部信息量的2/(n+1)。因此随着时间推移,有效信息的比例将趋近于零。现状若不改变,互联网终有一天会变成垃圾场。
2、信息本身不能表明其自身的真伪和是否有效,只能由人来鉴定。
一个失效租房信息只有通过联系后才知道被出租出去了;即使被发布方标明失效了,也需要浏览者阅读过才知道。这些垃圾信息浪费了浏览者宝贵的时间与金钱。因此隔绝垃圾信息,从垃圾信息的海洋里甄别出有效信息,并把有效信息聚集起来以供需要者浏览的工作就显得尤为重要了。
3、有害信息越来越多,恶意流氓信息产业化。
由于互联网的无国界性,网上有害信息得不到有效遏制和惩罚。加上恶行能产生巨额利益,因而人们必然趋之若鹜。虚假金融网站让网银损失惨重,虚假电子商务网站的猖獗迫使淘宝发起网商联盟运动,更有恶意欺骗的网络交友信息害人性命。当前这些都发展成为一个恶意信息产业了。
世人都以为房地产是目前最赚钱的行业,却不知贩毒更赚钱,而比贩毒更赚钱、又比房地产轻松的就是恶意信息产业了,例如病毒、有害信息、网络陷阱、信息欺诈等在现今网络里的大行其道。
4、生产信息的成本越来越低,而鉴定信息的代价往往很高,甚至要损失金钱和生命。
Google搜索的结果中就有大量垃圾信息,也有不良信息部分病毒网站被自动识别出来,但不能自动鉴别内容危害信息,仅有5%左右的有效信息。
一些欺诈网站甚至大胆利用Google等系统来做关键词广告,诱使人们受骗上当。现状若不改变,互联网终将成为犯罪的乐园。
因此如何在浩瀚的Web信息海洋里,远离恶意信息,避开垃圾信息,获得自己真正需要的有用信息,就成为摆在互联网信息科学家们面前的迫切课题了。
5、技术变革势在必行。
互联网已经成为人们现代生活不可或缺的基础性信息工具了,人们不可能离开正越来越依赖中的网络生活。但人们又一定不会愿意接受互联网正日益成为垃圾场和犯罪乐园的事实,因此技术变革成为必然。所以解决互联网以上问题的KSL技术系统必然会被接受并流行起来。
Web发明人说Web的流行是因为有利于共享信息资源,那么RSS-OPML-KSL必将因有利于共享有用信息而流行起来。其中RSS是“推”Web资源技术,OPML是“推”RSS技术,KSL是“推”OPML的人际关系网络技术。
2008年03月13日

服务器坏了,修改了的图片传不上来了。 这个blog系统维护出故障了

具体图片请参阅http://bbs.w3china.org/dispbbs.asp?boardid=57&id=59921

    马云,阿里巴巴的主人,成功地搞出了电子商务模型系统。深刻地影响了互联网的应用与发展。马云是我们互联网时代的英雄豪杰,必将成为历史上的正面代表人物之一。
    马云认为,互联网是逐渐深入地影响人类生活的:在"web1.0"时代,只有以雅虎与新浪为代表的门户网站系统,网民只能浏览网页,被动接受信息;在"web2.0"时代,qq\msn等虚拟网络社区大行其道,通过网络发展人际关系,从网民转化为网友,网友间以游戏娱乐关系为主;在"web3.0"时代里,阿里巴巴、淘宝等电子商务系统成为主流应用,人们在网上做买卖,买进卖出,网络成为人们生活财富的基本途径之一。
    那么,人们在网上浏览游戏和生活之后,互联网还要怎样发展呢?我以为教学科研是必然。人们将通过网络学习交流一切媒体资源,此时网络将发展进入网生时代,网生包括网上学生和网上先生。实现网络资源规划的本体论就是"web4.0"了。所谓本体论就是把网络资源建设为一个全能的图书馆系统;本体论是google和百度这样的资源搜索系统的下一代技术,也是我语用网的基础设施;就是我需要通过一个如同QQ、msn等的p2p即时通信系统来分享rss\opml信息的ksl系统。本体论的价值应该比百度与google等关键字搜索系统的价值之和高一个数量级。
    当然的,“web5.0”就只能是语用网了,语用网里,一切事务性的工程工作都将由计算机系统完成,互联网上的所有计算机系统实现自动通信,有效协作。人们将不再需要从事今天所谓的工科领域,所谓的工程师的工作都将自动实现并完成,从而导致一切物质资料的边际成本为零。人类的物质世界将由计算机自动实现,人们高度依赖自动系统。因此我称此时的人类为网魂,遨游在网络里的灵魂。