2008年12月31日

今天是2008年最后一天。京都,艳阳高照,空气寒澈。

中午起床后就直接去超市购物,储备粮食,准备过个日本新年。

走出超市大门的时候,我手中已经多了一个10斤重的大包裹。

穿过两个巷口,准备转弯的时候,感觉一丝冰凉划过脸颊,抬头一看,似乎是下雪了。

但是,雪花很小,几乎看不到。

出着太阳,下着雪,这种奇观不是第一次看到了,上周在立命馆大学内就碰到一次。

也许这在日本挺常见,但在中国国内,我是从来没见过。

可惜,今天的雪太小了,还没有落到地上就融化了,只有偶尔飘到脸上的才让人感觉到。

我还真希望京都下点大雪,据说这也是京都的一大景色之一,如果真下了,难道又要去一次岚山?

哈哈,有待考虑。

2008年12月26日

本来想在那个科学网安个家,结果人家不批准,只能继续待在这里。

这个博客开设已经两年了,一直以来我都没有好好经营,想到什么写什么,主题看来有点混乱,所以定制浏览量总是忽上忽下,最高时接近200,目前大约60~100.对这个数字我倒并不在乎,我只是想记录点东西,关注的人我想也是同行。

博客到目前还不是一个规范的科学交流平台,所以很多同行并不写博客,主要原因可能是中国的抄袭现象还是很严重的,特别是科研领域,你的一个好点子可能无意中就成为了别人的研究起点,思想被剽窃了,你还不知道,所以靠科研创新吃饭的学者们开博客的相当少。

其实,我倒不这么想,科学研究的目的在于创新和发展,把好东西放在自己脑子里不如拿出来分享,于人于己都没有坏处。博客是一个thinking in writing的世界,写作的时候会促使你思考,无论内容是否严谨,你都可以发表出来,当作一个交流,这也正是博客的特征:口语化的记录和发表。所以,一直以来我宁可通过博客把不成熟的观点写出来,也不愿意为了一个所谓的创新而仓促的写作一篇论文发表在正式期刊上误人子弟。

写到这突然想到,如果我们不要求硕士发表正式的论文,只要他们发表点博客就可以毕业,是否可以提高我们学术期刊的水平呢?这个结果我无法判断,但我肯定,我们的期刊水分会被压缩,知识型博客也会繁荣。

还是那句话,有些东西需要沉淀,该发表在博客上的就发表在博客上,能发表在期刊上才发表到期刊,别混在一起都向期刊投稿。

2008年12月25日

1、引文稀少、构不成知识链条,不利于读者扩展阅读,甚至无法评价文章的价值,不利于学科发展和积累。

2、题目与内容不一致,有的文章本来就是一个。。。。综述或者进展,作者却使用。。。。研究,故弄玄虚,误导读者,看着题目很好,再看内容没有任何创新。

3、分不清引用还是自创,有的文章内容都是别人的思想和原话,却没有引号和引用标识,让读者搞不清楚那些算是作者的原创贡献。

4、不遵守科学发表规范,有的文章中的图形是其他人论文中的图形,作者在引用这种图形必须取得原创者同意,以及在文中加以说明图形来源,但很多文章作者都没有这么做。

这些弊病可能不是那个学科独有的,很多学科都或多或少的存在,这也正是国内期刊水平整体上不高的原因。

2008年11月23日

今天看到方文山在北大的一个演讲稿,深有感触。

目前我在日本,有几次和朋友聊天都谈到一个问题,日本的城市中,街道和房屋的颜色都很素雅,而且色系统一,很少有颜色特别突兀的、刺眼的建筑存在,整个城市感觉很有规划(注意:日本的住宅都是私人的)。反观国内的建筑,似乎是没有任何规划,至少在颜色和风格上参差不齐,各具一格,完全没有协调性,说的难听点就是乱七八糟(注意:我们的建筑可都要规划部门审批)。这种巨大的反差让我很不舒服,到底这是怎么回事呢?不讲和谐和集中规划的国家比我们这个处处讲和谐和集体的国家更知道如何和谐统一,多么大的讽刺。

这个问题说的大点就是关于个性和共性的问题。

日本是一个西化的社会,从其文化上看是十分推崇个性的,从他们衣着服装上就看的出来,各种奇装异服都可以在大学校园内看到。从出版物的内容上也可以看到这一点,这个国家并不讲什么是主旋律,所有出版物的内容都由市场决定,所以出版主题五花八门,似乎没有什么共性。但是,实际上,这个国家很看重共性,或者说这个国家的文化里对共性很认同,仅仅从其城市建筑风格上就可以看的很明白。此外,这个国家拥有众多的民族服饰,在重大节日里,他们都会穿出来,显现出某种共性存在。

再反看我们国家,处处都讲集体主义,讲和谐统一,也就是说我们十分看重共性,但在我们的文化深处最缺乏的恰恰就是共性,仅仅从建筑风格的混乱上就可见一斑。

谈到这一点,不得不说与之类似的一个现象,就是制度和行为的问题。所谓制度就是大家共同遵守的一个行为约束条例,比如交通规则,目的就是让大家在行为上存在共性,中国并不是一个缺少制度的国家,但是大家往往并不遵守制度,私自行动,比如违法行车。说开点就是,我们总是制定很多制度,寻找共性,而在实际行动时,我们又常常尊称个性,强调“不按规矩出牌才能赢”,结果导致我们的制度都是形同虚设。

而在日本,没有人强调什么是主旋律,强调什么是共性,但他们总是默默遵守共性的东西,看看日本人对交通规则的遵守程度就知道,这个国家对集体一词的理解程度比我们有过之而无不及啊(尽管我们是最强调集体主义的国家)。

为什么我们华人在口喊集体行动,协调一致的时,个人都打自己的小算盘;为什么日本不喊任何口号,却自觉的遵守某个一致的规则呢?

这是隐藏在我们文化深处的根劣?还是我们的文化和教育系统出了问题?

2008年11月19日

杨致远的辞职是无奈之举,它标志着yahoo这个巨人的转身并不成功,或者说依靠昔日的光辉已经不再能够支撑这个巨人的庞大身躯,门户已经彻底走下神坛,告别了昨日辉煌。

这样一个落幕,不仅仅是yahoo自己的事情,也意味着互联网经济的转型,门户经济已经开始落伍。大众已经开始从门户逐渐流失,大量新兴的web2.0网站吸引了更多用户的注意和时间,门户走向衰落已成必然。

远的不说,就看sina首页上越来越多的与“情色”相关的链接标题就表明,sina的用户流失率恐怕不比yahoo差多少。大量的用户都只看新浪首页的内容,而放弃了深入浏览,这是因为互联网上产生了越来越多的新鲜服务和应用,例如博客,sns等。用户在门户上的消耗时间直线减少已成必然,门户的利润下滑当然也不可避免。

从Alexa统计绘制的最近的一个SNS用户分布图来看,互联网应用服务网站进入新的战国时代,各种类型的SNS层出不穷,全世界范围内,也没有一个SNS可以统领全球,即使是Facebook,也没有得到全球的青睐,实施上SNS表现出的地域性十分明显。美国网民似乎喜欢Myspace,日本网民喜欢Mixi,中国网民则更喜欢校内。

这一表现说明互联网正在和现实世界链接的更加紧密,所以其区域性愈加明显。从这一变化可以预测,未来的商业服务将是全球化和地区化并存的,也就是说电子商务的市场拓展应该更加聚焦于本地市场,而非全国和全球。

 

2008年10月14日

长期以来我对百度的态度都是喜忧参半。喜的是李彦宏同学毕竟和我一个专业,搞情报出身的,对信息搜索有那么点灵性和感觉;忧的是这个公司创新能力并不怎么强,而且在外文搜索和专业搜索上能力太差,它似乎更适合普通市民搜索点生活信息,而不适合专业人士搜索知识,所以长期以来,我只有在出租房屋的时候才使用百度,平常很少用到它。

除了以上的评价外,我对百度并没有额外的看法,但是最近的一篇文章令我实在是不吐不快。《南方日报:公关屏蔽只会捅出更大丑闻》这篇文章暗示出百度目前很有可能正在从事“公关屏蔽”业务。看完这篇文章,我不得不承认:在中国互联网界,没有做不到,只有想不到。

“公共屏蔽”这个词绝对算得上一个新鲜词汇,而且是只有在互联网时代才可能出现的词汇。遗憾的是,这个词一出生就带有令人厌恶的色彩。尽管目前这个词还没有一个专业定义,对于媒体界和信息界,它的本质确实清晰的,既利用部分组织借用网络技术对大众本应自由获取的信息进行人为的过滤。

从法律上将,这种行为本来是政府有能力和有权利做的事情(事实上,政府也不应该拥有这个权利,特殊国情除外),现在却被百度这样的搜索引擎公司给发扬光大了。真是令人感到意外,百度在商业模式上的创新竟然是以侵犯人权为基础的,还给自己标榜清白和无辜,可事实是什么呢,你自己按照这篇文章的提示搜索一下“创维电视 不合格 伤害了谁? ”就知道了。

好了,事实已经很清楚了。在中国,“公共屏蔽”行为并不是百度独有的行为,甚至某些与政治相关的公共屏蔽行为也是被逼无奈,可现在百度却习以为常(联想三鹿事件),甚至借用自己的垄断地位(在中国,百度在搜索引擎上的市场份额已经远远超过其他搜索引擎,如果信息市场存在垄断行为的话,这就是典型的垄断)左右大众的耳目,把政治领域的把戏引用到了经济领域。这是个可怕的事情,如果任由这种商业模式存在甚至流行的话,我无法想想,搜索引擎——这种新型的数字媒体给我们呈现的拟态社会将是怎样的一个虚幻世界。

百度啊,你的道德底线在那里。

我曾经在一篇文章里提到,从数字出版的角度来看,搜索引擎绝对算得上是一个新型的数字媒体,只不过它的出版模式很特殊,是一种索引式出版,也就是,它并不生产任何数字资源,但它对数字内容进行自动编辑和排序后,生成了文件索引,然后在向用户提供个性化的服务。不管技术后台多么复杂,搜索引擎不过是在做一个简单的索引式出版服务。

在互联网时代,网络媒体,特别是搜索引擎这样的入口式媒体对大众的影响里已经远远超过了普通的纸质传统媒体。我们今天近乎一半的信息搜索和获取都要依赖于搜索引擎,它已经成为了现在人类生存的基础。在这种背景下,百度——这种中国搜索市场上的霸主,这个新时代的公共的看门狗,你的角色到底该怎么定义呢?

百度,难道你不应该补补最基本的媒体伦理和商业伦理课吗?

2008年07月04日

对于一个网站运营商来说,注册量是一个命根,每每炫耀自己的时候,都会说我们的已有了多少多少万用户,比如3G门户放话说“我们有5000万用户”。

这个数字看起来确实诱人,如果拿这个数字和我们的2.8亿网民比较的话,确实可观,20%的网民都是它的用户。可实际真是这样吗?

当然不是,这5000万不过是注册量而已,根本不能代表实际用户数。

有数据显示,仅在中国,BBS和各种论坛的用户注册量就超过30亿,如果把各种网站的注册量全部算上,恐怕这个数字已经超过50亿。你这区区5000万,不过是1%而已。

当然,这5000万是否是真是数据还不确定,即使是真是数据,其中大部分都是过客,即注册后就从不登陆者,还有一批重复注册者,最好用实际活跃用户来算的话,恐怕也就10万个用户吧

当然,10万活跃用户价值已经相当明显,但是网站也不能总是拿5000万这个大帽子忽悠人啊。

2008年06月23日

复杂科学管理视角下的信息系统

 

从起源于19世纪末期工业制造领域的科学管理开始,管理思想一直伴随着时代的发展和社会经济的变革而处于演变和发展中。继以泰勒为代表的科学管理之后,以马斯洛和赫兹伯格为代表的人本管理、麦肯锡和波士顿为代表的战略竞争、以戴明为代表的日本式管理技巧和以彼得·圣吉为代表的学习型组织纷纷在管理研究舞台上亮相,“你唱罢来,我登场”。

面对繁华的管理丛林和频繁的思想变革,20世纪末期的管理学者开始对以往的管理思想史进行反思和总结,这种反思和总结多少带有批判的色彩,其源头是科学范式的整体性演化。科学哲学和认识论领域的学者在这场科学革命中无疑扮演了重要的先驱者形象,其对科学的整体性反思使我们认识到21世纪以前,还原论和分割式思维在各个学科舞台上都唱了主调,而进入21世纪以来,随着人类社会全球化和信息化运动的深入和渗透,世界联系开始越来越紧密,事物间的依赖程度也越来越深,社会系统的各个子系统间的互动也愈加频繁。由混沌论、协同论和耗散结构论代表的“新三论”正在取代由信息论、系统论和控制论代表的“旧三论”,而推动科学集体性进入一个崭新的历史阶段。

在新的历史阶段下,科学思维模式的变化集中体现为各学科对事物复杂性的认识的统一性。目前,包括混沌、秩序、混序、自组织、他组织、自适应等系统复杂性思维已经走下了哲学神坛,迈向了更广阔的物理学、经济学、社会学、管理学等场域。基于这种革命性背景,复杂科学管理开始走上管理学舞台,这是继科学管理、人本管理、战略竞争、日本式管理技巧、学习型组织之后的一个新的管理思想。本文力求应用这种新型的管理思想对信息系统在企业这个复杂系统中的角色、定位及价值进行重新解读和阐释。

一 复杂科学管理思想的诞生与其对传统管理思想的超越

1.复杂科学思想的提出

20世纪年代以来,人们逐渐认识到系统整体大于部分之和,系统具有层次结构和功能结构,系统处于不断的发展变化之中,系统经常与其环境(外界)有物质、能量和信息的交换,系统在远离平衡的状态下也可以稳定(自组织),确定性的系统有其内在的随机性(混沌),而随机性的系统却又有其内在的确定性(突现)。这些新的发现不断地冲击着经典科学的传统观念。系统论、信息论、控制沦、相变论(主要研究平衡结构的形成与演化)、耗散结构论(主要研究非平衡相变与自组织)、突变论(主要研究连续过程引起的不连续结果)、协同论(主要研究系统演化与自组织)、混沌论(主要研究确定性系统的内在随机性)、超循环论(主要研究在生命系统演化行为基础上的自组织理论)等新科学理论也相继诞生。这种趋势使许多科学家感到困惑,也促使一些有远见的科学家开始思考并探索新的道路。复杂系统和系统的复杂性这两个科学概念就是在这样的背景下提出的。

复杂科学(complexity science)是国外在80年代提出的范畴,主要是研究复杂性和复杂系统的科学。1984年,一批从事物理、经济、理论生物、计算机等学科的研究人员,在诺贝尔奖获得者盖尔曼(M.Gell-Mann)、安德森(PAnderson)、阿罗(K.Arrow)等人的支持下,聚集在一起组织了圣塔菲研究所(Santa Fe Institute,SFI),专门从事复杂科学的研究,试图由此找到一条通过学科间的融合来解决复杂性问题的道路。与此同时,乔治.梅森大学(George Mason University)的沃菲尔德(J.Warfield),麻省理工学院的森格(P.Senge),以及普里戈金(IPrigogine)、哈肯(H.Haken)等人也在探索复杂性问题,我国学者钱学森也于1990年提出了开放的复杂巨系统的概念。

复杂科学概念和研究范畴及范式的出现成为复杂科学管理思想诞生的大背景和汲取思想的源泉。和彼得·圣吉在《第五项修炼》倡导的学习型组织一样,组织(主要指企业)是复杂科学管理思想生长的温床,也是发挥作用的范畴。

2.复杂科学管理在组织定义的超越

复杂科学管理认为组织是一个能系统思维的大脑。这就是说组织具有智能结构,它包括三个层次:知识结构——组织具有基本知识;能力结构——组织能够应用知识解决问题;智能结构——组织能够应用系统思维模式整合组织内外机能解决问题。

这种定义综合体现了现代组织的复杂性,它超越传统的对“组织是一个黑箱”的浅薄认识,将能动性的自组织的能力赋予组织这个整体,从而摆脱了机械论的论述语调,使我们对组织的认识踏过了智能时代的门槛,为未来智能组织结构的建设夯实了理论基础。

3.复杂科学管理在组织本质认识上的超越

在组织本质的认识论上,复杂科学管理有如下认识:(1)社会层面上的复杂系统是具有思维能力的人介入其中的复杂系统。(2)该类复杂系统中的某些个体具有随机性、不确定性和非线性;个体之间相互影响、不断进化;系统本身及其组成部分受环境影响,即随环境的变化而变化;反过来,系统又影响环境。(3)该类复杂系统具有多层次结构,每个层次的经济利益通常并不一致,需要协调。(4)该类复杂系统的组成成分中具有智能,即其组成部分中含有专家的经验、智慧、思维。(5)该类复杂系统具有自组织性、自适应性和动态性。

在对组织本质认识上,复杂科学管理显然吸收了“新三论”的思想,它强调了个体复杂性和集体复杂性间非线性的关系,个体的随机性和不确定性是集体无序的来源,但在个体进化中,系统整体涌现出了单个个体所不具有的集体智慧,它是系统自组织、自适应和动态性的结果,体现了整体大于部分之和的系统论特征。复杂科学管理对以往组织本质认识的超越在于,它揭示了组织的复杂性,即组织不是简单的投入产出的函数,而是由具有思维能力的人之间的随机互动维持的介于混沌和有序之间的一种混序状态。在这里,传统的不受外界因素影响其生产能力的简单“黑箱说”被处于混序的进化的“大脑说”代替。

4.思维模式的超越  

复杂科学管理的思维模式是系统思维,包括:研究复杂问题的思考方式——系统思考;观察复杂问题的角度——从环状看因果,即在观察一连串的变化过程时,不是单向看因果关系,而从一个更大的循环看因果互动关系;分析复杂问题的思维过程——结构化、模块化思维,即从整体的视角,将系统中的各组成部件描述成若干个模块,找出因果互动关系,辨认哪些重要、哪些不重要;哪些事情应关注,哪些事情不必太重视,最后达到整合搭配的最佳平衡点。研究复杂问题的思维方法——融逻辑思维与形象思维于一体的视觉思考。

系统思维是以整体观为核心,强调通过对资源进行整合,以改变整个系统的产出,被整合的资源包括自然资源、社会资源、文化资源、体制资源等,它们都是可以推动经济持续发展的必要动力,由于特性的冲突,在这些资源间进行必要的整合必不可少,甚至成为组织生存和成功的关键。

系统思维方式像一座几层的建筑。它的基础由信息、控制、系统三论形成,包含着关于组织的理论所必要的工具。然后是与冯·诺依曼、冯·弗尔斯特和普利高津关于自组织的观念有关的第二层。对于这座建筑,复杂科学管理的补充是环状看因果,结构化和模块化思维以及视觉思考。所以说系统思维决不是一种单一的思维方式,也不是简化思维方式的对立面,它在整合传统思维的同时也进行了超越,其系统整体观、新资源观和整合论和互动理论都是在新的知识经济时代对社会复杂性提升的体现和反思。

5.研究工具的超越

复杂科学管理的研究工具有循环图、探索图、结构图。循环图用来描述因果互动关系,它将从一个更大的循环观察因果互动关系,体现从环状看因果。探索图以图画的思考方式即视觉思考,将对现实世界的直观感觉与智力理解连接在一起;将想象的创造力与直觉的技巧和分析能力整合在一起,帮助我们观察并了解我们面临的复杂问题。结构图用来解决这样一些决策问题:在众多要素(事情、备选方案)中,挑选出某些要素使整体达到最佳平衡点。结构图将问题清晰地描述出来,使得你能够结合目标,从整体的视角进行分析,找出因果互动关系,辨认哪些重要、哪些不重要;哪些应关注,哪些不必太重视,最后达到整合搭配的最佳平衡点。

以上三种工具整合了微观的观念和宏观的社会关系,既体现了思维的结构,又体现了复杂系统中各个模块的联系,所以相对于传统的管理思想和工具来说,在“思想—理论—工具”这条研究逻辑上走的更远、构建更完整、操作更便利。

二 信息系统复杂性及其进展

1.信息系统假设前提的再认识

我们生活的社会复杂性不断加剧,制度秩序也正在消散。复杂性科学管理的出现给我们提供了一个新的研究视角,它证明我们传统的经验和常识都有可能建筑在错误的假设之上。这些假设包括:

u      组织是一个简单的封闭系统

u      组织的经营环境足够稳定

u      在组织中,存在着一系列明确的杠杆

今天,这几个假设已被新的现实替代:

u      组织是一个复杂的“开放系统”

u      环境变化非常迅速

u      在组织中,并不存在简单的线性因果模型

在这种新的认识下,我们会得出以下推理,我们对企业的措施不一定会产生我们想要的结果,而简单的,比复杂系统的能量低的措施很快会被复杂系统同化或消解,只有能量高于复杂系统的措施,才有可能破坏复杂系统。因此我们可以得出结论:企业不可能通过渐变而成为好企业,企业的环境变化剧烈,使它赖于决策的预测和相关战略意图可能随时失去意义,从而使相应的战略和决策无法产生既定的效果。

以上假设及假设的变革显然对组织信息系统的建设影响深远,由于传统信息系统战略的规划都是以稳定的组织环境、组织结构和固化的信息流程为前提,所以信息系统本身的结构、功能、数据都是相对稳定的和不可变。尽管近年来中间件的发展降低了信息系统本身模块间的耦合性,提高了系统的灵活性,而敏捷开发的应用也大大压缩了系统规划与系统实施的时间周期,提高了信息系统对组织战略的反应速度,但系统建设者依旧没有认识到组织战略本身的复杂性还远远映射在对应的信息系统上,或者说目前信息系统的生态复杂性远远不及组织生态本身的复杂性。

2.信息系统的复杂性

哈克认为“任何自我组织、自我管理、有适应能力、非线性复杂的有机体、组织社群或系统、无论是物理、生物或社会行为,均能和谐地结合混沌与秩序两种特性”。尽管信息系统相对社会组织系统而言,它也是人造的、由人管理的系统,但这并不妨碍信息系统自身作为一个无机系统的复杂性的衍生,而这种复杂性也在不断增加,混沌特征也逐渐明显。

早期的信息系统以单机系统为主,其对环境和数据的要求是尖刻的,甚至输入设备是单一的、数据格式是固定的,系统间几乎不可能交换数据。这样的系统结构最稳定,系统内的“熵”最小。也因为如此,它的生命周期最短,退出历史舞台的速度最快。

20世纪80年代,信息系统走入内部网时代,计算机之间通讯时的噪声大大增加了系统本身的不确定,随着“熵”的增加,稳定的架构开始因为不断增加的适应其它系统要求的接口的增加而变得愈加解体。但此时的系统功能内聚度依旧很高,数据的分布式处理改变了子系统间的相互依赖关系,信息系统的生态体系开始出现,部分系统成为另外一部分系统的寄生体,总的来看系统复杂性急剧增大。

进入20世纪90年代,互联网和电子商务系统大兴其道。互联网是由对等精神建构的平等的非集中控制的网络。相对于传统的主从结构,它的去中心化结构带来的是系统控制权利和信息处理功能的分散化。在全球参与的格局下,信息系统的生态环境也更加多变,冲突也无处不再,如各种信息标准、数据格式、语言编码、文化习俗间的抵触和竞争等。此时的信息系统已经不再是独立系统,而成为万维网这个大系统中的多层子系统之一。基于互联网的信息系统的已经由封闭式的微系统进化成开放的巨系统,其复杂性和不确定再次增大。

如果把信息系统生态视作仅仅由路由器、个人电脑、服务器、光缆混合成的存在系统的话,那就大大降低了我们对信息系统复杂性的估值,因为“人件”是否真正进入软件工程和系统思维视野是评价系统是否进入进化队列的最显著标志。幸运的是,2004年以来,以互联网web2.0运动为代表的社会性软件的发展,消除了我们对此的顾忌。基于“人件”建构的社会性信息系统(如BlogDeliciousDigg等)的出现真正使信息系统成为了有机系统。

3.信息系统复杂性的进展

网络技术和信息标准可以说是相克相生的一对矛盾,技术的升级带来的是结构越来越复杂,而标准的诞生则让秩序越来越明显,所以说信息标准是人类对抗技术混沌并建立秩序的最重要工具。然而,信息系统与一般的系统并不完全相同,在信息被作为投入品被投入到信息系统中后,系统本身的“熵”并不是减少而是增加了,这与一般的信息的“熵减”作用正好相反。这种情况在信息系统实现开放体系和“人件”被纳入信息系统结构后得到改善。

由于纯粹的“物件”的可测性、可观察性、可确定性都远远高于“人件”,所以在“人件”进入信息系统,并成为系统的处理器的初期,系统产出的不确定性大大增加,但这并不表示系统秩序的散失。冯·弗尔斯特认为“由噪声产生有序”,普利高津通过不可逆过程的热力学,也指出“由无序产生组织”。事实上,在复杂的社会性信息系统中,“人件”的加入使系统的自组织能力得到释放,个体的能动性使系统在只有几条简单的规则下也能快速演化生成无数意向不到的规范,例如豆瓣(douban.com)中各种各样的小组的建立和小组之间关系的建立,都是由“人件”以自组织的方式构建。其中人件之间、人件与物件之间以及物件之间的“关系”取代传统系统中的“信息”发挥了“熵减”的作用,提高了系统的序化程度。

开放的、融合了“人件”的信息系统的复杂性体现在三个层次:对象复杂性、社会复杂性和生态复杂性。

1)信息系统的对象复杂性是由机械式信息系统到有机信息系统转化发展过程中产生的。传统信息系统的体系架构是静态的,即各功能组件之间的搭配组合关系是在设计阶段确定下来的、固定的,信息系统具有类机械系统的结构刚性,因此可称为机械式信息系统。随着信息系统以自顶向下、逐步细分设计为主转化为以自底向上、逐步集成设计为主,信息系统各功能部件/模块的独立性越来越高,部件间的耦合度越来越低,从而为各部件自主交互、自由搭配组合提供了可能。这种可灵活改变部件间组合关系的、具有动态体系结构(结构柔性)的信息系统,称为有机信息系统。

2)信息系统的社会复杂性是信息系统由人为设计的系统发展为人参与的社会—技术混合系统得过程中所带来的。主体参与式架构把用户的行为、用户的自主决策机制和社会交互机制纳入系统设计,让来自用户的人力智能和系统的计算智能有机结合起来,并在系统内自底向上地形成各种社会组织、涌现出各种社会集合行为(Collective behavior)等。信息系统由纯粹的人为设计的对象系统发展为人参与架构的社会—技术混合系统,从而具有了社会系统的复杂性。

3)开放式架构让信息系统由孤立、封闭的系统发展到开放协作的系统,众多系统间的开放协作构成了错综复杂的协作关系网络。在协作关系网络中,每个信息系统有其特定的功能和用途,相当于生态系统中不同生态位的生物,不同的协作组合可以完成更大的任务,类似于不同生物之间的生态协作。随着信息系统越来越开放,信息系统之间的综合、混合与互操作越来越普遍,系统之间的协作关系网也越来越复杂,信息系统因此具有了生态复杂性。信息系统的生态复杂性并不属于具体的某个信息系统,而属于多个相互协同与交互的系统构成的系统(System-of-systems)涌现出的特征。

三 信息系统在复杂科学管理中的角色与定位

以上分析表明,在组织结构与社会环境越来越复杂的同时,信息系统本身的生态环境也越来越复杂。从传统的信息系统哲学来看,组织中的信息系统一直都是对人类组织系统的模拟,类似于自然科学中的生物仿生,人类利用信息系统对自身的信息处理活动进行了仿生,所以对于一个确定的组织内信息系统来说,组织的业务战略一定是其信息系统战略的前提和基础,然而由于多种原因(包括软件方法论、需求管理者、资金和技术等)的存在,两者总存在一定的差距,特别是在系统与终端用户之间矛盾重重,所以提高信息系统与组织整体战略和终端用户需求之间的匹配度,降低冲突和鸿沟一直都是信息系统开发者和研究者的终极目标。

伴随着组织形式的多样化,组织结构的变革更加频繁,业务流程的重组和优化的速度也大大加快。在这种情景下,信息系统业出现了相应的适应性改进,如中间件的发展增加了模块匹配上的灵活性,开放架构和插件模式提高了组件的兼容性,对象语言和数据库的使用提高了系统的通用性,然而这种灵活性的提升伴随的是系统复杂性的增加。似乎这种变化是直接模仿组织的结果,在组织及其环境越来越复杂的情况下,信息系统必然发生从低级到高级的演化。但是,在复杂科学管理思想指导下,信息系统在组织结构中扮演何种角色呢?如何应用复杂科学管理思想指导信息系统开发呢?这两个问题成为我们不得不回答的难题,特别是在复杂性刚刚被研究者认识,而还没有真正进入实践领域和系统建设者大脑的时候。

1.信息系统与组织系统的关系

从仿生的角度来看,信息系统是人类利用计算机硬件和软件技术对组织系统及其功能和流程的映射,两者并非平行对立的关系。信息系统从一开始就是组织管理工具和管理对象,随着信息系统在组织基础架构中的地位提升,因为其混和了多种生产工具的特征而变得难以描述。电子商务的出现让信息系统和组织战略的关系更加密不可分,甚至混为一体。在某些情况下,信息系统已经不再是简单的生产工具,而成为维持组织这个大脑正常运转和持续生存的“神经器官”。

从信息处理角度来看,组织是一个信息处理器,不管是从下向上的回报信息还是从上向下的发布命令,信息传递效率一直制约着组织反应速度和决策水平,进而影响了组织竞争能力和可持续发展能力。在金字塔式组织结构中,信息往往只能在垂直条状的渠道内上下流动,而难于自由地横向流动,这会增加组织的“熵”,最终导致组织发生突变危机。实施信息系统大大改善了这种局面,信息系统不仅加大了组织与外界环境的信息交换,还实现了组织内各部门间的信息共享,大大降低了员工获取信息的成本,在擦除组织等级差异标识中有效地抑制了系统内“熵”的增加,从而有利于组织的稳定和可持续发展。

随着信息系统对组织嵌入程度的增加,信息系统在组织系统中扮演的角色已经不是传统的物质工具所能替代的。它类似于人类大脑中的神经系统,为系统建立了良好的信息通道,在整体上为组织智能的发展提供了保证。

2.复杂科学管理思想对信息系统建设的影响

复杂科学管理作为一种新的组织管理思想,它的出现是对现实世界的适应性反应,必然对未来复杂信息系统的设计、开发与实施等建设各环节都产生重大影响,本文认为这些影响分布在信息系统的建设目标、建设思想和建设方法上。

(1)    建设目标上的影响

在知识管理逐渐受到重视的今天,复杂科学管理的提出及其对“组织是一个能系统思维的大脑”的比喻式定义使我们必须调整信息系统的建设目标——从信息系统建设转移向知识系统和智能系统建设。在建设目标上,还必须考虑系统结构的三个层次:知识结构、能力结构和智能结构。显然,面对这三层结构,如何跳出信息思维而建立全新的以知识和语义为基础的智能结构是信息系统建设者不得不克服的巨大障碍。如果成功跨越这个障碍,信息系统必将走入一个人机和一的智能时代。

(2)    建设思想上的影响

复杂性思维认为系统处于秩序和混沌的中间地带,其本在复杂性远远超越了目前的信息系统结构和数据所能体现的复杂性。为最大程度的模仿现实组织系统的实现仿生结构,“人件”必须被纳入系统规划设计,因为只有以人为中心的信息系统才能营造适合系统自组织、自适应和动态性进化的环境。

系统思维、环状看因果、结构化思维和视觉思考是复杂科学管理的思维模式,也是建设复杂信息系统的基础准备。虽然信息系统已经在模块化思想上走了很远,但用环状看因果的思维来看,信息系统不仅应该体现组织业务战略,更应该在知识经济时代主导组织业务战略,坚持在资源整合中,达到信息系统无处不在。

(3)    建设方法上的影响

复杂科学管理使用的工具是循环图、探索图和结构图,这三种工具分别适用于价值链表达、概念关系探索和模块化结构表示。虽然它们是否适用于信息系统编码设计还有待考察,其体现的微观与宏观相结合以及还原论和整体论的结合理念却对信息系统的设计方法提供了借鉴。特别是在信息系统战略规划上,如何将组织系统的各种外在复杂因素综合反应在信息系统内部,探索图和结构图提供了一个可能性桥梁。

3.信息系统在复杂科学管理中的价值再定位

在组织是一个“能系统思维的大脑隐喻下,有必要对信息系统在组织中的角色和定位重新定义。尽管管理思想的进步并没有直接带来信息系统结构的重构,资源的再配置却是不可避免。

复杂科学管理视角下的组织是一个处于混沌和有序状态之间的有机组织,它在知识、能力和智能三层结构转换和跳跃,内部的不确定性和非线性在自组织和自适应行为得到对冲和平衡,在结构化思维和整体观论中,组织内部的各种资源得到重新整合和互动。运用复杂科学管理的思维模式和方法,我们将营造一种新型的组织,在这种组织内权力和功能将更加下放、信息和知识将更加分散、全球化的业务单元间互动将更加紧密,对通讯和带宽要求将更高。无疑这种变化趋势会带来系统内部“熵增”几率的增长,而为保证系统的稳定,组织需要更多的信息和知识对不确定性进行消解。

显然,面对以上变化,信息系统必须在以往的角色基础上承担更大的责任,它将从人际间、系统间和人机间信息传播平台,发展到拓展人类智慧和能力的人工智能体。相信作为复杂系统的有机组成,信息系统在自身的演变中会不断成熟,其在组织中的地位也将更加重要。

4.总结

复杂科学管理思想是一个面向未来的、具有超前意识的管理思想,在对传统思想的超越中,它揭示了组织发展的趋势和未来蓝图。在这种视角下,信息系统在组织内的角色和定位必须得到重新思考和探索。幸运的是近年来信息系统及其生态环境的发展已经显示出其正在朝这个方向演进,这种殊途同归一方面说明了复杂科学管理思想的前瞻性,另一方面也预示在组织复杂程度越来越大的未来,组织管理实践和信息系统开发面临的挑战也将越来越大。

 

引文:

1.徐绪松,吴强. 管理科学的前沿:复杂科学管理. 光明日报,2005.5.10 

2.成思危. 复杂科学与管理.中国科学院院刊,1999143

3.埃德加·莫兰. 复杂性思维方式, http://www.dedu.ecnu.edu.cn/dongtai/20050327.htm, 获得日期:2007.1.1

4.邬焜. 关于复杂信息系统理论研究的思考. 江南大学学报(人文社会科学版),200551)  

5.金吾伦. 混序组织及其应用. 获得日期:http://doc.zoomquiet.org/skdata/20060926095540/

张树人. 从社会性软件、Web2.0到复杂适应信息系统研究. 中国人民大学博士学位论文,2006

2007年12月03日

数据挖掘的背景知识

  • 作者:赵敏  来源:爱诺为   参与评论
  •  
  • 什么是数据挖掘?
    数据挖掘能做什么?
    数据挖掘的商业背景
    数据挖掘的技术背景
    数据挖掘的社会背景  

    0.什么是数据挖掘?

    数据挖掘是从大量的数据中,抽取出潜在的、有价值的知识(模型或规则)的过程。 

    数据挖掘能做什么?

    1)数据挖掘能做以下六种不同事情(分析方法):

    分类 (Classification)

    估值(Estimation)

    预言(Prediction)

    相关性分组或关联规则(Affinity grouping or association rules)

    聚集(Clustering)

    描述和可视化(Description and Visualization)

     

    2)数据挖掘分类

    以上六种数据挖掘的分析方法可以分为两类:直接数据挖掘;间接数据挖掘

    直接数据挖掘

    目标是利用可用的数据建立一个模型,这个模型对剩余的数据,对一个特定的变量(可以理解成数据库中表的属性,即列)进行描述。

    间接数据挖掘

    目标中没有选出某一具体的变量,用模型进行描述;而是在所有的变量中建立起某种关系。

    分类、估值、预言属于直接数据挖掘;后三种属于间接数据挖掘

     

    3)各种分析方法的简介

    分类 (Classification)

    首先从数据中选出已经分好类的训练集,在该训练集上运用数据挖掘分类的技术,建立分类模型,对于没有分类的数据进行分类。

    例子:

    a. 信用卡申请者,分类为低、中、高风险

    b. 分配客户到预先定义的客户分片

    注意: 类的个数是确定的,预先定义好的

     

    估值(Estimation)

    估值与分类类似,不同之处在于,分类描述的是离散型变量的输出,而估值处理连续值的输出;分类的类别是确定数目的,估值的量是不确定的。

    例子:

    a. 根据购买模式,估计一个家庭的孩子个数

    b. 根据购买模式,估计一个家庭的收入

    c. 估计real estate的价值

    一般来说,估值可以作为分类的前一步工作。给定一些输入数据,通过估值,得到未知的连续变量的值,然后,根据预先设定的阈值,进行分类。例如:银行对家庭贷款业务,运用估值,给各个客户记分(Score 0~1)。然后,根据阈值,将贷款级别分类。

     

    预言(Prediction)

    通常,预言是通过分类或估值起作用的,也就是说,通过分类或估值得出模型,该模型用于对未知变量的预言。从这种意义上说,预言其实没有必要分为一个单独的类。

    预言其目的是对未来未知变量的预测,这种预测是需要时间来验证的,即必须经过一定时间后,才知道预言准确性是多少。

     

    相关性分组或关联规则(Affinity grouping or association rules)

    决定哪些事情将一起发生。

    例子:

    a. 超市中客户在购买A的同时,经常会购买B,即A => B(关联规则)

    b. 客户在购买A后,隔一段时间,会购买B (序列分析)

     

    聚集(Clustering)

    聚集是对记录分组,把相似的记录在一个聚集里。聚集和分类的区别是聚集不依赖于预先定义好的类,不需要训练集。

    例子:

    a. 一些特定症状的聚集可能预示了一个特定的疾病

    b. 租VCD类型不相似的客户聚集,可能暗示成员属于不同的亚文化群

    聚集通常作为数据挖掘的第一步。例如,“哪一种类的促销对客户响应最好?”,对于这一类问题,首先对整个客户做聚集,将客户分组在各自的聚集里,然后对每个不同的聚集,回答问题,可能效果更好。

     

    描述和可视化(Description and Visualization)

    是对数据挖掘结果的表示方式。

     

    2.数据挖掘的商业背景

    数据挖掘首先是需要商业环境中收集了大量的数据,然后要求挖掘的知识是有价值的。有价值对商业而言,不外乎三种情况:降低开销;提高收入;增加股票价格。

    1)数据挖掘作为研究工具 (Research)

    2)数据挖掘提高过程控制(Process Improvement)

    3)数据挖掘作为市场营销工具(Marketing)

    4)数据挖掘作为客户关系管理CRM工具(Customer Relationship Management)

     

    3.数据挖掘的技术背景

    1)数据挖掘技术包括三个主要部分:算法和技术;数据;建模能力

    2)数据挖掘和机器学习(Machine Learning)

    机器学习是计算机科学和人工智能AI发展的产物

    机器学习分为两种学习方式:自组织学习(如神经网络);从例子中归纳出规则(如决策树)

    数据挖掘由来

    数据挖掘是八十年代,投资AI研究项目失败后,AI转入实际应用时提出的。它是一个新兴的,面向商业应用的AI研究。选择数据挖掘这一术语,表明了与统计、精算、长期从事预言模型的经济学家之间没有技术的重叠。

    3)数据挖掘和统计

    统计也开始支持数据挖掘。统计本包括预言算法(回归)、抽样、基于经验的设计等

    4)数据挖掘和决策支持系统

    数据仓库

    OLAP(联机分析处理)、Data Mart(数据集市)、多维数据库

    决策支持工具融合

    将数据仓库、OLAP,数据挖掘融合在一起,构成企业决策分析环境。

     

    4. 数据挖掘的社会背景

    数据挖掘与个人预言:数据挖掘号称能通过历史数据的分析,预测客户的行为,而事实上,客户自己可能都不明确自己下一步要作什么。所以,数据挖掘的结果,没有人们想象中神秘,它不可能是完全正确的。

    客户的行为是与社会环境相关连的,所以数据挖掘本身也受社会背景的影响。比如说,在美国对银行信用卡客户信用评级的模型运行得非常成功,但是,它可能不适合中国。

  • delicious被雅虎收购了,目前它已经是全球最大的社会书签网站。对它的讨论可以说说连篇累牍,各有各的看法,我的看法来自于它与情报学以及信息资源管理的关系

    它们有关系吗?当然有,下面我一条条说来

    书签我们经常用,最长用的就是一个小卡片用于放在书中某两页之间,用于记忆下次阅读的开始。在互联网上,我们主要使用IE收藏夹来保存好网址,以方便下次打开这个网站,但是这个功能以前都是单机,也就是说,每个人都有自己的收藏网站,但不能共享。这显然不符合人们的要求。

    后来,1999年,碧海银沙就提供了一个网上收藏夹,你可以把自己的网址放到网上,以方便你在非个人电脑上使用,例如办公室和家庭都可以使用。当时那个程序我也使用过,也有共享功能,但没有Tag功能,主要依靠分类在组织信息。

    delicious出现时它的创新在于使用tag,增加了好友这些社会性网络功能。这些功能给它带来了非同一般的欢迎,因为这些功能代表了web2.0这个新一代的网络构建模式。

    如果把普通的分布式的网页看作情报学中的一次信息(也有简单的标引,如网页的Meta等元数据) ,那delicious就类似于二次信息,它是网络经过分类和标引过的二次组织,从这一点看似乎没有特殊价值和新意,事实上图书馆一直都在做这种二次组织的事情,例如各种门户。

    那delicious的新意在那里呢?

    1、用户的组织而非专家组织,图书馆建设的学科门户都是专家组织的web1.0模式,而delicious是完全由用户自组织的web2.0模式,所有内容都是以用户为中心,而非以资源为中心,这是最大的差别。

    2、使用了tag和Folksonomy,上一讲已经说过,这里不再罗嗦。

    这种组织信息的方法也是以用户为中心的方法,不同与专家使用的学科分类和主题分类。

    3、私有与共享的平衡。delicious的成功很大程度上也归功于它的共享功能,如果它只有私有功能,也就是用户无法共享自己的资源,它肯定不能获得现在的地位。delicious类似于一个开放的系统,投入的是新的网络资源,输出的也是网络资源。用户使用它的原因在于,自己的资源和Tag就像一个种子一样,放进去后可以收获更多的种子。这和P2P网络一样,在一个社区内进行知识和信息的共享可以快速引爆“流行”,Myspace的发展一样的道理。

    以上说得是delicisous的新意和价值所在,下面说说它在信息资源组织思想上的意义:

    1、以用户为中心。说着容易,做着难,至少目前所有图书馆还是专家组织下的以资源科学性为中心。

    以用户为中心会导致个性化,以资源为中心需要系统化,它们是有矛盾的,如何平衡这个矛盾,我们也许可以向delicious学习。

    2、世界是平面的和网络化的。《世界是平的》是目前一本很火爆的图书,用它来比喻信息世界和信息空间似乎也适用。知识表示研究的本体、语义网和概念地图都揭示语意之间是网络关系而非等级关系,以往我们人为的把这个信息空间搞成了等级世界,现在看来我们也许需要改变下观点了。

    在用户大脑中,并没有什么严格的概念体系,只有概念关系,delicious很好的展现了这个事实,同时也满足了用户记忆的需要,所以它的tag用起来很方便,它们之间的网络关系总能给你惊喜。