2006年03月17日

文章编号:10098119200507004103

 

基于语义Web本体语言的推理机引擎的实现

侯冕1  廖乐健2

(1.  北京理工大学计算机系,北 京1000812.北京理工大学计算机系人工智能所,北 京100081)

 

    近年来,OWL等本体语言彭湃发展,并成为W3C未来Web语言的标准。本体语言的优势在于以较少的表达语句组成知识库,并蕴涵较多的信息。为了得到这些隐含的信息以及检查知识库的一致性,就需要开发出相应的推理机引擎。针对目前本体语言的发展现状,设计了一个灵活的推理机引擎框架。推理机引擎结构灵活,可方便的扩充或者降低其所处理的本体语言的表达能力。同时,也介绍了在实现该推理机引擎过程中的一些具体技术。

关键词  本体,语义网络

A realization of SWOL-based Reasoning Engineer

Hou Mian1, Liao Lejian2 

Department of Computer Science & Engineering ,Beijing Institute of Technology, Beijing 100081;AI Lab in Department of Computer Science & Engineering ,Beijing Institute of Technology, Beijing 100081

Abstract  Semantic Web Ontology Languages such as OWL developed fast in recent years, it became a web standard for future Web language by W3C. The advantage of Ontology language is that it can express more hiding information by less knowledge expressions. In order to get the hiding information and check the consistency of the KB, a reasoning engineer should be developed. In this paper, a Reasoning Engineer architecture is designed according to the characters of current ontology languages. This architecture is flexible and easy to be extended or amended in expressing ability with different expressive ontology languages. This paper also discusses some realization techniques in the development of the reasoning engineer.

keyword  Ontology Semantic Web


转自:http://www.tele21.com.cn/zzfw/show.asp?classid=1396 让网络学会思考 小林子■电脑报   Google的强大,相信不用在这里多费唇舌,大家一定也有深刻的切身体会。但是,我们经常说“金钱不是万能的”,事实上Google也一样,很多时候它也会查找到一大堆莫名其妙、毫不相关的垃圾信息。   从Google说开去   举个简单的例子,我们如果想要去买电脑,那么肯定会以“配件报价”为关键字进行搜索,但Google却会给出许多毫不相关的信息。   再举个更通俗易懂的例子,如果你在Google上查“番茄”,那么Google也不会把“西红柿”作为“番茄”的同义词进行查找。说到底,这是由于Google是基于关键字比较进行查找的,它只会考虑基于关键字的匹配,而不是像人一样是在理解内容的基础上再进行筛选。   语义网的诞生   为了解决以上问题,语义网应运而生了,它被称为下一代的网络,是由互联网的创始人Tim Berners-Lee提出的。让我们先来看一下Tim Berners-Lee给出的关于语义网的一个经典例子。   电话铃响时彼得拿起电话,彼得的姐姐露西从办公室打来电话说:“妈妈需要找一位专家看病,你能安排送一下妈妈吗?”在这之前,露西已经上网给她的语义Web代理下了指令,代理找出了在妈妈家方圆20英里范围内并在母亲的保险计划范围之内的所有诊所。然后,代理尝试将可能的预约时间和彼得及露西的繁忙的日程进行匹配,最后提供了一个完美的方案。   彼得和露西能够通过Web执行这些任务,不是靠今天的互联网,而是得益于将来的语义Web。事实上,从互联网建立时就已经有很多计算机工作者致力于语义Web的研究,到目前为止已经形成了比较完整的体系。许多类似于Jena和AQsearch的基于DAML(The DARPA Agent Markup Language)的推理机也相继被开发出来,同时类似于WordNet的工作对语义网的发展也有很大的帮助。   语义Web的根本   任何实际系统的发展都离不开它的基础理论,那么语义Web呢?事实上,当前的语义Web都是基于二元关系的,对于这个概念大家可能有点陌生。在通俗意义上我们称之为三元式,也就是说任何一次的知识表达都是由三部分组成——主语、谓语和宾语。那么大家又要问了,用这样简单的表示方法能否表现出现实世界的复杂性呢?你大可不必为此担心,我们可以通过绑定、组合等一系列方法来表示更为复杂的知识,就像计算机在底层只有0、1两种符号,但却可以进行复杂的数学运算的道理一样。   大家也许会奇怪,语义Web提出以后会不会完全代替现有的Web,如果不会的话,它将以一种怎样的形式与现有的Web相结合?事实上,语义Web是针对机器理解提出的,也就是说用语义Web描述的资源是让机器阅读的,那么传统意义上的Web还是有其必要性的。我们现在所要做的工作就是将这两部分结合在一起,传统Web提供给人们所需要的信息,而语义Web在后台给机器阅读,用于资源的发布、发现与管理。 语义Web的实例   说了这么多了,大家可能还不是特别明白,光说不练也是不行的,那么我们就举一个具体的例子来看一下。   在这里我们选择DAML,一是由于DAML较早期的语义Web创建语言提供了更强大和方便的语义支持,二是由于它是由DARPA提出的,很具有权威性。   在这里要表述的内容如下:微软是一家生产操作系统的公司;Bill Gates是公司的CEO;Intel是一家生产CPU的公司,它和微软是战略伙伴;Windows98的售价是50美元(假设)。进行描述的文档如下:       Intel       1234567890   Microsofe   ……   friend       ……      在这里由于只是一个具体资源的描述文档,在后台还需要一个元数据文档进行支持,它也是由我们自己定义的,在这里由于篇幅关系就不一一列出了。   由于语义网是针对机器理解提出的,我们也看到了具体的资源描述文档,那么机器是如何在这些文档中找到自己想要的东西呢?这里用AQSearch作为推理机来进行查找。   我们首先进行必要的设定(如图所示),这里我们还是沿用上面举过的例子,查找和Intel公司有合作关系的公司,一切搞定以后按“Add Clause”键将查询条件输入,还可以同时输入几个查询条件进行复合查询,然后再按Execute键就OK了,接下来就是看查询的结果了。   在DAML Search Results中可以看到,AQSearch查到了Microsoft,并列出了与之相关的其他信息。   也许大家对AQSearch的搜索功能不以为然,认为这并没有什么了不起的。但在这里要指出的是AQSearch事先并不知道要查找的文档是用哪些元数据(就是HTML中的标签)进行描述的,这也体现了语义Web一个最为重要的特性——可扩充性,这也正是大家长期以来梦寐以求的东西。   语义网并非独立的另一个Web,而是现在Web的一种延伸。在其中,信息有定义完好的含意,更利于人机之间的合作。不久的将来,当机器有更强的能力去处理和“理解”现在它仅仅进行显示的数据时,我们将看到更多重要的新功能。

2006年03月16日

北京理工大学学报

第24 卷 第11 期

廖乐健,  幺敬国,  李守丽

(北京理工大学信息科学技术学院计算机科学工程系, 北京 100081)

摘 要: 设计了一个旅游信息系统, 并在系统中成功运用了语义W eb 技术。使用UML 建立了旅游领域的O nto lo2 gy, 并以几个旅游门户网站为信息源建立了旅游领域的语义W eb 数据库。提出了语义W eb 技术和传统搜索引擎相结合的信息检索方法, 设计了检索语义信息的算法。实现了描述逻辑知识库问题解答的优化, 设计了用户和知识库交互的方式。本系统是一个语义W eb 技术的商业应用原型。

关键词: 语义W eb; 旅游; 本体; 描述逻辑

中图分类号: TP 3931092   文献标识码:A

参考文献:
[1 ]  Berners2L ee T, Hendler J, L assila O. The sem antic W eb[J ]. Scientific Am erican, 2001, 284(5): 34-43.
[2 ]  Staab S, W erthner H, Knoblobk C, et al. Intelligent system s fo r tourism [J ]. IEEE Intelligent System s, 2002, 17(6): 53-66.
[3 ]  Baader F, Calvanese D, M cGuinness D, et al. The descrip tion logic handbook: Theo ry, imp lem entation and app lications[M ]. Cam bridge: Cam bridge U niver2 sity P ress, 2003.
[ 4 ]  廖乐健, 幺敬国, 曹元大等. 一个语义W eb 构架及其实现[J ]. 计算机工程与应用, 2003, 39(15): 157-161. L iao L ejian, Yao J ingguo, Cao Yuanda, et al. Se2 m antic W eb architecture and its imp lem entation[J]. Computer Engineering and App lications, 2003, 39  (15): 157-161. (in Chinese)
[5 ]  L assila O, Sw ich R R. Resource descrip tion fram e2 wo rk (rdf) model and syntax specification[EB�OL ]. http: ∥ www. w3. o rg�1999�TR �REC2rdf2syntax2 19990222, 1999202222�2002211201.
[6 ]  B rickley D, Guha R V. RDF vocabulary descrip tion language 110: rdf schem a[EB�
OL ]. http: ∥www. w3. o rg�2002�,TR�WD 2rdf2schem a220020430�20022 04230�2002211201.
[7 ]  Harm elen F V, Patel2Schneider P F, Ho rrocks I. Reference descrip tion of the DAML + O IL (M arch 2001) O nto logy m arkup language[EB�OL ]. H ttp: ∥ www. dam l. o rg�03�
2001�reference, 2001204211� 2002209208.
[8 ]  F ikes R, Hayer P, Ho rrocks I. DAML query lan2 guage (DQL) abstract specification[EB�OL ]. H ttp: 2002�dql�∥ www. dam l. o rg�08�dq1, 2002208219� 2002211202.
[9 ]  Guha R,M cCoo l R. TA P: A sem anticW eb p latfo rm [J]. Computer N etwo rks: The International Journal of Computer and Telecomm unications N etwo rking, 2003, 42(5): 557-577.
[10 ]  Ho rrocks I, Stattler U. Op tim ised reasoning fo r SH IQ [A ]. The 15th Eur Conf on A rtificial Intelli2 gence (ECA I 2002) [C ]. L yon, F rance: [n. l. ], 2002. 277-281.

转自:http://alife.ai.ustc.edu.cn

什么是人工生命?


历史和起源  定义 研究任务 目前状况 相关会议 相关刊物

简单教程( what-is-alife.zip,new version,10Kb

怎么成为人工生命的研究者

一些入门文章


  • 历史和起源

  1987年9月21日,美国罗沙拉莫斯的人工生命研讨会中人工生命作为一门新的研究学科诞生了。C.C.Langton 是人工生命这一概念的创始人,也就是公认的“人工生命之父”。

  其实,关于生命模拟的尝试早在70年代就已经出现,例如最初向世人展现人工生命的英国数学家约翰?康卫(John Horton Conway)开发了一个"生命游戏"软件,这个软件流行广泛,因为其具有不可抗拒的诱惑力,它象是一个演化中的微型宇宙。开始时,计算机屏幕上只出现这个宇宙的一个影象:一个平面坐标方格上布满了"活着的"黑方块和"死了的"白方块,最初的图案可以任你摆布。但一旦你开始运作这个游戏后,这些方块就会根据很少几条简单规律活过来或死过去。每一代的每一个方块首先要环顾其四周的近邻,如果近邻中就有太多活着的方块了,则这个方块的下一代就会因为数额过剩而死去。如果近邻中存活者过少,则这个方块就会因为孤独而死去。但如果其邻近中存有两到三个"活着的"方块,比例恰到好处,则这个方块的下一代就能存活下去。也就是说,要么是这一代已经活着,能够继续存活下去,如果不是这样,就会产生新的一代。虽然这些规则只是一些简单的漫画式的生物学,但是人们发现了很多有趣的图案,就象一个复杂的世界。

Top

  • 定义

象许多新兴学科一样,人工生命尚无统一的定义,要给人工生命下个准确的定义是困难的。不同科学或科学背景的学者对人工生命有不同的理解。这里,我们给出一些比较典型的定义:

定义1

"研究具有自然生命系统行为的人造系统。"

C. G. Langton. "Artificial Life." In C. G. Langton, editor. Artificial Life, Volume VI of SFI Studies in the Sciences of Complexity, pages 1-47, Addison-Wesley, Redwood City, CA, 1989.

定义2

"人工生命是研究怎样通过抽取生物现象中的基本动力规则来理解生命,并且在物理媒体如计算机上重建这些现象,使它们成为一种新的实验方式和受操纵。

C. G. Langton. "Preface." In C. G. Langton, C. Taylor, J. D. Farmer, and S. Rasmussen, editors, Artificial Life II, Volume X of SFI Studies in the Sciences of Complexity, pages xiii-xviii, Addison-Wesley, Redwood City, CA, 1992.

定义3
"在人工生命中的所有存在或将会存在的事物中,我们至少可以说这一领域从总体来说,代表了一种尝试,就是加重了生物学中合成理论的分量。"

C. G. Langton. "Editor’s introduction." Artificial Life Journal, Volume 1, Number 1/2, pages v-viii, 1994. The MIT Press, Cambridge, MA.

定义4
"人工生命模型有足够强大的功能来获取复杂系统中更多的认知。这种方式较之自然系统更容易被操纵、重复和精确控制实验。"

C. Taylor and D. Jefferson. "Artificial life as a tool for biological inquiry." Artificial Life Journal, Volume 1, Number 1/2, pages 1-13, 1994. The MIT Press, Cambridge, MA.

Top

  • 目前状况

  在这十几年来,人工生命引起了越来越多的人的关注, 进行了大量的相关研究。除了计算机领域的科研工作站外,研究者还来自于其它学科领域,例如生物,经济,物理,化学等等。进行人工生命研究的著名研究所有圣塔非研究所,CalTech的Avida Artificial Life Group,意大利G.R.A.L研究所的 Research Group on Artificial Life…

  1996年,我国举行了第一届人工生命研讨会,中科院自动化研究所与中科院系统研究所联合举办, 邀请参加的专家来自美国的SFI、MIT、加拿大、日本与中国。

Top

  • 研究任务

简单的说,人工生命研究有2方面:如何用计算机帮助生物学和如何用生物学帮助计算机。

可以说人工生命是一门相对新兴的混合了计算技术和生物学的高级学科。 从程序员的角度上说:是运用人工智能技术作为指导,开发软件模型,模拟当今最聪明的计算机系统,以观察它的行为是否能象人类一样表现出自我学习和适应环境。对于某些人来说,是试图用计算机来模拟生物学。

Top

  • 相关会议

7th International Conference on Artificial Life The Seventh International Conference on the Simulation and Synthesis of Living Systems Reed College, Portland, Oregon, USA .1-6 August 2000
"Looking Backward, Looking Forward"

6th International Conference on Artificial Life

4th International Conference on Artificial Life

3rd International Conference on Artificial Life

2nd International Conference on Artificial Life

1st International Conference on Artificial Life

Top

  • 相关刊物

Paper Journals

Artificial Life (MIT Press)

Adaptive Behavior (MIT Press)

Artificial Life and Robotics (Springer Verlag)

Advances in Complex Systems (formerly Journal of Complex Systems) (Editions Hermes)

Biological Cybernetics (Springer Verlag)

Complexity (Wiley)

Cybernetics & Systems Analysis (Plenum)

Evolution (Society for the Study of Evolution)

Evolution of Communication (John Benjamins Publishing Co.)

Evolutionary Computation (MIT Press)

IEEE Transactions on Evolutionary Computation (IEEE)

IEEE Transcations on Fuzzy Systems (IEEE)

IEEE Transactions on Neural Networks (IEEE)

IEEE Transactions on Systems, Man, and Cybernetics B: Cybernetics (IEEE)

Journal of Complexity (Academic Press)

Journal of Social and Evolutionary Systems (JAI)

Journal of Theoretical Biology (Academic)

Kybernetes (MCB)

Open Systems & Information Dynamics (Kluwer)

Online Electronic Journals

Complexity International: an electronic journal of complex systems research

Complexity Digest: an news bulletin of complex systems research

Intelligent Data Analysis-an International Journal (European mirror)

Journal of Artificial Societies and Social Simulation (full text available)

Journal of Memetics: Evolutionary Models of Information Transmission

Noetica: A Cognitive Science Forum. A WWW journal devoted to the interdisciplinary field of cognitive science (Australian mirror)

(相关刊物这一部分是从alife.org拷贝的)

Top

How to study to become an ALife scientist?  (from alife.org)

怎么成为人工生命的研究者

“我的经历是从计算机科学开始,然后选修了一些自适应系统和人工智能的课程,以及生物学课程。”

基础:计算机科学

“由于要做Alife的计算机实验,所以基本的编程基础是很需要的。建议学习:编程技术、计算机科学一般原理、面向对象的程序设计、数学。学习一些人工智能方面的课程,例如:AI、自适应系统、机器学习、机器人学和电子学、系统学、搏奕论、计算机图形学、分布式系统。”

加上一些生物学

“毕竟,人工生命适与生物学有关的。所以我还学习了:生态学、行为生物学、进化学、基因学、生态人口学。”

但是,这样还是不够的

… …

  • A lot of people often ask me how they should choose their studies to prepare for a career in Artificial Life. I myself have done a study, of which I think, is a good preparation for further work in Artificial Life. I started with a basis in computer science, then choose some adaptive systems and artificial intelligence courses from our computer science department, and added a couple of courses from the biology faculty to complete my studies. Of course, my thesis was about Artificial Life. A complete review of my curriculum is below, and I would recommend a similar package to all students preparing for Artificial Life.  “我的经历是从计算机科学开始,然后选修了一些自适应系统和人工智能的课程,以及生物学课程。”

The basics: Computer Science 基础:计算机科学

  • Artificial Life is about creating life in artificial media, with the computer on the first place. So you’ll need all the basic notions of computer science to even be able to start programming on ALife experiments. If you’re able to choose a package of courses at you university, make sure you have the following courses in that package:
    • Programming techniques: A good introduction to computer programming. You’re going to need that for preparing your computer experiments in Artificial Life.
    • Formal methods in computer science: If you don’t know the theoretical basics needed for computational experiments, you’re nowhere in writing simulations.
    • Object oriented programming: Courses in object-oriented programming offer you the ability to get good programming style. A lot of the simulations written by ALife scientists are simply better when written from an Object Oriented basis.
    • Mathematics: This is maybe even more important than the computer scientific classes. make sure there’s differential equations (and not just differentials) in the mathematics courses, because a lot of the basic notions of complex systems are based on these differential equations.

    “由于要做Alife的计算机实验,所以基本的编程基础是很需要的。建议学习:编程技术、计算机科学一般原理、面向对象的程序设计、数学。”

    Most of the computer science faculties around the world offer some Artificial Intelligence related courses. Make sure you take a couple of these too, especially look out for universities offering the following courses:

    • Artificial Intelligence: Offering you the basics of Artificial Intelligence, this is sometimes combined with a couple of topics from robotics and cognitive sciences (brain, language, …)
    • Adaptive Systems: Giving you the basics of neural networks, genetic algorithms and the alike. this is a very important part in becoming an Artificial life scientist
    • Machine Learning: Different formal methods in learning. Things that should be covered are bayesian learning and the alike.
    • Robotics and Electronics: If you’re planning to work with robots, make sure you have basic notions of robotics and electronics
    • Systems theory: If your university offers a course that includes systems theory, be sure to have that one too. A good introduction to complex and dynamical systems is needed to be able to discuss several topics in Artificial Life.
    • Game theory: i personnally think that game theory will have a serious impact on Artificial Life in the near future, so be sure to have some of that too. Most game theory courses offer you the first relations between biology and formal thinking.
    • Computer graphics: this course is not necessary, but can give you a couple of techniques that could come in handy when programming Artificial Life projects.
    • Distributed systems: this isn’t necessary either, but can give you some notions on how to work with multiple machines on one simulation project, and explain to you how the agents in your simulations should communicate with each other. I found it necessary.

    “学习一些人工智能方面的课程,例如:AI、自适应系统、机器学习、机器人学和电子学、系统学、搏奕论、计算机图形学、分布式系统。”

    In most universities you also need to do a couple of programming projects. Try to get a project that is related to Artificial Life. Many professors don’t mind that you propose your own programming projects. Try to do something difficult with genetic algorithms to get the feeling of it.

Add some biology to that  加上一些生物学

  • In my university, we had to choose a couple of courses to complete our study. I also had the possibility to add courses from the biology faculty to my curriculum in the computer science faculty. If you’re looking for a basis in Artificial Life, be sure to ask whether your university offers you the possibility to add a couple of courses from the biology department to your curriculum.

    After all, Artificial Life is about biology…

    And if you’re looking for biology classes, be sure to pick out the more theoretical classes. this is the list of biology classes I added to my CS curriculum:

    • Ecology: this gives you most of the definitions that could come in handy when doing research in Artificial Life.
    • Behavioral biology: How do animals react on their environment? A lot of the ALife projects are based on behavioral techniques taken from biology.
    • Evolution: A lot of biology is based on evolutionary thinking. So a good thorough introduction to evolution is needed to do something useful for biology. And don’t you think that evolution is just about Darwin and dinosaurs, it’s a bit harder than that.
    • Genetics: When you’re involved with genetic algorithms and evolutionary techniques in Artificial Life, a pure biological class on genetics can come in handy too!
    • Population ecology: This is about how dynamics on the level of population is studied. A lot of basic notions of "emergent behavior" can be studied in the population ecology course. Plus it’s a very theoretical start for doing formal biology.

    “毕竟,人工生命适与生物学有关的。所以我还学习了:生态学、行为生物学、进化学、基因学、生态人口学。”

But that’s not it  但是,这样还是不够的

  • Doing Artificial Life is not just about studying the former list of courses, it’s a lot more. You’ll have to be prepared for a couple of other things…

    Be sure that you want to do something with Artificial Life. It could be a very interesting new topic in science, but you’ll need a lot of motivation to get there. Some of the courses (like the mathematics and formal methods) would at first be very hard to get through but you’ll be needing them later.

    And it’s not just about studying. You’ll be doing a lot of other homework too. Make sure to follow a lot of the work that’s already been done in Artificial Life. Buy the proceedings of a couple of recent conferences (such as Artificial Life or ECAL or SAB conferences) and try to read as much books and papers you can find. Some books on Biology are good too. Philosophy of science books in biology (e.g. the heavy weight books by Mayr) are a good read. Maybe it’s also a good idea to try and prepare a paper for a conference yourself. Publishing can give you some confidence in starting an Artificial Life career. “阅读大量文章,例如Artificial Life or ECAL or SAB 的会议论文等”

    If you’re really motivated, make sure that most of your studies will bring you something new about Artificial Life. If you have to do anything like projects, try to talk to the professor about what you’re planning to do and they’ll be happy to give you a chance in doing a project that will gain you some techniques needed in Artificial Life.

    It’s hard to get to the finishing line, but if you studied the courses, you’ll have a good basis in doing research as an Artificial Life scientist. By the way, I did it so anyone can do it :)

    Top

一些文章

(以下1-8摘自http://ai.ia.ac.cn)

1.人工生命,周登勇、戴汝为,模式识别与人工智能. Vol. 4, 1998(3): 412-418

2.The Control Structure of Artificial CreaturesZhou Dengyong, Dai Ruweito appear in Artificial Life and RoboticsVol.5,2000

3.适应性行为与仿真,周登勇、戴汝为,已被《系统仿真学报》接受发表。

4.一个基于多主体的仿真工具系统-COMPLEXITY,周登勇,已被《模式识别与人工智能》接受发表。

5.智能控制与适应性,戴汝为、周登勇,第三届全球智能控制大会,2000,安徽。

6.遗传算法,董向辉,2000.3,开题报告。

7.从复杂性的观点来理解智能行为,周登勇、戴汝为,2000.6。( 请使用gsview阅读 )(新增)

8.从复杂性的观点来理解动物行为,周登勇、戴汝为,2000.6

9.人工生命的研究,沈学华,杨献春,周志华等。南大学报,2000,11。

http://blogger.org.cn/blog/blog.asp?subjectid=1838&name=Lee

转自:http://boole.cs.iastate.edu/semanticweb/view.cgi?forum=30&topic=1
在中国谁在研究语义网?

整理过的在这里:
http://boole.cs.iastate.edu:9090/popeye/Wiki.jsp?page=Academic.Bookeshelf.Reference.SW.China

参见学位论文那个帖子
http://boole.cs.iastate.edu/semanticweb/topic.cgi?forum=30&topic=17&show=0


史忠植
http://www.intsci.ac.cn/mise/research.html
他以前研究过神经网, 也研究过agent



 
baojie 发表于: 2003/11/24 05:09am
 
qinpu   
 
 
 等级:大一新生
 文章:12
 积分:66
 注册:2003-10-29
     OICQ    第3楼

我知道的情况:
东南大学,以前是从 Xobject 入手的,目前他们有国家自然科学基金的立项;
清华大学,KEL;
北京大学,医学部的心血管疾病知识库方面应用(我在做),去年我们还有一个RDF方面的应用,另外GIS实验室有人整理过一些ontology方面的东西,另外信息科学中心AI的甑验室有个研究生在搞;
农科院信息文献情报中心,关于农业叙词表,希望引入ontology相关技术;
国土资源部,考虑在土地重新分类时利用相关技术改造数据库;
上海的学校(记不清了)有人发过文章,比较早,关于用RDF实现ontology的,不过有错误。

资料不是很详细。目前在专心做项目,可能消息不一定很时效了。


 
 顶部
baojie 发表于: 2003/11/24 05:10am
 
lisawater   
 
 
 等级:大一新生
 文章:2
 积分:54
 注册:2003-11-14
       第5楼

是2001年的?
杨秋芬  和   陈跃新的文章吗?
不是北大的吧?
是湖南广播电视大学  和  国防科学技术大学 的
我看过篇北大的昵 《Ontology理论研究和应用建模》
2003-11-14 11:17:18   

admin   
 
 
 等级:管理员
 文章:227
 积分:382
 注册:2002-5-19
        第6楼

02年9月北京大学学报(自然科学版)上的
《Ontology研究综述》作者为邓志鸿等
———————————————-


 
 顶部
baojie 发表于: 2003/11/24 05:13am
 
XObjects
http://xobjects.seu.edu.cn/xobjects/
http://xobjects.seu.edu.cn/xobjects/English/index.html
 顶部
baojie 发表于: 2003/11/24 05:14am
 
Ontology研究综述
邓志鸿1), 唐世渭2), 张 铭1), 杨冬青1), 陈 捷2)


( 1)北京大学计算机系, 2)北京大学视觉与听觉处理国家重点实验室,北京,100871)

摘要:
Ontology是描述概念及概念之间关系的概念模型,通过概念之间的关系来描述概念的语义。作为一种有效表现概念层次结构和语义的模型,Ontology被广泛地应用到计算机科学的众多领域。本文作者对目前Ontology的研究与应用现状进行了综述性地介绍,从Ontology的定义Ontology理论研究、Ontology在信息系统中的应用以及在语义Web中的地位等方面加以了系统阐述。

关键词:
Ontology; 信息系统; 语义Web; XML; RDF

中图分类号:
TP 301; TP 391

(R.D.2001-09-11 P.D.2002-09-20 Vol.38 No.5 pp.730~728)
 
 顶部
baojie 发表于: 2003/11/24 05:16am
 
http://www.ahetc.gov.cn/cit/200110/01.doc

Ontology  方法学综述
杨秋芬      陈跃新
湖南广播电视大学     国防科学技术大学
[摘要]
  近来,一种新的基本知识模型的出现,解决了以前专家系统基于规则技术的缺陷。最新的知识工程化技巧就是Ontology(本体论),获取本体论的动机是“可再用性”(reusability)。在信息系统、接口和面向对象设计和编程等方面,本体论都是一个很好的工具。本文详细介绍构造ontology方法学。
[关键词]  Ontology    方法学

很笼统 和semantic web没什么关系
 顶部
baojie 发表于: 2003/11/24 05:18am
 
10月北大计算语言学研究所学术活动汇报

应北京大学计算语言学研究所之邀,台湾地区和、美国、日本、英国、法国、意大利的计算语言学方面的专家对北大计算语言所进行访问,为此,本研究所邀请他们作学术报告以及进行座谈。本所师生获益匪浅。以下是具体内容:

²        Talk # 1.

报告者:黄居仁教授 (台湾中央研究院)  

题目:Sense and Meaning Facets-  Linguistic Units of Meaning in Chinese and Criteria for Their Identification

       (词义与意面: 中文意义表征的单位与判定原则)

  时间: 2003年10月14日(星期二)上午10:10-12:00

地点:北京大学 理科一号楼 一层 1126号 

²        Talk # 2.

  报告者:黄居仁教授 (台湾中央研究院)

  题目:Knowledge Representations: Ontology, WordNet, and Metaphor

       (知识表征: 知识本体,词网,与隐喻中的知识领域)

  时间: 2003年10月21日(星期二)上午10:10-12:00

  地点:北京大学 理科一号楼 一层 1126号

²        Talk # 3.

报告者:Adam Pease博士 (the member of the SUMO working group)

        http://ontology.teknowledge.com/

  题目:An Overview of the Suggested Upper Merged Ontology and its Applications.

时间: 2003年10月23日(星期四)上午10:10-12:00

地点:北京大学 理科一号楼(即本研究所所在的楼)1131号 (学术报告厅)

²        Talk # 4.

  报告者:Adam Pease博士 (the member of the SUMO working group)

题目:Using the Suggested Upper Merged Ontology and its Mappings to WordNet

时间: 2003年10月24日(星期五)上午10:10-12:00

地点:北大计算语言所会议室(理科一号楼1453号)

²        Talk #5.

  题目:与日本、英国、法国和意大利的计算语言学专家(Tsujii教授、Kilgarriff博士、Boitet教授、Calzolari教授等)座谈

时间:2003年10月30日(星期四)上午9:40-11:00

地点:北大计算语言所会议室(理科一号楼1453号)

²        2003年10月30日下午,韩国庆北大学电子学系参观了计算语言学研究所。


 
 顶部
baojie 发表于: 2003/11/24 05:30am
 
GIS所的主页
http://gis.pku.edu.cn/

看过他们的<Ontology理论研究和应用建模> 很好
http://gis.pku.edu.cn/Resources/TR/Ontology_Study_application.doc
 顶部
捷 发表于: 2003/11/25 03:51pm
 
发信人: ldlc (考试), 信区: WebServices
标  题: Re: 语义Web的前景如何?
发信站: BBS 水木清华站 (Tue Nov 25 21:46:35 2003), 转信

前几天在人大举办了科学院青年论坛,主题是Semantic Web。

其中诸葛海老师认为Semantic Web or Semantic Grid的研究分成三个步骤

首先是语义互联,就是将现有的web利用类似本体的taxanomy关联上语义。

然后是规范组织,进入Web的资源不是随意的,是需要规范约束。

最后就是智能聚合,所谓推理或者问题解决模型之类的东西。

我个人感觉就第一点难度都很大,现在说本体动不动就是领域范围内。这个领域

就是一个模糊的概念,什么叫一个领域啊。大一统的本体已经被认为是不可能的

任务。而本体mapping现在看来也是世界难题。总之是解决了一些互操作的问题,

但带来了新的问题。Semantic Web任重而道远。
 
 顶部
baojie 发表于: 2003/11/26 03:58pm
 
YOCSEF于11月21日举行学术报告会–语义WEB

发布日期:  2003-11-18 08:43:30.0  访问总次数:  3 
 

中国计算机学会青年计算机科技论坛

CCF Young Computer Scientists & Engineers Forum

YOCSEF

于2003年11月21日(星期五)14:00-17: 30
在人民大学多媒体教学楼(教学4楼)4101教室
举行学术报告会,敬请光临


报告会主题

语义WEB

程  序

14:00       报告会开始

执行主席:金  芝  博士,中科院数学与系统科学研究院 研究员

                                                        YOCSEF学术委员会副主席

执行主席:吴朝晖  博士,浙江大学计算机科学与技术学院 教授

                                                        YOCSEF学术委员会委员

特邀讲者:怀进鹏  博士,北京航空航天大学 教授

报告题目:软件与网格技术

特邀讲者:诸葛海  博士,中科院计算技术所 研究员

报告题目:中国知识网格研究进展

特邀讲者:潘  越  博士,IBM中国研究中心

报告题目:语义网与信息集成

特邀讲者:吴朝晖  博士,浙江大学计算机科学与技术学院 教授

报告题目:DartGrid: 基于语义万维网的知识库网格平台

参与者: 研究/开发人员,技术管理人员,研究生,等

免费参加。

Email: ccf@ict.ac.cn; Tel: (010)6256 2503, 6256 5533-8596, Fax: 6252 7485


—————————————————————————————————————–


语义WEB

如果说电子邮件推动了第一代互联网的发展,而WWW应用成为了第二代互联网的关键核心应用,那么,以信息共享、协同集成、虚拟个性化为特征的应用,将持续推动下一代互联网的发展,最终将提供一种一致的并统一的计算、信息和知识的服务。目前互联网上的信息表达形式完全缺乏语义,这与应用需求存在着严重脱节。应用需求迫切需要提升信息表达的规范,语义万维网(Semantic Web)就应势而生。本次报告会特别邀请到了国内从事该领域的知名学者,对语义万维网的发展现状与趋势、技术要点以及典型应用进行论述。

执行主席  金芝

博士。现任中科院数学与系统科学研究院研究员,并担任该院计算机科学室主任,和中科院管理、决策与信息系统开放实验室副主任。YOCSEF学术委员会副主席。主要研究方向为人工智能、软件需求工程、领域建模和基于知识的软件工程等。发表论文50余篇,出版合著英文专著1部,曾获得国防科工委科技进步二等奖、中创软件人才奖、中科院盈科优秀青年人才奖等。

特邀讲者 怀进鹏

北京航空航天大学教授,现任该校常务副校长、国家863计划计算机技术主题专家组首席科学家、国家信息化专家咨询委员会成员、国家电子政务试点示范工程总体专家组组长,以及国家电子政务标准化总体组组长,《计算机学报》等编委,中国计算机学会常务理事,曾任YOCSEF学术委员会委员。一直从事计算机软件与理论、网络安全和信息系统研发和教学工作,尤颇昵在中间件、网格技术和网络安全协议等方面取得了重要的研究成果。已发表学术论文80余篇、获中国软件版权和发明专利14项,获部级科技进步奖6项(其中一等奖两项)等奖。

特邀讲者 诸葛海


1992年毕业于浙江大学,获博士学位,2000年入选中科院“百人计划”。现任中国科学院计算所智能信息处理重点实验室常务副主任,研究员,博士生导师,担任知识网格研究组(http://kg.ict.ac.cn)的负责人。担任《Journal of Systems and Software》等国际学术刊物的编委。目前主要致力于未来互联环境研究,有多篇学术论文在《Communications of the ACM》、《IEEE Computer》、《IEEE Intelligent Systems》等知名国际刊物上发表,并出版专著两部。

特邀讲者 潘越

1996年在中国科学院自动化研究所获博士学位,曾就职于信息产业部信息化工程总体研究中心。1998年加入IBM中国研究中心工作至今。先后主持过国际互联网内容选择平台(PICS)、跨语言检索(Native Search)、中文知识门户技术(Chinese Knowledge Portal)、市场情报门户(Market Intelligence Portal)等项目的研究开发。目前的研究兴趣包括信息检索、自然语言处理、知识的表示和推理等。

特邀讲者 吴朝晖

浙江大学计算机科学与技术学院副院长,教授/博士。国家863软件重大专项专家组成员,省信息化专家组成员。长期以来主要从事分布式人工智能、信息网格、嵌入式系统工程等领域的研究开发和教学工作,主持完成了国家攀登计划、国家八六三高科技、国家自然科学基金、省重大攻关30余项科研项目;在国内外杂志和国际会议上发表近120篇高质量的学术论文,出版专著2本,并获得省部科技进步二等奖等多项奖励。任YOCSEF学术委员会委员。

 
 顶部
baojie 发表于: 2003/11/27 10:28pm
 
董逸生
东南大学计算机科学与工程系   
http://cse.seu.edu.cn/people/ysdong/
学生
吴文明, 许卓明
http://cse.seu.edu.cn/people/ysdong/resource/lectures.htm

 
 顶部
baojie 发表于: 2003/11/29 06:02am
 
Chenxi Lin
http://apex.sjtu.edu.cn/people/linchenxi/

Research Interests

My current research interests include the Semantic Web theory and technologies, and Ontology based Knowledge Management. My master dissertation proposal should be focus on Ontology Versioning although it is not finally decided yet.
 
 顶部
baojie 发表于: 2004/01/08 04:39pm
 
中科院软件所电子商务技术研究中心聚集来自各高校从事电子商务技术研究的博士、硕士组成研究队伍,开展电子商务标准体系及颇甑现技术研究;基于语义的电子商务数据交换、应用集成技术研究;网格服务环境下软件开发模式研究;利用 Grid、Semantic Web、Web Service等技术实现企业间的协同产品开发。

http://www.chinaecc.org/modules/news/
 顶部
baojie 发表于: 2004/01/08 04:41pm
 
 
APEX实验室致力于数据与知识管理方面的研究和开发工作。当前的主要研究内容包括:下一代搜索技术, 本体工程的理论和技术, 语义万维网(Semantic Web)等。我们希望通过我们的研究,帮助人们从各种各样的结构化的或非结构化的信息中更好地获得和管理所需要的知识,从而为最终用户创造价值。 [了解更多:研究内容 - 在研项目 - 发表论文]

 

APEX实验室现有成员24人,包括博士生导师俞勇教授,博士和硕士研究生约20人。俞勇教授曾带队赢得2002年ACM国际大学生程序设计竞赛(ACM ICPC)的昀界冠军。多数研究生获得过各类奖学金,有多名研究生曾在微软和IBM研究中心进行过实习,拥有获得过ACM ICPC世界冠军的多名队员。[了解更多:所有人员 - 实验室活动]

 
APEX实验室拥有良好的甑验和工作环境,每一位成员都拥有自己的工作空间。实验室拥有RS/6000+AIX,NetFinity+Linux,HPServer+Win2k等多台服务器,通过100M局域网连接所有的个人PC,全部使用液晶显示器。

——————————————————————————–
©2003 上海交通大学 计算机系 APEX实验室 

http://apex.sjtu.edu.cn/home.htm


 已发表论文

YanFeng Ge, Yong Yu, Xing Zhu, Shen Huang and Min Xu, "OntoVote: a scalable distributed votes collecting mechanism for ontology drift of P2P platforms", In Proceedings of the IJCAI-03 Workshop on Ontologies and Distributed Systems, August 9-15, Acapulco, Mexico.


Zhuo Zhang, Lei Zhang, ChenXi Lin, Yan Zhao, Yong Yu, "Data Migration for Ontology Evolution", as Poster in the 2nd International Semantic Web Conference (ISWC 2003), 20-23 October, Florida, USA.


Kewei Tu, Jing Lu, Haiping Zhu, Guowei Liu and Yong Yu, "A Semantic Search Approach by Graph Matching with Negations and Inferences", In Proceedings of the 11th International Conference on Concpetual Structures (ICCS 2003), LNCS 2746, July 21-25, 2003, Dresden, Germany. >>Springer


Xing Zhu, Shen Huang and Yong Yu,"Recognizing the Relations between Web Pages Using Artificial Neural Network",InProceedings of the 18th ACM Symposium on Applied Computing (SAC 2003). March 2003, Melbourne, Florida, USA.


Haiping Zhu, Jiwei Zhong, Jianming Li and Yong Yu, "An Approach for Semantic Search by Matching RDF Graphs",In Proceedings of the Special Track on Semantic Web at the 15th International FLAIRS Conference (sponsored by AAAI), May 14-16, 2002, Florida, USA.


Jiwei Zhong, Haiping Zhu, Jianming Li and Yong Yu, "Conceptual Graph Matching for Semantic Search",In Proceedings of the 10th International Conference on Conceptual Structures (ICCS 2002), LNCS 2393, July 15-19, 2002, Borovets, Bulgaria. >>Springer


Jianming Li, Lei Zhang and Yong Yu, "Learning to Generate Semantic Annotation for Domain Specific Sentences",In the Workshop on Knowledge Markup and Semantic Annotation at the 1st International Conference on Knowledge Capture (K-CAP 2001), October, 2001, Victoria, B.C., Canada.


Lei Zhang and Yong Yu, "Learning to Generate CGs from Domain Specific Sentences". In Proceedings of the 9th International Conference on Conceptual Structures (ICCS 2001), LNCS 2120, July 30-August 3, 2001, Stanford, CA, USA. >>Springer


Jun Zhu and Yong Yu, "An Architecture for Adaptively Replicating Cooperative Shared Objects", In Procceedings of the 5th International Symposium on Decentralized Systems, IEEE Computer Society Press, March 2001, Dallas, Texas, USA.


Zhou Gao and Yong Yu, "Distributed Object Access Service in TANGRAM ", In Procceedings of the High Performance Conference Asia (HPC Asia 2000), May 2000, Beijing, China.


金毅,张卓,赵彦,俞勇,"基于语义万维网应用的平台",已被《上海交通大学学报》录用,拟于在2003年出版的期刊中刊载。


刘炎禄,俞勇,"面向语义Web的知识表示框架",上海交通大学学报,已录用, 2002。 
 
 顶部
baojie 发表于: 2004/03/08 02:36am
 
吉林大学的一个组
 顶部
mbxian 发表于: 2004/03/25 00:12am
 
很好的信息 ,很想知道斑竹的研究方向和联系方式,能告诉我吗?谢谢 
 顶部
baojie 发表于: 2004/03/28 11:24pm
 
我侧重ontology的学习 联系方式看我个人资料了
 顶部
npu007 发表于: 2004/04/02 02:22am
 
根据我查找的国内资料,现在国内做的人很多,(苦于俺太懒,还没有像斑竹一样整理一份详细的列表)
我知道的是:
北大,清华都有人在做,但是清华的我根据他们的主页上提供的信息,感觉做了些实用的工具,但是学术方便做得很不理想!!
浙江大学的吴朝辉那里做,我有他们的近年的硕士论文,以及JCST和几个还不错的国际会议上的论文。
南京大学有人做。
东南大学,上海交大也有人做,看上海交大的觉得他们做得比较专一和实际(与IBM有合作吧),实验室的同学素质应该也不错(ACM大奖的成员)。
广东工业大学的有位老师也在做。
电子科技大学的也有人做,我看过他们一位博士的被SCI收录的论文。
西北工业大学也有人做。
此外,从一些硕士论文也可以看到福州大学也有人做。
—————————————————————-
没有具体列出,抱歉。
 
 顶部
baojie 发表于: 2004/04/06 00:57am
 
23.周竞涛,王明微,XML+RDF——实现Web数据基于语义的描述,西北工业大学CAD/CAM国家专业实验室,2003年9月
 顶部
opmissing 发表于: 2004/04/12 02:34am
 
西安电子科技大学
 顶部
baojie 发表于: 2004/04/12 02:41am
 
 【篇名】   语义网知识表示的评价标准   
【作者】   何杭军,龚丽霞,陆汝占 
【刊名】   计算机工程 2002年06期 编辑部Email 
《中文核心期刊要目总览》来源期刊   ASPT来源刊   CJFD收录期刊 
【机构】  上海交通大学计算机科学与工程系,上海交通大学计算机科学与工程系,上海交通大学计算机科学与工程系 上海200030 ,上海200030 ,上海200030 
【关键词】   语义网;;知识表示;;特征 
【聚类检索】  同类文献 
【摘要】  基于Web具有的一些特征以及应用于语义网的知识表示语言,比较了语义网中知识表示和传统知识表示的不同,提出了语义网知识表示的评价标准,并结合标准评价了现有的知识表示语言。 
【光盘号】  INFO0209 

 
 顶部
baojie 发表于: 2004/04/12 02:42am
 
【篇名】   面向语义Web的知识表示框架   
【作者】   刘炎禄,俞勇 
【刊名】   上海交通大学学报 2002年09期 编辑部Email 
《中文核心期刊要目总览》来源期刊   “中国期刊方阵”入选期刊   ASPT来源刊   CJFD收录期刊 
【机构】  上海交通大学计算机科学与工程系,上海交通大学计算机科学与工程系 上海,200030 ,上海,200030 
【关键词】   资源描述框架;;本体;;元数据;;核心元素集合;;语义互联网 
【聚类检索】  同类文献 
【摘要】  语义互联网 ( Semantic Web)主要在于提供计算机软件可处理的元数据 ( Metadata)描述和信息表达方式 .介绍了以 RDF( S)技术为基础的在 Web上表达知识信息的方法 ,讨论了运用 RDF( S)技术建立知识表示本体 ( Ontology) ,以及通过扩展基本的 RDF( S)描述集合方法来增强表示特定领域知识的能力 .提出了运用基于 RDFS技术的基本 RDF( S)元语集合、通用描述元语集合、公理描述元语集合和关系约束元语集合进行知识表示的技术框架 .使用这 4层元语集合 ,可以将一般领域的知识信息以 RDF( S)的方式存储在 Web平台上 ,并通过相应支持 XML的程序进行处理 
【光盘号】  SCTC0211 
 
 顶部
milaneuo 发表于: 2004/04/15 01:00am
 
这些信息太有用了
谢谢各位老大
 顶部
baojie 发表于: 2004/04/15 10:54pm
 
瞿裕忠

个 人 简 介 (English Version)

瞿裕忠,男,1965年9月出生,东南大学计算机科学与工程系教授,中国计算机学会系统软件专业委员会委员,曾经担任ICYCS’99、NCYCS’2000、GCC 2002和GCC2003等会议的程序委员会委员。

他分别于1985年和1988年从复旦大学获得基础数学专业的学士和硕士学位。1991年至1994年在南京大学攻读计算机软件专业的博士学位,并获得博士学位,论文题目为“对象式程序设计语言形式语义的研究”,指导老师为徐家福先生。

1988年至1991年,他在河海大学数理系任助教。1994年9月到东南大学计算机系任讲师,1996年4月任副教授,1999年上半年在美国北卡州大访问学习,并在美国 RTP(研究三角园)IBM实验室从事XML技术在电子商务中应用的研究。研究兴趣包括面向对象方法、软件工程、Web技术与信息安全。发表论文30余篇,出版教材2部,译作5本,有1项发明专利申请(申请号:02112504.X)。

代表性的学术论文

1           Yuzhong Qu: A Predicate-Ordered Logic for Knowledge Representation on the Web, Future Generation Computer System, 2003. Available online via ScienceDirect: http://www.sciencedirect.com

2           A Predicate-Ordered Sort-Ordered Logic for RDFS,Proceeding of the Poster Track of WWW2003, Budapest, Hungary, May 21-23, 2003.

3           Yuzhong Qu, Zheng Chen, and Weidong Kou: A Secure Digital Content Delivery Scheme Based on XML Technology. Proc. of International Workshop on Grid and Cooperative Computing, GCC 2002. Edited by Yanbo Han and Meilin Shi. Dec. 2002. Hainan, 989-995.

4           QU Yuzhong, ZHANG Jianfeng, WANG Conggang: A Java-based Software Platform for XML Processing. World Wide Web Technologies in China: Research, Development, and Application. Edited By Zhongzhi Shi & William Song. pp50-60. Rinton Press Inc. USA, June 2002. http://www.rintonpress.com/books/index.html

5           Qu Yuzhong, Wang Zhijian, Xu Jiafu: A Mathematical Model of Inheritance. Science in China, 1996,39(1):17-26.

6           Qu Yuzhong, Wang Zhijian, Xu Jiafu: Denotational Semantics of a Simple Model of Eiffel. J. Computer Science and Technology, 1995,10(3):214-226.

从事的主要研究项目

1           语义Web语言及支撑软件技术基础研究(江苏省自然科学基金重点项目),40万,2003.7-2006.6.

2           语义Web的关键技术研究,国家自然科学基金项目,批准号:60173036,2002.1-2004.12。

3           基于XML的数字权限管理技术,国家八六三计划课题,批准号:2002AA144070,2002.9-2003.12。

4           基于Java的XML信息处理软件平台的研制,国家八六三计划课题,编号:863-306-ZD12-13-4,1999.10-2000.12。

5           XML for e-business,IBM SUR(Shared University Research)项目, 2000.10-2001.12。

主讲课程

1           软件工程(参考资源)

相关链接

Fuzzy and Neural Group at North Carolina State University

Xobjects Group at Southeast University

W3C: Semantic Web,RDFCore WG, WebOnt WG

OASIS

Email: yzqu@seu.edu.cn, Fax: 86-25-3794838, 南京市四牌楼2号,东南大学计算机科学与工程系,邮编210096。于2003年9月更新。


 
 顶部
baojie 发表于: 2004/04/15 10:56pm
 
李 善 平 博士
 


——————————————————————————–

计算机应用专业博士,浙江大学计算机学院教授,博士生导师。1987年起在浙江大学任教。1992年曾在英国利兹大学从事STEP技术、SGML技术的研究,2001年在美国NETSCAPE公司访问。近年来负责承担国家自然科学基金、国家863计划以及国防预研等项目6项,获国家级和部级科技进步奖,有一些荣誉称号。研究方向之一为信息集成,曾出版专著《产品数据标准与PDM》,目前对本体论和语义Web感兴趣。研究方向之二为Linux与嵌入式系统,出版教材《LINUX操作系统及实验教程》、《Linux 2.4版内核分析大全》、《边干边学:Linux内核指导》、《Linux与嵌入式系统》,先后研究或开发机顶盒、电子邮件服务、IP电话、VOD、视频服务器、宽带网络终端等嵌入式系统。同时从事本科和研究生的操作系统教学,指导研究生。荣获由研究生自由评选的“良师益友”称号。


 
 顶部
baojie 发表于: 2004/04/15 10:56pm
 
何克清 博士 教授 博士生导师 
 武汉大学软件工程研究所所长
软件工程国家重点实验室常务副主任
中国互操作性测评中心主任
中国UML教育与资格认证中心主任
ISO SC32工作组中国代表
亚洲软件标准化工作组副组长
 

   在国内较早从事软件工程研究,1982年出版国内第一部《计算机软件工程学》专著,对我国软件工程学科发展产生了较大影响。自1985年起在国内较早地从事了面向对象软件工程的研究,出版了《基于面向对象计算模型的软件工程》专著;作为学术带头人,先后创建了软件工程国家重点实验室(武汉大学)、中国软件互操作性测评中心和中国UML教育与资格认证中心。

   作为国家重点实验室负责人、项目主持人和学术带头人,完成了国家“六五”-“十五”、4轮“863”高技术项目、国家自然科学基金、省自然科学基金,国家军工预研项目、中日政府、中法政府合作研究项目等共32项,取得了国内外一批有影响的科研成果。目前承担的主要项目包括: 武汉市科学技术重点项目网上银行软组件系统的示范开发、Web软构件工程与软构件库的研究开发; 国际标准化组织ISO软构件登记互操作性标准规范;富士通公司委托研究项目Role Modeling方法及其应用、Web业务应用系统的软件框架、软件模式;中日政府科技合作项目面向对象的形式化方法及其应用等。

E-mail:hekeqing@public.wh.hb.cn 
目前主要研究方向:
   语义互联网上的软构件工程,语义Web软构件R&R&B,软件工程信息知识网格的基础研究,本体元建模理论与方法,互操作性理论与测试方法、标准,软件模式,软件框架,软件工程基础设施与平台等。 
   具有广泛的国际交流合作经历和国际软件产业工作经验。1995—2000年应富士通公司聘请,进入富士通公司软件事业本部任副参事、副部长,在国外从事了五年软件工程的应用基础、软件产业基础设施的研究与开发工作。在日本《情报处理学会论文志》、中国《软件学报》、《计算机研究与发展》等刊物和国际会议上发表学术论文70多篇,出版专著4本。多次举办软件工程国际学术会议,在国内外学术界、产业界产生了良好的影响。

 
 顶部
baojie 发表于: 2004/04/15 11:00pm
 
王克宏- 清华大学 计算机系 教授、博士生导师

  简历:

  毕业于南京大学数学系数理逻辑专业;毕业分配来清华大学自动控制系工作至今;1992 ~ 1993年作为访问学者(高访)在美国普渡(Purdue University)等大学进修;现为清华大学计算机系教授,博士生导师; 多年来一直从事于知识工程、分布式知识处理的研究工作,完成了国家八六三项目、国家科技攻关项目和军用基础研究等项目,获得过国家教委科技进步二等奖,机电部科技进步三等奖和“国家科技攻关项目个人突出成就奖”;北京市科技进步二等奖。发表论文 60 余篇著作 10余本(《Java 系列丛书》14本,《Internet 系列丛书》3本,《知识工程与知识处理系统》等)

  研究方向:网络计算与知识处理

  研究内容:1.网络计算模式下的知识表示、获取、传输、管理与应用; 2.语义Web和智能Web 服务(IWS);3.基于Web 技术的知识挖掘(DM&KM&KDD); 4.基于Web技术的软件技术研究与开发; 5.嵌入技术的研究;
 
 顶部
baojie 发表于: 2004/04/15 11:03pm
 
北京理工大学学报
TRANSACTIONS OF BEIJING INSTITUTE OF TECHNOLOGY
2004 Vol.24 No.2
一个语义Web系统的设计与实现
  廖乐健 幺敬国 曹元大等
 顶部
baojie 发表于: 2004/04/15 11:05pm
 
中国农业大学

计算机应用技术
陶兰
教授
博导
计算机网络与智能信息处理
博士
智能软件Agents、Web Mining、语义Web智能技术在网络信息共享、信息安全等方面的应用研究
 
 顶部
baojie 发表于: 2004/04/15 11:05pm
 
郭鸣

郭鸣简历
  郭鸣,男,博士,毕业于浙江大学计算机学院。主要研究方向为知识表示、语义Web、本体论、信息集成、网格计算、普适计算等。

江大学城市学院
 
 顶部
baojie 发表于: 2004/04/15 11:11pm
 
60363006 面向语义Web的Ontology计算与语义推理技术研究姚绍文云南大学7 地区基金
 顶部
baojie 发表于: 2004/04/15 11:13pm
 
60373057 基于约束对象的语义Web智能代理技术的研究廖乐健北京理工大学14 自由基金
 顶部
baojie 发表于: 2004/04/15 11:16pm
 
b语义Web 语义Web Services、语义融合、Ontonogy库、基于 Ontonogy 库的语义推理、基于规则引擎软件系统集成 胡运发 Email:yfhu@fudan.edu.cn

Tel:021-65641867(o), 021-55510340(o)       复旦大学博士后流动站   
 顶部
baojie 发表于: 2004/04/15 11:19pm
 
语义Web上本体与智能信息Agent的集成研究= Intelligent Information Agent with Ontology on Semantic Web [刊,中]/ 李卫华(广东工业大学计算机学院,广州 510090),//计算机工程与应用—2002,38(16).—136~138
关键词:语义Web;本体;智能Agent;信息;Web服务
 
 顶部
wallis 发表于: 2004/04/16 01:03am
 
国家自然科学基金今年启动了一个重大项目“非规范知识的基本理论及核心技术研究”,有七个子课题,很多学校和单位都参加了,中国人民大学参与子课题“因特网上非规范知识实验平台”的研究,主要是示范语义网的建设和相关内容。
 顶部
baojie 发表于: 2004/04/16 01:58am
 
就是这个了
http://boole.cs.iastate.edu/semanticweb/topic.cgi?forum=32&topic=11&show=0

真是财源滚滚阿.

 
 顶部
wallis 发表于: 2004/04/17 08:20pm
 
yes! 目前已经申请下来,时间是从2004年至2007年。

参与的学校和研究单位很多,版上应该也有很多朋友参加了吧?多多交流:)
 顶部
baojie 发表于: 2004/04/20 07:03am
 
UBIQUITOUS COMPUTING LABORATORY
PEKING UNIVERSITY

http://www.uclab.org/

The Ubiquitous Computing Lab (UCLAB) conducts research in the core technologies based on ubiquitous environment, at Peking University. Current work focuses on design and development of universal access and message passing platform; ontology engineering and ontology based semantic web; architectures for adaptive agent systems; and knowledge-based systems for science, engineering and defense applications.

 
 顶部
baojie 发表于: 2004/04/22 03:52am
 
http://info.ruc.edu.cn/wang/ 王 珊  中国人民大学信息学院
 顶部
baojie 发表于: 2004/04/23 05:07pm
 
[这个贴子最后由baojie在 2004/04/23 05:08pm 第 1 次编辑]

http://lib.utsz.edu.cn/adl2004/adl04_2.html
2004年数字图书馆前沿问题高级研讨班

秦健 语义网(Semantic Web)和实用分类系统 (Ontologies)
介绍目前语义网的发展和实用分类系统的技术,着重讨论主要技术和标准、对数字化图书馆的影响、以及目前的应用

曾蕾 语义网发展应用实例
介绍、分析语义网应用的几个例子

北京大学数字图书馆研究所聘请曾蕾、秦健
两位博士为顾问

  为及时了解海外数字图书馆研究情况,推动北京大学数字图书馆研究和实践,北京大学数字图书馆研究所于2002年5月20日下午在北京大学图书馆新馆会议室举行仪式,正式聘请曾蕾、秦健两位博士为北京大学数字图书馆研究所顾问。
  参加仪式的有北京大学数字图书馆研究所副所长、北京大学图书馆馆长戴龙基;数字图书馆研究所副所长、CALIS管理中心副主任朱强、陈凌;北京大学图书馆副馆长肖珑,以及图书馆参与数字图书馆研究和实验项目的员工。仪式上,肖珑、陈凌、朱强、戴龙基等先后发言,表达数字图书馆聘请两位为顾问的诚挚心意,希望能够在数字图书馆研究和建设方面得到她们真诚的指导和帮助。最后,戴龙基馆长正式向两位博士颁发了聘请证书。
  曾蕾博士现为美国肯特州立大学图书馆情报学学院副教授,1984年毕业于武汉大学,获图书馆学硕士学位,1992年毕业于美国匹兹堡大学情报学院,获博士学位。主要研究方向为:知识的组织,词表和其它索引语言,信息的存储和回溯系统等。秦健博士现执教于美国锡拉丘兹大学信息研究学院,1984年毕业于武汉大学,在加拿大西安大略大学获硕士学位,美国伊利诺依州大学香槟分校毕业,获博士学位。主要研究方向:信息组织,数据库设计和元数据管理系统,知识组织等。两位博士在国内图书馆界有很高的知名度,与北京大学图书馆有很深的渊源,经常来北大讲座、座谈,与图书馆有很好的合作交流。两博士均表示,将进一步加强与北大的联系合作,争取每年到北大图书馆做短期访问讲学一次,为北大数字图书馆研究和实验做出贡献。 (办公室)

http://www.lib.pku.edu.cn/tongxun/tx2002/news4.htm
 顶部
baojie 发表于: 2004/04/24 00:28am
 
王洪伟、吴家春、蒋馥(上海交通大学管理学院智能化管理与计算机仿真应用研究中心,上海 200052) 
 顶部
baojie 发表于: 2004/04/24 00:31am
 
董明楷,蒋运承,史忠植,一种带缺省推理的描述逻辑,计算机学报,2003,26(6)
董明楷,史忠植,基于动态描述逻辑的主体模型,计算机研究与发展,2003,40(12) 
 顶部
baojie 发表于: 2004/04/25 07:30pm
 
清华大学知识工程研究室 
http://boole.cs.iastate.edu/semanticweb/topic.cgi?forum=30&topic=52&show=0
 顶部
baojie 发表于: 2004/04/27 02:15pm
 
河海大学计算机学院  许卓明

他有几个本科生做语义网的毕业设计


姓  名:
许卓明
性  别:

出生年月:
1965年1月
职  称:
副教授
毕业学校:
  河海大学
专 业:
 计算机应用技术
学 位:
 硕士
联系电话:
 
电子邮件:

研究方向:
数据与知识工程
软件工程
获奖情况:
1994年度江苏省科技进步四等奖(“澳门国际机场施工管理系统”,本人排名第4)。
1996年度水利部科技进步三等奖(“三峡工程右岸一期工程项目管理信息系统”,本人排名第1)
2002年12月,被江苏省学位委员会和省教育厅授予(首批)江苏省优秀研究生课程奖(“现代数据管理技术”,课程建设负责人、主讲教师,本人排名第1)。
主要成果:
(主要)科研项目:
1.作为主研人员同英国SPP工程咨询公司合作开发的“澳门国际机场施工管理系统”获1994年度江苏省科技进步四等奖(本人排名第4)。
2.负责并主持了国家九五重点项目“三峡工程管理系统(TGPMS)”5个子题的研究开发,其中:“三峡工程右岸一期工程项目管理信息系统”子题获1996年度水利部科技进步三等奖奖(排名第1),“TGPMS总体设计”及“左岸永久船闸项目管理系统”2个子题与加拿大Monenco AGRA公司合作完成。
(主要)论文发表:
1.Design and Implementation of Right Bank Project Management Information System, Proc. of 18th Int’l Conf. on Computers & Industrial Engineering (ICC&IE’95), 1995. Vol. 2: 1392-1395.
2.澳门国际机场施工管理系统的设计与实现, 系统工程理论与实践, 1996, 16(3): 62-66.
3.三峡工程施工进度控制系统的设计与实现, 河海大学学报, 1996, 24(2): 1-6.
4.项目管理信息系统研究开发,微型计算机,16(2),1996: 55-57
5.基于XML的商业DBMS技术评述,计算机工程与设计, 2002, 23(11): 24-28.
6.本体技术及其在B2B电子商务信息集成中的应用, 计算机应用研究, 2003, 20(2): 44-47.
在研项目:
1、为主参与东南大学导师董逸生教授负责的“数据仓库系统的研究与开发(江苏省十五高科技项目BG2001013)”项目。
2、合作参与东南大学瞿裕忠教授负责的“语义Web关键技术研究(国家自然科学基金项目60173036)”项目。
3、负责“《现代数据管理技术》优秀研究生课程建设及网络双语课件系统MODTeacher开发(“江苏省研究生培养创新工程”专项基金)”
4、负责“《数据库系统原理》本科课程建设及网络课件系统PODTeacher开发(河海大学校基金)”

个人主页:
 
返回
 
 顶部
baojie 发表于: 2004/05/11 09:10am
 
http://www.mis.yuntech.edu.tw/new_site/board_detail.php?qry_sn=43


專題演講[05/07],葉慶隆,語意網與知識管理 

——————————————————————————–

公告單位: 系辦  [20040428]

——————————————————————————–

內        容: 專題演講公告

主講者:葉慶隆 教授

主  題:語意網與知識管理

日期:2004.5.07(三)時間:15:20-17:00

地點:GA107(學生活動中心)

現任職 大同大學資訊工程系所副教授

研究專長
 Semantic web
 Semantic Interoperability in Digital Libraries
 Automatic generation of FAQs
 Electronic business: ebXML, RosettaNet
 Knowledge-based systems/ Knowledge management
 Natural language understanding and generation

 
 顶部
baojie 发表于: 2004/05/11 09:13am
 
戚玉樑  中原大學資訊管理學系所
http://dcrl.mis.cycu.edu.tw/

網路服務技術及語意網研究中心
http://www.ws.org.tw/
 顶部
baojie 发表于: 2004/05/20 03:35pm
 
Fifth Agricultural Ontology Service (AOS) Workshop
http://www.fao.org/agris/aos/Workshops/China_AAOS/AAOS_Programme.htm

Part of Participants

Chang Chun Scientech Documentation and Information Center (SDIC),CAAS,China
Cui Guangzuo Modern Education Technology Center, Peking University,China
Fan Jing  Graduate Department,Chinese Defense Science and Technology Information Center(CDSTIC), China 
Fu Honghu Library of Chinese Academy of Sciences, China 
Gong Changming Library, Chinese Defense Science and Technology Information Center(CDSTIC), China 
He Jianxi Nanjing Agricultural University, China 
Hou Hanqing Nanjing Agricultural University, China
Hu Chuling The computer & Language Information Engineering Research Center, Chinese Academy of Sciences, China 
Hu Qiongjing Graduate Department,Chinese Defense Science and Technology Information Center(CDSTIC), China
Huang Heyan The computer & Language Information Engineering Research Center,Chinese Academy of Sciences, China 
Lai Maosheng Information Department of Peking University, China
Li Jing Library of Chinese Academy of Sciences, China
Li Sijing Scientech Documentation and Information Center (SDIC),CAAS,China
Li Yu Library of Chinese Academy of Sciences, China
Liang Na Library of Chinese Academy of Sciences, China
Liang Zhanping Chinese Information Institute of Science and Technique, China
Lu Wenlin Scientech Documentation and Information Center (SDIC), CAAS, China
Mao Jun Library of Chinese Academy of Sciences, China
Mei Fangquan  Scientech Documentation and Information Center (SDIC), CAAS,China 
Meng Xianxue  Scientech Documentation and Information Center (SDIC), CAAS, China 
Qian Ping  Scientech Documentation and Information Center (SDIC), CAAS, China 
Song Jiping  The computer & Language Information Engineering Research Center, Chinese Academy of Sciences, China 
Song Lizhe  Beijing Institute of Technology, China 
Tang Aimin  Graduate Department,Chinese Defense Science and Technology Information Center(CDSTIC), China 
Tang Shanhong Library, Chinese Defense Science and Technology Information Center(CDSTIC), China 
Wang Fang  Library of Chinese Academy of Sciences, China 
Wang Xin  Library of Chinese Academy of Sciences, China 
Wang Zhong  Institute of Sci-Tech Information Guangdong Academy of Agricultural Sciences, China 
Wu Zhuyu  Information Department of Peking University, China 
Xu Shiwei  Scientech Documentation and Information Center (SDIC), CAAS, China 
Yang Xiudan  Information Department of Peking University, China 
Zhang Chunhui  Library of Guangzhou First Surgeon University, China 
Zhang Li  Scientech Documentation and Information Center (SDIC),CAAS,China 
Zhang Xiaolin  Library of Chinese Academy of Sciences,China 
Zhen Zhen  Library of China Defense Science Technique Information Center, China 
 
 顶部
jyxu 发表于: 2005/02/17 08:14am
 

下面引用由baojie在 2004/04/22 03:52am 发表的内容:
http://info.ruc.edu.cn/wang/ 王 珊  中国人民大学信息学院
 
 


 
 顶部
yaresky 发表于: 2005/05/31 07:27pm
 
北京大学计算机系的iEMS研究小组(iems911.nease.net) 正在做语义网络
实验室的网站是 http://gis.pku.edu.cn

应急预案是iEMS中突发公共事件处置的基础,是高效率处置的基础,然而在重大事件处置中几乎不会完全按固定预案执行,总会出现突发事件的意外情况,甚至是意外事件,此时应急决策取决于指挥者的经验和临机能力,如何让IT特别是语义网络辅助普通指挥者进行临机决策是本研究方向的主旨。

有关研究放在论坛 http://forumabc.net/cgi-bin/forums.cgi?forum=12

 
 顶部
yaresky 发表于: 2005/05/31 07:39pm
 
为此,我们专门设了城市应急指挥系统/应急联动系统的网站和论坛 http://iems911.nease.net

2006年03月15日

http://zh.transwiki.org/cn/rdfprimer.htm

转自:http://zh.transwiki.org/cn/rdfprimer.htm

TransWiki – W3CHINA.ORG开放翻译计划(OTP)



译文(Translation Document) RDF入门 推荐标准http://zh.transwiki.org/cn/rdfprimer.htm (http://zh.transwiki.org/cn/rdfprimer.htm)
原文(Original Document) RDF Primer Recommendation(http://www.w3.org/TR/rdf-primer/ (http://www.w3.org/TR/rdf-primer/)
说明(Notes)
  • 本文档是根据2004年2月10日发布的http://www.w3.org/TR/rdf-primer/ RDF Primer推荐标准 (http://www.w3.org/TR/rdf-primer/)进行翻译的。
  • 本文档的http://www.w3.org/TR/rdf-primer/ 英文版 (http://www.w3.org/TR/rdf-primer/)是唯一的正式版本。
  • 虽然译者已为翻译之精确付出努力,不足之处仍难免存在。欢迎指正 (http://zh.transwiki.org/cn/rdfprimer-edit.htm)
  • 译注的内容是非正式的,仅代表译者个人观点。
  • 著作权声明位于:

http://www.w3.org/Consortium/Legal/copyright-documents.html
Copyright  © 1998 W3C® (MIT, INRIA, Keio ), All Rights

Reserved. W3C liability, trademark, document use and software licensing rules apply.

  • 中文版的版权声明:转载本文,请注明译者、原链接及出处为“W3CHINA.ORG 开放翻译计划(OTP)”。
译者及校对(Translators&Reviewers)
  • 朱礼军 (http://bbs.w3china.org/dispuser.asp?name=trevol)(Lijun Zhu)翻译活动主席(Lead) (http://zh.transwiki.org/wiki/index.php/ActivityProcess#.E7.BF.BB.E8.AF.91.E6.B4.BB.E5.8A.A8.E4.B8.BB.E5.B8.AD) zhulj<at>w3china.org:翻译第5节、6.4节,校对第3节,并负责全文的统稿和翻译中的协调与裁决工作。
  • 刘升平 (http://bbs.w3china.org/dispuser.asp?name=orangebench)(Shengping Liu)翻译活动副主席(Co-Lead) (http://zh.transwiki.org/wiki/index.php/ActivityProcess#.E7.BF.BB.E8.AF.91.E6.B4.BB.E5.8A.A8.E4.B8.BB.E5.B8.AD) lsp<at>w3china.org:翻译第4节、5.3-5.5节、6.7节和第7节,校对第1-2节、6.1-6.3节、6.5-6.6节和附录,并负责工作组的组织与翻译工作的统筹。
  • 徐涵 (http://bbs.w3china.org/dispuser.asp?name=admin)(Collin Hsu),webmaster<at>w3china.org:翻译目录、第1节、第3节和附录,校对摘要、本文档的状态第5节和6.7节。
  • 詹子鹏 (http://bbs.w3china.org/dispuser.asp?name=forwar)(Zipeng Zhan):翻译摘要、第2节和6.2节。
  • 倪跃 (http://bbs.w3china.org/dispuser.asp?name=nybon)(nybon@163.com):翻译6.5和6.6节。
  • Ontoweb (http://bbs.w3china.org/dispuser.asp?name=Ontoweb)(zhao608<at>yahoo.com.cn):翻译6.1节。
  • 暴雨 (http://bbs.w3china.org/dispuser.asp?name=weekend)(weekend256@yahoo.com.cn):翻译6.3节。
  • 汪鹏 (http://bbs.w3china.org/dispuser.asp?name=npubird)(npu007@263.net):校对第4节。
  • 张钋 (http://bbs.w3china.org/dispuser.asp?name=monbit)(zhangpo217217@sina.com):校对6.4节。

关于本文档翻译工作的说明、任务分配及进展情况,请参见http://bbs.xml.org.cn/dispbbs.asp?boardid=2&id=8689&star=1#8689 (http://bbs.xml.org.cn/dispbbs.asp?boardid=2&id=8689&star=1#8689)

致谢
特别感谢orangebench,他在翻译过程中所提出口号——“一日一段不懈怠”成为了鞭策小组成员持之以恒、不断努力的座右铭。还要特别感谢由W3CHINA.ORG (http://www.w3china.org/)主办的开放翻译计划(OTP) (http://zh.transwiki.org/)为本次翻译计划提供翻译与讨论平台。最后感谢工作组其它成员Admin、ForWar、Nybon、Weekend、OntoWeb等积极参与该次翻译活动,并就有关的翻译问题进行了热烈讨论。


w3c_home.png (http://www.w3.org/)


RDF入门



W3C 推荐标准 2004年02月10日


当前版本:
http://www.w3.org/TR/2004/REC-rdf-primer-20040210/ (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/)

最新版本:
http://www.w3.org/TR/rdf-primer/ (http://www.w3.org/TR/rdf-primer/)

上一版本:
http://www.w3.org/TR/2003/PR-rdf-primer-20031215/ (http://www.w3.org/TR/2003/PR-rdf-primer-20031215/)

编者:

Frank Manola, fmanola@acm.org (mailto:fmanola@acm.org)

Eric Miller, W3C, em@w3.org (mailto:em@w3.org)

系列文档编者:

Brian McBride, Hewlett-Packard Laboratories, bwm@hplb.hpl.hp.com (mailto:bwm@hplb.hpl.hp.com)

阅读时请参照本文档的勘误表 (http://www.w3.org/2001/sw/RDFCore/errata#rdf-primer),其中可能会包含一些规范性的修正。

也要留意译文 (http://www.w3.org/2001/sw/RDFCore/translation/rdf-primer)

Copyright (http://www.w3.org/Consortium/Legal/ipr-notice#Copyright)? 2004 W3C? (MIT, ERCIM, Keio (http://www.keio.ac.jp/)), All Rights Reserved. W3C liability (http://www.w3.org/Consortium/Legal/ipr-notice#Legal_Disclaimer), trademark (http://www.w3.org/Consortium/Legal/ipr-notice#W3C_Trademarks), document use (http://www.w3.org/Consortium/Legal/copyright-documents) and software licensing (http://www.w3.org/Consortium/Legal/copyright-software) rules apply.




摘要

资源描述框架 (RDF) 是用来表现万维网上各类资源的信息的一种语言,为了帮助读者了解一些必备的基础知识后能有效地使用 RDF,特编写此基础入门教程。本书介绍了RDF的一些基本概念以及RDF基于XML(可扩展标记语言)的语法。本书还讨论了如何用RDF词汇描述语言来定义RDF词汇集,并总结了目前所部署的一些基于RDF的应用。最后,本文介绍了其他RDF规范文档的内容和用途。



本文档的状态

本文档已被W3C成员及其他相关方面审阅,并已被W3C总监(W3C Director)[译注//Director是W3C组织的最高行政职位,目前由Tim Berners-Lee担任。]批准为W3C推荐标准(W3C Recommendation) (http://www.w3.org/2003/06/Process-20030618/tr.html#RecsW3C)。W3C 制定推荐标准的任务是使之受到关注,并促使其被广泛应用。这将增强Web的功能性(functionality)与互操作性(interoperablity)。

本文档是一套文档系列 (http://www.w3.org/TR/2004/REC-rdf-concepts-20040210/#section-Introduction)中的一份,该文档系列 (http://www.w3.org/TR/2004/REC-rdf-concepts-20040210/#section-Introduction)共六份,他们分别是:入门 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/)概念 (http://www.w3.org/TR/2004/REC-rdf-concepts-20040210/)语法 (http://www.w3.org/TR/2004/REC-rdf-syntax-grammar-20040210/)语义 (http://www.w3.org/TR/2004/REC-rdf-mt-20040210/)词汇表 (http://www.w3.org/TR/2004/REC-rdf-schema-20040210/)测试用例 (http://www.w3.org/TR/2004/REC-rdf-testcases-20040210/))之中的一份。该文档系列将替换原有的资源描述框架规范(Resource Description Framework specifications)、RDF的模型与语法 推荐标准 (http://www.w3.org/TR/1999/REC-rdf-syntax-19990222/)RDF Schema 推荐标准 (http://www.w3.org/TR/2000/CR-rdf-schema-20000327/)。 本文档由RDF核心工作组(RDF Core Working Group) (http://www.w3.org/2001/sw/RDFCore/)制定,它是W3C语义网行动组(W3C Semantic Web Activity) (http://www.w3.org/2001/sw/)的一部分(行动组声明 (http://www.w3.org/2001/sw/Activity)工作组章程 (http://www.w3.org/2002/11/swv2/charters/RDFCoreWGCharter))的一部份,被定于在2004年2月10日发布。

自建议推荐标准以来的修改已被详细记录在更改日志中。

欢迎大家将意见发送至www-rdf-comments@w3.org (mailto:www-rdf-comments@w3.org)存档文件 (http://lists.w3.org/Archives/Public/www-rdf-comments/))并积极参与www-rdf-interest@w3.org (mailto:www-rdf-interest@w3.org)(存档文件 (http://lists.w3.org/Archives/Public/www-rdf-interest/))上的相关技术讨论。

一个RDF的实现列表可通过http://www.w3.org/2001/sw/RDFCore/impls (http://www.w3.org/2001/sw/RDFCore/impls)获得。

W3C维护着一个有关这项工作的已公开专利列表 (http://www.w3.org/2001/sw/RDFCore/ipr-statements)

本节描述了本文档在发布时的状态。本文档有可能被其他本文档所替代。W3C推荐标准及其他技术文档(technical document)的最新列表可从以下网址获得:http://www.w3.org/TR (http://www.w3.org/TR)



目录

  1. 介绍(Introduction) (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#intro)
  2. 关于资源的陈述(Making Statements About Resources) (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#statements)
      2.1 基本概念(Basic Concepts) (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#basicconcepts)
      2.2 RDF模型(The RDF Model) (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#rdfmodel)
      2.3 结构化属性值与空白节点(Structured Property Values and Blank Nodes) (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#structuredproperties)
      2.4 类型文字(Typed Literals) (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#typedliterals)
      2.5 总结(Concepts Summary) (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#conceptsummary)
  3. RDF/XML – 一种用于RDF的XML语法(An XML Syntax for RDF: RDF/XML) (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#rdfxml)
      3.1 基本原理(Basic Principles) (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#basicprinciples)
      3.2 简化和组织RDF URIrefs(Abbreviating and Organizing RDF URIrefs) (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#newresources)
      3.3 总结(RDF/XML Summary) (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#rdfxmlsummary)
  4. 其它RDF表达能力(Other RDF Capabilities) (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#othercapabilities)
      4.1 RDF容器(RDF Containers) (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#containers)
      4.2 RDF集合(RDF Collections) (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#collections)
      4.3 RDF具体化(RDF Reification) (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#reification)
      4.4 关于结构化值(rdf:value)的更多信息(More on Structured Values: rdf:value) (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#rdfvalue)
      4.5 XML文字(Literal)(XML Literals) (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#xmlliterals)
  5. RDF Schema – 定义RDF的词汇表(Defining RDF Vocabularies: RDF Schema) (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#rdfschema)
      5.1 描述类(Class)(Describing Classes) (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#schemaclasses)
      5.2 描述属性(Property)(Describing Properties) (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#properties)
      5.3 理解RDF Schema声明(Interpreting RDF Schema Declarations) (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#interpretingschema)
      5.4 其它关于Schema的信息(Other Schema Information) (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#otherschema)
      5.5 更丰富的Schema语言(Richer Schema Languages) (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#richerschemas)
  6. 一些RDF的应用:具体领域中的RDF(Some RDF Applications: RDF in the Field) (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#applications)
      6.1 都柏林核心元数据倡议(Dublin Core Metadata Initiative) (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#dublincore)
      6.2 PRISM (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#prism)
      6.3 XPackage (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#xpackage)
      6.4 RSS 1.0:RDF站点汇总(RSS 1.0: RDF Site Summary) (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#rss)
      6.5 CIM/XML (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#cimxml)
      6.6 基因本体协会(Gene Ontology Consortium) (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#geneont)
      6.7 描述设备性能与用户偏好(Describing Device Capabilities and User Preferences) (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#devcap)
  7. RDF规范的其它部分(Other Parts of the RDF Specification) (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#otherparts)
      7.1 RDF语义(RDF Semantics) (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#semantics)
      7.2 测试用例(Test Cases) (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#testcases)
  8. 参考文献(References) (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#references)
      8.1 规范性参考文献(Normative References) (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#normative-references)
      8.2 参考性资料(Informational References) (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#informational-references)
  9. 致谢(Acknowledgments) (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#acknowledgements)


附录

  A. 关于URI的更多信息(More on Uniform Resource Identifiers (URIs)) (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#identifiers)
  B. 关于XML的更多信息(More on the Extensible Markup Language (XML)) (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#documents)
  C. 改动记录(Changes) (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#changes)




1. 介绍(Introduction)

资源描述框架(Resource Description Framework, 简称 RDF)是一个用于表达关于万维网(World Wide Web)上的资源的信息的语言. 它专门用于表达关于Web资源的元数据, 比如Web页面的标题、作者和修改时间,Web文档的版权和许可信息,某个被共享资源的可用计划表等。然而,将“Web资源(Web resource)”这一概念一般化后,RDF可被用于表达关于任何可在Web上被标识的事物的信息,即使有时它们不能被直接从Web上获取。比如关于一个在线购物机构的某项产品的信息(例如关于规格、价格和可用性信息),或者是关于一个Web用户在信息递送方面的偏好的描述。

RDF用于信息需要被应用程序处理而不是仅仅显示给人观看的场合。RDF提供了一种用于表达这一信息、并使其能在应用程序间交换而不丧失语义的通用框架。既然是通用框架,应用程序设计者可以利用现成的通用RDF解析器(RDF parser)以及通用的处理工具。能够在不同的应用程序间交换信息意味着对于那些并非信息的最初创建者的应用程序也是可利用这些信息。

RDF基于这样的思想:用Web标识符(称作统一资源标识符Uniform Resource IdentifiersURIs)来标识事物,用简单的属性(property)及属性值来描述资源。这使得RDF可以将一个或多个关于资源的简单陈述表示为一个由结点和弧组成的图(graph),其中的结点和弧代表资源、属性或属性值。为了让讨论显得尽量具体一些,下面的这组陈述“有一个人由http://www.w3.org/People/EM/contact#me 标识, 他的名字是Eric Miller, 他的电子邮件地址是em@w3.org,他的头衔是Dr.”可以表示为图1 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#figure1)所示的图:

fig1dec16.png

图1:一个描述Eric Miller的RDF图

图1 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#figure1)展示了RDF用URIs来标识:

RDF提供了一种基于XML的语法(称为RDF/XML)用于保存和交换RDF图。图1 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#figure1)所示的RDF用RDF/XML来书写的话就像下面的例1 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example1)这样:

例1:一段描述Eric Miller的RDF/XML

 <?xml version="1.0"?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:contact="http://www.w3.org/2000/10/swap/pim/contact#">
<contact:Person rdf:about="http://www.w3.org/People/EM/contact#me">
<contact:fullName>Eric Miller</contact:fullName>
<contact:mailbox rdf:resource="mailto:em@w3.org"/>
<contact:personalTitle>Dr.</contact:personalTitle>
</contact:Person>
</rdf:RDF>

注意:上述RDF/XML也包含URIs,同样地还包含简略形式的属性(比如mailbox和fullName)及各个属性的值(em@w3.org和Eric Miller)。

和HTML一样,RDF/XML也是机器可处理的,也使用URIs,RDF也可以链接Web上任何地方的信息。然而与传统超文本不同的是,RDF URIs可以引用任何可标识的事物,包括那些不是直接可从Web上获取的事物(比如Eric Miller这个人)。结果是,RDF除了能够描述像网页这类事物以外,还可以描述汽车,商业活动,人类,新闻事件等等。此外,RDF中的属性本身有URIs,用以准确标识被链接的事物之间的关系。

下列文档都属于RDF规范的一部分:

本文档旨在提供一个关于RDF的介绍,并描述一些已有的RDF应用,以帮助信息系统设计者及应用程序开发者理解RDF的特性和如何使用这些特性。特别地,本文档旨对下列这类问题做出回答:

  • RDF看起来是怎样的?
  • RDF可以表达什么信息?
  • RDF信息是如何被创建、访问和处理的?
  • 现有信息如何能够与RDF结合?

本文档是一个非规范性(non-normative)文档,也就是说它并不是关于RDF的权威性的规范。本文档中的例子和其他解释性的资料用于帮助读者理解RDF,但是它们有可能并不是权威性的和充分完善的。在这些情况下,请参考RDF规范中相关的规范性文档。为此,本文档描述了RDF规范中的其他文档所担任的角色,并在适当的地方提供了指向规范性文档中相关部分的链接。

需要注意的是,上述RDF文档更新并更清晰地解释了先前发布的一些RDF规范,资源描述框架(RDF)的模型和语法规范 (http://www.w3.org/TR/1999/REC-rdf-syntax-19990222/) [RDF-MS (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-rdfms)]和资源描述框架模式(RDF Schema)规范1.0 (http://www.w3.org/TR/2000/CR-rdf-schema-20000327/)[RDF-S (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-rdf-s)]。所以,一些术语、语法和概念已经稍有变化。本文档反映的是在上面的列表中给出的新版本RDF规范。因此,对于熟悉旧规范或基于旧规范的教程、入门读物的读者,应留意当前版本的规范与先前版本的一些差异。关于先前版本的RDF中出现的一些问题以及它们在当前版本中的解决方案的列表,请参见[http://www.w3.org/2000/03/rdf-tracking/ RDF问题跟踪(Issue Tracking)。


2. 关于资源的陈述

RDF是用以提供一种发表关于Web资源(如网页)的陈述的简单方法的。这部分描述了RDF提供这些能力(描述这些概念的规范标准就是RDF概念和抽象语法 (http://www.w3.org/TR/rdf-concepts/)[RDF-CONCEPTS (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-rdf-concepts)])背后的基本思想。



2.1 基本概念

试想一下这样的情形:有一个叫John Smith的人创建了某个网页。如果用自然语言(比如英语)来陈述该事实,一种简洁明了的方式是采用下面这种简单陈述的形式:

 http://www.example.org/index.html has a creator whose value is John Smith

强调该陈述的各个部分是为了强调:为了描述某事物的特性,需要某些方法来命名或标识多种事物:

  • 陈述所描述的事物(譬如此例中John Smith所创建的网页)
  • 陈述所描述事物的具体属性(property)(譬如本例中的creator)
  • 陈述所描述的作为该属性(陈述所描述事物对应的)的值的事物(如这个网页的creator是谁)。

在上面的陈述中,网页用它的URL(Uniform Resource Locator,统一资源定位符)来标识。另外,单词“creator”被用来标识事物的属性(property),短语“John Smith”被用来标识作为属性(property)的值的事物(一个人)。

该网页的其他属性(property)可以通过书写其他具有相同形式的英文陈述来描述:用URL标识该网页,用单词(或其他表达式)来标识网页的属性(properties)及其值。例如:这个网页的创建日期和所用的语种可以由下列陈述来描述:

 http://www.example.org/index.html has a creation-date whose value is August 16, 1999
http://www.example.org/index.html has a language whose value is English

RDF是基于这一思想的:被描述的事物具有一些属性 (http://www.w3.org/TR/rdf-concepts/#dfn-property) (properties),而这些属性各有其值(values);对资源的描述可以通过对它作出指定了上述属性及值的陈述(statement)来进行(就像上面例子中的那样)。RDF用一套特定的术语来表达陈述中的各个部分。确切地说,关于事物(譬如上例中的网页)的陈述中用于识别事物的那部分就叫做主体 (http://www.w3.org/TR/rdf-concepts/#dfn-subject),而用于区分陈述对象主语的各个不同属性(譬如:作者,创建日期,语种等等)的那部分就叫做谓词 (http://www.w3.org/TR/rdf-concepts/#dfn-predicate),陈述中用于区分各个属性的值的那部分叫做客体 (http://www.w3.org/TR/rdf-concepts/#dfn-object)。因此,考虑英文陈述:

 http://www.example.org/index.html has a creator whose value is John Smith

这个陈述里的不同部分用RDF术语来说就是:

正如英语是作为(用英语沟通的)人们之间很好沟通工具一样,RDF是用来做出机器可处理的声明的工具。那么,如果想做出这种适合机器处理的声明,还需要两件事:

  • 一个可用来区分标识一个陈述中的主体,谓词,客体的机器可处理的标识符系统,同时这个标识符系统不会和其他人可能在Web上使用的相似的标识符系统混淆;
  • 一种用以表示这些陈述并让这些陈述可在机器间交流的机器可处理的语言;

幸运地是,现有的Web体系结构提供了这两个必需的工具。

正如前面所描述的,Web已经提供了一种形式的标识符-URL(Uniform Resource Locator,同一资源定位符)。在第一个例子中,就采用了一个URL来标识John Smith所创建的网页。URL是标识(identify)Web资源(Web resource)的字符串,这是通过标识资源的首选访问机制来实现的(本质上,即资源的网络“位置”)。然而,对于许多不具有网络地址或URL的资源(这一点与网页是不同的),能够记录关于它们的信息也是同等重要。

Web提供了一套更通用的标识符形式,称为统一资源标识符 (http://www.isi.edu/in-notes/rfc2396.txt)(Uniform Resource Identifier,URI)。URL是URI的一种具体形式。所有URI都具有共同的特征:即不同的人或组织可以彼此独立地创建并使用URI来标识事物。但是,URI并不局限于标识具有网络地址或其他计算机访问机制的资源。实际上,我们可以创建URI来引用陈述中需要被标识的任何资源,包括:

  • 网络可访问资源,譬如,一份电子文档、一个图片、一个服务(例如,“洛山矶的今日天气预报”)或是一组其他的资源;
  • 非网络可访问资源,譬如,人、公司、在图书馆装订成册的书籍;
  • 不物理存在的抽象概念,如“作者(creator)”这个概念;

由于上述通用性,RDF用URIs作为其标识机制(用于标识陈述中的主体、谓词和客体)的基础。更准确地说,RDF使用的是URI引用(URI references) (http://www.w3.org/TR/rdf-concepts/#dfn-URI-reference) [URIS (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-uri)]。一个URI引用(或“URIref”)是一个在尾部附加了可选的“片段识别符(fragment identifier)”的URI。比如,URI引用(URIref) http://www.example.org/index.html# 由URI http://www.example.org/index.html 和(由符号#分隔的)的section2 (片段标识符)组成。RDF URIrefs可以包含Unicode[UNICODE (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-unicode)]字符(参见[RDF-CONCEPTS (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-rdf-concepts)]),这就允许在URIrefs中使用多种语言。RDF将“资源(resource)”定义任何可被为URI引用(URIref)标识的事物。因此,使用URIrefs,RDF实际上可以描述任何事物,并陈述这些事物之间的关系。URIrefs和片段标识符将在Appendix A (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#identifiers)[RDF-CONCEPTS (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-rdf-concepts)]中作进一步的阐述。

为了用一种机器可处理的(machine-processable)方式来表示RDF陈述(RDF statements),RDF采用了可扩展标记语言(Extensible Markup Language) (http://www.w3.org/TR/2000/REC-xml-20001006)[XML (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-xml)]。XML被设计成允许任何人来设计他们自己的文档格式,并可用这种格式书写文档。RDF定义了一个特殊的XML标记语言(称为RDF/XML)来表示RDF信息和在机器间交换这些信息。在第一节 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#intro)中有一个关于RDF/XML的例子。这个例子(例 1 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example1) )使用了一些诸如<contact:fullName>和<contact:personalTitle>这样的标签来相应地区分Eric Miller和Dr这些文本内容。这些标签能让那些理解这些标签含义的程序正确地解释文本内容。XML的内容和标签(除了一些特例)能够包含统一字符编码[UNICODE (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-unicode)] 的字符,这就允许了来自各种语言的信息可以被直接显示出来。附录 B (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#documents)大体上给出了关于XML进一步的背景知识。关于RDF的RDF/XML专用语法在第三节 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#rdfxml)中有更详细的描述,且定义在规范[RDF-SYNTAX (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-rdf-syntax)]中。



2.2 RDF模型

2.1节 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#basicconcepts) 中阐述了以下内容:RDF陈述的基本概念,用URIref标识RDF陈述中涉及的事物的方法,以及用RDF/XML作为一种机器可处理的方式来表示RDF陈述。基于这些铺垫,这节将描述RDF是如何用URIs发表关于资源的陈述的。在介绍(第1节)中已经说明了,RDF的基本思想是:表达简单的资源陈述,其中每个陈述都是由主体(subject),谓词(predicate),客体(object)组成的。在RDF中,如下的英文陈述:

 http://www.example.org/index.html has a creator whose value is John Smith

可以由RDF陈述来表示:

请注意是如何用URIrefs不仅标识了陈述的主体,还标识了谓词和客体,而不分别用单词“作者”和“John Smith”(这样使用URIrefs的效果将会在这节的稍后部分做论述)。

RDF把图中的节点和弧作为陈述的模型。RDF的图模型 (http://www.w3.org/TR/rdf-concepts/#section-data-model)已在[RDF概念 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-rdf-concepts)]里有过详细说明。在这个表示法(图示法)中,一个陈述可表示为:

  • 一个表示主体的节点;
  • 一个表示客体的节点;
  • 一个由主体节点指向客体节点的表示谓词的弧;

因此以上的RDF陈述可以描述为如图2 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#figure2)所示的那样:

fig2dec16.png

图2:一个简单的RDF陈述

一组陈述相应地被一组节点和弧表示。所以,为了在RDF中表示其他的英文陈述:

http://www.example.org/index.html has a creation-date whose value is August 16, 1999
http://www.example.org/index.html has a language whose value is English

可以用图3 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#figure3)所示的图(用合适的URIrefs标识属性"creation-date" 和 "language"):

fig3nov19.png

图3:关于同一资源的多个陈述:

图3 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#figure3) 说明了RDF陈述中的客体可以是URIrefs,也可以是常量值(称作文字),即用于表示某种属性值的字符串。

图 3 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#figure3)显示了:为了表示多种类型的属性值,RDF陈述中的客体可能是URIrefs或字符串表示的常数(称为文字 (http://www.w3.org/TR/rdf-concepts/#section-Literals),literal)。(比如在以 “http://purl.org/dc/elements/1.1/language” 为谓词的例子中,那个文字就是一个英文的国际标准双字母码。)在RDF的陈述中,文字(literal)可能不被用作主体或者谓词。在画RDF图时,节点为URIrefs的用椭圆来表示,而节点为文字的则用方框来表示(这个例子中的简单字符串文字叫做平凡文字 (http://www.w3.org/TR/rdf-concepts/#dfn-plain-literal),它与将会在2.4节 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#typedliterals)做介绍的类型文字 (http://www.w3.org/TR/rdf-concepts/#dfn-typed-literal)(typed literals)是不同的。在[[RDF-CONCEPTS (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-rdf-concepts)]中详细说明了各种不同的可用于RDF陈述中的文字。平凡文字和类型文字都能容许采统一字符编码[UNICODE (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-unicode)]的字符,即允许信息用多种语言描述。)

有时在讨论它们的时候画图不太方便,因此也会用到一个替代的书写陈述的方法,称为三元组 (http://www.w3.org/TR/rdf-concepts/#dfn-rdf-triple)。在三元组表示法中,图中的每个陈述都可以写成一个依次为主体,谓词,客体的三元组。如图3 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#figure3)所表示的陈述用三元组表示法来写就是:

 <http://www.example.org/index.html&gt; <http://purl.org/dc/elements/1.1/creator&gt; <http://www.example.org/staffid/85740&gt; .
<http://www.example.org/index.html&gt; <http://www.example.org/terms/creation-date&gt; "August 16, 1999" .
<http://www.example.org/index.html&gt; <http://purl.org/dc/elements/1.1/language&gt; "en" .

每一个三元组均对应于图中的一条弧,且这个弧的起始节点和终止节点分别是陈述中的主体和客体。和图形表示法不同(倒像是原先的陈述),三元组表示法要求一个节点在它出现的每个陈述中都要有标识。因此,例如, “http://www.example.org/index.html” 在三元组表示法中共出现了三次(在每个三元组中均出现一次),而在图形表示法中只出现了一次。但是,三元组表示法和图示法描述了完全相同的信息,这揭示了一个要点:RDF的基础是陈述的图模型,而用于表示或描述这个图的表示法则是次要的。

完全的三元组表示法要求写出完整的URIref(括在尖刮号中),正如上面例子那样,所以导致了在一页中有很多长句。为方便起见,本文档用一种简写法(也在其他的RDF规范里使用)来书写三元组。在这种简写法中, 一个不用尖刮号的XML限定名(QName)作为一个完整的URIref 的缩写形式 (QName 会在附录 B (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#documents)进一步讨论)。一个QName包括一个被赋为命名空间URI的前缀,其后是一个冒号,然后是个"局部名称"(local name)。由QName可以生成完整的URIref,即将局部名称添加到已经赋了命名空间URI的前缀。因此,例如,如果将命名空间URI“http://example.org/somewhere/”赋值给QName前缀foo,那么QName “foo:bar”就是URIref“http://example.org/somewhere/bar”的缩写。在本文档的例子中也会用一些“公认的”QName前缀(这些前缀无需说明就可使用),定义如下:

 前缀 rdf:, 命名空间 URI: http://www.w3.org/1999/02/22-rdf-syntax-ns#
前缀 rdfs:, 命名空间 URI: http://www.w3.org/2000/01/rdf-schema#
前缀 dc:, 命名空间 URI: http://purl.org/dc/elements/1.1/
前缀 owl:, 命名空间 URI: http://www.w3.org/2002/07/owl#
前缀 ex:, 命名空间 URI: http://www.example.org/ (or http://www.example.com/)
前缀 xsd:, 命名空间 URI: http://www.w3.org/2001/XMLSchema#

显然,“example”的前缀 “ex:”的变形在需要时也会用在示例中,例如:

 前缀 exterms:, 命名空间 URI: http://www.example.org/terms/ (作为示例的组织中的词汇),
前缀 exstaff:, 命名空间 URI: http://www.example.org/staffid/ (作为示例的组织中的雇员标识),
前缀 ex2:, 命名空间 URI: http://www.domain2.example.org/ (作为示例的第二个组织中的词汇), and so on.

用这种简写法,先前的三元组可以写成:

 ex:index.html  dc:creator             exstaff:85740 .
ex:index.html exterms:creation-date "August 16, 1999" .
ex:index.html dc:language "en" .

因为RDF用URIref替代词语来命名陈述中的事物,RDF称一个URIref的集合(特别是为了某个目的集合)为词汇表(vocabulary)。通常,这些词汇表中的URIrefs被组织为一个有相同前缀的QName的集合。也就是说,一个词汇表中的所有术语都有一个相同的命名空间URIref,通常这个URIref(无论是谁控制)定义了这个词汇表。包含在词汇表里的URIrefs是通过在公用的URIref的末端加上局部名称形成的,这样就构成了一套有着公用前缀的URIrefs。譬如:正像前面的例子展示的那样,一个组织,比方说是example.org,可能定义一个由前缀全部为http://www.example.org/terms/ 的URIrefs构成的词汇表,用来表示这个组织在业务中用到的术语(例如:“创建日期”,“产品”等),同时也会定义一个全部由http://www.example.org/staffid/ 开头的URIrefs词汇表来标识这个组织的雇员。RDF用相同的方法来定义它自己的术语的词汇表,这些术语在在RDF中有着特定的含义。RDF 词汇表中的 URIrefs 都以 “http://www.w3.org/1999/02/22-rdf-syntax-ns# ”开头,通常情况下,其QName用前缀“rdf:”来表示。RDF词汇描述语言(将会在 第五节 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#rdfschema)做阐述)定义了另一套都以http://www.w3.org/2000/01/rdf-schema# 开头的URIrefs的术语集合,其QName用前缀“rdfs:”来表示。(当一个特定的QName前缀以这种方式与一个已给定的术语集相关联的时候,那么这个QName前缀有时会用以作为这个词汇表的名称,比如,有人可能说“rdfs: 词汇”)。

使用公用的URI前缀提供了一种便捷的方法来组织一套相关的术语集URIrefs,然而,这仅仅只是一种约定。RDF模型只认可完整的URIrefs;它不会去看URIrefs的具体内容或使用任何关于它们结构的知识。特别地,RDF不会仅仅因为URIrefs有一个公用的前缀而认定这些URIrefs之间有联系(更深入的探讨请看附录A (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#identifiers) )。当 URIrefs 带有不同的前缀时,并没有规定说,这些URIrefs就不能被认为属于同一个词汇表。 某个特定的组织、过程(process)或者工具等可以根据自己的需要,来定义词汇。这些词汇的 URIrefs可以来自于任何其它的词汇,数目不受限制。

另外,有时一个组织将使用词汇表的URIref命名空间用作是提供关于该词汇表的详细资料这种Web资源所在地的URL。例如:像著名的QName前缀dc: 将会在本文档的例子中用到,它是和命名空间URIref http://purl.org/dc/elements/1.1/ 相关联的。事实上,这指在6.1节 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#dublincore)阐述的都柏林核心词汇表。通过在网页浏览器中访问这个URIref命名空间就能获得关于都柏林核心词汇表(明确地说,是一个RDF Schema)的其他一些信息。然而,这也仅仅只是一种约定。RDF不会认为每个URI命名空间都能确定一个可获取的Web资源(更深入的探讨请看附录B (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#documents) )。

在这个入门文档的其余部分里,当涉及到一些为特殊目而定义的一套URIref,比如供RDF自身的使用而定义的各种URIref ,或者是example.org定义的用来标识它雇员的一套URIref,时都将会用到术语“词汇表”。术语“命名空间”只是在特指XML命名空间这个语法概念的时候才会使用(或者用来描述 QName中的URI前缀)。

在RDF图中可以自由混合来自不同词汇表的URIrefs。譬如:在图 3 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#figure3) 中用到了分别采用了exterms:,exstaff:,dc:词汇表的URIref。在RDF图中,RDF也没有限制能用多少个具有同一谓词URIref的陈述描述同一个资源。例如:如果资源ex:index.html是由约翰·史密斯和其他几名工作人员努力合作创造的话,那么example.org可能写以下陈述:

 ex:index.html dc:creator exstaff:85740 .
ex:index.html dc:creator exstaff:27354 .
ex:index.html dc:creator exstaff:00816 .

这些RDF陈述的例子开始展现一些使用URIref作为RDF标识事物的基本方式的优势所在。譬如:在第一个陈述中,不用字符串“John Smith”来作为网页的制作者,而是把一个URIref(使用基于他的雇员号码的URIref)http://www.example.org/staffid/85740赋予给他。这样使用URIref的一个优点就是陈述主体可以被更加精确的标识出来。就是说,这个网页的制作者不是字符串“John Smith”,也不是数以千计的名叫John Smith的人中的一个,而是与那个URIref(且不管是谁创建了定义了这种关系的URIref)相关的那个特殊的John Smith。而且,因为一个指向John Smith的URIref,他就成为一个成熟的资源,并且仅仅通过增加其他主体为John的 URIref的RDF陈述,就可以记录他的一些其他信息。例如:图 4 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#figure4)展示了可给出关于John的姓名和年龄的一些陈述。

fig4dec16.png

图4:更多关于John Smith的信息

这些例子也说明了RDF在RDF陈述中用URIref作为谓词。就是说,RDF使用URIrefs标识属性,而不是使用像“creator”或者“name”那样的字符串(或词组)。用URIref来标识属性的重要性是基于很多原因的。第一,它可以把一个人用的属性和其他人用的属性区别开来,尽管他们可能用相同的字符串来表示属性。例如:在图4 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#figure4)中的例子,example.org使用"name"想要使写出的某人的全名作为一个字符串文字(譬如:“John Smith”),但是其他人可能想要使"name"代表某些不同的事物(譬如:在一个程序段中的变量名)。当一段程序遇到“name”作为一个Web上的属性标识符(或者当合并来自多个数据源的数据)时将不一定能区分这些使用方法。但是,如果example.org用“http://www.example.org/terms/name”当作它定义的“name”的值,并且其他人用“http://www.domain2.example.org/genealogy/terms/name”当作他们定义的“name”的值,那么显然不同的“name”包含着不同的值(即使一个程序不能自动确定它们的具体含义)。此外,使用URIrefs来区分属性能使属性被看成是资源本身。因为属性也是资源,仅仅通过增加主体为属性的URIref的RDF陈述,就能记录关于属性的信息(譬如:example.org 所用的“name”属性的含义的英文描述)。

用URIref作为RDF陈述的主体,谓词,客体支持了Web上的共享词汇表的使用和发展,因为人们可以发现并开始使用已经在用的词汇表来描述事物,这反映了人们对那些概念的共享理解。例如:在三元组“ex:index.html dc:creator exstaff:85740 ”中:

 ex:index.html   dc:creator   exstaff:85740 .

当谓词“dc:crearot”完全展开为一个URIref时,就明确的指向了Dublin Core元数据属性集(一个广泛使用的描述各种各样信息的一套属性集,将在6.1节 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#dublincore)中做深入的讨论)中的“creator”的属性。这个三元组的作者有效地说明了网页(由http://www.example.org/index.html 所标识)和网页的作者(一个独一无二的人,由http://www.example.org/staffid/85740 所标识)之间的关系正是一个由http://purl.org/dc/elements/1.1/creator 标识的概念。另一个熟悉Dublin Core词汇的人,或是查明了“dc:creator”确切含义(通过在Web上查找的它的定义)的人,将会明白这个关系的含义。另外,在这种理解的基础上,在处理含有谓词“dc:creator”的三元组时,人们就能编写出行为与这个含义一致的程序来。

当然,这有赖于越来越普遍地使用URIref而不是用文字来指代事物;譬如:用URIref像“exstaff:85740”和“dc:creator”来代替字符串文字像“John Smith”和“creator”。即使是那样,RDF对URIre的使用仍不能解决所有的标识问题,因为例如:人们仍然能够用不同的URIref来指代同一个事物。由于这个原因,尽量使用现有的词汇表(比如Dublin Core)的术语,而不发明可能与其他词汇表中术语重复的术语,这是个不错的想法。 正如在第6节 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#applications)描述的应用展示的那样,在特定领域里适用的词汇表一直都在完善中。然而,即使同义词被建立了,在普遍可访问的“Web 空间”中使用不同的URIref,即提供了在这些URIref中识别等价关系的机遇,也提供了转向使用通用词汇表的机遇。

另外,重要的是,要区分RDF本身赋予RDF陈述中的词汇(比如在先前例子里的dc:creator)的含义与人们(或人编写的程序)可能赋予这些词汇的其他外部定义的含义。作为一门语言,RDF直接定义的只有主体,谓词,客体三元组的图示语法,在rdf:词汇表中的URIrefs的某些含义,和稍后会做介绍的某些其他概念。这些事物在[RDF-CONCEPTS (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-rdf-concepts)]和[RDF-SEMANTICS (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-rdf-semantics)]有规范的定义。不过,RDF没有定义在RDF陈述中使用的其他词汇表中的术语的含义,比如:dc:creator。特定的词汇表会被创建且其中的URIref会被赋予特定的含义,但这是在RDF之外的。使用了这些词汇表中的URIref的RDF陈述可能会把那些术语的特定含义传达给熟悉这些词汇表的人,或是处理这些词汇表的RDF应用程序,而不会把这些含义传达给不是特意处理这些词汇表的通用RDF应用程序。

例如,人们可以给一个三元组如:

ex:index.html dc:creator exstaff:85740 .

赋予一定的含义,这是基于单词“creator”作为URIref“dc:creator”的一部分出现所表示的含义,或者基于在他们理解了“dc:creator”在Dublin Core词汇表中的确切定义。 不过,就通用的RDF应用程序而言,这个三元组和下面的三元组在内在的含义上是一样的:

 fy:joefy.iunm  ed:dsfbups  fytubgg:85740 .

与此类似,任何可能在Web上找到的描述“dc:creator”含义的自然语言文本都无法为一个通用的RDF应用程序提供其直接可用的额外的含义信息。

当然,来自一个特定词汇表的URIrefs可以在RDF陈述中被使用,尽管给定的应用程序可能不能把任何特定的含义赋予他们。例如,通用的RDF软件会识别出上述表达式是一个RDF陈述,其中“ed:dsfbups”是一个谓词,等等。它不会把词汇表开发人员赋予给一个URIref(比如 ed:dsfbups)的任何特定含义赋给这个三元组。此外,基于他们对一个给定的词汇表的理解,人们仍可以编写出一个与这个词汇表中的URIref的特定含义一致的RDF应用程序,尽管这个含义对不是以这种方式编写的RDF应用程序是无法理解的。

结果是:RDF提供了一种发表更易被应用程序处理的陈述的方法。一个应用不能真正理解这些陈述,就如当一个数据库系统处理一个查询语句如:SELECT NAME FROM EMPLOYEE WHERE SLALRY > 35000 的时候,数据库系统对像“employee”或“salary”这类的词汇的理解一样。但是, 如果一个应用程序编写的很合理,那么它处理RDF陈述时就好像它确实理解它们一样,这正像是一个数据库系统和它的程序并没有理解什么是“employee”和“payroll”却能在处理雇员和薪水的数据信息时做有用的工作一样。例如:一个人能搜寻Web找到全部书评并且为每本书创建一个平均等级。 然后,这个人就可以把这些关于书的信息放到Web上。 而另一网站能获取这些书平均等级的列表并且创造一个"评价最高的十本书"页面。 这里,一个关于书等级的共享词汇表的可用性和及其使用,以及用于标识那些书的一组共享的URIref,允许个人建造一个在Web上可相互理解和用处日益广泛(或说是做了其他贡献那样)的关于书的“信息库”。相同的原则适用于人们每天在Web上创建的关于数以千计的主题的大量信息。

RDF陈述和很多其他信息记录格式类似,像:

  • 在一个数据处理系统里,一个简单的记录或是目录清单中的实体,
  • 一个简单的关系数据库的行,
  • 形式逻辑的简单断言,

并且,这些格式的信息都能看成RDF陈述,这使得RDF能用于集成来自多个数据源的数据。



2.3 结构化的属性值与空节点

需要记录的信息,如果用简单的RDF语句的形式来描述就足够了,那么,一切都将变得很简单,但是,大多数现实世界中的数据,至少表面看起来,要比简单的RDF语句所能描述的形式复杂得多。例如,在最初的那个例子中,用来记录创建网页的是一个简单的数据:creation-date属性,这个属性的值是简单的字符型,但是,假设这个creation-date属性的值需要分别记录年、月、日,或者,在描述John Smith的个人信息的情况下,我们来考虑John的地址,整个的地址可以被写作一个简单的字符串,或者一个三元组"1501 Grant Avenue, Bedford, Massachusetts 01730"。

 exstaff:85740   exterms:address   "1501 Grant Avenue, Bedford, Massachusetts 01730" .

然而,设想一下约翰的地址需要记录为由一个街道,城市,州和邮政编码组成的结构,这些在RDF中是如何做到的?

像这样的结构化的数据信息在RDF中是通过以下方式描述的:把被描述的事物聚集体(比如:John Smith的住址)看成一个资源,然后发表关于这个新资源的陈述。所以,在RDF图中,为了将John Smith住址分解成它的各个组成部分,一个用来描述John Smith住址这一概念的新节点就随之产生了,并用一个新的URIref来标识,如http://www.example.org/addressid/85740 (可缩写为exaddressid:85740)。把这个节点作为主体,RDF陈述(附加的弧和节点)可用来描述附加的信息,如图5 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#figure5)所示:

fig5may19.png 图5:分解John的住址:

相应的三元组表示如下:

 exstaff:85740       exterms:address        exaddressid:85740 .
exaddressid:85740 exterms:street "1501 Grant Avenue" .
exaddressid:85740 exterms:city "Bedford" .
exaddressid:85740 exterms:state "Massachusetts" .
exaddressid:85740 exterms:postalCode "01730" .

这中描述RDF结构化数据的方法会产生很多的“中间的”URIrefs,比如像描述聚集体概念(如John’s address)的URIref exaddressid:85740。这些概念可能从来不会被从RDF图的外部引用,因此可能不需要“通用的”标识符。另外,在用于描述一组陈述的图 图5 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#figure5)中,用来标识“John Smith’s address”的URIref并不是真正需要的,因为这个图可以简单地标识为如图6 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#figure6)所示:

fig6may19.png

图6:使用一个空节点

图6 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#figure6)是一个近乎完美的RDF图,它使用了一个没有URIref的节点来表示“John Smith’s address”这一概念。这个空节点 (http://www.w3.org/TR/rdf-concepts/#dfn-blank-node)虽然没有URIref,但表达了它应该表达的含义,因为这个空节点本身提供了图中各个部分之间必需的连通作用(空节点在[RDF-MS (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-rdfms)]中被称作匿名资源(anonymous resources))。然而,为了把这个图表示为三元组的形式,就需要一个某种形式的能清楚表示那个空节点的标识符。这里试着写出了与图6 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#figure6) 所示的内容相应的三元组:

 exstaff:85740   exterms:address         ??? .
??? exterms:street "1501 Grant Avenue" .
??? exterms:city "Bedford" .
??? exterms:state "Massachusetts" .
??? exterms:postalCode "01730" .

“???”出现的地方正是出空节点出现过的地方。因为一个复杂的图包含的空节点可能会不只一个,所以需要一种区分在图的三元组表示法中出现的不同空节点的办法。因此,三元组使用空节点标识符 (http://www.w3.org/TR/rdf-concepts/#dfn-blank-node-id),以“_:name”的形式来表示空节点。例如:在这个例子中,空节点标识符“_:johnaddress”可以用来表示空节点,那么相应的三元组可以写成如下的形式:

 exstaff:85740   exterms:address         _:johnaddress .
_:johnaddress exterms:street "1501 Grant Avenue" .
_:johnaddress exterms:city "Bedford" .
_:johnaddress exterms:state "Massachusetts" .
_:johnaddress exterms:postalCode "01730" .

在表示一个图的三元组中,图中每个不同的空节点都被赋予一个不同的空节点标识符。与URIref和文字不一样,空节点标识符并不被认为是RDF图的一个实际组成部分(这从图6 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#figure6)所示的就可以看出来,并且注意在图中空节点并没有空节点标识符)。空节点标识符仅仅是在把RDF图表示成三元组形式的时候,用来表示图中的空节点的(并且区分不同的空节点)。空节点标识符只是在用三元组表示单一的图的时候才有意义(两个有相同空节点数目的RDF图可能会独自地使用相同的空节点标识符来区别那些空节点,但是如果假设不同RDF图中具有相同标识符的空节点是相同的就不对了)。如果希望图中的一个节点需要从图的外部来引用,那么就应该赋予一个URIref值来标识它。最后,因为空节点标识符表示的是(空)节点而非弧,所以在一个图的三元组表达式中:空节点标识符只能出现在三元组主体和客体的位置上;不能出现在谓词的位置上。

这一节的开头部分记录了聚集体结构(比如John Smith’s address)可以通过如下的方式来描述:聚集体被作为一种资源描述,然后发表关于这个新资源的陈述。这个例子阐明了RDF的一个重要方面:RDF只能直接表示二元关系,例如:John Smith和描述他住址的文字(literal)之间的关系。要描述John和由这个地址的每个单独部分组成的组的关系的时候,就要涉及到处理一个N元(n-ary)关系(在这里N=5),其中这五元分别是John,街区(street),城市(city),州(state),和邮政编码(postal code)。为了要在RDF中直接的描述这种结构(例如:把地址看作是由街区(street),城市(city),州(state),和邮政编码(postal code)这四个部分构成的一个组),就必须把这个N元关系分解为一组二元关系。空节点提供了一种完成这个任务的方法:对于每一个N元关系,选择其中的一元( participant)作为这个关系的主体(比如John),创建一个空节点来描述其余的关系(比如John’s address),这个N元关系的其他元(比如city)则被描述成由空节点标识的新资源的各个单独的属性。

有些资源可能没有URI,空节点也同样提供了一种更准确的发表关于这些资源的陈述的方法,但这是通过和那些有URI的资源的关系来描述的。例如:当发表一个关于某人(比如Jane Smith)的陈述的时候,可能会很自然的想到要用基于这人的email地址的URI作为她的URI(mailto:jane@example.org ),但是,这种方法可能会导致一些问题。如果需要同时记录关于Jane(比如她目前的实际住址)和她的邮箱(比如,它所在的服务器)两者的信息,那么,还用基于她邮箱地址的URI作为她的URIref的话,就会很难区分表述的到底是Jane还是她的邮箱。同样的问题也会出现在下面这种情况:当一个公司用它公司的网页URL(比如:http://www.example.com/)作为自己的URI的时候。同样地,当需要同时记录关于网页(比如:是谁于何时创建的)和这个公司两者的信息时,如果还用“http://www.example.com/”作为两者的标识符,就会导致很难区分谁是真正意义上的主体。

这些问题出现的根本原因就是:用Jane的邮箱来代表Jane是不正确的,因为Jane和她的邮箱根本就是两码事,因此她和它应该区别对待。当Jane自己没有URI时,空节点提供了一条为这种情形更正确的建模方法:Jane可以由一个空节点表示,并且用这个以“exterms:mailbox”为属性的空节点作为陈述的主体,且用URIref“mailto:jane@example.org” 作为它的这个属性的值。这个空节点也可以用以“exterms:Person”为值的一个“rdf:type”属性来表述(类型(type)将在以后章节做更详细的讨论),或者是其他有用的描述性信息,正如下列三元组所示的:

 _:jane   exterms:mailbox   <mailto:jane@example.org&gt; .
_:jane rdf:type exterms:Person .
_:jane exterms:name "Jane Smith" .
_:jane exterms:empID "23748" .
_:jane exterms:age "26" .

(注意在第一个三元组中“ mailto:jane@example.org”写在两个尖括号里面,这是因为“mailto:jane@example.org” 在mailto URI模式中是个完整的URIref,而不是一个QName缩写,在三元组表示法里一个完整的URIref必需写在一对尖括号内。)

这些三元组准确地说明了:“有一个资源,其类型为exterms:Person,其电子邮箱是由“mailto:jane@example.org” 来标识的,其名字是Jane Smith,等等”。就是说,空节点可以读作“有一个资源”。以这个空节点作主体的陈述就提供关于这个资源特性方面的信息。

实际上,在这些情况下用空节点替代URIref并不会在信息处理方面带来太多改变。例如:人们知道一个email地址唯一确定在example.org里的某人(特别地,如果这个地址不能被重用的话),那么,这个email地址会被用来聚集来自多个数据源的关于这个人的信息。尽管这个email地址不是这人的URI。在这种情况下,如果在Web上找到了一些描述一本书的RDF,并且给出了作者的联系资料如 mailto:jane@example.org,那么把这条新信息和先前的一套三元组结合起来,然后推断作者的名字是Jane Smith,这样做就可能是合理的。这种说法的关键有点像"这书的作者是 mailto:jane@example.org"是“这书的作者是邮箱是mailto:jane@example.org的某人"的一种典型的缩写一样。用一个空节点来表示这个“某人”是一种更准确地来表示真实世界的方法。(顺便说一下,一些基于RDF的模式语言特别指出允许某些属性可以作为它们描述的资源的”唯一标识符“。这些将在5.5节 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#richerschemas)做更深入的探讨。)

这种使用空节点的方法也可以帮助人们避免文字(literals)在可能不适当情况下的使用.例如:当描述Jane的书而又缺少一个识别作者的URIref时,出版商就可能这样写(使用出版商自己的ex2terms:词汇表):

 ex2terms:book78354   rdf:type          ex2terms:Book .
ex2terms:book78354 ex2terms:author "Jane Smith" .

但是,书的作者却不是字符串“Jane Smith”,而是一个名叫Jane Smith的人。于是,当出版商用一个空节点时相同的信息就可能会被更准确的表达出来:

 ex2terms:book78354   rdf:type          ex2terms:Book .
ex2terms:book78354 ex2terms:author _:author78354 .
_:author78354 rdf:type ex2terms:Person .
_:author78354 ex2terms:name "Jane Smith" .

这实质上说,“ex2terms:book78354”的类型是“ex2terms:book”,并且它的作者是类型为“ex2terms:Person”的一个资源,作者的名字是“Jane Smith”。当然,在这个特例中,出版者为了要鼓励对作者的外部引用,可能对作者指派他自己的URIrefs而不是使用空节点识别他们。

最后,上面的例子给出了Jane的年龄是26说明了这么一件事实就是:有时一个属性的值可能表面上看来很简单,但实际上可能会更复杂。在这种情况,Jane的年龄实际上是26岁,但是单位量(岁)没有明确给出。当确信某个访问文本中属性值的人由此能推定所使用的单位量时类似的单位量经常被省略。但是,在Web上无际的文本海洋里,这样的“确信”通常是不可靠的,例如:一个美国地址也许给定一个重量单位--磅,但是某个从外部访问这个数据的人可能会推想给定的单位是千克。总的来说,对于单位或是类似的信息应该经过缜密的考虑然后进行明确的表述。这个问题将会在4.4节 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#rdfvalue)做更深入的探讨,在这节中将会讲述能把这样的信息表述成构造值(structured values)是RDF特色之一,同时也会涉及到另外一些用于表述这类信息的技术。



2.4 类型文字

上一节讲述了怎样处理如下这种情况:用平凡文字表示的属性值分解为能表示那些文字每个单独部分的构造值。例如:如果要记录一个网页的创建日期的话,这种方法用一个专门的平凡文字作为它的值,这个值会以一个由年,月,日组成的结构体作为资料的各个部分,并分别用平凡文字来表示相应的值,就取代了通过创建一个单独exterms:creation-date属性来记录一个网页创建日期的方法。但是,到目前为止,所有可以在RDF中作为客体的常量值都用这些平凡(非类型)文字表示,甚至当意图是用数字(例如一个年份属性或是年龄属性的值)或者其他更特殊的值当作属性值时。

例如,如图4 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#figure4) 所示的一个记录关于John Smith资料的RDF图,这个图中记录的John Smith的属性“exterms:age”值为平凡文字“27”,正如图7 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#figure7)所示的那样:

fig7dec16.png

图7:表示John Smith的年龄

在这个例子中,假设的组织example.org可能想要用一个数字来表示“27”,而不是用由“2”和后面的“7”组成的字符串来表示(因为文字表示了一个属性“age”的值)。但是,图7并没有明确指出“27”应当被解释成一个数字。同样地,example.org可能也想把“27”表示成一个十进制数(比如,一个值为二十七的十进制数),而不是表示成一个八进制数(比如,一个值为二十三的八进制数)。然而,同样地,图7也没有明确指出这些信息。一些特殊的应用程序可能会在编码时把属性exterms:age的值解释成十进制数,但这意味着对这个RDF的正确解释会依赖RDF图中没有明确提供的信息,因而还依赖一些其他需要解释这个RDF的应用程序不一定能获取的信息。

在程序设计语言和数据库系统里通常都会提供一个关于如何解释文字的附加信息:即给文字关联一个数据类型,比如在这个例子里,数据类型是小数或者是整数。一个能理解数据类型的应用程序就会知道,比如,把文字“10”表示成数字十,还是数字二,还是由字符“1”和后面的字符“0”组成的一个字符串,取决于指定的数据类型是整数,二进制数,还是字符串。(虽然这本入门文档不会详细说明关于数据类型的概念,但在2.3节 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#structuredproperties)的结尾处已经提到过更多可以用来包含单位信息的专门的数据类型,比如:一个为intergerYears数据类型。)在RDF中,类型文字 (http://www.w3.org/TR/rdf-concepts/#dfn-typed-literal) 是用来提供这类信息的。

一个RDF类型文字是通过把一个字符串与一个能确定一个特殊数据类型的URIref配对形成的。结果在RDF图中的一个文字节点就是这个配对。类型文字表示的值就是把指定的字符串赋值给指定的数据类型的值。例如,使用一个类型文字,John Smith的年龄将会被表述成在三元组中使用的整数27:

 <http://www.example.org/staffid/85740&gt;  <http://www.example.org/terms/age&gt; "27"^^<http://www.w3.org/2001/XMLSchema#integer&gt; .

或者,使用QName来简化URI则可写成:

 exstaff:85740  exterms:age  "27"^^xsd:integer .

或者,如图8所示的:

fig8jul23.png

图8:一个表示John Smith年龄的类型文字

同样地,如图3 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#figure3)所示它表述了关于一个网页的信息资料,网页的 exterms:creation-date属性值写成了平凡文字“August 16,1999”。然而,如果使用一个类型文字,那么这个网页的创建日期就可以明确的表述成1999年8月16号(August 16, 1999),用三元组表示就是:

 ex:index.html  exterms:creation-date  "1999-08-16"^^xsd:date .

或正如图9 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#figure9)所示的那样:

fig9jul23.png

图9:一个表示一个网页创建日期的类型文字

不像典型的程序设计语言和数据库系统那样,RDF没有自己的内置数据类型,比如,整型,实型,字符型,或者日期类型。但是,RDF类型文字为一个已给定的文字提供了一种简单的方法来指出应该用什么样的数据类型来说明它。在类型文字中使用的类型在外部定义,并且由它们的数据类型URI (http://www.w3.org/TR/rdf-concepts/#dfn-datatype-URI)来确定。(有一个例外,RDF用URIref“rdf:XMLLiteral”定义了一个内置数据类型用来把XML内容表示成一个文字值。这个数据类型定义在[RDF-CONCEPTS (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-rdf-concepts)],并在4.5节 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#xmlliterals)讲述的它的使用方法。)例如:图8 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#figure8)图9 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#figure9) 的例子都使用了整数的数据类型和来自XML数据类型的数据,其中,在XML模型的第二部分:数据类型 (http://www.w3.org/TR/xmlschema-2/) [XML-SCHEMA2 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-xmlschema2)]中定义了XML数据类型。用这种方法的优点之一便是它赋予了RDF直接表述信息的机动灵活性,因为在表述那些来自不同信息源的信息时无需进行信息源和RDF本身的数据类型集之间的转换。(当在不同的数据类型集系统之间移动信息时,还是要进行类型转换的,但当信息在RDF中移入或移出时,RDF无需额外的数据类型转换。)

正如在RDF概念(RDF Concepts)和抽象语法(Abstract Syntax) (http://www.w3.org/TR/rdf-concepts/)[RDF-CONCEPTS (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-rdf-concepts)]中叙述的那样,RDF数据类型概念是基于XML数据类型[XML-SCHEMA2 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-xmlschema2)]的概念框架上的,这种概念框架定义了包含以下部分的数据类型:

  • 一个要用数据类型文字表示的值的集合,被称作值空间(value space)。例如,XML模型数据类型xsd:date的值空间就是日期的集合。
  • 一个数据类型用来表示它的值的字符串的集合,被称作是词法空间(lexical space)。词法空间决定了哪一种字符串能够合乎规则地被用来表示这种数据类型的文字。例如:数据类型xsd:date定义了“1999-08-16”是书写这种类型文字的一种合乎规则的方法(相反的如果写成“August 16,1999”则可认为是不合乎规则的)。正如在[RDF-CONCEPTS (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-rdf-concepts)]中定义的,一种数据类型的词法空间是一个双字节字符[UNICODE (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-unicode)]串集,它允许直接表示来自很多语言的信息。
  • 一个从词空间到值空间的“词-值(lexical-to-value)映射”.这决定了这样的一个字符串的值:一个为表示这种特殊数据类型的取自词法空间里的一个特定的字符串。例如:一个映射到数据类型xsd:date的词-值映射,决定了对于这种数据类型,字符串“1999-08-16”表示日期“August 16, 1999”。词-值映射是个重要因素因为相同的字符串可能为不同数据类型表示不同的值。

并不是所有数据类型都适和在RDF中使用。一种适和在RDF中使用的数据类型必须符合上述的概念框架。主要意思就是:对于一个特定的字符串,数据类型必须明确地说明这个字符串是否在它的词法空间内,以及这个字符串在它的值空间里所表示的值。例如:基本的XML数据类型(比方说是xsd:string,xsd:boolean,xsd:date等等)就适合用在RDF当中。然而,一些XML内建数据类型就不适合用在RDF当中。例如:xsd:duration没有一个良式定义(well-defined)的值空间,并且xsd:QName需要一个封装的XML文本文档。到目前为止所认为适合和不适合用在RDF中的XML数据类型的清单已经在[RDF-SEMANTICS (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-rdf-semantics)]中给出了。

因为一个特定类型文字表示的值是由类型文字的数据类型决定的,且RDF没有定义任一种数据类型(rdf:XMLLiteral是例外),对一个出现在RDF图中的类型文字的实际解释(例如:决定它所表示的值)必须由那些编写成能正确处理RDF和类型文字的数据类型的软件完成。也就是说,这种软件必须能处理一种RDF的扩展语言,即把RDF和数据类型都作为其内置词汇表的一部分。这使得关于哪种将会在RDF软件中普遍用到的数据类型的争论日益激烈。通常,那些在[RDF-SEMANTICS (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-rdf-semantics)]罗列出的适合在RDF中使用的XML模型数据类型在RDF中有着“首屈一指”的地位。正如已注明的,图8 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#figure8)图9 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#figure9) 的例子使用了XML数据类型中的一些数据类型,并且这本入门书也将在类型文字的其他例子中使用这些数据类型(另外,XML数据类型已经被赋值为用来查阅它们的URIref了,这一点在[XML-SCHEMA2 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-xmlschema2)]有详细的说明)。比较起其他的数据类型来这些XML数据类型并没受到区别对待,但人们期望它们能被广泛的应用,因此它们最有可能被不同的软件共同使用。然而,RDF也应该能处理其他的数据类型集,因为正如已经阐述的,它们也是适合使用在RDF中的。

通常,RDF软件可能被要求处理一些包含引用了软件不能处理的数据类型 的RDF数据,这样就有些事情软件是无法做到的。一个原因是,除了·rdf:XMLLiteral外,RDF本身不能定义标识数据类型的URIref。因此,除非RDF软件理解特定的URIref,否则将不能决定一个类型文字中的URIref是否实际上标识了一个数据类型。此外,即使一个URIref确实标识了一个数据类型,RDF自身也无法定义这个数据类型和一个特定文字配对的合法性。只有那些能够正确理解这种数据类型的软件才能判断这种合法性。

例如,在如下三元组中的类型文字:

 exstaff:85740  exterms:age  "pumpkin"^^xsd:integer .

或如图10 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#figure10)所示的那样:

fig10jul23.png

图10:一个用作John Smith的年龄的非法类型文字

是有效的RDF,但是很明显,一个错误与数据类型xsd:integer有关,因为“pumpkin”没有在xsd:integer的词法空间里定义。不能处理数据类型xsd:integer的RDF软件将不会发现这个错误。

然而,适当地使用RDF类型文字可以提供更多关于文字值的解释方面的信息,并因此使得RDF陈述成为一种更好的在应用程序中交换信息的方式。



2.5 总结

综上所述,基本上说,RDF是比较简单的:由节点和弧构成的图解释说明了有关被URIref识别事物的陈述。在这一部分已经介绍了这些概念。如早先注明的,描述这些概念标准的(即权威的)RDF规范是RDF概念(RDF Concepts)和抽象语法(Abstract Syntax) (http://www.w3.org/TR/rdf-concepts/) [RDF-CONCEPTS (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-rdf-concepts)],如果做更深入的研究就应当参考它们。在(标准的)RDF语义学 (http://www.w3.org/TR/rdf-mt/) (RDF Semantics)[RDF-SEMANTICS (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-rdf-semantics)] 文档中详细说明了这些概念的形式语义。

然而,描述事物除了用目前为止所讨论的RDF陈述的基本技术之外,人们或组织也需要一种能够描述他们想要用在那些陈述中的词汇表(术语(term))的方法,显然,如下列的这些词汇表:

  • 描述事物类型的词汇表(比如:exterms:Person)
  • 描述事物属性的词汇表(比如:exterms:age和exterms:creation-date)
  • 和牵涉到那些属性并可以作为陈述中的主体和客体的事物的类型的词汇表(比如:通常用xsd:integer词汇表来确定属性“exterms:age”的值)。

在RDF中描述这类词汇表是依据RDF Vocabulary Description Language 1.0: RDF Schema (http://www.w3.org/TR/rdf-schema/) ] [RDF-VOCABULARY (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-rdf-vocabulary)],这将在第5节 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#rdfschema)做介绍。

另外,RDF基本思想的背景知识和它在提供一种能描述Web上信息的语言中扮演的角色,这一点可以在[WEBDATA (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-webdata)]中找到。RDF从知识表示,人工智能和数据管理领域中借鉴了一些思想,具体包括:概念图(Conceptual Graphs),基于逻辑的知识表示(logic-based knowledge representation),框架(frames),关系数据库(relational databases)。关于这些学科的背景知识可能的资料来源包括:[SOWA (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-sowa)],[CG (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-cg)],[KIF (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-kif)],[HAYES (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-hayes)],[LUGER (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-luger)], and [GRAY (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-gray)]。



3. 表示RDF的XML语法: RDF/XML

如第2部分所描述的,RDF的概念模型是一张图(graph)。RDF提供了一种被称为RDF/XML的XML语法来书写和交换RDF图。与RDF的简略记法——三元组(triples)不同,RDF/XML是书写RDF的规范性语法(normative syntax)。RDF/XML定义于RDF/XML语法规范 (http://www.w3.org/TR/rdf-syntax-grammar/)[RDF-SYNTAX (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-rdf-syntax)]。本节描述RDF/XML的语法。


3.1 基本原理

RDF/XML语法的基本思想可以通过前面的一些例子来说明。以下面这句英文为例:

 http://www.example.org/index.html has a creation-date whose value is August 16, 1999

上面这个陈述可以用RDF图来表示(其中的creation-date属性已指定了URIref),如图11 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#figure11)所示:

fig11dec16.png

图11: 描述一个网页的创建日期(Creation Date)

用三元组表示就是:

 ex:index.html   exterms:creation-date   "August 16, 1999" .

(注意:在这个例子中没有用类型文字(typed literal)作为日期的值。类型文字在RDF/XML中的表示将在后面描述)

例2 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example2) 显示了图11 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#figure11)所对应的RDF/XML语法:

例2:描述网页创建日期的RDF/XML

 1. <?xml version="1.0"?>
2. <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
3. xmlns:exterms="http://www.example.org/terms/">
4. <rdf:Description rdf:about="http://www.example.org/index.html">
5. <exterms:creation-date>August 16, 1999</exterms:creation-date>
6. </rdf:Description>
7. </rdf:RDF>

(加入行号仅仅是为了便于解释例子,RDF/XML中并不包含行号)

看起来有些摸不着头脑(a lot of overhead),依次考虑该XML的各个部分将利于理解其作用。(附录B (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#documents)提供了一个关于XML的简单介绍)。

第1行是XML声明(XML declaration):<?xml version="1.0"?>。它表明以下内容将是XML,XML版本号是1.0。

第2行以rdf:RDF元素开始。它表明以下XML内容(从这里开始,直到第7行的</rdf:RDF>为止)用于表达RDF。同一行紧随rdf:RDF其后的是XML命名空间声明(XML namespace declaration),即rdf:RDF首标签的xmlns属性。该声明指明在当前内容中出现的所有前缀为rdf:的标签都属于由下列URIref所标识的命名空间:http://www.w3.org/1999/02/22-rdf-syntax-ns#。以http://www.w3.org/1999/02/22-rdf-syntax-ns#打头的URIrefs用于标识来自RDF词汇表中的术语。

第3行是另一个XML命名空间声明(关于前缀exterms:的)。该声明用rdf:RDF元素的另一个xmlns属性来表示。它指明前缀exterms:与命名空间URIref http://www.example.org/terms/关联。以http://www.example.org/terms/开始的URIrefs用于由example组织(example.org)[译注:example组织为本文档所举示例]定义的词汇表中的术语。第3行末尾的">"符号表明rdf:RDF首标签的结束。第1至3行是常规的、必备的部分,用以表明当前的内容是RDF/XML,并声明内容中所使用的命名空间。

第4-6行是Figure 11 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#figure11)中所示陈述的RDF/XML主要部分。谈及RDF陈述时,显而易见,陈述是一种“description(描述)”。并且,它是一种“about(有关)”陈述主体的描述(在本例中,是有关 http://www.example.org/index.html的描述)。RDF/XML表示陈述的方式正是如此。第4行中rdf:Description的起始标签表明某个资源描述的开始,然后标识了陈述所“about(针对)”的资源(也就是陈述的主体)。RDF/XML采用了 rdf:about 属性来指定主体资源的URIref。第5行用QName exterms:creation-date作为标签,提供了“属性元素(property element)”,来表示谓词以及陈述的客体。选择QName exterms:creation-date,可以将本地名称creation-date 扩展为http://www.example.org/terms/creation-date,这个属性元素(property element )的内容就是陈述的客体-即平凡文字“August 19, 1999 ”(主体资源的creation-date 属性的值)。属性元素(property element)在rdf:Description 元素所包含内容中以嵌套的形式存在,意味着该属性(property )应用于rdf:Description 元素的rdf:about 属性(attribute)所指定的资源。第6行表明这个rdf:Description 到此结束。

最后,第7行表明从第2行开始的rdf:RDF元素到此结束。在能够通过上下文确定XML内容为RDF/XML的情况下,可以不用rdf:RDF元素来包括RDF/XML的内容。这在[RDF-SYNTAX (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-rdf-syntax)]中将进一步讨论。但是,使用rdf:RDF元素在任何情况下均没有坏处,本文档中的示例一般都会(但并不总是)使用rdf:RDF元素。

例2 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example2)展示了RDF/XML如何把一个RDF图编码为XML元素、属性、元素内容和属性值的基本思想。谓词(以及一些结点)的URIrefs被写作XML QNames,即包含一个简短的前缀(prefix)(代表命名空间URI)和一个内部名(local name)(代表命名空间中的元素或属性)(详见附录B (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#documents))。对于一个(命名空间URIref,内部名)对,将命名空间URIref和内部名连接起来将形成结点或谓词的URIref(像图11中的那样)。主体结点(subject nodes)的URIrefs被写为XML属性值(客体结点(object nodes)的URIrefs有时也可被写为属性值)。文字结点(Literal nodes)(总是客体结点)写为元素的文本内容或属性值。(本文档后面的部分将对这里的部分写法作进一步描述;关于所有写法的描述,请参见[RDF-SYNTAX (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-rdf-syntax)]。)

对于包含多个陈述的RDF图可以用下面RDF/XML方式书写:用类似于例2 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example2)中第4至6行的方式分别表示RDF图中的各个陈述。举例来说,对于下面两个陈述:

 ex:index.html   exterms:creation-date   "August 16, 1999" .
ex:index.html dc:language "en" .

可以用例3 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example3)中的RDF/XML来表示:

例3: 表达两条陈述的RDF/XML

 1.  <?xml version="1.0"?>
2. <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
3. xmlns:dc="http://purl.org/dc/elements/1.1/"
4. xmlns:exterms="http://www.example.org/terms/">
5. <rdf:Description rdf:about="http://www.example.org/index.html">
6. <exterms:creation-date>August 16, 1999</exterms:creation-date>
7. </rdf:Description>
8. <rdf:Description rdf:about="http://www.example.org/index.html">
9. <dc:language>en</dc:language>
10. </rdf:Description>
11. </rdf:RDF>

例3 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example3)例2 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example2)一样,只是多了一个表达第二条陈述的rdf:Description元素(第8至10行)。(第3行给出了另一个命名空间声明,以标识在第二条陈述中用到的命名空间)。可以用同样的方式添加任意多个陈述,只需对每条陈述分别使用一个rdf:Description元素。如例3 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example3)所示,一旦完成了书写XML和命名空间声明,RDF/XML中各个RDF陈述的书写将简单明了。

RDF/XML语法提供了若干种简略表达形式以便于书写。比如在例3 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example3)中,用多个属性和属性值来描述同一资源,这里资源ex:index.html同时作为多个陈述的主体(subject)。在这种情况下,RDF/XML允许在标识该主体的rdf:Description元素下嵌入多个属性元素来表达属性。比如,要表达下列一组关于资源 http://www.example.org/index.html 的陈述:

 ex:index.html   dc:creator              exstaff:85740 .
ex:index.html exterms:creation-date "August 16, 1999" .
ex:index.html dc:language "en" .

它所对应的RDF图(和图3 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#figure3)相同)如图12 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#figure12)所示:

fig3nov19.png

图12:关于同一资源的多个陈述

例4 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example4)是它所对应的RDF/XML:

例4: 简略表达多个属性

 1.  <?xml version="1.0"?>
2. <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
3. xmlns:dc="http://purl.org/dc/elements/1.1/"
4. xmlns:exterms="http://www.example.org/terms/">
5. <rdf:Description rdf:about="http://www.example.org/index.html">
6. <exterms:creation-date>August 16, 1999</exterms:creation-date>
7. <dc:language>en</dc:language>
8. <dc:creator rdf:resource="http://www.example.org/staffid/85740"/>
9. </rdf:Description>
10. </rdf:RDF>

与前面两个例子相比,例4 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example4)中多了一个dc:creator属性元素(在第8行)[译注//属性元素(property element)指表示RDF中的属性(property)的XML元素(XML element)]。另外,三个属性元素(表达主体http://www.example.org/index.html的三个属性)都嵌在同一个rdf:Description元素(标识主体http://www.example.org/index.html)里,而不是为各个陈述单独写一个rdf:Description元素。

第8行引入了一种新的属性元素形式。第7行中的dc:language元素与例2 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example2)中的exterms:creation-date元素类似,他们都是用平凡文字(plain literal)来表示属性的值,并且都用与属性名称(property name)对应的首标签(start-tag)和尾标签(end-tag)将上述文字括起来。然而,第8行中的dc:creator元素表示一个属性值为另一个资源(而不是平凡文字)的属性。如果把该资源的URIref写成被括在首标签和尾标签中的平凡文字(像前两个元素那样),这将表示dc:creator元素的值是字符串 http://www.example.org/staffid/85740 ,而不是由该字符串代表的URIref所标识的资源。为了表明这一区别,dc:creator元素被写成空元素标签(empty-element tag)(即没有尾标签)的形式,同时用一个rdf:resource属性(attribute)来表达属性的值(property value)。rdf:resource属性(attribute)表明属性元素(property element)的值是另一个用URIref标识资源(resource)。由于该URIref要作为属性(attribute),RDF/XML要求这个URIref必须被写成绝对URIref或相对URIref的形式,而不能像写元素(element name)或属性(attribute name)那样被简略为QName(关于绝对URIref和相对URIref,请参见附录A (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#identifiers))。

例4 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example4)中的RDF/XML是一种简略形式,理解这一点很重要。例5 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example5)是描述同一个RDF图(图12 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#figure12))的RDF/XML,其中各个陈述被分开书写:

例5:用分开的陈述书写例4

 <?xml version="1.0"?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns:exterms="http://www.example.org/terms/">
   <rdf:Description rdf:about="http://www.example.org/index.html">
<exterms:creation-date>August 16, 1999</exterms:creation-date>
</rdf:Description>
   <rdf:Description rdf:about="http://www.example.org/index.html">
<dc:language>en</dc:language>
</rdf:Description>
   <rdf:Description rdf:about="http://www.example.org/index.html">
<dc:creator rdf:resource="http://www.example.org/staffid/85740"/>
</rdf:Description>
 </rdf:RDF>

下面部分将描述另外一些RDF/XML简略形式。[RDF-SYNTAX (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-rdf-syntax)]提供了关于所有简略形式的更全面的描述。

RDF/XML同样可以表示包含空白结点(blank node)(即没有URIref的结点,详见2.3节 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#structuredproperties))的图。比如,图13 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#figure13)(取自[RDF-SYNTAX (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-rdf-syntax)])显示了一个表达下列信息的图:“文档’http://www.w3.org/TR/rdf-syntax-grammar‘有一个title(标题)(’RDF/XML Syntax Specification (Revised)’)和一个editor(编者),而editor的name(姓名)为’Dave Beckett’、home page(主页)为’http://purl.org/net/dajobe/‘”。

fig13dec16.png

图13:一个包含空白结点的图

上面的例子展示了2.3节 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#structuredproperties)中曾讨论过的想法,即用一个空白结点(blank node)来表示某个没有URIref、但可用其它信息来描述的事物。在上面的例子中,该空白结点表示一个人,即文档的editor(编者),这个人是用他的name(姓名)和homepage(主页)来描述的。

RDF/XML提供了多种方式来表示包含空白结点的图。[RDF-SYNTAX (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-rdf-syntax)]描述了所有这些方式。这里所描述的方式是其中最直接的一种,即为各个空白结点指定一个空白结点标识符(blank node identifier)。空白结点标识符用于标识某个特定RDF/XML文档内部的一个空白结点。但是与URIref不同,空白结点标识符在所属文档外部是不可识别的[译注//即仅在它被指定为空白结点标识符的那个文档内有效]。在RDF/XML中,所有可以出现资源URIref的地方都可以用rdf:nodeID属性(attribute)来引用空白结点(用一个空白结点标识符作为该属性的值)。 具体地,一个以空白结点为主体的陈述,在RDF/XML中可以用一个拥有rdf:nodeID(而不是rdf:about)属性(attribute)的rdf:Description元素来描述。同样地,一个以空白结点为客体的陈述可以用一个拥有rdf:nodeID(而不是rdf:resource)属性(attribute)的属性元素(property element)来描述。例6 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example6)展示了如何用rdf:nodeID来描述图13 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#figure13)对应的RDF/XML:

例6:描述空白结点的RDF/XML

 1.  <?xml version="1.0"?>
2. <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
3. xmlns:dc="http://purl.org/dc/elements/1.1/"
4. xmlns:exterms="http://example.org/stuff/1.0/">
5. <rdf:Description rdf:about="http://www.w3.org/TR/rdf-syntax-grammar">
6. <dc:title>RDF/XML Syntax Specification (Revised)</dc:title>
7. <exterms:editor rdf:nodeID="abc"/>
8. </rdf:Description>
9. <rdf:Description rdf:nodeID="abc">
10. <exterms:fullName>Dave Beckett</exterms:fullName>
11. <exterms:homePage rdf:resource="http://purl.org/net/dajobe/"/>
12. </rdf:Description>
13. </rdf:RDF>

例6 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example6)中,第9行使用空白结点标识符abc来标识作为多个陈述的主体的空白结点,然后在第7行中利用该空白结点标识符来表明它所对应的空白结点是某个资源的exterms:editor属性(property)。相对于[RDF-SYNTAX (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-rdf-syntax)]中描述的其它方式而言,使用空白结点标识符的优点是可以在一个RDF/XML文档中多次引用同一个空白结点

最后,2.4节 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#typedliterals)中介绍的类型文字(typed literals)可以替代前面例子中的平凡文字(plain literals)作为属性的值(property values)。类型文字(typed literal)在RDF/XML中的表示方法为:为包含该文字的属性元素(property element)增加一个rdf:datatype属性(attribute),并通过该属性指定数据类型的URIref。

比如,将例2 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example2)中的陈述改为用类型文字而不是平凡文字来作为exterms:creation-date属性的值(property values),那么三元组将这样书写:

 ex:index.html   exterms:creation-date   "1999-08-16"^^xsd:date .

它所对应的RDF/XML如例7 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example7)所示:

例7:使用类型文字的RDF/XML

 1. <?xml version="1.0"?>
2. <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
3. xmlns:exterms="http://www.example.org/terms/">
4. <rdf:Description rdf:about="http://www.example.org/index.html">
5. <exterms:creation-date rdf:datatype=
"http://www.w3.org/2001/XMLSchema#date">1999-08-16
</exterms:creation-date>
6. </rdf:Description>
7. </rdf:RDF>

例7 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example7)中,在第5行给出的exterms:creation-date属性元素(property element)的值是一个类型文字(而不是平凡文字),这是通过为exterms:creation-date元素的首标签(start-tag)增加一个rdf:datatype属性(attribute)并由此指定数据类型实现的。rdf:datatype属性(attribute)的值应是某个数据类型的URIref,在本例中它是XML Schema中的date数据类型的URIref。作为属性值(attribute value),URIref必须被写全[译注//即写为相对URIref或绝对URIref],而不是像在三元组中那样写出它的QName形式xsd:date。用一个正确的数据类型文字作为元素内容(element content),在本例中是文字1999-08-16,即用XML Schema中的date数据类型表示的一个代表1999年8月16日的文字。

在本文档下面的示例中,我们将避免使用平凡文字(无类型的),而是使用具有正确数据类型(datatype)的类型文字(typed literals)。这样做的目的在于强调类型文字可以传递更多关于文字值(literal values)解释的信息。(但下列情况例外,即示例取自实际应用,而在该实际应用中没有使用类型文字。在这种情况下,示例将保留原应用中的平凡文字,以精确反映RDF在该应用中的用法。)在RDF/XML中,平凡文字和类型文字(以及某些例外情况下的标签(tag))都可以包含Unicode[UNICODE (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-unicode)]字符,以允许直接表达多语言的信息。

例7 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example7)举例说明了使用类型文字需要为每一个元素值为类型文字的元素书写一个rdf:datatype属性(attribute),并用一个标识具体数据类型的URIref作为属性值。如前面提到的,RDF/XML要求用作属性值(attribute value)的URIrefs必须书写完整,而不能写成QName形式。在这种情况下,RDF/XML允许使用XML 实体(entities)以提高可读性,即为URIrefs提供一个另外的简写形式。XML实体声明的本质是将一个XML名称(XML name)与一个字符串相关联。如果实体名在XML文档中被引用,XML处理器(XML processors)将用相应的字符串来替换该引用。比如,下列ENTITY声明(被写在RDF/XML文档头部的DOCTYPE声明中):

 <!DOCTYPE rdf:RDF [<!ENTITY xsd "http://www.w3.org/2001/XMLSchema#">]> 

把实体xsd定义为一个代表命名空间URIref(对应于XML Schema数据类型的命名空间)的字符串。这一声明使得完整的命名空间URIref可在XML文档中被简略为实体引用&xsd;。在例7 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example7)中使用上述简略形式便可得到例8 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example8).

例8: 使用类型文字和XML实体的RDF/XML

 1. <?xml version="1.0"?>
2. <!DOCTYPE rdf:RDF [<!ENTITY xsd "http://www.w3.org/2001/XMLSchema#">]>
3. <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
4. xmlns:exterms="http://www.example.org/terms/">
5. <rdf:Description rdf:about="http://www.example.org/index.html">
6. <exterms:creation-date rdf:datatype="&xsd;date">1999-08-16
</exterms:creation-date>
7. </rdf:Description>
8. </rdf:RDF>

第2行中的DOCTYPE声明定义了实体xsd,该实体被用在第6行中。

是否在RDF/XML中用XML实体作为简略机制是可选的,因此是否在RDF/XML中使用XML DOCTYPE声明也是可选的。(对于熟悉XML的读者,RDF/XML只需是“良构的(well-formed)”XML。RDF/XML没有被设计为将用验证型XML处理器(validating XML processor)验证它对于某个DTD的有效性。附录B (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#documents)将对此作全面论述,并提供了关于XML的更多信息。 )

出于可读性考虑,本文剩余部分的示例将使用XML实体xsd(如前面描述的那样)。附录B (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#documents)将对XML实体作进一步讨论。如附录B (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#documents)的说明,其他URIrefs(而且更一般地,字符串)也可以被简略为使用XML实体。然而,在本文档的示例中,我们仅对XML Schema数据类型采用这种简略方式。

尽管还有其他用于书写RDF/XML的简略形式,但到目前为止所介绍的方法提供了一种简单而一般的用RDF/XML来表达RDF图的方法。要应用这些方法,一个RDF图可以这样书写RDF/XML:

  • 所有空白结点(blank nodes)被指定空白结点标识符(blank node identifiers)。
  • 依次列出各个结点,将它作为一个非嵌套的rdf:Description元素的主体(subject)。若该结点有URIref,则rdf:Description元素使用rdf:about属性(attribute);若该结点是空结点,则rdf:Description元素使用rdf:nodeID属性(attribute)。

对于各个以该结点作为主体(subject)的三元组(triple),创建一个正确的属性元素(property element)。该属性元素或者是元素内容(element content)为文字(literal)(可能为空)、或者是有一个指定该三元组的客体(object)的rdf:resource属性(attribute)(对于客体有URIref的情况)、或者是有一个指定该三元组的客体的rdf:nodeID属性(attribute)(对于客体结点为空结点的情况)。

与更多在[RDF-SYNTAX (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-rdf-syntax)]中描述的简略方法相比,上述这种简单的方式提供了实际图结构的最直接的表示。另外,如果应用中的输出RDF/XML将在进一步的RDF处理中被使用的话,这种方式是特别推荐的。



3.2 简写与组织RDF URIrefs

到目前为止,所有的示例都假定所描述资源已指派了URIrefs。比如,前面的几个例子提供了关于example.org网页的描述性信息,该网页的URIref为 http://www.example.org/index.html 。在RDF/XML中,这个资源(resource)的标识是通过使用一个rdf:about属性(attribute)并用资源的URIref作为属性值实现的。尽管RDF并没有规定或限定如何为资源(resources)指派URIrefs,有时希望为一些有组织的资源指派URIrefs。比如,设想一个运动产品公司example.com要为它的产品(比如帐篷、旅行鞋等等)提供一个基于RDF的目录,该目录是一个RDF/XML文档,用 http://www.example.com/2002/04/products 来对它进行标识和定位。在该资源中,各个产品可能会有一个单独的RDF描述。例9 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example9)所示的RDF/XML描述了这个产品目录和一种型号为“Overnighter”的帐篷所对应的目录项及其描述:

例9:example.com产品目录的RDF/XML

 1.   <?xml version="1.0"?>
2. <!DOCTYPE rdf:RDF [<!ENTITY xsd "http://www.w3.org/2001/XMLSchema#">]>
3. <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
4. xmlns:exterms="http://www.example.com/terms/">
5. <rdf:Description rdf:ID="item10245">
6. <exterms:model rdf:datatype="&xsd;string">Overnighter</exterms:model>
7. <exterms:sleeps rdf:datatype="&xsd;integer">2</exterms:sleeps>
8. <exterms:weight rdf:datatype="&xsd;decimal">2.4</exterms:weight>
9. <exterms:packedSize rdf:datatype="&xsd;integer">784</exterms:packedSize>
10. </rdf:Description>
...other product descriptions...
11. </rdf:RDF>

与前面例子的一个重要区别在于第5行中的rdf:Description元素,它有一个rdf:ID属性(attribute)而不是rdf:about属性(attribute)。rdf:ID用于指定一个片断标识符(fragment identifier)作为资源完整URIref的简略形式,该片断标识符在rdf:ID属性值(attribute)(在本例中为item10245,它可能是由example.com指定的目录号)中给出。片断标识符item10245的解析是相对于基准URI(base URI)(在本例中,基准URI为目录文档的URI)。该帐篷的完整URIref是这样形成的:取(目录的)基准URI,在后面添加字符“#”(表明后面跟随的是片断标识符)和字符串“item10245”,这样得到了绝对URIref http://www.example.com/2002/04/products#item10245.

这里的rdf:ID属性有些类似XML和HTML中的ID属性(attribute),因为它定义了一个相对于当前基准URI(在本例中,基准URI是目录的基准URI)[译注//其原因参见XML Base (http://www.w3.org/TR/2001/REC-xmlbase-20010627/)或其简体中文翻译[http://xmlbase.w3china.org/ ]]必须唯一的名称。在本例中,rdf:ID属性(attribute)为这种特定的帐篷指派一个名称(item10245)。同一文档中的其他RDF/XML可以用两种方式来引用这个帐篷:使用绝对URIref http://www.example.com/2002/04/products#item10245 ,或使用相对URIref #item10245。相对URIref可被理解为一个相对目录的基准URIref定义的URIref。使用同样的简略形式,帐篷的URIref也可以在目录项中通过使用rdf:about="#item10245"来给出(也就是说,直接给出帐篷的相对URIref),而不是使用rdf:ID="item10245"。作为一种简略机制,这两种方式本质上是相同的:RDF/XML在这两种方式下形成的完整URIref完全相同,都是 http://www.example.com/2002/04/products#item10245 。但是,使用rdf:ID提供了一种机制,可以在指派一组互不相同的名称集合时进行检测,因为rdf:ID属性(attribute)给定的值在隶属同一个基准URI的范围(在本例中为产品目录文档)内只能出现一次。如果用另一种方式的话,example.com将通过两步给出该帐篷的URIref:首先指定整个产品目录的URIref,然后在产品目录中的帐篷描述中使用一个相对URIref来表明该帐篷被指派的URIref。另外,相对URIref的使用可被理解为是对RDF中这个帐篷指派的完整URIref的一种简略形式,也可以被认为是对产品目录中这个帐篷的URIref的指派。

位于产品目录外部的RDF可以用完整的URIref(通过连接该帐篷的相对URIref #item10245和产品目录的基准URI形成绝对URIref http://www.example.com/2002/04/products#item10245)来引用这个帐篷。例如,一个户外运动网站exampleRatings.com也许会用RDF来提供各种帐篷的排名。例9 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example9)所描述的帐篷被给予的等级为(5-star),这一信息可以在exampleRatings.com网站上由例10 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example10)所示的RDF/XML来表示:

例10: exampleRatings.com给上述帐篷的等级

 1.  <?xml version="1.0"?>
2. <!DOCTYPE rdf:RDF [<!ENTITY xsd "http://www.w3.org/2001/XMLSchema#">]>
3. <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax- ns#"
4. xmlns:sportex="http://www.exampleRatings.com/terms/">
5. <rdf:Description rdf:about="http://www.example.com/2002/04/products#item10245">
6. <sportex:ratingBy rdf:datatype="&xsd;string">Richard Roe</sportex:ratingBy>
7. <sportex:numberStars rdf:datatype="&xsd;integer">5</sportex:numberStars>
8. </rdf:Description>
9. </rdf:RDF>

例10 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example10)中,第5行使用的rdf:Description元素带有一个rdf:about属性(attribute),该属性的值为被描述的帐篷的完整URIref。使用这个URIref可以精确标识被排名所引用的帐篷。

上面这些例子说明了若干要点。首先,尽管RDF没有规定或限定如何为资源(如本例中的各种帐篷和其他产品)指派URIrefs,但在RDF中可通过下面的方法获得为资源指派URIrefs的效果:(在RDF之外)标识一个文档(如本例中的产品目录),并将它作为资源描述的来源;而在该文档中描述各个资源时使用相对URIref[译注//该相对URIref被作为资源在所属文档范围内的标识符]。比如,example.com可以将这个产品目录作为描述它的产品的总的来源,如果一个产品的产品号不在产品目录中的任何条目中出现,那么它就不是一个example.com所知道的产品。(注意:RDF并不会仅根据两个资源的URIrefs有相同的基准(base)或在某些方面相像而假定它们之间存在任何特定的关系。也许example.com了解这些关系,但它们没有直接在RDF中定义。)

以上的示例说明了Web体系结构的一个基本原则,即任何人都应能够用他们愿意使用的任何词汇自由地添加关于某一现存资源的信息[BERNERS-LEE98 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-berners-lee98)]。这些例子进一步说明了描述某个特定资源的RDF不需要全部存放于某一处;相反,它可以被分布于Web上。这一点不仅对上述情形(即一个组织对其他组织定义的资源给出排名或评论)适用,对于下面这种情形也是适用的,即资源的最初定义者希望通过增加关于资源(或其他人)的信息来充实资源的描述。这可以通过修改RDF文档(即资源被最初定义的文档)来实现:即增加为了描述附加信息所必需的属性(properties)和值。另一种实现方式(如本例所展示的)是:创建一个单独的文档,并在其中通过使用rdf:Description元素为资源(用rdf:Description元素的rdf:about属性(attribute)的值来标识)提供附加的属性(properties)和值。

上面的论述表明,相对URIrefs(比如#item10245)的解析将是相对于某个基准URI(base URI)的。缺省情况下,这个基准URI可以是该相对URI所在资源的URI。但是,在某些情况下也许希望能够显式指定基准URI。比如,设想除位于 http://www.example.com/2002/04/products 的产品目录以外,example.org希望在某个镜像站点上提供一个产品目录的副本(比如,位于 http://mirror.example.com/2002/04/products )。这可能会造成一些问题,因为如果是通过镜像站点获得产品目录的话,帐篷的URIref将会通过产品目录的URI产生,也就是说形成的绝对URIref为 http://mirror.example.com/2002/04/products#item10245 ,而不是 http://www.example.com/2002/04/products#item10245 。显然,这将引用一个非期望的资源。作为另一个选择,example.org也许希望为它的产品的URIrefs指定一个基准URIref,而不是使用产品目录文档的位置作为基准URIref。

为了处理上述情况,RDF/XML支持XML Base (http://www.w3.org/TR/2001/REC-xmlbase-20010627/) [XML-BASE (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-xml-base)]。XML Base允许XML文档指定一个基准URI,而不是将XML文档本身的URI作为基准URI。例11 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example11)显示了产品目录是如何用XML Base来描述的:

例11: 在example.com的产品目录中使用XML Base

 1.   <?xml version="1.0"?>
2. <!DOCTYPE rdf:RDF [<!ENTITY xsd "http://www.w3.org/2001/XMLSchema#">]>
3. <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax- ns#"
4. xmlns:exterms="http://www.example.com/terms/"
5. xml:base="http://www.example.com/2002/04/products">
6. <rdf:Description rdf:ID="item10245">
7. <exterms:model rdf:datatype="&xsd;string">Overnighter</exterms:model>
8. <exterms:sleeps rdf:datatype="&xsd;integer">2</exterms:sleeps>
9. <exterms:weight rdf:datatype="&xsd;decimal">2.4</exterms:weight>
10. <exterms:packedSize rdf:datatype="&xsd;integer">784</exterms:packedSize>
11. </rdf:Description>
...other product descriptions...
12. </rdf:RDF>

例11 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example11)中,第5行的xml:base声明为rdf:RDF元素里的内容指定了基准URI(直到在遇到其他被指定的xml:base为止) http://www.example.com/2002/04/products 。这样,在元素里引用的所有相对URIrefs的解析将相对于xml:base所指定的基准URI,而与这些相对URIrefs所在文档的URI是什么无关。因此,所描述帐篷的相对URIref #item10245将被解析为同一个绝对URIref http://www.example.com/2002/04/products#item10245,不管产品目录文档的实际URI是什么,也不管基准URIref是否真的标识了某一具体文档。

到目前为止,所有示例使用的都是同一个产品描述——example.com产品目录中的某个具体型号的帐篷。然而,example.org也许希望提供多种不同型号的帐篷,同样对旅行背包、旅行鞋等多个不同类型产品也提供多种选择。把事物划分为不同的种类(kings)类别(categories)这一想法与程序设计语言里的对象(objects)有不同的类型(types)类(classes)类似。RDF通过提供预定义属性(property)rdf:type来支持这种概念。当我们用rdf:type属性(property)来描述一个RDF资源时,该属性的值就是被看作表达这种事物的种类(kings)类别(categories)的资源。该属性的主体被看作为该种类(kings)类别(categories)的一个实例(instance)例12 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example12)展示了example.com是如何使用rdf:type来表达产品描述是关于一个帐篷的:

例12: 在帐篷的描述中使用rdf:type

 1.   <?xml version="1.0"?>
2. <!DOCTYPE rdf:RDF [<!ENTITY xsd "http://www.w3.org/2001/XMLSchema#">]>
3. <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax- ns#"
4. xmlns:exterms="http://www.example.com/terms/"
5. xml:base="http://www.example.com/2002/04/products">
6. <rdf:Description rdf:ID="item10245">
7. <rdf:type rdf:resource="http://www.example.com/terms/Tent"/>
8. <exterms:model rdf:datatype="&xsd;string">Overnighter</exterms:model>
9. <exterms:sleeps rdf:datatype="&xsd;integer">2</exterms:sleeps>
10. <exterms:weight rdf:datatype="&xsd;decimal">2.4</exterms:weight>
11. <exterms:packedSize rdf:datatype="&xsd;integer">784</exterms:packedSize>
12. </rdf:Description>
...other product descriptions...
13. </rdf:RDF>

例12 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example12)中,第7行的rdf:type属性(property)表示被描述的资源是URLref http://www.example.com/terms/Tent 所标识的类的一个实例(instance)。这假定了example.com已经在某个词汇表中描述了这个类(class),因此才可以在上面的例子中用该类的绝对URIref来引用它。如果example.com是在产品目录所在文档中描述了这个类,那么可以用相对URIref #Tent来引用它。

RDF本身并没有提供方法来定义特定应用中的类(class),比如本例中的Tent、或它们的属性(properties)如exterms:weight等。这些类是在RDF schema中使用RDF Schema语言(将在第5节 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#rdfschema)介绍)来描述的。其他用于类描述的方法也可以被定义,比如DAML+OILOWL语言(将在http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#richerschemas 5.5节]介绍)。

在RDF中,为被描述的资源指定rdf:type属性(property)以指明它是某个特定类型或类的实例是非常普遍的手法。这样的资源在RDF图中被称作有类型结点(typed node),在RDF/XML中被称作有类型结点元素(typed node elements)。RDF/XML提供了一种特殊的简略形式以描述这些有类型结点。在这种简略形式中,rdf:type属性及其的值被移去,而结点对应的rdf:Description元素被替换为一个以QName为名称的元素(QName对应于被移去的那个rdf:type属性的值,也就是某个类的URIref)。使用这种简略形式,例12 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example12)中example.com的帐篷也可用例13 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example13)所示的RDF/XML来描述:

例13:简略帐篷的类型

 1.   <?xml version="1.0"?>
2. <!DOCTYPE rdf:RDF [<!ENTITY xsd "http://www.w3.org/2001/XMLSchema#">]>
3. <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax- ns#"
4. xmlns:exterms="http://www.example.com/terms/"
5. xml:base="http://www.example.com/2002/04/products">
6. <exterms:Tent rdf:ID="item10245">
7. <exterms:model rdf:datatype="&xsd;string">Overnighter</exterms:model>
8. <exterms:sleeps rdf:datatype="&xsd;integer">2</exterms:sleeps>
9. <exterms:weight rdf:datatype="&xsd;decimal">2.4</exterms:weight>
10. <exterms:packedSize rdf:datatype="&xsd;integer">784</exterms:packedSize>
11. </exterms:Tent>
...other product descriptions...
12. </rdf:RDF>

因为一个资源可能被描述为是多个类的实,因此一个资源可能有多个rdf:type属性。但是,在这些rdf:type属性中,只有一个可被写为简略形式,其余的必须像例12 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example12)中的那样用rdf:type属性写出。

有类型结点的简略形式除用于描述用户自定义类(user-defined classes)(比如exterms:Tent)的实例以外,在描述内建RDF类(built-in RDF classes,将在第4节 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#othercapabilities)中介绍)(比如rdf:Bag)和内建RDF Schema类(built-in RDF Schema classes,将在第5节 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#rdfschema)中介绍)(比如rdfs:Class)时也是被普遍使用的。

例12 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example12)例13 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example13)展示了一点,即用RDF/XML写出的RDF陈述可以非常类似直接用XML(而不是RDF)书写的描述。在XML正被使用于越来越多的应用这一背景下,这是一个重要的考虑,因为这意味着RDF可在这些应用中被使用,而不需对信息的构造方式作较大改动。



3.3 总结

上面的例子已经展现了RDF/XML背后的一些基本思想。这些例子为开始书写有用的RDF/XML提供了足够的信息。关于用XML进行RDF陈述的建模(被称作striping)背后的理论、以及其他可用的RDF/XML简略形式、和其他关于用XML书写RDF的细节和示例,请参见(规范性)文档RDF/XML语法规范 (http://www.w3.org/TR/rdf-syntax-grammar/) [RDF-SYNTAX (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-rdf-syntax)]。



4. 其他RDF表达能力

RDF提供了一些额外 的表达能力,如内嵌的表示资源组和RDF陈述组的类和属性,还能让XML片断做为属性的值。下面讨论这些额外的表达能力。



4.1 RDF容器

我们常常需要描述一组事物:例如,说一般书是由多个作者写的,或把上某门课程的学生都列出来,或一个软件包下的所有模块。RDF提供了一些预定义的类型和属性用以描述一组事物。

首先,RDF提供了容器词汇,包括三个预定义的类型,以及他们的一些属性。一个容器是一个包含了一些事物的资源,这些被包含的事物称为成员。容器的成员可能是资源(包括匿名节点)或文字。RDF定义了三种类型的容器:

    • rdf:Bag
    • rdf:Seq
    • rdf:Alt

一个包(Bag,是类型为rdf:Bag的资源)表示了一组可能包含重复成员的资源或文字,且成员之间是无序的。例如,包可以用来描述对于成员的添加或处理顺序没有特别要求的组。

一个序列(Sequence,是类型为rdf:Seq的资源)表示了一组资源或文字,其中可能有重复的成员,而且成员之间是有序的。例如,序列可以用来描述一组必须按字母顺序排列的事物。

一个替换(Alternative,是类型为rdf:Alt的资源)表示了一组可以选择的资源或文字(常常是属性的一个值)。例如,序列可以用来描述一组可以互相替换的关于著作的不同语言的翻译,或者描述一个资源可能出现的几个因特网镜像站点。在应用中,如果属性的值是一个替换,这可以选择替换中任意一个合适的成员作为属性的值。

为了表示一个资源是一个容器,这个资源必须有个属性rdf:type且值为预定义的三个资源:rdf:Bag, rdf:Seq, or rdf:Alt 之一。这个容器资源(可能是匿名节点或由URIref标识的节点)代表了作为一个整体的一组事物。容器的成员和容器资源之间的关系是由一组专门为此定义的表示成员关系的属性描述的,这些属性的主体是容器资源,客体是其成员。这些成员关系属性的名字形为rdf:_n,其中n是一个大于0的十进制整数,如 rdf:_1, rdf:_2, rdf:_3等等。除了成员关系属性和rdf:type属性外,容器资源还可以有其他的属性。

很重要的一点是:尽管这些容器可以用预定义的RDF类型和属性定义,但并没有为这些容器提供特定的意义,例如,一个替换容器的成员的值是可替换的,这只是RDF的设计用途。这些容器类型和他们的定义,目的是在需要描述一组事物的时候建立一个大家认同的惯例。RDF所做的只是提供预定以的类型和属性用以构造RDF图来描述各种容器,相对于一个普通的资源如ex:Tent (如 3.2节 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#newresources)讨论的),它并没有给作为包的资源更多的内置的解释。在这种情况下,应用程序必须注意到不同类型的容器有不同的含义,这点会在下面的例子中进一步讨论:

容器的一个惯常用法是表明有个属性的值是一组事物。例如,为了表示句子 “参加课程6.001的学生有:Amy, Mohamed, Johann, Maria, 和 Phuong”,可以给课程一个s:students属性(来自一个合适的词汇集),它的值是一个包容器(表示一组学生),然后再用容器成员关系属性,每个学生可以标识为这个组的成员,如RDF图图14 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#figure14)所示:

fig14july12.png

图14:一个简单的包容器描述

因为这个例子中属性s:students的值是一个包,因此学生的URIrefs的顺序是无关紧要的,尽管容器成员属性的名字包含了一些整数。应用程序应该在创建或处理图的时候忽略掉属性名字中显示出来的顺序。

RDF/XML提供了一些特殊的语法和缩写来简化容器的描述。例如例14 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example14)描述了例14 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#figure14)所示的图。

例14:用RDF/XML书写的一个包含学生的包(bag)

 <?xml version="1.0"?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:s="http://example.org/students/vocab#">

<rdf:Description rdf:about="http://example.org/courses/6.001">
<s:students>
<rdf:Bag>
<rdf:li rdf:resource="http://example.org/students/Amy"/>
<rdf:li rdf:resource="http://example.org/students/Mohamed"/>
<rdf:li rdf:resource="http://example.org/students/Johann"/>
<rdf:li rdf:resource="http://example.org/students/Maria"/>
<rdf:li rdf:resource="http://example.org/students/Phuong"/>
</rdf:Bag>
</s:students>
</rdf:Description>
</rdf:RDF>

例14 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example14)展示了RDF/XML用rdf:li作为一个便利元素来避免显式地指定属性的名字。那些标号了的属性,如rdf:_1, rdf:_2是由图中的rdf:li自动生成的。元素名rdf:li是借鉴HTML的列表的。<rdf:Bag>元素又是一个例13 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example13)演示的缩写的例子,即当描述一个类的实例时,用单个元素替换一个rdf:Description元素和rdf:type元素。因为没有指定URIref,这个包资源是一个匿名节点。另外,它是属性元素<s:students> 的子节点,这也是一种缩写,表示这个匿名节点是属性的值。[RDF-SYNTAX (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-rdf-syntax)]讲解了更详细的缩写方法。

容器rdf:Seq的图结构和对应的RDF/XML写法和rdf:Bag相似(唯一的区别是类型是rdf:Seq)。同样地,虽然rdf:Seq是用来描述序列,但应用程序要负责在创建和处理RDF图时正确解释体现在属性名字中的顺序。

为了演示替换容器的用法,句子“X11的源代码可能可以在网站ftp.example.org, ftp1.example.org, 或 ftp2.example.org上找到”可用如图15 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#figure15)所示的图表示:

fig15july12.png

图15:一个简单的替换容器描述

图15 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#figure15)代表的图可以在RDF/XML中如例15 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example15)所示:

例15:用RDF/XML书写的一个替换容器(Alt Container)

 <?xml version="1.0"?>

<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"

xmlns:s="http://example.org/packages/vocab#">



<rdf:Description rdf:about="http://example.org/packages/X11">

<s:DistributionSite>

<rdf:Alt>

<rdf:li rdf:resource="ftp://ftp.example.org"/>

<rdf:li rdf:resource="ftp://ftp1.example.org"/>

<rdf:li rdf:resource="ftp://ftp2.example.org"/>

</rdf:Alt>

</s:DistributionSite>

</rdf:Description>

</rdf:RDF>

一个替换容器被设计为至少有一个成员,由属性rdf:_1标识。这个成员被认为是属性的缺省值或优先值。除了rdf:_1外,其他剩下的成员的顺序是无关紧要的。

图15 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#figure15)中的RDF图表示属性s:DistributionSite的值是一个类型是替换容器的资源。关于这个RDF图更多的意义必须由应用程序来解释,例如,替换容器的一个成员可以看成属性s:DistributionSite的值,或者ftp://ftp.example.org是这个属性的缺省值或优先值。

替换容器常常和语言标记一起使用(RDF/XML允许用在[XML (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-xml)]定义的属性xml:lang 表示元素节点的内容是用什么语言书写的。 [RDF-SYNTAX (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-rdf-syntax)]描述了xml:lang的用法, 6.2节 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#prism)也演示它的用法。)。例如,如果一个著作被翻译成了多种语言,这这本著作的标题属性可以是一个替换容器,这个容器包含了用多种语言书写的标题。

包和替换的用法的区别可以通过以下例子更清楚地看出来。哈克贝里?芬历险记(“Huckleberry Finn”)这本书只有一个作者,但作者有两个名字(马克?吐温是笔名,塞谬尔?克莱门斯是原名),每个名字都可以表示作者。因此,包含这两个名字的替换比包更适合作为作者名这个属性的值,因为包容器隐含了这是两个不同的作者的意思。

用户可以不用RDF容器词汇,随意选择自己的方式表达一组资源。这些RDF容器只是提供一种通用的方式,如果能得到广泛应用,可以使描述一组资源的数据具有更好的互操作性。

有时候,有明显的方法可以代替RDF容器。例如,要描述一个资源和一组资源的关系,可以用多个陈述(属性是相同的)来表示,每个陈述的主体都是第一个资源,客体是一组资源的一个资源。这和用一个陈述表示,主体是第一个资源,客体是包含一组资源的容器的方式在结构上是不同的。有些时候,这两种表示方式有相同的意义,但也有时候不一样。如何在不同的情况下去选择不同的方式要考虑以下问题:

考虑一个例子表示作家和其的作品之间关系的例子,如下面的句子:

Sue已经写了"Anthology of Time", "Zoological Reasoning", 和 "Gravitational Reflections"这三本书。

在这个例子中,有三个资源都是由相同的作者独立完成的,这可以用重复的属性表示如下:

 exstaff:Sue   exterms:publication   ex:AnthologyOfTime .
exstaff:Sue exterms:publication ex:ZoologicalReasoning .
exstaff:Sue exterms:publication ex:GravitationalReflections .

在这个例子中,只说了作品之间的关系是他们由同一个作者写成。每个陈述是一个独立的事实,因为用重复的属性也是合理的选择。当然,用一个关于Sue写的一组书的陈述表示的话,也是合理的。

 exstaff:Sue   exterms:publication   _:z .
_:z rdf:type rdf:Bag .
_:z rdf:_1 ex:AnthologyOfTime .
_:z rdf:_2 ex:ZoologicalReasoning .
_:z rdf:_3 ex:GravitationalReflections .

在另一方面,句子

 这个决议被由Fred, Wilma 和 Dino组成的章程委员会批准了。

说这个委员会作为一个整体批准了这个决议;并不是说每个单独的委员会成员都投票同意了这个决议。在这个例子中,如果把这个句子用三个独立的exterms:approvedBy陈述表示,每一个陈述的主体是一个委员会成员, 如下所示,则是不恰当的,

 ex:resolution   exterms:approvedBy   ex:Fred .
ex:resolution exterms:approvedBy ex:Wilma .
ex:resolution exterms:approvedBy ex:Dino .

因为这些陈述是说每个成员都批准了这个决议。

如果将这句话表示为一个陈述,其主体是决议,客体是委员会,则更为恰当。这个委员会可以用一个包含这三个委员会成员的包容器来描述,如下面的这些三元组所示:

 ex:resolution       exterms:approvedBy   ex:rulesCommittee .
ex:rulesCommittee rdf:type rdf:Bag .
ex:rulesCommittee rdf:_1 ex:Fred .
ex:rulesCommittee rdf:_2 ex:Wilma .
ex:rulesCommittee rdf:_3 ex:Dino .

当用RDF容器时,要明白这些陈述不是像程序语言中的结构那样在构造容器,而是描述已经存在的容器。在刚给出的章程委员会例子中,章程委员会是一组没有排序的人,不管RDF的描述方式是怎样的。说资源 ex:rulesCommittee 的类型是rdf:Bag,并不等于说章程委员会是一个数据结构,或说构造了一个包含这个组的成员的数据结构(章程委员会可以描述为一个包即使没有描述他的任意成员。反之,它描述了章程委员会和包容器有对应的特点,即有成员且成员之间的序是无关紧要的。类似地,用容器成员属性只是描述了一个容器资源有一些事物作为其成员,并不是说这些事物是容器仅有的成员。例如,上面的三元组只说Fred, Wilma,和 Dino是委员会的成员,但没有说他们是委员会的所有成员。

同样,例14 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example14) and 例15 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example15)显示了描述容器的一个通用模式。然而,很重要的一点是,RDF并不强制使用RDF容器词汇的方式,因此,可能会有其他使用容器的方式。例如,有时候让容器资源有一个URIref比作为一个匿名节点更为恰当。此外,还可能有不像前面的例子那样格式规范的容器词汇使用方式,例如,例16 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example16) 显示了一个用RDF/XML表示的和图15 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#figure15)中的替换容器类似的图, 但它显式地写出了容器成员属性,而不是由rdf:li自动生成:

例16:一个格式不正确的替换容器的RDF/XML表示

 <?xml version="1.0"?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:s="http://example.org/packages/vocab#">

<rdf:Description rdf:about="http://example.org/packages/X11">
<s:DistributionSite>
<rdf:Alt>
<rdf:type rdf:resource="http://www.w3.org/1999/02/22-rdf-syntax-ns#Bag"/>
<rdf:_2 rdf:resource="ftp://ftp.example.org"/>
<rdf:_2 rdf:resource="ftp://ftp1.example.org"/>
<rdf:_5 rdf:resource="ftp://ftp2.example.org"/>
</rdf:Alt>
</s:DistributionSite>
</rdf:Description>
</rdf:RDF>

[RDF-SEMANTICS (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-rdf-semantics)]所说,RDF没有对RDF容器词汇的使用施加格式正确性约束,因此例16 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example16)是合法的,尽管这个容器的类型即是包又是替换,属性rdf:_2还具有两个不同的值,还没有属性rdf:_1, rdf:_3, 或 rdf:_4。

结果是,RDF应用如果需要容器是格式正确的,则为了应用的鲁棒性,应该写代码检查容器词汇的使用恰当与否。



4.2 RDF集合

4.1节 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#containers)中描述的容器的一个缺点是没有办法封闭它,即没有办法说这些是容器的所有成员。一个容器只说一些有标识的资源是它的成员,无法说没有其他的成员了。而且,如果有一个图描述它的一些成员,我们没法排除在其他地方有图也描述这个容器的其它成员的可能。RDF以RDF集合(collection)的形式提供了对描述特定成员的组的支持。一个RDF集合是用列表结构表示的一组事物,这个列表结构是用一些预定义的集合词汇表示的。RDF的集合词汇包括属性rdf:first 和rdf:rest,和资源rdf:nil.

为了展示这个,句子“上课程6.001的学生有:Amy, Mohamed, 和Johann”可以用图16 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#figure16)所示的图表示:

fig16bjuly12.png

图16:一个RDF集合(列表结构)

在这个图中,集合中的每个成员,如s:Amy,是属性rdf:first的客体,这个属性的主体是表示一个列表的资源(这个例子中是一个匿名节点)。这个列表通过属性rdf:rest链到列表的剩下的元素,列表的结束用一个值为rdf:nil 的属性rdf:rest表示(rdf:nil表示一个空列表,它的类型是rdf:List)。这种结构和Lisp语言很像,像Lisp一样,属性rdf:first 和rdf:rest允许程序遍历这个结构。组成列表结构的每个匿名节点的类型默认为rdf:List,尽管这没有在图中显示出来。RDF Schema语言[RDF-VOCABULARY (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-rdf-vocabulary)]定义了属性rdf:first 和rdf:rest的主体的类型是rdf:List,因此,这些匿名节点的类型信息可以推导出来,而不用每次都写出来。

RDF/XML提供了一种特殊的图的记法使描述集合更为简单。在RDF/XML中,一个集合可以用一个代表属性的元素节点表示,且这个元素节点有个属性节点是rdf:parseType="Collection",这表示元素节点下的内容要以一种特殊的方式解释。在这里,rdf:parseType="Collection"表示包含的元素要用来创建RDF图中(其它的rdf:parseType属性的值将在后面的章节中讲述)。

为了展示rdf:parseType="Collection"是怎么工作的,例17 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example17) 中的RDF/XML写法对应的图如 图16 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#figure16)说示:

例17:一个关于学生的集合的 RDF/XML表示

 <?xml version="1.0"?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:s="http://example.org/students/vocab#">

<rdf:Description rdf:about="http://example.org/courses/6.001">
<s:students rdf:parseType="Collection">
<rdf:Description rdf:about="http://example.org/students/Amy"/>
<rdf:Description rdf:about="http://example.org/students/Mohamed"/>
<rdf:Description rdf:about="http://example.org/students/Johann"/>
</s:students>
</rdf:Description>
</rdf:RDF>

在RDF/XML 中用rdf:parseType="Collection" 常定义了一个如 图16 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#figure16)所示的列表结构:一个固定有限长度的列表,它用rdf:nil表示列表的结束,还用了一些相对于列表唯一的匿名节点。然后,RDF并没有强制集合词汇只能用于这种方式,因此也可以用于其他方式。有些方式可能没有描述列表或者说封闭的集合。为了知道原因,注意到图16 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#figure16)所示的图也可以用集合词汇的普通格式(不用rdf:parseType="Collection")写,如例18 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example18)所示:

例18:一个关于学生的集合的RDF/XML普通格式表示

 <?xml version="1.0"?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:s="http://example.org/students/vocab#">

<rdf:Description rdf:about="http://example.org/courses/6.001">
<s:students rdf:nodeID="sch1"/>
</rdf:Description>

<rdf:Description rdf:nodeID="sch1">
<rdf:first rdf:resource="http://example.org/students/Amy"/>
<rdf:rest rdf:nodeID="sch2"/>
</rdf:Description>

<rdf:Description rdf:nodeID="sch2">
<rdf:first rdf:resource="http://example.org/students/Mohamed"/>
<rdf:rest rdf:nodeID="sch3"/>
</rdf:Description>

<rdf:Description rdf:nodeID="sch3">
<rdf:first rdf:resource="http://example.org/students/Johann"/>
<rdf:rest rdf:resource="http://www.w3.org/1999/02/22-rdf-syntax-ns#nil"/>
</rdf:Description>
</rdf:RDF>

注意到在 [RDF-SEMANTICS (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-rdf-semantics)] (和容器词汇相同的情况4.1节 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#containers))中, RDF并没有对集合词汇施加格式正确性约束(well-formedness),因此,当用普通格式写时,有可能写出的列表结构并不像由用rdf:parseType=“collection”自动生成的那样正确,如一个节点的rdf:first属性有两个不同的值是合法的,或列表结构的最后的节点不是空列表,或简单地忽略了结合的某些部分。另外,用普通格式写的集合词汇定义的图可以用URIrefs标识列表中的部分节点,而不是在列表中是唯一的匿名节点,这样,有可能在别的图中有三元组为集合添加元素,而使之不封闭。

结果是,RDF应用如果需要集合是格式正确的,为了应用的鲁棒性,就应该检查集合词汇时被正确的使用。另外,语言 OWL (http://www.w3.org/TR/owl-ref/) [OWL (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-owl)], 能够对RDF图的结构定义额外的限制,可以避免一些集合格式不正确的情况。



4.3 RDF具体化

有时候RDF应用需要描述RDF陈述,例如,为了记录RDF陈述发表的时间,作者和其他类似的信息(有时这些信息称为“来源”信息)。在3.2节的例9中,我们描述了一个帐篷,其URIref是exproducts:item10245, 被example.com出售。其中一个三元组描述了帐篷的重量:

 exproducts:item10245   exterms:weight   "2.4"^^xsd:decimal .

如果能记录是谁提供了这个信息,可能对example.com有用。

RDF提供了用以描述RDF陈述的内置词汇。用这些词汇对一个陈述的描述称为这个陈述的具体化(reification)。RDF具体化词汇包含类rdf:Statement,属性rdf:subject, rdf:predicate, 和 rdf:object。然而,用RDF具体化词汇需要谨慎,因为很容易想到这些词汇定义了一些实际上没有定义事物。这个问题会再这节的后面讨论。

用RDF具体化词汇,关于帐篷重量的陈述的具体化可以通过给这个陈述一个URIref,如exproducts:triple12345(这样可以写陈述去描述它),可以通过以下陈述描述它:

 exproducts:triple12345   rdf:type        rdf:Statement .
exproducts:triple12345 rdf:subject exproducts:item10245 .
exproducts:triple12345 rdf:predicate exterms:weight .
exproducts:triple12345 rdf:object "2.4"^^xsd:decimal .

这些陈述是说:由URIref exproducts:triple12345标识的资源是一个RDF陈述,且这个陈述的主体是exproducts:item10245标识的资源,这个陈述的谓词是exterms:weight标识的资源,这个陈述的客体是有类型文字"2.4"^^xsd:decimal标识的小数值。假设原来的陈述的确是被exproducts:triple12345标识的,通过比较原来的陈述和这个陈述的具体化,很清楚具体化的确描述了原来的陈述。RDF具体化词汇的惯用法通常包含了用这个模式描述的四个陈述,因此,这四个陈述有时被称为“具体化四元组”(reification quad)。

根据这个惯例用RDF具体化,example.com可以这样记录John Smith发表了关于帐篷重量的陈述的事实:首先赋予这个陈述一URIref(如,exproducts:triple12345),用上面描写的具体化描述这个陈述,然后再加一个语句,即exproducts:triple12345 是由John Smith 写的(用一个URIref标识“John Smith”)。结果是:

 exproducts:triple12345   rdf:type        rdf:Statement .
exproducts:triple12345 rdf:subject exproducts:item10245 .
exproducts:triple12345 rdf:predicate exterms:weight .
exproducts:triple12345 rdf:object "2.4"^^xsd:decimal .
exproducts:triple12345 dc:creator exstaff:85740 .

这原来的陈述,和具体化以及作为陈述的作者John Smith形成了如图17所示的图:

reificationFigJul22.png

图17:一个陈述及其具体化和属性

这个图用RDF/XML的写法如例19所示:

例19:一个具体化例子的RDF/XML表示

 <?xml version="1.0"?>
<!DOCTYPE rdf:RDF [<!ENTITY xsd "http://www.w3.org/2001/XMLSchema#">]>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns:exterms="http://www.example.com/terms/"
xml:base="http://www.example.com/2002/04/products">
   <rdf:Description rdf:ID="item10245">
<exterms:weight rdf:datatype="&xsd;decimal">2.4</exterms:weight>
</rdf:Description>
   <rdf:Statement rdf:about="#triple12345">
<rdf:subject rdf:resource="http://www.example.com/2002/04/products#item10245"/>
<rdf:predicate rdf:resource="http://www.example.com/terms/weight"/>
<rdf:object rdf:datatype="&xsd;decimal">2.4</rdf:object>
      <dc:creator rdf:resource="http://www.example.com/staffid/85740"/>
</rdf:Statement>
 </rdf:RDF>

3.2节介绍了使用RDF/XML的rdf:ID属性于rdf:Description元素中来简化称述主体的URIref。rdf:ID也可以用在属性元素节点中,用来自动产生一个属性元素生成的三元组的具体化。例20 显示了这样可以表示和例19同样的图:

例20:用rdf:ID 生成具体化表示

 <?xml version="1.0"?>
<!DOCTYPE rdf:RDF [<!ENTITY xsd "http://www.w3.org/2001/XMLSchema#">]>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns:exterms="http://www.example.com/terms/"
xml:base="http://www.example.com/2002/04/products">
   <rdf:Description rdf:ID="item10245">
<exterms:weight rdf:ID="triple12345" rdf:datatype="&xsd;decimal">2.4
</exterms:weight>
</rdf:Description>
   <rdf:Description rdf:about="#triple12345">
<dc:creator rdf:resource="http://www.example.com/staffid/85740"/>
</rdf:Description>
 </rdf:RDF>

在这种情况下,把属性节点rdf:ID="triple12345"放在exterms:weight元素中,达到与原来描述帐篷重量的三元组同样的效果:

 exproducts:item10245   exterms:weight   "2.4"^^xsd:decimal .

和一些具体化三元组:

 exproducts:triple12345   rdf:type        rdf:Statement .
exproducts:triple12345 rdf:subject exproducts:item10245 .
exproducts:triple12345 rdf:predicate exterms:weight .
exproducts:triple12345 rdf:object "2.4"^^xsd:decimal .

这些具体化三元组的主体是一个URIref,它是由文档的基准URI(在xml:base中声明),字符“#“和rdf:ID的值连接而成。也就是说,这些三元组和前面的例子一样,具有相同的主体:exproducts:triple12345。

注意:对具体化做断言和对原来的陈述做断言是不同的,并且,它们中的一个成立不能推出另一个成立。也就是说,当有的人说,John说了些关于帐篷重量的东西,他们并不是在陈述一个帐篷的重量,他们是在陈述John说了什么。相反地, 当某人(用一个陈述)描述了一个帐篷的重量,他并没有对这个陈述做出其他的陈述(因为他可能没有兴趣说关于“陈述”的事情)。

上述说法在一些地方被称为“具体化的惯例用法”。就像前面说到的一样,用RDF具体化词汇的时候要谨慎,因为很容易设想这些词汇定义了一些其实并没有定义的事情。如果有应用程序成功使用具体化词汇,他们是通过遵循某些惯例,做了一些假设做到的,这些惯例和假设都是在RDF为具体化词汇定义的真正意义之外的,也是在RDF为了支持他们而提供的真正辅助之外的。

首先,重要的是,在具体化的惯例用法中,具体化三元组的主体是假设为标识了在一个特定的RDF文档中特定的三元组,而不是一些任意的具有相同的主体,谓词,客体的三元组。使用这个惯例是因为具体化是被设计用于表达一些属性,如书写的日期,RDF数据远信息,就像例子中已经给出的那样,这些属性必须应用于三元组的特定实例。有可能有多个三元组具有相同的主体,谓词,客体,另外,尽管图是定义为一个三元组的“集合”,多个结构相同的三元组实例可能出现在不同的文档中。因此,为了完全支持这个惯例,需要一些方式来将具体化三元组的主体和一些文档中个体三元组关联起来。然而,RDF没有提供办法实现它。

例如,在上面的例子中,在三元组中和RDF/XML中都没有显式的信息说那个描述帐篷重量的陈述就是资源exproducts:triple12345,它是四个具体化三元组的主体,也是John Smith做出的陈述。这可以从图17 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#figure17)看出。原来的陈述当然是图的一部分,但就图上的信息而言,exproducts:triple12345是一个单独的资源,而不是标识了图中的那个陈述。RDF没有提供内置的方式来表明一个像exproducts:triple12345的URIref是怎样关联到一个特定的陈述或图的,和没有提供内置的方式来表明一个像exproducts: item10245的URIref是怎样关联到一个具体的帐篷一样。关联特定的URIref到特定的资源(这里是陈述)必须通过RDF以外的机制实现。

用如例20 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example20)所示的rdf:ID能够自动生成具体化三元组,这提供了一种方便的办法来表明用在具体化中的陈述的主体URIref。而且,它提供了一个“窍门”用以把具体化三元组和创建他们的RDF/XML语法部分关联起来,因为rdf:ID属性的值triple12345是用于生成具体化三元组的主体URIref。然而,这个关联还是在RDF之外的,因为生成的三元组中没有任何东西显式地说原来的三元组有个URIref是exproducts:triple12345(RDF并不假设在一个URIref和任何使用了这个URIref或其缩写形式的RDF/XML之间有任何关系)。

缺乏内置的方式赋予陈述URIref并不意味着这种类型的来源(provenance)信息无法在RDF中表示,而是这无法仅仅用RDF关联给具体化词汇的语义达到。例如,如果一个RDF文档(如,一个网页)有个URI,这可以对这个URI表示的资源做出陈述,然后,通过一些应用相关的对这些陈述的解释,一个应用可以认为这些陈述对文档中的全部陈述起作用。另外,如果有些RDF之外的机制可用以赋予RDF陈述URI,当然可以做出关于陈述(用这些URI标识)的陈述。然而,这样的话,没有必要严格遵照具体化词汇的惯例用法。

为了明白这点,假设原来的陈述:

 exproducts:item10245   exterms:weight   "2.4"^^xsd:decimal .

有一个URIref exproducts:triple12345,这个陈述可以简单地通过下面的陈述让其归属于John Smith:

 exproducts:triple12345   dc:creator   exstaff:85740 .

而没有用具体化词汇(尽管加上exproducts:triple12345的rdf:type是rdf:Statement可能是有益的)。

另外,具体化词汇在使用时,可以直接遵照上述的惯例,并附带应用相关的对如何把特定的三元组和其具体化关联起来的理解。然而,其他收到这个RDF数据的应用不一定能够分享这个应用相关的理解,因此不一定能够正确地解释这个图。

还有一点需要重视:这里讲述的具体化的解释和一些语言中的“引用”(quotation)不同。具体化描述了一个特定的三元组的实例和这三元组提及的资源之间的关系,具体化可以直观地理解为:这个三元组说的是这些事物,而不是在引用中的:这个三元组有这个形式。例如,在这节中的具体化例子中,三元组

exproducts:triple12345 rdf:subject exproducts:item10245 .

描述了原来的陈述的rdf:subject, 是说陈述的主体是由URIref exproducts:item10245标识的资源(那个帐篷)。它不是像引用那样说陈述的主体是这个URIref本身(一个由一些字符开头的字符串)。



4.4 关于结构化值(rdf:value)的更多信息

2.3节 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#structuredproperties)注意到RDF模型本质上只支持二元关系,也就是说,一个陈述表示了两个资源之间的关系。例如,陈述:

 exstaff:85740   exterms:manager   exstaff:62345 .

说两个雇员之间有exterms: manager关系(一个管理另一个)。

然而,有些情况下有必要在RDF中表示多元关系(多于两个资源之间的关系)。2.3节 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#structuredproperties) 讨论了一个例子,这个例子的问题是要表示John Smith和他的地址信息,即一个由街道,城市,州,邮政编码组成的结构。可以看出这个地址信息是一个5元关系。

 address(exstaff:85740, "1501 Grant Avenue", "Bedford", "Massachusetts", "01730")

2.3节 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#structuredproperties)注意到这种结构化的信息可以通过聚集一部分信息作为一个单独的资源(这里,John’s的地址信息),然后对这个新资源发表单独的陈述,如下面的三元组所示:

 exstaff:85740   exterms:address        _:johnaddress .
_:johnaddress exterms:street "1501 Grant Avenue" .
_:johnaddress exterms:city "Bedford" .
_:johnaddress exterms:state "Massachusetts" .
_:johnaddress exterms:postalCode "01730" .

(其中_:johnaddress是表示John’s的地址的匿名节点的标识)这是在RDF中表示N元关系的一般方法:选出关系中的一个元素(这里是John)作为关系(这里是address)的主体,指定一个中间的资源来表示关系中剩下的部分,然后把关系剩下部分都作为这个中间资源的属性。

在John 的地址信息中,没有一个部分能够作为属性exterms:address的主值(main value),所有部分对值的贡献是相同的。然后,有时候,结构中的一部分可以作为结构的主值,其他部分提供上下文信息或其他对主值的修饰信息。例如,在3.2节 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#newresources)例9 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example9) 中,一个帐篷的重量的值是小数2.4,也就是,

 exproduct:item10245   exterms:weight   "2.4"^^xsd:decimal .

实际上,更为复杂的对重量的描述应该是2.4千克( kilograms),而不是仅仅小数2.4。为了表示这个,属性exterms:weight的值还需要2个部分:作为类型文字的数值和量度的单位(千克)。在这种情况下,数值可以看成属性exterms:weight的主值,因为一般这个值都是一个类型文字,而依赖对上下文信息来填充这个值的单位。

在RDF模型中,这种类型的带有修饰的属性值可以看成一种简单的结构化值。为了表达这个,一个单独的资源可以用来表示结构化值,且作为原来陈述的客体。这个资源可以有属性表示结构值中的部分。在这里,应该有个属性表示数值,还一个属性表示单位。RDF提供了一个预定义的属性rdf:value来描述结构值中的主值。因此,这里的数值可以作为rdf:value的值,资源exunits:kilograms作为属性exterms:units的值(假设资源exunits:kilograms定义为example.org的词汇集的一部分)。结果,这些三元组为:

 exproduct:item10245   exterms:weight   _:weight10245 .
_:weight10245 rdf:value "2.4"^^xsd:decimal .
_:weight10245 exterms:units exunits:kilograms .

这可以用RDF/XML表示,如例21 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example21)所示:

例21:用rdf:value的RDF/XML表示

 <?xml version="1.0"?>
<!DOCTYPE rdf:RDF [<!ENTITY xsd "http://www.w3.org/2001/XMLSchema#">]>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:exterms="http://www.example.org/terms/">

<rdf:Description rdf:about="http://www.example.com/2002/04/products#item10245">
<exterms:weight rdf:parseType="Resource">
<rdf:value rdf:datatype="&xsd;decimal">2.4</rdf:value>
<exterms:units rdf:resource="http://www.example.org/units/kilograms"/>
</exterms:weight>
</rdf:Description>

</rdf:RDF>

例21 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example21)也显示了对4.2节 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#collections)介绍的属性rdf:parseType的用法,在这里,rdf:parseType="Resource"用以表示节点的内容同时被解释为一个新的匿名节点,而不用写一个嵌套的rdf:Description元素。rdf:parseType="Resource" 用在属性 exterms:weight 元素节点中表示创建了一个匿名节点作为属性的值,且包含的元素 (rdf:value 和 exterms:units) 描述了这个匿名节点的属性。关于rdf:parseType="Resource"更详细的信息在[RDF-SYNTAX].

相同的方法也可用于表示具有任何单位的数量,用rdf:value属性表示主值,用其他的属性表示关于数量的其他信息。

但没有必要用rdf:value去取代用户自定义的属性,如例21 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example21)中的属性exterms:amount, 因为RDF并没有给rdf:value特殊的解释。它只是作为表示这种情形的惯例。

然而,尽管大部分数据库中和Web上的数据用简单的数值作为属性(如,重量,价格等)的值,这种简单的数值往往不足够描述这些值。在像Web这样的环境,一般来说,假设其他人访问属性的值的时候能知道它的单位(或其他上下文相关的信息)是不稳妥的。例如,一个美国的网站给出重量的单位默认是磅,但非美国的人访问这个数据的时候常假设单位是公斤。对Web上数据的正确解释可能需要其他的信息,如单位信息。这有很多种方法:例如,用rdf:value,把单位信息放在属性名字种,如属性exterms:weightInKg包含了数据的单位信息。或者,加上用户自定义的的信息,如exterms:unitOfWeight, 在物品或产品实例的描述中,在一个数据集的描述中,或者在Schema中(参考第5节 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#rdfschema)



4.5 XML文字

有时候,属性的值可能是一个XML的片断,或包含XML标记的文本。例如,出版社可能要维护一些RDF元数据,包括书和文章的标题。当然,这些标题可能是简单的字符串,但并不总是这样。例如,数学书的标题可能包含用MathML [MATHML (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-mathml)]表示的数学公式。标题还可能因为其他原因包含标记,如 Ruby标注 [RUBY (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-ruby)], 或者双相的显示特殊的浮雕型变量。 ([CHARMOD (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-charmod)])

RDF/XML提供了一个特殊的符号,使书写这种文字变得简单。即通过属性rdf:parseType第三个值,如果一个元素节点的有属性节点rdf:parseType="Literal",表明这个元素节点的内容应该被解释为一个XML片断。例22 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example22) 演示了这种用法。

例22:一个XML文字的RDF/XML表示

 <?xml version="1.0"?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:dc="http://purl.org/dc/elements/1.1/"
xml:base="http://www.example.com/books">

<rdf:Description rdf:ID="book12345">
<dc:title rdf:parseType="Literal">
<span xml:lang="en">
The <em>&lt;br /&gt;</em> Element Considered Harmful.
</span>
</dc:title>
</rdf:Description>

</rdf:RDF>

Example 22 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example22) 中的RDF/XML 描述了一个包含了一个三元组的图,这个三元组的主体是ex:book12345, 谓词是dc:title. 属性节点 rdf:parseType="Literal" 表示元素节点 <dc:title> 下的内容是一个XML片断,即作为属性dc:title的值。在这个图中,值是类型为rdf:XMLLiteral 的类型文字。[RDF-CONCEPTS (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-rdf-concepts)] 特意定义rdf:XMLLiteral作为表示XML片断的数据类型。这些XML片断都是根据XML Exclusive Canonicalization recommendation [XML-XC14N (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-xml-xc14n)]规范化了的,这导致了一些转换,如为XML片断加上已用的名字空间声明,统一的字符转义或去转义,空元素的扩展。(因为这些原因以及三元组的标注本身需要一些转义符,这里不显示真正的类型文字。RDF/XML 提供了属性 rdf:parseType="Literal" 使RDF用户不用进行这些转换。详细信息请参考[RDF-CONCEPTS (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-rdf-concepts)] 和 [RDF-SYNTAX (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-rdf-syntax)].) 一些上下文属性,如xml:lang 和 xml:base 并不会从RDF/XML文档中继承,如果需要的化,如上例所示,必须在XML片断中给出。

这个例子表明了书写RDF数据是要谨慎。乍看,标题的值是用平凡文字表示的简单字符串,后来又发现会包含XML标记。如果一个属性的值有时包含XML标记,有时有不包含,应该都用rdf:parseType="Literal",或者软件应该能处理属性的值可能是平凡文字和rdf:XMLLiteral类型的文字的情况。



5. RDF Schema — 定义RDF的词汇表

RDF使用命名特性和值来表达与资源有关的简单声明。但是,在某些情况下,用户希望能够根据需要自定义一些词汇,然后用这些词汇来描述资源。这些词汇表明用户正在描述某种资源,并且会采用某些特定的特性来描述。例如,3.2节所举例子中,example.com 公司想要描述一个类:exterms:Tent,并且使用特性 exterms:model,exterms:weightInKg 和 exterms:packedSize来描述它们。(这些类和特性的名字之前带有各种“example”名称空间前缀,表明:在RDF中,这些名字其实都是RUI引用,2.1小节中已经讨论过这个问题)。类似的情况,那些对图书资源比较感兴趣的RDF开发人员可能会描述 ex2:Book或者ex2:MagazineArtical这样的类,并使用ex2:author, ex2:title ,ex2:subject之类的特性来描述这些类。其它的一些应用可能会描述诸如ex3:Person、ex3:Company 这样的类和ex3:age 、ex3:jobTitle、ex3:stockSymbol 、ex3:numberofEmployee之类的一些特性。RDF本身并不能针对特定应用需求来定义一些类和特性。这些类和特性被称为RDF词汇,它们需要通过RDF词汇描述语言:RDF Schema(RDF的一种扩展语言) 来定义。

RDF Schema 并没有针对特定应用提供诸如 exterms:Tent , ex2:Book 或者 ex3:Person这样的一些类或者是诸如 exterms:weightInKg ex2:author 或者 ex3:JobTitle 这样的一些特性词汇。RDFS只是提供了描述一种这些类和特性的能力 (facilities),并且可以暗示某些类和特性期望合在一起使用(例如,特性 ex3:jobTitle 应该用来描述ex3:Person)。换句话说,RDF Schema为RDF提供了一个类型系统。RDF Schema 类型系统在某些方面类似于Java这样的面向对象编程语言的类型系统。例如,RDF Schema允许资源被定义为一个或者多个类的实例。另外,RDFS通常把类组织成为一种分级结构;例如,类 ex:Dog可以定义为ex:Mammal的子类,而ex:Mammal又是ex:Animal的子类。 如果某个资源是类 ex:Dog的实例,那么隐含意味着它也是ex:Animal的实例。然而,RDF 类和特性在某些方面又与编程语言的类型系统有着明显的差异。RDF类和特性并没有过多束缚资源的描述方式,而是提供了一些关于RDF 资源的额外描述信息。这些添加的信息可以通过各种方式来使用,具体内容将在5.3节中介绍。

RDF Schema 所具有的这些能力本身也是以 RDF词汇形式提供的。也就是说,这些RDF 词汇是一组带有特殊含义的、预定义的RDF资源。 这些资源的(RDF Schema词汇)URI带有前缀 http://www.w3.org/2000/01/rdf-schema# (QName通常采用前缀 rdfs:)。采用RDF Schema 语言所定义的词汇描述(schemas)也是合法的RDF图。因此,即使一个软件不是专为处理新加的RDF Schema词汇而开发的,它仍然可以将schema解释为一个包含了各种资源和特性的合法RDF图,但是这个软件并不能“理解”新添加的RDF Schema术语的内在含义。为了理解新加术语的含义,RDF 软件必须能够处理一种扩展语言。这种扩展语言不仅仅包含rdf:前缀的词汇,而且还包含了rdfs:前缀的词汇,以及这些词汇的内在含义。下一小节中将对这一点进行详细分析。

下一小节将详细分析RDF Schema的基本资源和特性。



5.1 描述类

描述过程通常从划分被描述事物的种类开始。RDF Schema把事物的种类称之为类(class)。RDF Schema中的类(class)与我们通常所说的类型(Type)或者分类(Category)基本相同,有点类似于面向对象编程语言(比如Java)中的类(class)的概念。RDF类可以用来表示事物的任何分类,例如网页、人、文档类型、数据库或者抽象概念等。类可以通过RDF Schema中的资源(rdfs:Class和rdfs:Resource)以及特性(rdf:type和rdfs:subClassOf)来表示。

例如,假设example.org这个组织想用RDF来提供有关不同种类机动车(Motor vehicles)的信息,那么它在RDF Schema中首先需要一个代表机动车这一分类(category)的类(class)。属于某个类(class)的资源被称为该类的实例(instances)。在本例中,所有是机动车的资源都是这个类的实例。

在RDF Schema中,一个是任何具有rdf:type特性、并且该特性的值为rdfs:Class的资源。因此,可以这样来描述一个机动车类:为该类指定一个URIref,比如ex:MotorVehicle(其中的前缀 ex: 代表URIref http://www.example.org/schemas/vehicles,ex: 被用作example.org词汇表中的所有URIrefs的前缀),然后将这个机动车类描述为一个具有rdf:type特性、并且特性值为rdfs:Class的资源。也就是说,example.org应该编写如下的RDF声明:

 ex:MotorVehicle   rdf:type   rdfs:Class .

正如在3.2节 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#newresources)中所讨论的那样,特性rdf:type用来表明一个资源是某个类的实例。因此,将ex:MotorVehicle描述为类之后,可以用下面的RDF声明来描述资源exthing:companyCar是一个机动车:

 exthings:companyCar   rdf:type   ex:MotorVehicle .

(在书写上述RDF声明时,遵守了一些约定,即:将类名的首字母大写,而将特性和实例名称的首字母小写。但是,RDF Schema并不强制要求这一点。上述RDF声明也假定:example.org已分别为事物的类(classes)和事物的实例(instances)定义了两个不同的词汇表[译注//这两个词汇表分别在ex:和exthings:所代表的命名空间里定义]。)

rdfs:Class本身也是资源,而且也有一个rdf:type特征并且该特性的值为rdfs:Class。一个资源可以是一个或多个类的实例.

example.org在描述了ex:MotorVehicle类之后,也许还要再定义一些类来代表各种特定种类的机动车,例如客车(passenger vehicles)、大篷货车(vans)、小型货车(minivans)等等。这些类可以采用和类ex:MotorVehicle同样的方法来定义:首先为每个新建的类指定一个URIref,然后编写如下的RDF声明将这些资源定义为类:

 ex:Van     rdf:type   rdfs:Class .
ex:Truck rdf:type rdfs:Class .

但是上面这些声明本身只是对单个的类的定义。example.org可能还要描述上面定义的类与类ex:MotorVehicle之间的特定关系,比如它们是机动车(MotorVehicle)中的一

这种两个类之间的特化关系(specialization relationship)可以用预定义的特性rdfs:subClassOf来描述。例如,可以通过编写下面这条RDF声明来描述ex:Van是一种特殊的ex:MotorVehicle:

 ex:Van   rdfs:subClassOf   ex:MotorVehicle .

在上面的例子中,rdfs:subClassOf的含义是:任何ex:Van类的实例同时也是ex:MotroVehicle类的实例。因此,如果资源exthings:companyVan是ex:Van的一个实例,那么理解RDF Schema词汇表的RDF软件可以根据上面声明的rdfs:subClassOf关系推理出额外的有用信息,即exthings:companyVan也是ex:MotorVehicle的一个实例。

exthings:companyVan的例子说明了一点,即RDF Schema可以定义一种扩展语言。但是,RDF本身并没有定义RDF Schema中的词汇(比如 rdfs:subClassOf)所具有的含义。因此,即时某个RDF schema[译注//注意RDF Schema与RDF schema的区别]定义了ex:Van和ex:MotorVehicle之间的rdfs:subClassOf关系(通过编写一个RDF声明),但是对于不理解RDF Schema术语的RDF软件来说,这个RDF声明只是一个以rdfs:subClassOf为谓词的三元组,该RDF软件并不能理解rdfs:subClassOf所代表的含义,因此也不能据此得到额外的结论:exthing:companyVan也是ex:MotorVehicle的实例。

rdfs:subClassOf特性具有传递性(transitive)。也就是说,如果给出下列RDF声明:

 ex:Van       rdfs:subClassOf   ex:MotorVehicle .
ex:MiniVan rdfs:subClassOf ex:Van .

这些声明可以推理出ex:MiniVan同时也是ex:MotroVehicle的子类。相应的,如果RDF Schema定义了某个资源是ex:MiniVan的实例,那么它也是ex:MotorVehicle的实例(同时也是类ex:Van的实例)。一个类可以是一个或多个类的子类。(例如:ex:MiniVan可以同时为ex:Van和ex:PassengerVehicle的子类)。RDF Schema规定:所有的类总是rdfs:Resource的子类(因为任何类的实例都是资源)。

图18 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#figure18)是上面这些例子的一个完整的类层次图。

vehicleClassesJan12.png

图18:车辆类层次图

为了简化起见,图18 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#figure18)中将连接类和rdfs:Class的rdf:type特性全部省略了。事实上,根据RDF Schema的定义,一个以rdfs:subClassOf为谓词的声明中的主体和客体都应该是rdfs:Class类型的资源。因此,这些信息可以推理出来,不过在实际编写schema的时候,明确声明这些信息是一种比较好的编码风格。

上图所示的schema可以用下列三元组来描述:

 ex:MotorVehicle       rdf:type          rdfs:Class .
ex:PassengerVehicle rdf:type rdfs:Class .
ex:Van rdf:type rdfs:Class .
ex:Truck rdf:type rdfs:Class .
ex:MiniVan rdf:type rdfs:Class .
 ex:PassengerVehicle   rdfs:subClassOf   ex:MotorVehicle .
ex:Van rdfs:subClassOf ex:MotorVehicle .
ex:Truck rdfs:subClassOf ex:MotorVehicle .
 ex:MiniVan            rdfs:subClassOf   ex:Van .
ex:MiniVan rdfs:subClassOf ex:PassengerVehicle .

上述schema可用例23 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example23)所示的RDF/XML来书写。

例23:用RDF/XML书写的车辆类层次图

 <?xml version="1.0"?>
<!DOCTYPE rdf:RDF [<!ENTITY xsd "http://www.w3.org/2001/XMLSchema#">]>
<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
xml:base="http://example.org/schemas/vehicles">
<rdf:Description rdf:ID="MotorVehicle">
<rdf:type rdf:resource="http://www.w3.org/2000/01/rdf-schema#Class"/>
</rdf:Description>
<rdf:Description rdf:ID="PassengerVehicle">
<rdf:type rdf:resource="http://www.w3.org/2000/01/rdf-schema#Class"/>
<rdfs:subClassOf rdf:resource="#MotorVehicle"/>
</rdf:Description>
<rdf:Description rdf:ID="Truck">
<rdf:type rdf:resource="http://www.w3.org/2000/01/rdf-schema#Class"/>
<rdfs:subClassOf rdf:resource="#MotorVehicle"/>
</rdf:Description>
<rdf:Description rdf:ID="Van">
<rdf:type rdf:resource="http://www.w3.org/2000/01/rdf-schema#Class"/>
<rdfs:subClassOf rdf:resource="#MotorVehicle"/>
</rdf:Description>
<rdf:Description rdf:ID="MiniVan">
<rdf:type rdf:resource="http://www.w3.org/2000/01/rdf-schema#Class"/>
<rdfs:subClassOf rdf:resource="#Van"/>
<rdfs:subClassOf rdf:resource="#PassengerVehicle"/>
</rdf:Description>
</rdf:RDF>

正如3.2节 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#newresources)以及例13 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example13)中所讨论的,RDF/XML提供了一种简写形式来描述具有rdf:type特性的资源(类型结点)。因为RDF Schema的类同时也是RDF资源,这种简写形式可以应用于对类的描述。上述的schema也可以使用这种简写形式来描述,如例24所示:

例24:使用类型节点的机动车类层次简写形式

 <?xml version="1.0"?>
<!DOCTYPE rdf:RDF [<!ENTITY xsd "http://www.w3.org/2001/XMLSchema#">]>
<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
xml:base="http://example.org/schemas/vehicles">
<rdfs:Class rdf:ID="MotorVehicle"/>
<rdfs:Class rdf:ID="PassengerVehicle">
<rdfs:subClassOf rdf:resource="#MotorVehicle"/>
</rdfs:Class>
<rdfs:Class rdf:ID="Truck">
<rdfs:subClassOf rdf:resource="#MotorVehicle"/>
</rdfs:Class>
<rdfs:Class rdf:ID="Van">
<rdfs:subClassOf rdf:resource="#MotorVehicle"/>
</rdfs:Class>
<rdfs:Class rdf:ID="MiniVan">
<rdfs:subClassOf rdf:resource="#Van"/>
<rdfs:subClassOf rdf:resource="#PassengerVehicle"/>
</rdfs:Class>
</rdf:RDF>

本节其余部分都将采用相似的类型节点简写形式。

例23 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example23)例24 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example24)中的RDF/XML为那些具有rdf:ID特性的资源(类)指定了资源名称(例如:MotorVehicle),这相当于为资源(类)指派了一个相对于schema文档的URIrefs(参见3.2节 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#newresources)的描述)。这里的rdf:ID非常有用,因为它不仅仅是URIrefs的简写形式,同时还提供了一种额外检查,即确保rdf:ID属性的值相对于当前的基准URI(通常的情况下就是本文档URI)是唯一的。在RDF schemas中定义类和特性的名称时,这种机制有助于发现重复的rdf:ID值。在同一个schema中,基于这些名字的相对URIrefs可以在其它类的定义中被引用。(例如,可以在其它类的描述中用#MotorVehicle来引用MotorVehicle类)。假定schema本身的URI是 http://example.org/schemas/vehicles ,那么MotorVehicle类的完整URIref就是 http://example.org/schemas/vehicles#MotorVehicle (如图18 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#figure18)所示)。正如3.2节 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#newresources)所指出的,schema可能被移动或复制(或者只是为schema中的类指定一个基准URIref,而不假定它们被发布在同一个位置)。为了确保在这些情况下对schema中类的引用能够维持一致,可以在定义这些类的时候显式声明一个基准URI(即增加属性 xml:base="http://example.org/schemas/vehicles" )。显式声明xml:base是一种良好的编码风格,前面两个例子就是这样做。

为了在别处的RDF实例数据(即描述属于某个类的个体的数据)中引用这些类,example.org可采取下列方式:声明一个恰当的xml:base,并书写相对URIrefs,然后根据这两者所确定的绝对URIrefs来标识类;或者,声明一个恰当的名字空间,并书写QNames,然后根据由QName展开得到的绝对URIrefs来标识类。例如,在例25 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example25)所示的RDF/XML中,资源exthings:companyCar可被描述为类ex:MotorVehicle(在例24 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example25)中定义的)的一个实例:

例25:一个ex:MotorVehicle类的实例

 <?xml version="1.0"?>
<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:ex="http://example.org/schemas/vehicles#"
xml:base="http://example.org/things">
<ex:MotorVehicle rdf:ID="companyCar"/>
 </rdf:RDF>

注意:QName ex:MotorVehicle将根据命名空间声明 xmlns:ex="http://example.org/schemas/vehicles#" 展开为完整的URIref http://example.org/schemas/vehicles#MotorVehicle,即MotorVehicle类的URIref(见图18 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#figure18))。xml:base声明 xml:base=http://example.org/things 用于将rdf:ID="companyCar"展开为exthings:companyCar所对应的URIref(这里没有采用前一种机制是因为QName不能作为rdf:ID属性的值)。


5.2 描述特性

用户除了描述他们想要描述的类(classes),通常还需要能够定义刻画这些类的特性(properties)(例如用rearSeatLegRoom来描述一个客车)。在RDF schema中,特性是用RDF类rdf:Property以及RDF Schema特性rdfs:domain(定义域)、rdfs:range(值域)以及rdfs;subPropertyOf来描述的。

RDF中的所有特性都被描述为类rdf:Property的实例。因此一个新特性(例如exterms:weigntInKg)的描述是通过为它指派一个URIref,并使用一个值为rdf:Property的rdf:type特性来完成的。例如,书写如下的RDF声明:

 exterms:weightInKg   rdf:type   rdf:Property .

RDF Schema还提供了一些词汇用于描述如何在RDF数据中正确使用特性和类。其中最重要的一个信息是由RDF Schema特性rdfs:range和rdfs:domain提供的,它们用于进一步描述与应用相关的特性。

rdfs:range用于表明某个特性的值(定义域)是给定类的实例。例如,如果example.org想要表明“特性ex:author的值是类ex:person的实例”,那么可以写出如下的RDF声明:

 ex:Person   rdf:type     rdfs:Class .
ex:author rdf:type rdf:Property .
ex:author rdfs:range ex:Person .

上述声明表明:ex:person是一个类,ex:author是一个特性,并且对于使用ex:author特性的RDF声明,其客体(Object)是ex:person类的实例。

一个特性(比如ex:hasMother)可以有零个、一个、或多个range特性。如果ex:hasMother没有range特性,那么对ex:hasMother特性的值而言,就没有什么限制。如果ex:hasMother有一个range特性限制,例如指定ex:Person作为其值域,这表明ex:hasMother特性的值是类ex:Person的实例。如果ex:hasMother有多个range特性,例如在指定ex:person为它的range特性的同时,还指定了ex:Femal作为它的range特性,这说明了ex:hasMother特性的值是所有被指定的类的实例。例如,ex:hasMother的值既是一个ex:Femal又是一个ex:Person

最后一点并不是十分明显,即:实际上,为特性ex:hasMother指定两个range(ex:Femal和ex:person)涉及到两个独立的声明:

 ex:hasMother   rdfs:range   ex:Female .
ex:hasMother rdfs:range ex:Person .

对于任何用到上述特性的声明,比方说:

 exstaff:frank   ex:hasMother   exstaff:frances .

为确保两个rdfs:range声明正确,exstaff:frances必须同时是ex:Femal和ex:Person类的实例。

rdfs:range特性也可用于表明特性的值是一个类型文字(typed literal,见2.4节 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#typedliterals))。例如,如果example.org要表明特性ex:age的值来自XML Schema数据类型xsd:integer,它应书写如下RDF声明:

 ex:age   rdf:type     rdf:Property .
ex:age rdfs:range xsd:integer .

数据类型xsd:integer是通过URIref(完整的URIref为 http://www.w3.org/2001/XMLSchema#integer )来标识的。可以不在schema中显式声明该URIref标识某个数据类型而直接使t用它。然而,显式声明一个给定的URIref标识某个数据类型常常是有用的。这可以通过使用RDF Schema类rdfs:Datatype来完成。要声明xsd:integer是一个数据类型,example.org应书写如下RDF声明:

 xsd:integer   rdf:type   rdfs:Datatype .

这个声明的含义是:xsd:integer是某个数据类型(它被假定符合[RDF-CONCEPTS (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-rdf-concepts)]中所描述的RDF数据类型要求)的URIref。这一声明并构成一个数据类型的定义,即仿佛example.org是在定义一个新的数据类型。在RDF Schema中,没有可用来定义数据类型的方式。正如在2.4节 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#typedliterals)中提到的,数据类型是在RDF(甚至是RDF Schema)之外定义、然后在RDF中通过它们的URIrefs来引用的。上述声明的作用仅仅是记录该数据类型的存在,并显式表明它在schema中被用到。

rdfds:domain用于表明某个特性应用于指定的类(定义域)。例如,如果example.org要表明特性ex:author应用于类ex:Book的实例上,它应书写如下RDF声明:

 ex:Book     rdf:type      rdfs:Class .
ex:author rdf:type rdf:Property .
ex:author rdfs:domain ex:Book .

上述声明表明ex:Book是类,ex:author是特性。而使用ex:author特性的RDF声明以ex:Book的实例为主体。

一个给定的特性(例如exterms:weight)可能有零个、一个或多个domain特性。如果exterm:weight没有domain特性,那么便没有规定exterms:weight特性对应的主体是某类资源,也就是说任何资源都可以作为exterms:weight特性的主体。如果exterms:weight有一个domain特性,例如指定ex:Book作为其定义域,这表明exterms:weight特性应用于类ex:Book的实例。如果exterms:weight有多个domain特性,例如一个domain特性指定其定义域为ex:Book,另一个domain特性指定其定义域为ex:MotorVehicle,这表明具有exterms:weight特性的资源是所有被指定为定义域的类的实例,即具有exterms:weight特性的资源既是ex:Book类的实例又是ex:MotorVehicle类的实例(对待具体问题,需要认真分析、仔细地指定定义域和值域)。

与rdfs:range的情况一样,最后一点可能不是非常明显,即:实际上,为特性exterms:weight声明两个定义域(ex:Book和ex:MotorVehicle)涉及到两个独立的声明:BR>

 exterms:weight   rdfs:domain   ex:Book .
exterms:weight rdfs:domain ex:MotorVehicle .

对于任何用到该特性的声明,比方说:

 exthings:companyCar   exterms:weight   "2500"^^xsd:integer .

为了保证两个rdfs:domain声明是正确的,必须保证exthings:companyCar同时是ex:Book和ex:MotorVehicle类的实例。

我们可以扩展车辆类的schema来举例说明值域(range)和定义域(domain)描述的使用方法:增加两个特性ex:registeredTo和ex:rearSeatLegRoom,然后添加一个新的类ex:Person,并显式地将xsd:integer声明为数据类型。ex:registerdTo特性应用于任何ex:MotorVehicle,并且它的值是ex:Person。对本例而言,ex:rearSeatLegRoom仅仅应用到ex:PassengerVehicle类的实例上,其值是一个xsd:integer(该值给定了后座的脚部活动空间的厘米数)。例26 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example26)显示了这些描述的RDF/XML:

例26:车辆schema的一些特性描述

 <rdf:Property rdf:ID="registeredTo">
<rdfs:domain rdf:resource="#MotorVehicle"/>
<rdfs:range rdf:resource="#Person"/>
</rdf:Property>
<rdf:Property rdf:ID="rearSeatLegRoom">
<rdfs:domain rdf:resource="#PassengerVehicle"/>
<rdfs:range rdf:resource="&xsd;integer"/>
</rdf:Property>
<rdfs:Class rdf:ID="Person"/>
<rdfs:Datatype rdf:about="&xsd;integer"/>

注意:例26 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example26)中没有使用<rdf:RDF>元素,因为这里的RDF/XML片断将被添加到了例24 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example24)所示的车辆schema中。同理,这里可以使用相对Urirefs(比如#MotorVehicle)来引用该schema中的类。

RDF Schema提供了一种方法来像描述类的特化关系一样来描述特性之间的特化关系。这种两个特性之间的特化关系可以使用预定义的rdfs:subPropertyOf特性来描述。例如,如果ex:primaryDriver和ex:driver都是特性,则example.org可以通过下列RDF声明来描述“ex:primaryDriver是ex:driver的特化”:

 ex:driver          rdf:type             rdf:Property .
ex:primaryDriver rdf:type rdf:Property .
ex:primaryDriver rdfs:subPropertyOf ex:driver .

rdfs:subPropertyOf关系的含义在于,如果一个实例exstaff:fred是实例ex:companyVan的一个ex:primaryDriver,那么RDF Schema定义exstaff:fred也是ex:companVan的一个ex:driver 。例27 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example27)所示的RDF/XML描述了这些特性(同样,该RDF/XML片断将被添加到例24 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example24)所示的车辆schema中)

例27:车辆schema中其它的特性

 <rdf:Property rdf:ID="driver">
<rdfs:domain rdf:resource="#MotorVehicle"/>
</rdf:Property>
<rdf:Property rdf:ID="primaryDriver">
<rdfs:subPropertyOf rdf:resource="#driver"/>
</rdf:Property>

一个特性可以是零个、一个或多个特性的子特性(subproperty)。当RDF Schema中的rdfs:range和rdfs:domain特性应用于某个RDF特性时,它们也会应用于该RDF特性的子特性。因此,在上面的例子中,RDF Schema定义了ex:primaryDriver也具有rdfs:domain约束(值为ex:MotorVehicle),因为ex:primaryDriver是ex:driver的子特性。

例28 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example28)是车辆schema的完整RDF/XML代码,包括了到目前为止的所有描述。

例28:完整的车辆schema

 <?xml version="1.0"?>
<!DOCTYPE rdf:RDF [<!ENTITY xsd "http://www.w3.org/2001/XMLSchema#">]>
<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
xml:base="http://example.org/schemas/vehicles">
<rdfs:Class rdf:ID="MotorVehicle"/>
<rdfs:Class rdf:ID="PassengerVehicle">
<rdfs:subClassOf rdf:resource="#MotorVehicle"/>
</rdfs:Class>
<rdfs:Class rdf:ID="Truck">
<rdfs:subClassOf rdf:resource="#MotorVehicle"/>
</rdfs:Class>
<rdfs:Class rdf:ID="Van">
<rdfs:subClassOf rdf:resource="#MotorVehicle"/>
</rdfs:Class>
<rdfs:Class rdf:ID="MiniVan">
<rdfs:subClassOf rdf:resource="#Van"/>
<rdfs:subClassOf rdf:resource="#PassengerVehicle"/>
</rdfs:Class>
<rdfs:Class rdf:ID="Person"/>
<rdfs:Datatype rdf:about="&xsd;integer"/>
<rdf:Property rdf:ID="registeredTo">
<rdfs:domain rdf:resource="#MotorVehicle"/>
<rdfs:range rdf:resource="#Person"/>
</rdf:Property>
<rdf:Property rdf:ID="rearSeatLegRoom">
<rdfs:domain rdf:resource="#PassengerVehicle"/>
<rdfs:range rdf:resource="&xsd;integer"/>
</rdf:Property>
<rdf:Property rdf:ID="driver">
<rdfs:domain rdf:resource="#MotorVehicle"/>
</rdf:Property>
<rdf:Property rdf:ID="primaryDriver">
<rdfs:subPropertyOf rdf:resource="#driver"/>
</rdf:Property>
</rdf:RDF>

前面说明了如何使用RDF Schema来描述类和特性,现在可以讲述使用这些类和特性的实例了。例如, 例29 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example29)描述了一个ex:passengerVehicle类(见例28 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example28))的实例,并为它的一些特性赋了值。

例 29:一个ex:PassengerVehicle类的实例

 <?xml version="1.0"?>
<!DOCTYPE rdf:RDF [<!ENTITY xsd "http://www.w3.org/2001/XMLSchema#">]>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:ex="http://example.org/schemas/vehicles#"
xml:base="http://example.org/things">
<ex:PassengerVehicle rdf:ID="johnSmithsCar">
<ex:registeredTo rdf:resource="http://www.example.org/staffid/85740"/>
<ex:rearSeatLegRoom
rdf:datatype="&xsd;integer">127</ex:rearSeatLegRoom>
<ex:primaryDriver rdf:resource="http://www.example.org/staffid/85740"/>
</ex:PassengerVehicle>
</rdf:RDF>

本例假定实例与schema是分别在不同的文档中描述的。由于schema以http://example.org/schemas/vehicles作为其XML base(即作为xml:base属性的值),因此在实例数据[译注//如5.1节 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#schemaclasses)所述,即描述属于某个类的个体的数据]中用命名空间声明xmlns:ex="http://example.org/schemas/vehicles#"来保证QNames(如ex:registeredTo)得以展开为正确的、标识schema中类和特性的URIrefs。实例描述中也使用了一个xml:base声明,用于将rdf:ID="johnSmithsCar"中的johnSmithsCar展开为正确的绝对URIref,而绝对URIrefs的展开过程是根据xml:base进行的,与当前文档的位置无关。

注意,ex:registeredTo特性可被用来描述ex:PassengerVehicle类的实例,因为ex:PassengerVehicle是ex:MotorVehicle的子类。也要注意到,在实例描述中,ex:rearSetLegRoom特性的值是一个类型文字(typed literal),而不是平凡文字(plain literal)(它不是通过<ex:rearSeatLegRoom>127</ex:rearSeatLegRoom>的方式来指定值)。因为schema中描述了该特性的值域(range)为一个xsd:integer,因此该特性的值应该是一个数据类型为xsd:interger的类型文字以满足值域限制(即值域声明并不会自动地将平凡文字指派为某种数据类型,因此必须显式提供一个具有正确数据类型的类型文字)。正如4.4节 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#rdfvalue)中所讨论的那样,可以在schema或者附加的实例数据中提供一些额外信息来显式指定ex:rearSetLegRoom特性的单位(厘米)。



5.3 解释RDF Schema声明

正如前所述,RDF Schema的类型系统与面向对象编程语言(如Java)的类型系统很相似,然而,RDF与大部分程序设计语言的类型系统在几个重要方面是有区别:

一个重要的区别是:RDF Schema描述属性可以作用于哪些特定的类(通过domainrange属性),而不是(像面向对象类型系统)描述类具有哪些特定属性的集合。例如:在一个典型的面向对象编程语言中,类 Book会定义为有一个属性author,且author的类型是Person;而在RDF Schema中,类ex:Book和属性ex:author都会被分开定义,另外,属性ex:author的定义域是ex:Book,值域是ex:Person。

这两种定义方法的区别表面上看起来只是语法层次上的,其实,他们有着重大的区别。在程序设计语言中,属性author是关于类Book的描述的一部分,而且只能应用于类Book的实例。如果另外一个类,例如SoftwareModule也有个属性author,这两个author属性被看成是不同的属性。因为在大多数编程语言中,属性的作用域局部与它被定义的类或类型的。而在RDF中,缺省地,属性的描述是独立于类描述的,并且属性的作用域是全局的(尽管可以它们可被声明为只能应用于某些类)。

一个结果是:RDF Schema可以描述一个不指定定义域的属性,如exterms:weight这个属性可以用来描述任何具有重量(weight)属性的类的实例。RDF的以属性为中心的方法的一个好处是:扩展属性的用途使其应用于最初定义时未预知的情形更为容易。同时,这个“好处”也要谨慎使用,以免属性错误应用于不恰当的情形。

RDF属性的全局作用域的另外一个结果是:无法在RDF Schema中定义一个根据所描述类(即定义域)的不同而具有不同值域的属性。例如,在定义属性ex:hasParent时,如果这个属性用于描述类ex:Human,则这个属性的值域是ex:Human;如果这个属性用于描述类ex:Tiger,则这个属性的值域是ex:Tiger,这样定义属性显然更为合适。但这种定义方法无法在RDF Schema中实现。对一个RDF属性的值域的任何定义将应用于用到该属性的所有地方。因此,定义值域时应谨慎。然而,虽然不能在RDF Schema中定义这种局部相异的属性值域,但在5.5节 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#richerschemas)中讨论的表达能力更强的模式语言中可以定义。

另外一个重要的区别是:RDF Schema的描述不一定像程序设计语言的类型声明那样是规约性的(prescriptive)。例如,如果在某个程序设计语言中,类Book被定义为有一个属性author,且author的类型是Person,这通常被解释为一组约束。该语言不会允许Book的一个实例没有author属性,也不会允许Book的一个实例的book属性值的类型不是Person。更为重要的是,如果author的定义为类Book的唯一属性,该语言不会允许Book的实例具有其他的属性。

相反,RDF Schem提供的模式信息是作为对资源的额外描述(descriptions),并不会限制这些描述怎样被用于一个应用。例如,假设一个RDF Schema中定义了属性ex:author的值域(rdfs:range)是ex:Person,这仅仅是一个简单的RDF陈述: 谓词是ex:author的陈述的客体是类ex:Person的实例。

这个Schema提供的信息可能以多种方式得到利用。一个应用可能把这个陈述解释为创建RDF数据的模板的一部分,且用它来限制任意ex:author的值都是ex:Person的实例。也就是说,这个应用和程序设计语言一样,把模式信息解释为约束(constraint)。然而,另外一个应用可能把这个陈述解释为获取的数据的额外信息,这个信息并没有在原数据中显式表示。例如,第二个应用可能收到一些RDF数据,这些数据包含了一个值为未知类型的ex:author属性,则可以利用RDF Schema中的那个陈述推导出这个ex:author属性的值是类ex:Person的实例。第三个应用可能收到一些RDF数据, 这些数据包含了一个值为ex:Corporation的实例的ex:author属性,利用RDF Schema的信息,可以发出警告:“数据可能不一致,也可能不是”。在其他地方,可能存在一个声明消除了这个数据不一致性(例如,声明一个“Corporation”也是一个“Person”)。

此外,根据应用解释属性描述的方式,一个实例仍然可以被认为是合法的,即使没有RDF Schema指定的属性(如可能有一些ex:Book的实例没有ex:author属性,即使ex:author的定义域为ex:Book),或者具有其他的属性(如可能有一些ex:Book的实例具有ex:technicalEditor属性,即使描述ex:Book的Schema没有对这个属性的描述)。

换句话说,RDF Schema中的陈述通常是描述(descriptions)。他们也可以是规约性的(prescriptive),如果应用要这样解释的话。RDF Schema所做的是提供额外的信息。这些信息是否和显式指定的实例数据有冲突,取决于具体的应用。



5.4 其他Schema信息

RDF Schema还提供了一些其他的内嵌属性,这些属性可以用于为RDF Schema和实例提供资料记录和其他信息。例如,rdfs:comment属性可用于提供关于资源的易读的描述,rdfs:label属性可用于提供关于资源的更易读的名字, rdfs:seeAlso属性可用于提示其他地方可能有关于此资源的更多的描述,rdfs:isDefinedBy是rdfs:seeAlso的子属性,可用于提示其他地方有关于此资源的定义。对这些属性更多的讨论,请参考RDF词汇描述语言1.0: RDF Schema (http://www.w3.org/TR/rdf-schema/)[RDF-VOCABULARY (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-rdf-vocabulary)]。

对于其他的内嵌RDF属性(如rdf:value)它们的用途就是规范中的设计用途(intended use),文档[RDF-SEMANTICS (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-rdf-semantics)]对这些属性没有定义特定的语义,RDF Schmea也没有基于他们的设计用途定义任何的约束。例如,没有约束限制属性rdfs:seeAlso的客体必须为它所在的陈述的主体提供额外的信息。



5.5 表达更丰富的Schema语言

RDF Schema提供了描述RDF词汇集的基本能力,更强的表达能力是可能的,也是有用的。这些能力可以通过进一步发展RDF Schema来提供,也可以通过其他基于RDF的语言来提供。其他已被认为有用但RDF Schema没有提供的、更丰富的表达能力包括:

  • 对属性的基数限制。例如,一个人有且只有一个生物学意义上的父亲。
  • 指定一个属性(如ex:hasAncestor)是传递的,即:如果A ex:hasAncestor B,且 B ex:hasAncestor C,则A ex:hasAncestor C。
  • 指定一个属性是一个类的实例的唯一表示符(或说,主键)。
  • 指定两个不同的类(具有不同的URIrefs)实际代表同一个的类。
  • 指定两个不同的实例(具有不同的URIrefs)实际代表同一个实例。
  • 指定属性的值域或基数限制取决于属性应用到的类,例如,说一个足球队的属性ex:hasPlayers值的个数为11,同时,这个属性应用于篮球队时,值的个数应该是5。
  • 能够通过对类的组合(如,并,交)得到新的类,或者说两个类是相离的,即两个类没有共同的实例。

上面提到这些丰富的表达能力,以及其他一些没提到的,正是本体语言(如DAML+OIL (http://www.w3.org/TR/daml+oil-reference)[DAML+OIL (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-damloil)]和OWL (http://www.w3.org/TR/owl-ref/)[OWL (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-owl)])的目标。这些本体语言都是基于RDF和RDF Schema的。这些语言的目的是为资源提供更多的机器可处理的语义信息,也就是说,使资源的机器表示能够更紧密模拟真实世界对应的部分。虽然这些语言对构造基于RDF的有用应用(第6节 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#applications)有一些已有的RDF应用的描述)来说不是必须的,但这些语言的研究是语义Web研究中的一个非常活跃的主题。



6. 一些RDF应用:具体领域中的RDF

在前面的章节里,已经描述了RDF和RDF Schema的大体的表达能力,并且举了一些例子来演示这些能力,其中有些例子还可能暗示了一些潜在的RDF应用,但是并没有讨论任何真正的应用。在这节中,将会描述一些真正已经发布的RDF应用,说明了RDF是怎样支持各种不同的现实世界的关于表示和处理关于各种事物的信息的需求。



6.1 都柏林核心元数据倡议

元数据是关于数据的数据。这个术语指的是用来识别、描述、查找信息资源的数据,而不管这些资源是物理存在的或电子化的。虽然用计算机处理的结构化元数据相对较新,但在帮助管理和使用海量信息时的元数据的基本概念已经用了多年。图书目录卡就是一个大家熟悉的这种元数据例子。

都柏林核心是描述文件(因此,也是为了记录元数据)的一个“元素”集(属性)。这个元素集是由元数据工作组在1995年3月在俄亥俄州的都柏林(Dublin, Ohio)首先开发出来的。稍后,在都柏林核心元数据工作组基础上,都柏林核心进行了一系列的修改,这就是我们现在看到的都柏林核心元数据倡议 (http://dublincore.org/)。都柏林核心的目的是提供一个描述性的元素的最小集,以便对类似文档的网络对象进行描述和自动索引,就像一张图书目录卡一样。都柏林核心元数据集的设计目标是适合让因特网上资源发现工具使用,如通行的万维网搜索引擎使用的网络爬虫(“Webcrawlers”)。此外,都柏林核心有意为足够简单,使得为因特网提供信息的各种各样的作者和出版商都能够理解和使用。都柏林核心元素已广泛地应用于记录因特网资源的有关信息(都柏林核心元素dc:create已经在以前的例子中用到)。 都柏林核心元素的当前版本定义在柏林核心元数据元素集,版本1.1:参考描述 (http://dublincore.org/documents/2003/06/02/dces/) [DC (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-dublin-core)],它包含了下列属性的定义:

    • Title: 资源的名字。
    • Creator: 一个主要负责创建资源内容的实体。
    • Subject: 资源内容的主题.
    • Description: 资源内容的描述.
    • Publisher: 一个负责使得资源内容可用的实体
    • Contributor: 一个负责为资源内容作出贡献的实体(如作者)。
    • Date: 在资源生命周期中某时间关联的日期。
    • Type: 资源内容的类型。
    • Format: 资源的物理形式或数据形式.
    • Identifier: 一个在给定上下文中明确标识资源的标识符。
    • Source: 一个对作为目前资源的来源的资源引用。
    • Language: 资源内容采用的语言
    • Relation: 一个对相关资源的引用
    • Coverage: 资源内容所在的范围或区域
    • Rights: 关于资源的权限信息.

使用都柏林核心元素的信息可以用任意适合的语言( 例如,HTML的 meta元素)表示。 然而,RDF是都柏林核心信息的一种理想的表示。 下面的例子表示了在RDF中,用都柏林核心词汇表示的关于一个资源集合的简单描述。注意,这里显示的都柏林核心RDF词汇不是权威的描述,都柏林核心参考描述[DC (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-dublin-core)]才是最权威的参考。

第一个例子(例30),使用都柏林核心属性描述一个网站主页:

例30:一个用都柏林核心属性描述的网页

 <rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:dc="http://purl.org/dc/elements/1.1/">
<rdf:Description rdf:about="http://www.dlib.org">
<dc:title>D-Lib Program - Research in Digital Libraries</dc:title>
<dc:description>The D-Lib program supports the community of people
with research interests in digital libraries and electronic
publishing.</dc:description>
<dc:publisher>Corporation For National Research Initiatives</dc:publisher>
<dc:date>1995-01-07</dc:date>
<dc:subject>
<rdf:Bag>
<rdf:li>Research; statistical methods</rdf:li>
<rdf:li>Education, research, related topics</rdf:li>
<rdf:li>Library use Studies</rdf:li>
</rdf:Bag>
</dc:subject>
<dc:type>World Wide Web Home Page</dc:type>
<dc:format>text/html</dc:format>
<dc:language>en</dc:language>
</rdf:Description>
</rdf:RDF>

我们注意到,RDF和都柏林核心都定义了一个( XML )元素称为为“Description”,(虽然都柏林核心元素名称用了小写字母)。 即使开头的字母都是大写字母,还是可以用XML的名字空间机制将这两个元素区别开来(一是rdf:Description,另外一个是dc:description)。 同时,有趣的是,在Web浏览器中访问http://purl.org/dc/elements/1.1/ (http://purl.org/dc/elements/1.1/) 时(名字空间URI在这里用于标识都柏林核心词汇),可以得到一个[DC (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-dublin-core)]的RDF Schema声明。

第二个例子,例31 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example31) 描述了一个出版了的杂志

 <rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns:dcterms="http://purl.org/dc/terms/">
<rdf:Description rdf:about="http://www.dlib.org/dlib/may98/05contents.html">
<dc:title>DLIB Magazine - The Magazine for Digital Library Research
- May 1998</dc:title>
<dc:description>D-LIB magazine is a monthly compilation of
contributed stories, commentary, and briefings.</dc:description>
<dc:contributor>Amy Friedlander</dc:contributor>
<dc:publisher>Corporation for National Research Initiatives</dc:publisher>
<dc:date>1998-01-05</dc:date>
<dc:type>electronic journal</dc:type>
<dc:subject>
<rdf:Bag>
<rdf:li>library use studies</rdf:li>
<rdf:li>magazines and newspapers</rdf:li>
</rdf:Bag>
</dc:subject>
<dc:format>text/html</dc:format>
<dc:identifier rdf:resource="urn:issn:1082-9873"/>
<dcterms:isPartOf rdf:resource="http://www.dlib.org"/>
</rdf:Description>
</rdf:RDF>

例31 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example31) 使用了都柏林的限定词“isPartOf”(来自一个单独的词汇表)来说明这份杂志是以前描述过的Web网站的一部分。

第三个例子,例 32 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example32), 描述了例 31 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example31)中描述过的杂志中的一篇特定的文章

例32:描述一篇杂志文章

 <rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns:dcterms="http://purl.org/dc/terms/">
<rdf:Description rdf:about="http://www.dlib.org/dlib/may98/miller/05miller.html">
<dc:title>An Introduction to the Resource Description Framework</dc:title>
<dc:creator>Eric J. Miller</dc:creator>
<dc:description>The Resource Description Framework (RDF) is an
infrastructure that enables the encoding, exchange and reuse of
structured metadata. rdf is an application of xml that imposes needed
structural constraints to provide unambiguous methods of expressing
semantics. rdf additionally provides a means for publishing both
human-readable and machine-processable vocabularies designed to
encourage the reuse and extension of metadata semantics among
disparate information communities. the structural constraints rdf
imposes to support the consistent encoding and exchange of
standardized metadata provides for the interchangeability of separate
packages of metadata defined by different resource description
communities. </dc:description>
<dc:publisher>Corporation for National Research Initiatives</dc:publisher>
<dc:subject>
<rdf:Bag>
<rdf:li>machine-readable catalog record formats</rdf:li>
<rdf:li>applications of computer file organization and
access methods</rdf:li>
</rdf:Bag>
</dc:subject>
<dc:rights>Copyright ? 1998 Eric Miller</dc:rights>
<dc:type>Electronic Document</dc:type>
<dc:format>text/html</dc:format>
<dc:language>en</dc:language>
<dcterms:isPartOf rdf:resource="http://www.dlib.org/dlib/may98/05contents.html"/>
</rdf:Description>
</rdf:RDF>

例32中也使用了限定词“isPartOf”,这次是指这篇文章是先前描述过的杂志中的一部分。

计算机语言和文件格式并非总能为他们描述的数据嵌入元数据提供明确的方式。在许多情况下,元数据不得不被指定为一种单独的资源,并被明确地链接到数据(如,描述本入门文档的RDF元数据就是这样的;在本文档的的最后一部分有一个对元数据的显式链接)。 然而,应用程序和语言日益为元数据直接嵌入数据提供明确的方式。例如, W3C的可伸缩矢量图形语言[SVG (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-svg)] (另一个以XML为基础的语言)提供了一个明确的元数据元素用以记录关于其他SVG数据的元数据。 任何以XML为基础的元数据语言都能包含在这个元素里。[SVG (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-svg)] 包含了例 33 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example33)所示的例子,它描述了一个SVG文件的元数据是如何嵌入在SVG文件本身的。这个例子使用了都柏林核心词汇和RDF/XML来记录元数据。

例33:在SVG文件中嵌入元数据

 <?xml version="1.0"?>
<svg width="4in" height="3in" version="1.1"
xmlns = 'http://www.w3.org/2000/svg'>
<desc xmlns:myfoo="http://example.org/myfoo">
<myfoo:title>This is a financial report</myfoo:title>
<myfoo:descr>The global description uses markup from the
<myfoo:emph>myfoo</myfoo:emph> namespace.</myfoo:descr>
<myfoo:scene><myfoo:what>widget $growth</myfoo:what>
<myfoo:contains>$three $graph-bar</myfoo:contains>
<myfoo:when>1998 $through 2000</myfoo:when> </myfoo:scene>
</desc>
<metadata>
<rdf:RDF
xmlns:rdf = "http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:rdfs = "http://www.w3.org/2000/01/rdf-schema#"
xmlns:dc = "http://purl.org/dc/elements/1.1/" >
<rdf:Description rdf:about="http://example.org/myfoo"
dc:title="MyFoo Financial Report"
dc:description="$three $bar $thousands $dollars $from 1998 $through 2000"
dc:publisher="Example Organization"
dc:date="2000-04-11"
dc:format="image/svg+xml"
dc:language="en" >
<dc:creator>
<rdf:Bag>
<rdf:li>Irving Bird</rdf:li>
<rdf:li>Mary Lambert</rdf:li>
</rdf:Bag>
</dc:creator>
</rdf:Description>
</rdf:RDF>
</metadata>
</svg>

Adobe公司的可扩展元数据平台( XMP )是另一个允许关于一个文件的元数据被嵌入到文件本身中的技术的例子。 XMP使用RDF/XML作为其元数据表示的基础。 一些Adobe产品已经支持XMP。



6.2 PRISM

PRISM:PRISM: 出版业标准元数据需求 (http://www.prismstandard.org/)[PRISM (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-prism)]是在出版业中发展完善的一个元数据规范。PRISM工作组是由杂志出版商和杂志的销售商构成的,他们确定行业所需的元数据(metadata)并为之指定一些列相关的规范。出版商想以多种方式利用现有内容(资料),目的是获取更多的对创建资源时的投资回报。一个例子是为了发布在Web上而把杂志文章转换成HTML;而把它许可给一个叫LexisNexis (http://www.lexisnexis.com/) 的聚合器则是另外一个例子。所有的这些都是内容的“首次使用”;当杂志发行时,其内容也跟着公诸于世了,出版商也想让他们的内容变成“常青树”。它有可能用于其他的期号,如在一个回顾文章中。它也可能用于公司的其他部门,如把杂志中的图片等编辑成书。另一个用途则是许可给外人使用,如关于产品评论的再版,或其他出版商的精选辑中。全部达到这些目的就需要一种元数据方式,它着重于"发现","权限追踪"和"端到端的元数据"。

发现(Discovery):发现是关于寻找资料的一个笼统的术语,包含了搜索,浏览,内容的传输,以及其他技术。关于发现的讨论经常以客户在公众网站的搜索为中心。不过,内容发现的范畴要比这宽广得多。(发现的)主体可能由客户组成,或可能由内部用户(如研究人员,设计者,图片编辑,许可证代理人,等等)组成。为了辅助法内容发现,PRISM提供了一系列属性来描述资源的主题,格式,类型,来源和上下文。它同时也提供了一种用多主题描述分类系统对资源分类的方法。

权限追踪(Rights Tracking):杂志经常包含了经其它人许可使用的材料。除了文章,工具条和其他所有内容可能已被许可的类型之外,特许资料的最普遍的类型就是从一个图片代理处获得的图片。一份资料是否有一次性使用权(当然,这也是要交特许使用金的),还是被出版商完全占有;仅仅想知道这些就需要一番努力了。PRISM为简单的权限跟踪提供了一些元素。PRISM规范定义了一个单独的词汇集用来支持一些描述(description),这些描述记录了资料可以或不可以被使用的地方,次数,行业等相关内容。

端到端的元数据(End-to-end metadata):大多数出版的内容都已经有了为它们创建的元数据。遗憾的是,当在系统之间传输内容时,元数据经常会丢失,那么只有在以后的生产过程中以相当的开销来重建它们。为了减少这种问题的发生,PRISM提供了一种能在内容生产线的多个阶段中使用的规范。PRISM规范的一大特色是对其他现有的规范的使用。工作组坚决尽可能多的使用现有的规范,而不是创建一个全新的事物,并且只是在必需的地方定义新事物。因此,RPISM规范使用XML,RDF,Dublin Core,和各种ISO格式和词汇表。

一个PRISM描述可能和一些值为频繁文字的Dublin Core属性那么简单。例34 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example34) 描述了一个照片,并给出了它的名称,摄影师,格式等一些基本的信息:

例34:一个照片的PRISM描述

 <?xml version="1.0" encoding="UTF-8"?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:dc="http://purl.org/dc/elements/1.1/"
xml:lang="en-US">

<rdf:Description rdf:about="http://travel.example.com/2000/08/Corfu.jpg">
<dc:title>Walking on the Beach in Corfu</dc:title>
<dc:description>Photograph taken at 6:00 am on Corfu with two models
</dc:description>
<dc:creator>John Peterson</dc:creator>
<dc:contributor>Sally Smith, lighting</dc:contributor>
<dc:format>image/jpeg</dc:format>
</rdf:Description>
</rdf:RDF>

PRISM也对Dublin Core的作了补充用以允许更详细的描述。补充的内容通过三个新的词汇集来说明,通常通过前缀prism:,pcv:和prl来引用:

prism: 这个前缀指主要的RPISM词汇集,它的术语使用了URI前缀“http://prismstandard.org/namespaces/basic/1.0/”。这个词汇集中的大部分属性是来自Dublin Core属性的更细化版本。例如,dc:date的细化版本是由像prism:publicationTime,prism:releaseTime,prism:expirationTime等等这样的属性提供的。

pcv:这个前缀指PRISM受控词汇表(PRISM Controlled Vocabulary(pcv)),它的术语使用了URI前缀“http://prismstandard.org/namespaces/pcv/1.0/”。通常,描述文章的主题(可能不止一个)的常见做法是提供描述性的关键词。遗憾的是,由于不同的人会使用不同的关键词[BATES96 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-bates96)],简单的关键词对提高检索性能上并没有太大作用。最好的办法是用取自某“受控词汇表”的主题术语(subject terms)为文章编码,这个词汇集应当为词汇集中的术语提供尽可能多的同义词。这样,受控的术语就会为搜索者和编索引者提供共用的关键词。pcv词汇集提供了属性,用以说明词汇集中的术语,术语之间的关系,和术语的别称。

prl:这个前缀指PRISM权限语言词汇集( PRISM Rights Language vocabulary),它的术语使用URI前缀“http://prismstandard.org/namespaces/prl/1.0/”。数字权限管理(Digital Rights Management)是个承受着剧变的领域。有很多关于权限管理语言的提议,但没有一个能在整个行业中明显受欢迎。因为没有明确的可推荐选择,于是PRISM Rights Language (PRL)就被定义为一个过渡性的标准。它提供了依赖于时间,地理,行业等条件的属性,这些属性可以让人们表示一个术语能或不能被使用。人们相信这是一个将会帮助出版商在跟踪权限时省钱的“80/20平衡”【译者注:意思是说80%的人经常使用占术语总数20%的那部分术语,所以,确定一个标准(即限定这20%的术语)可以使出版商在跟踪权限时省时省力,也就省了钱。】。它不是作为一种通用的权限语言的,也不能让出版商对客户的内容使用作出限制。

PRISM采用RDF是因为它有处理复杂程度不同的描述的能力。目前,很多元数据使用普通的字符串(平凡文字)值,例如:

 <dc:coverage>Greece</dc:coverage>

长时间以来PRISM的开发者期待着PRISM规范的使用变得更完善,由简单文字值向更具构造性的值转化。事实上,那个范围的值正是现在有待解决的。一些出版商已经在使用完善的受控词汇集了,而其他的才刚刚使用手工提供(manually-supplied)的关键词。为了说明这些,能赋值给属性dc:coverage的不同类型的值的例子是:

 <dc:coverage>Greece</dc:coverage>

 <dc:coverage rdf:resource="http://prismstandard.org/vocabs/ISO-3166/GR"/>

(也就是说,用平凡文字或URIref标识这个国家)和

 <dc:coverage>
<pcv:Descriptor rdf:about="http://prismstandard.org/vocabs/ISO-3166/GR">
<pcv:label xml:lang="en">Greece</pcv:label>
<pcv:label xml:lang="fr">Grèce</pcv:label>
</pcv:Descriptor>
</dc:coverage>

(使用一个构造值来提供一个URIref和在多种语言中的名称)

同时注意有些含义近似,或可说是其他属性的子集的属性。例如:一个资源的地理主题可以像这样给出:

 <prism:subject>Greece</prism:subject>
<dc:coverage>Greece</dc:coverage>



 <prism:location>Greece</prism:location>

那些属性当中的任何一个都可能使用简单文字值或是一个更复杂的结构值。DTD,甚至是更新的XML Schemas,都不能充分的描述出这种多变的可能性。虽然要处理这种范围广泛的句法变化,RDF的模型图却有一种简单的结构--三元组集。在三元组领域处理元数据使得旧软件适应有新扩展的内容轻松多了。

这一节由最后举两个例子结束。例35 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example35) 说明了:图像(…/Corfu.jpg)不能够被用于(#none)烟草工业(在SIC(Standard Industrial Classifications,标准工业分类)中的代码为21 )。

例35:一个图片的PRISM描述:

 <rdf:RDF xmlns:prism="http://prismstandard.org/namespaces/basic/1.0/"
xmlns:prl="http://prismstandard.org/namespaces/prl/1.0/"
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:dc="http://purl.org/dc/elements/1.1/">
  <rdf:Description rdf:about="http://travel.example.com/2000/08/Corfu.jpg">
<dc:rights rdf:parseType="Resource"
xml:base="http://prismstandard.org/vocabularies/1.0/usage.xml">
<prl:usage rdf:resource="#none"/>
<prl:industry rdf:resource="http://prismstandard.org/vocabs/SIC/21"/>
</dc:rights>
</rdf:Description>
</rdf:RDF>

例36 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example36) 说明了图片“Corfu”的摄影师员工编号是“3845”(employee 3845),就是人们熟知的John Peterson(better known as John Peterson)。它还说明了图片所显示的地理位置为希腊。例36之所以能够做到这一点,在于它不仅仅提供了来自受控词汇表的术语代码(code),而且它还可以提供该词汇表中术语代码所隐含的信息。

例36:关于例35中图片的附加说明:

 <?xml version="1.0" encoding="UTF-8"?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:pcv="http://prismstandard.org/namespaces/pcv/1.0/"
xmlns:dc="http://purl.org/dc/elements/1.1/"
xml:base="http://travel.example.com/">

<rdf:Description rdf:about="/2000/08/Corfu.jpg">
<dc:identifier rdf:resource="/content/2357845" />
<dc:creator>
<pcv:Descriptor rdf:about="/emp3845">
<pcv:label>John Peterson</pcv:label>
</pcv:Descriptor>
</dc:creator>
<dc:coverage>
<pcv:Descriptor
rdf:about="http://prismstandard.org/vocabs/ISO-3166/GR">
<pcv:label xml:lang="en">Greece</pcv:label>
<pcv:label xml:lang="fr">Grece</pcv:label>
</pcv:Descriptor>
</dc:coverage>
</rdf:Description>
</rdf:RDF>



6.3 XPackage

在很多情况下都需要维持 关于资源的结构化分组和他们用作单位的联系的信息.The XML 包 (XPackage) 规格说明书 (http://www.xpackage.org/specification/) [XPACKAGE (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-xpackage)提供了一个定义这样的分组的框架,叫做"包". XPackage 详细说明了一个框架来描述包含在包里面的资源,这些资源的特性,包含的方法,还有他们之间的相互关系. XPackage 应用包括指定一个文档用的样式表,声明多个文档共用的图片, 指明一个文档的作者和其他元数据, 描述XML资源是如何使用名字空间的,还提供了一个清单来把资源和一个档案文件捆在一起.

XPackage 框架是基于XML, RDF和XML 链接语言 (http://www.w3.org/TR/xlink/) [XLINK (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-xlink)], 还提供了多个RDF词汇表: 一个是用在一般的包装描述, 还有几个词汇表是用于对包装处理器提供一些有用的信息.

对XPackage的一个应用是描述XHTML文档和他们支持的资源.当一个站点要获取一个XHTML文档的时候,或许还会牵涉到其他的资源,像样式表和图像文件也需要被获取.然而,如果不处理这个文档,这些资源的特性就不是很明显了.关于这个文档的其他信息,例如作者的名字,如果不处理这个文档,可能也是不可取的. XPackage允许这些叙述性情报(如作者等信息)标准地储存在一个包含RDF的包描述文档.例 37 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example37) (为了简明, 删除了名字空间声明):描述一个XHTML文档的包描述文档的外部元素:

例 37: 一个XPackage 包描述文档的外部元素

 <?xml version="1.0"?>
<xpackage:description>
<rdf:RDF>

(description of individual resources go here)

</rdf:RDF>
</xpackage:description>

在包描述文档里面,资源(如XHTML文档, 样式表, 和图片) 被标准的RDF/XML语法描述. 每一个资源描述元素都包含在不同的词汇表里面的RDF属性(XPackage 使用术语"ontology"来表示RDF里面的"词汇表"). 除了那个主要的包词汇表, XPackage 本身自带了几个补充的词汇表,包括:

 *一个描述文件(包含属性如 file:size)的词汇表(使用前缀 file:)
*一个提供MIME信息(包含属性如mime:contentType)的词汇表(使用前缀 mime:)
*一个提供字符使用信息(包含属性如unicode:sript)的词汇表(使用前缀 unicode:)
*一个描述基于XML的资源(包含属性如x:namespace和x:style)的词汇表(使用前缀 x:)

例 38 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example38), 使用一个标准的属于XPackage MINE 词汇表的XPackage属性(mime:contentType),定义了文件的MIME 内容类型 ("application/xhtml+xml"). 另一个属性,使用了一个Dublin Core 词汇表里面的属性来描述文档的作者 (在这个例子里是"Garret Wilson").这个属性是在XPackage外部定义的,所有就使用了dc:creator这个属性.

例 38: 对一个XHTML文档的描述

 <?xml version="1.0"?> 
<xpackage:description
xmlns:xpackage="http://xpackage.org/namespaces/2003/xpackage#"
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns:mime="http://xpackage.org/namespaces/2003/mime#"
xmlns:x="http://xpackage.org/namespaces/2003/xml#"
xmlns:xlink="http://www.w3.org/1999/xlink">
<rdf:RDF>

<!--doc.html-->
<rdf:Description rdf:about="urn:example:xhtmldocument-doc">
<rdfs:comment>The XHTML document.</rdfs:comment>
<xpackage:location xlink:href="doc.html"/>
<mime:contentType>application/xhtml+xml</mime:contentType>
<x:namespace rdf:resource="http://www.w3.org/1999/xhtml"/>
<x:style rdf:resource="urn:example:xhtmldocument-stylesheet"/>
<dc:creator>Garret Wilson</dc:creator>
<xpackage:manifest rdf:parseType="Collection">
<rdf:Description rdf:about="urn:example:xhtmldocument-stylesheet"/>
<rdf:Description rdf:about="urn:example:xhtmldocument-image"/>
</xpackage:manifest>
</rdf:Description>

</rdf:RDF>
</xpackage:description>

属性xpackage:manifest 指明,在处理的时候,样式表和图像资源都需要用到; 那些资源在包描述文档里面被分别的描述. 在描述样式表的例子例 39 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example39)里面, 使用在general XPackage 词汇表里面的xpackage:location属性列出了它在包里面的路径("stylesheet.css"), 也用XPackage MIME 词汇表的 mime:contentType 属性来说明了这是一个CSS 样式表 ("text/css").

例 39: 一个样式表的资源描述

 <?xml version="1.0"?> 
<xpackage:description
xmlns:xpackage="http://xpackage.org/namespaces/2003/xpackage#"
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns:mime="http://xpackage.org/namespaces/2003/mime#"
xmlns:x="http://xpackage.org/namespaces/2003/xml#"
xmlns:xlink="http://www.w3.org/1999/xlink">
<rdf:RDF>

<!--stylesheet.css-->
<rdf:Description rdf:about="urn:example:xhtmldocument-css">
<rdfs:comment>The document style sheet.</rdfs:comment>
<xpackage:location xlink:href="stylesheet.css"/>
<mime:contentType>text/css</mime:contentType>
</rdf:Description>

</rdf:RDF>
</xpackage:description>

这个例子的完整版本可以在[XPACKAGE (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-xpackage)]上看到.



6.4 RSS 1.0: RDF站点汇总

人们常常需要每天访问网上各种各样的信息,例如计划安排、任务表、新闻标题、搜索结果,最新消息等。随着万维网上信息资源和多样性的增加,管理这些信息并将之集成为一个整体的难度越来越大。RSS1.0(http://purl.org/rss/1.0)(“RDF Site Sumary”)是一个RDF词汇表,它提供一种轻量级但功能强大的方式来描述这些实时的、大规模分布和可重用的信息。RSS1.0同时可能也是万维网上最为广泛的RDF应用。

举例来说,W3C主页(http://www.w3.org)是W3C组织与保持公众联系的主要方式,服务于传播有关该组织的研究信息。图19是某一天的W3C主页,(http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#figure19).中间一列是新闻条目,经常发生改变。为了能够及时传播这些信息,W3C 小组实现了一个RDF Site Summary(RSS 1.0 (http://purl.org/rss/1.0/))新闻种子,这样中间列的内容就可以被其它人按需获取或者重用。新闻综合站点可以将(种子站点的)新闻标题融合进自己当天新闻综述之中。其它的站点也可以将新闻标题作为一种链接显示给它们的访问者,并且,越来越多的个人会用自己的桌面应用来订阅种子(站点的内容)。这些桌面的RSS 阅读器允许它们的用户不用浏览器去访问每一个站点,就能追踪上百个站点。

fig18dec16.gif (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/w3c-rss.crop.gif)

图19:W3C主页

万维网上大量的站点都提供RSS1.0种子。例40 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example40)是某一天W3C种子的实例。(http://www.w3.org/2000/08/w3c-synd/home.rss)

例 40: W3C RSS 1.0 种子示例

 <?xml version="1.0" encoding="utf-8"?>
 <rdf:RDF xmlns="http://purl.org/rss/1.0/"
xmlns:dc="http://purl.org/dc/elements/1.1/"
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#">
   <channel rdf:about="http://www.w3.org/2000/08/w3c-synd/home.rss">
<title>The World Wide Web Consortium</title>
<description>Leading the Web to its Full Potential...</description>
<link>http://www.w3.org/</link&gt;
     <dc:date>2002-10-28T08:07:21Z</dc:date>
     <items>
<rdf:Seq>
<rdf:li rdf:resource="http://www.w3.org/News/2002#item164"/>
<rdf:li rdf:resource="http://www.w3.org/News/2002#item168"/>
<rdf:li rdf:resource="http://www.w3.org/News/2002#item167"/>
</rdf:Seq>
</items>
   </channel>
   <item rdf:about="http://www.w3.org/News/2002#item164">
<title>User Agent Accessibility Guidelines Become a W3C
Proposed Recommendation</title>
<description>17 October 2002: W3C is pleased to announce the
advancement of User Agent Accessibility Guidelines 1.0 to
Proposed Recommendation. Comments are welcome through 14 November.
Written for developers of user agents, the guidelines lower
barriers to Web accessibility for people with disabilities
(visual, hearing, physical, cognitive, and neurological).
The companion Techniques Working Draft is updated. Read about
the Web Accessibility Initiative. (News archive)</description>
<link>http://www.w3.org/News/2002#item164</link&gt;
<dc:date>2002-10-17</dc:date>
</item>
   <item rdf:about="http://www.w3.org/News/2002#item168">
<title>Working Draft of Authoring Challenges for Device
Independence Published</title>
<description>25 October 2002: The Device Independence
Working Group has released the first public Working Draft of
Authoring Challenges for Device Independence. The draft describes
the considerations that Web authors face in supporting access to
their sites from a variety of different devices. It is written
for authors, language developers, device experts and developers
of Web applications and authoring systems. Read about the Device
Independence Activity (News archive)</description>
<link>http://www.w3.org/News/2002#item168</link&gt;
<dc:date>2002-10-25</dc:date>
</item>
   <item rdf:about="http://www.w3.org/News/2002#item167">
<title>CSS3 Last Call Working Drafts Published</title>
<description>24 October 2002: The CSS Working Group has
released two Last Call Working Drafts and welcomes comments
on them through 27 November. CSS3 module: text is a set of
text formatting properties and addresses international contexts.
CSS3 module: Ruby is properties for ruby, a short run of text
alongside base text typically used in East Asia. CSS3 module:
The box model for the layout of textual documents in visual
media is also updated. Cascading Style Sheets (CSS) is a
language used to render structured documents like HTML and
XML on screen, on paper, and in speech. Visit the CSS home
page. (News archive)</description>
<link>http://www.w3.org/News/2002#item167</link&gt;
<dc:date>2002-10-24</dc:date>
</item>
 </rdf:RDF>

正如例40所示 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example40),种子的格式经过专门设计,这样内容就可以非常容易地打包进不同的部分。新闻站点,网站日志,体育比分(sports scores)、股票报价 一类的应用都是RSS1.O的典型用例。

RSS种子可以被任何能够“讲”HTTP的应用所请求。最近,RSS1.0应用分成了以下三种不同的大类:

fig19Adec16.gif (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/meerkat-rss.crop.gif) fig19Bdec16.gif (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/newsisfree-rss.crop.gif)

图20:MeerKat 和 NewsIsFree

RSS1.0遵照可扩展原则进行设计。通过引入其它的RDF词汇(RSS开发团体称之为模块(modules)),RSS1.0作者可以提供大量的元数据并处理。模块可以和其它更通用的RDF词汇一样,可以由感兴趣的人员来开发。当前,已经开发了三个官方认可的模块(http://web.resource.org/rss/1.0/),和19个建议模块(http://web.resource.org/rss/1.0/modules/proposed.html)。这些模块已经被大量团体所认同,其覆盖范围从完整的都柏林核心模块(Dublin Core module) (http://web.resource.org/rss/1.0/modules/dc/) 到更加专业的RSS中心模块,例如 Aggregation module (http://web.resource.org/rss/1.0/modules/aggregation/).

应当注意一点,当我们在RDF的范畴讨论RSS的时候,当前有两中RSS规范标准。一个分支(RSS 0.91,0.92,0.93,0.94 和2.0)没有使用RDF,另外一个分支(RSS 0.9 和1.0)使用了RDF。



6.5 CIM/XML

电业部门使用电力系统模型以完成各种不同的任务。例如,在计划和安全分析中电力系统的模拟就是必不可少的。电力系统模型同时也应用于实际的操作中,比如它可以被能源管理系统(Energy Management Systems ,EMS)用于能源控制中心中。一个实际运作的电力系统模型可能由几千种信息类别组成。除了在内部使用这些模型,电业部门为了规划和一些运作目的,比如为了达到协调电力传输或者确保操作可靠性的目的,还需要相互交换系统模型信息。然而,各个电业部门使用了不同的软件来完成这些任务,因此,系统模型以不同的格式存储,这使得这些模型的交换相当困难。

为了使电力系统模型间能够进行信息交换,电业部门需要就电力系统的实体以及实体间关系的定义达成一致。一个非盈利性的电力科学研究协会――电力能源研究协会 (http://www.epri.com/)(Electric Power Research Institute,EPRI),开发了一个[通用信息模型 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-cim)](Common Information Model,CIM)来完成这一任务。在CIM模型中,明确了电力系统的资源,属性以及关系等的通用语义。除此之外,为了能够进一步增强电子化地交换CIM模型的能力,电力业已经开发了一种用XML表达CIM模型的语言CIM/XML (http://www.langdale.com.au/CIMXML/)。CIM/XML是一种RDF的应用,使用RDF和RDF Schema来组织CIM模型的XML文档结构。北美电力可靠性理事会 (http://www.nerc.com/)(North American Electric Reliability Council,NERC)(一个业界组织的以提高北美地区电力传送可靠性为目的的理事会)已经采纳了CIM/XML作为电力传输系统运营商间交换模型信息的标准。同时,CIM/XML格式也通过了国际电工委员会的国际标准化认证过程。在[DWZ01 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-devos)]上有关于CIM/XML的大量精彩讨论.[注:请不要将电力业CIM与分布式管理任务组(Distributed Management Task Force, DMTF) (http://www.dmtf.org/)所开发的CIM混淆。DMTF开发的CIM是用以为分布式软件、网络和企业环境表示管理信息的,它也是采用XML进行表示的,目前并未采用RDF,但关于这个方向的独立研究已经展开。

CIM模型能将一个电业部门的所有主要对象均表示为类、属性以及它们之间的关系.CIM模型使用这些类和属性以支持独立开发的应用软件之间的集成,这些软件可能应用于特定厂商的EMS之间,也可能是应用于某个EMS和其他的与系统运作有关的系统之间,像发电和送电的管理等。

CIM模型被明确表示为一系列使用统一建模语言 (http://www.uml.org/)(Unified Modeling Language,UML)描述的类图。CIM模型的基类是PowerSystemResource类,同时CIM模型还包括了Substation 、Switch、Breaker等一些特殊化的子类。CIM/XML将CIM表示为RDF模式的一个词汇表,并将RDF/XML用作为交换特定系统模型间的语言。例41 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example41)展示了CIM/XML类和属性定义的例子。

例41: CIM/XML类和属性定义的例子

 <rdfs:Class rdf:ID="PowerSystemResource"> 
<rdfs:label xml:lang="en">PowerSystemResource</rdfs:label>
<rdfs:comment>"A power system component that can be either an
individual element such as a switch or a set of elements
such as a substation. PowerSystemResources that are sets
could be members of other sets. For example a Switch is a
member of a Substation and a Substation could be a member
of a division of a Company"</rdfs:comment>
</rdfs:Class>
<rdfs:Class rdf:ID="Breaker">
<rdfs:label xml:lang="en">Breaker</rdfs:label>
<rdfs:subClassOf rdf:resource="#Switch" />
<rdfs:comment>"A mechanical switching device capable of making,
carrying, and breaking currents under normal circuit conditions
and also making, carrying for a specified time, and breaking
currents under specified abnormal circuit conditions e.g. those
of short circuit. The typeName is the type of breaker, e.g.,
oil, air blast, vacuum, SF6."</rdfs:comment>
</rdfs:Class>
<rdf:Property rdf:ID="Breaker.ampRating">
<rdfs:label xml:lang="en">ampRating</rdfs:label>
<rdfs:domain rdf:resource="#Breaker" />
<rdfs:range rdf:resource="#CurrentFlow" />
<rdfs:comment>"Fault interrupting rating in amperes"</rdfs:comment>
</rdf:Property>

CIM/XML为了简化模型表达,只使用了RDF/XML完全语法的一个子集。并且,CIM/XML对RDF Schema词汇表进行了一些扩展。这些扩展支持逆属性的描述以及多值(基数)约束。多值(基数)约束用来描述对于一个给定资源的一个给定属性允许的作为其值的实例个数(对于一个多值声明允许的值是“零值或单值”、“单值”、“零值或多值”、“单值或多值”)。例42 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example42)中的属性阐述了这些扩展(这些扩展的部分用QName前缀cims标识):

例42:一些RDF模式的CIM/XML扩展

 <rdf:Property rdf:ID="Breaker.OperatedBy"> 
<rdfs:label xml:lang="en">OperatedBy</rdfs:label>
<rdfs:domain rdf:resource="#Breaker" />
<rdfs:range rdf:resource="#ProtectionEquipment" />
<cims:inverseRoleName rdf:resource="#ProtectionEquipment.Operates" />
<cims:multiplicity rdf:resource="http://www.cim-logic.com/schema/990530#M:0..n" />
<rdfs:comment>"Circuit breakers may be operated by
protection relays."</rdfs:comment>
</rdf:Property>

<rdf:Property rdf:ID="ProtectionEquipment.Operates">
<rdfs:label xml:lang="en">Operates</rdfs:label>
<rdfs:domain rdf:resource="#ProtectionEquipment" />
<rdfs:range rdf:resource="#Breaker" />
<cims:inverseRoleName rdf:resource="#Breaker.OperatedBy" />
<cims:multiplicity rdf:resource="http://www.cim-logic.com/schema/990530#M:0..n" />
<rdfs:comment>"Circuit breakers may be operated by
protection relays."</rdfs:comment>
</rdf:Property>

通过使用CIM/XML交换各个厂商产品之间的实际的大规模模型(包括像在一个测试中使用到的2000多所变电站的描述数据),并通过验证这些模型能被有代表性的应用软件所正确解释,电力科学研究院已经成功的进行了互操作的测试。尽管CIM模型原先是被计划用于电力管理系统,但现在它已经被扩展到电力传输以及其他方面的一些应用领域了。

对象管理组织 (http://www.omg.org/)(Object Management Group,OMG)已经采用了一个称为数据访问辅助工具(Data Access Facility ,[DAF (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-daf)])的对象接口标准来对CIM电力系统模型进行访问。类似CIM/XML语言,DAF也是基于RDF模型的,并且与CIM/XML共享相同的CIM模式。.然而,CIM/XML目的是使一个模型能够以文档的方式被交换,而DAF则是使应用软件能够像访问一个对象集合一样的访问这个模型。

基于XML的信息交换很自然地能被表示为实体-关系模型或者面向对象的类、属性和关系(甚至不要求这些信息是能通过Web访问的),CIM/XML阐明了RDF在这其中能够扮演的重要角色。在这些情况下,RDF为XML提供了一个基本架构以支持对象标识,以及支持在结构化的关系中使用这些对象。大量使用RDF/XML进行信息交换的应用软件阐明了这一关系,同时大量研究RDF(或者像OWL等的本体语言)和UML(以及它的XML表示)之间联系的工程也阐明了这一关系。CIM/XML需要扩展RDF模式才能支持基数约束和逆属性,这类的需要促使人们开发更强大的基于RDF的Schema或本体语言,如DAML+OIL和在5.5节 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#richerschemas)描述的OWL等。在将来,这些语言在支持一些类似的模型应用就可能更为合适。

最后,CIM/XML还为那些正在寻找另外的“RDF在领域中的应用”的例子的那些人阐述了一个重要事实:一些语言被描述为“XML”语言,或者系统被描述为使用“XML”的,而它们实际使用的“XML”就是RDF/XML,也即它们就是关于RDF的应用。有时需要相当深入地了解这些语言或者这些系统的描述才能发现这点(在某些已知的例子中,RDF甚至根本没有被明确的提及,但是样例数据清楚地显示这是RDF/XML)。同时,在类似于CIM/XML的这些应用中,由于创建的RDF是被计划用作软件部件间的信息交换而不是用于通用性的访问(尽管我们可以假想在未来,更多这种类型的RDF能够通过Web访问),因此创建出的RDF在Web上并不那么容易找到。



6.6 基因本体协会

使用像 SNOMED RT (http://www.snomed.org/) (医学文献术语系统化命名法, Systematized Nomenclature of Medicine Reference Terminology) 和MeSH (http://www.nlm.nih.gov/mesh/meshhome.html) (医学学科标题,Medical Subject Headings) 之类的受控词汇表的结构化元数据在医学界扮演着越来越重要的角色。这些结构化元数据提高了文献搜索的效率,并有助于医学知识[COWAN (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-cowan)]的传播与交换。但是,由于医学领域知识在不断地发生快速变化,这就要求人们开发额外的词汇表以供使用。

基因本体协会 (http://www.geneontology.org/)(Gene Ontology (GO) Consortium)的[基因本体 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-go)([GO])]旨在提供一个受控词汇表,用以描述基因产品某些方面的特征。相互协作的数据库使用基因本体术语标注它们的基因产品(或者基因),引用并指明了哪些证据可用以支持这些注释。这些数据库使用通用基因本体术语,更加容易实现数据库之间的统一查询。结构化的基因本体可以在不同的粒度等级上进行归因与查询。由于有关基因和蛋白质在细胞中功能的知识在不断积累和更新,因此基因本体词汇表也是动态变化的。

基因本体的三个组织原则是“分子功能”,“生物过程”和“细胞成分”。某个基因产品可能有一种或多种分子功能,并有可能作用于一个或多个生物过程之中;该产品可能包含了一种或多种的细胞成分,也可能与一种或多种细胞成分相关联。这三种本体中所有的术语定义都包含在一个单独的(文本格式的)定义文件中。每月都会定时生成一些XML格式的文件,其中包含了这三种本体文件以及所有可用的(本体)定义。

功能、过程和成分被表示为有向无环图(DAGs)或者网络。一个子术语可能是其父术语的一个“实例”(isa-关系),或者是其父术语的一个成分(part-of关系)。一个子术语可能有多个父术语并可能与其不同的父术语间有着不同的关系类别。本体还可以表示同义词和对外部数据库的交叉引用。由于RDF/XML在表示图结构时有很大的灵活性,并且有着广泛的工具支持,基因本体使用RDF/XML来简化XML版本的本体中的术语间的关系表示。但是,基因本体目前在术语描述中使用了“非”RDF嵌套的XML结构,所以现在所使用的基因本体描述语言并不是纯粹的RDF/XML。

例 43 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example43) 展示了一些基因本体文档 (http://www.geneontology.org/GO.doc.html)中的基因本体信息的样例:

例 43:基因本体信息样例

 <?xml version="1.0" encoding="UTF-8"?> 
<!DOCTYPE go:go>
<go:go xmlns:go="http://www.geneontology.org/xml-dtd/go.dtd#"
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#">
<go:version timestamp="Wed May 9 23:55:02 2001" />
<rdf:RDF>
<go:term rdf:about="http://www.geneontology.org/go#GO:0003673">
<go:accession>GO:0003673</go:accession>
<go:name>Gene_Ontology</go:name>
<go:definition></go:definition>
</go:term>
<go:term rdf:about="http://www.geneontology.org/go#GO:0003674">
<go:accession>GO:0003674</go:accession>
<go:name>molecular_function</go:name>
<go:definition>The action characteristic of a gene product.</go:definition>
<go:part-of rdf:resource="http://www.geneontology.org/go#GO:0003673" />
<go:dbxref>
<go:database_symbol>go</go:database_symbol>
<go:reference>curators</go:reference>
</go:dbxref>
</go:term>
<go:term rdf:about="http://www.geneontology.org/go#GO:0016209">
<go:accession>GO:0016209</go:accession>
<go:name>antioxidant</go:name>
<go:definition></go:definition>
<go:isa rdf:resource="http://www.geneontology.org/go#GO:0003674" />
<go:association>
<go:evidence evidence_code="ISS">
<go:dbxref>
<go:database_symbol>fb</go:database_symbol>
<go:reference>fbrf0105495</go:reference>
</go:dbxref>
</go:evidence>
<go:gene_product>
<go:name>CG7217</go:name>
<go:dbxref>
<go:database_symbol>fb</go:database_symbol>
<go:reference>FBgn0038570</go:reference>
</go:dbxref>
</go:gene_product>
</go:association>
<go:association>
<go:evidence evidence_code="ISS">
<go:dbxref>
<go:database_symbol>fb</go:database_symbol>
<go:reference>fbrf0105495</go:reference>
</go:dbxref>
</go:evidence>
<go:gene_product>
<go:name>Jafrac1</go:name>
<go:dbxref>
<go:database_symbol>fb</go:database_symbol>
<go:reference>FBgn0040309</go:reference>
</go:dbxref>
</go:gene_product>
</go:association>
</go:term>
</rdf:RDF>
</go:go>

例 43 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example43)说明了go:term是基本元素。在某些情况下,基因本体没有使用RDF Schema,而定义了它自己的术语。例如,术语GO:0016209有一个元素<go:isa rdf:resource="http://www.geneontology.org/go#GO:0003674" />。这一标记表示了"GO:0016209 isa GO:0003674"这一关系,或者用英语来说,表示了“Molecular function is part of the Gene Ontology(抗氧化剂是一个分子功能)”。另一个关系特例是go:part-of。例如,GO:0003674有一个元素是<go:part-of rdf:resource="http://www.geneontology.org/go#GO:0003673" />。这表明了“Molecular function is part of the Gene Ontology(分子功能是基因本体的一部分)”。

任何一个标注必须被归因到一个源,这个源可以是一份参考文献、一个数据库或者一个计算分析。标注必须指明在引用的源中找到了哪些证据以支持基因产品与这一基因术语的关联。一个简单的受控词汇表可以用来记录这些证据。例子包括:

  • ISS 意思是 “inferred from sequence similarity [with <database:sequence_id>](根据基因序列相似性推断[用<database:sequence_id>])”
  • IDA意思是 “inferred from direct assay(根据直接化验推断)”
  • TAS 意思是 “traceable author statement(可追踪的作者论述)”

go:dbxref元素表示在外部数据库的术语,而go:association表示每个术语的基因关联。go:association能同时含有go:association 和go:gene_product,前者包含了指向支持关联证据的go:dbxref,后者则包含了基因符号与go:dbxref。这些元素说明了基因本体的XML语法并不是“纯粹的”RDF/XML,因为这些元素中嵌套着其他元素这一事实并未遵循[RDF-SYNTAX (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-rdf-syntax)]的2.1节与2.2节中所描述的交替节点/谓词弧的条状嵌套语法。

基因本体说明了许多有趣的要点。首先,它表明使用RDF结构化XML能增强XML在信息交换中的作用。在数据结构整体上是一个图结构或者网络结构而不是一个严格层次结构的情况下,这一点将体现得更加明显。同时,基因本体作为一个例子表明了使用RDF的数据并不一定要以在Web上直接使用的形式出现(尽管所有的文件通过Web都是可访问的)。而基因本体也可作为一个例子,表明数据表面上使用“XML”进行描述,但是进一步观察可发现其使用的是RDF/XML(尽管不是“纯粹的”RDF/XML)。最后,基因本体阐明了RDF在本体本体中所扮演的基础性角色。在5.5节 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#richerschemas)中讨论过DAML+OIL 与OWL等基于RDF的更加丰富的本体描述语言,一旦这些语言得到广泛使用,RDF的作用将会更进一步得到增强。实际上,一个下一代基因本体 (http://gong.man.ac.uk/)(Gene Ontology Next Generation)的项目已经开始使用这些更丰富的语言来展开基因本体表示的相关研究。



6.7 描述设备性能和用户参数

近几年新出现了很多用于浏览Web的移动设备(mobile devices)。这些设备中有许多具有高度分散的能力,包括选择广泛的输入与输出能力,以及不同级别的语言支持。移动设备在网络连接能力方面也可能有着广泛的不同。这些新设备的用户期望有一个便于使用的外观显示,而不管其设备能力与当前的网络特性如何。同样地,用户希望在内容或应用呈现给他们时能够考虑到他们动态变化的偏好(比如是否开启声音)。然而在现实中,由于设备的异构性以及缺少一种让用户向服务器传达个人偏好的标准方式,这会造成:得到的内容可能不能存贮在设备里、不能显示出来或者违反了用户意愿。此外,最终的内容可能会在网络传输上花很多时间才到达客户端设备。

处理这些问题的一个办法是让客户端编码递送上下文(delivery context)(即设备能力、用户偏好、网络特性等等)使得服务端可以利用这个上下文为设备和用户进行内容的定制(关于递送上下文的定义,请参见[DIPRINC (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-diprinc)])。W3C的组合能力/偏好特征(Composite Capabilities/Preferences Profile, CC/PP)规范[CC/PP (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-ccpp)]通过定义一个描述递送上下文的通用框架促进了这个问题的解决。

CC/PP框架定义了一个相对简单的结构,即一个由组件和属性/值对构成的2层结构。一个组件(component)可被用来描述递送上下文的一部分(如网络特性、设备支持的软件或设备的硬件特性)。一个组件可以包含一个或多个属性(attributes)。例如,一个表示用户偏好的组件可能会需要包含一个指定是否打开音频输出的属性。

CC/PP用RDF Schema定义上述层次结构(关于此结构的Schema详细信息,请参见[CC/PP (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-ccpp)])。一个CC/PP词汇表定义了一些特定的组件和各自的属性,但[CC/PP (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-ccpp)]不定义这些词汇。这些词汇是由其他机构或应用(如下所述)定义的。[CC/PP (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-ccpp)]也没有定义传输CC/PP词汇实例的协议。

CC/PP词汇表的一个实例称为一个特征文件(profile)。在特征文件中,CC/PP属性(attribute)用RDF属性(property)表示。例44 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example44)所显示的是一个特征文件的片断,它描述了用户的打开音频输出的偏好:

例44:一个CC/PP特征文件的片断

 <ccpp:component>
<rdf:Description rdf:ID="UserPreferences">
<rdf:type rdf:resource="http://www.example.org/profiles/prefs/v1_0#UserPreferences"/>
<ex:AudioOutput>Yes</ex:AudioOutput>
<ex:Graphics>No</ex:Graphics>
<ex:Languages>
<rdf:Seq>
<rdf:li>en-cockney</rdf:li>
<rdf:li>en</rdf:li>
</rdf:Seq>
</ex:Languages>
</rdf:Description>
</ccpp:component>

在这个应用中使用RDF有几个优势。第一,以CC/PP编码的特征文件包含的属性可能是在由不同组织创建的Schema中定义的。RDF很自然地适合表示这些特征文件,因为没有单个组织能够为聚集的特征数据创建一个超级Schema。 使用RDF的第二个好处是,它使得在特征文件中插入任意属性变得更为容易(由于RDF是基于图的数据模型),这对包含了频繁变化的数据(如地点信息)的特征文件尤为有用。

开放移动联盟(Open Mobile Alliance)已经定义了用户代理特征文件(User Agent Profile, UAProf),[UAPROF (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-uaprof)]。它是一个基于CC/PP的框架,包含了一个用于描述设备能力、用户代理能力、网络特性等的词汇表,并定义了一个传输特征文件的协议。UAProf定义了六个组件,包括硬件平台(HardwarePlatform)软件平台(SoftwarePlatform)网络特性(NetworkCharacteristrics)用户浏览器(BrowserUA)等。它还为每个组件定义了一些属性,尽管组件的属性并是不固定的——可能被补充或撤销。20040210/#example45 例45 (http://www.w3.org/TR/2004/REC-rdf-primer-)显示了一个关于硬件平台组件的UAProf片断:

例45:一个关于硬件平台组件的UAProf片断:

 <prf:component>
<rdf:Description rdf:ID="HardwarePlatform">
<rdf:type rdf:resource="http://www.openmobilealliance.org/profiles/UAPROF/ccppschema-20021113#HardwarePlatform"/>
<prf:ScreenSizeChar>15x6</prf:ScreenSizeChar>
<prf:BitsPerPixel>2</prf:BitsPerPixel>
<prf:ColorCapable>No</prf:ColorCapable>
<prf:BluetoothProfile>
<rdf:Bag>
<rdf:li>headset</rdf:li>
<rdf:li>dialup</rdf:li>
<rdf:li>lanaccess</rdf:li>
</rdf:Bag>
</prf:BluetoothProfile>
</rdf:Description>
</prf:component>

UAProf协议支持静态特征文件和动态特征文件。一个静态特征文件是通过URI访问的。这有几个优点:在客户发给服务器的请求中只含有一个URI,而不是一个冗长的XML文档(这将减少网络拥塞);客户不需要存储和/或创建这个特征文件;客户端的实现负担是相对轻量级的。动态特征文件是动态创建的,因此没有相关联的URI。它可以包含一个描述与静态特征文件差别的特征文件片断,也可以包含客户的静态特征文件中所没有的数据。一个请求可以包含任意数量的静态特征文件和动态特征文件。然后,特征文件的顺序是重要的,因为在请求中后面的特征文件会覆盖前面的。关于UAProf的协议和处理多个特征文件的规则,详见[UAPROF (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-uaprof)]。

一些其他的团体(例如,3GPP’s TS 26.234 [3GPP (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-3gpp)]和WAP论坛的多媒体消息服务客户端事务规范(Multimedia Messaging Service Client Transactions Specification [MMS-CTR (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-mms)]))已经定义了一些基于CC/PP的词汇表。因此,一个特征文件可以利用RDF的分布式特点,包含来自不同词汇表定义的组件。http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example46 例46]显示了一个这样的特征文件:

例46:一个用到多个词汇表的特征文件

 <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:prf="http://www.wapforum.org/profiles/UAPROF/ccppschema-20010330#"
xmlns:mms="http://www.wapforum.org/profiles/MMS/ccppschema-20010111#"
xmlns:pss="http://www.3gpp.org/profiles/PSS/ccppschema-YYYYMMDD#">
  <rdf:Description rdf:ID="SomeDevice">
<prf:component>
<rdf:Description rdf:ID="Streaming">
<rdf:type rdf:resource="http://www.3gpp.org/profiles/PSS/ccppschema-PSS5#Streaming"/>
<pss:AudioChannels>Stereo</pss:AudioChannels>
<pss:VideoPreDecoderBufferSize>30720</pss:VideoPreDecoderBufferSize>
<pss:VideoInitialPostDecoderBufferingPeriod>0</pss:VideoInitialPostDecoderBufferingPeriod>
<pss:VideoDecodingByteRate>16000</pss:VideoDecodingByteRate>
</rdf:Description>
</prf:component>
<prf:component>
<rdf:Description rdf:ID="MmsCharacteristics">
<rdf:type rdf:resource="http://www.wapforum.org/profiles/MMS/ccppschema-20010111#Streaming"/>
<mms:MmsMaxMessageSize>2048</mms:MmsMaxMessageSize>
<mms:MmsMaxImageResolution>80x60</mms:MmsMaxImageResolution>
<mms:MmsVersion>2.0</mms:MmsVersion>
</rdf:Description>
</prf:component>
<prf:component>
<rdf:Description rdf:ID="PushCharacteristics">
<rdf:type rdf:resource="http://www.openmobilealliance.org/profiles/UAPROF/ccppschema-20010330#PushCharacteristics"/>
<prf:Push-MsgSize>1024</prf:Push-MsgSize>
<prf:Push-MaxPushReq>5</prf:Push-MaxPushReq>
<prf:Push-Accept>
<rdf:Bag>
<rdf:li>text/html</rdf:li>
<rdf:li>text/plain</rdf:li>
<rdf:li>image/gif</rdf:li>
</rdf:Bag>
</prf:Push-Accept>
</rdf:Description>
</prf:component>
</rdf:Description>
</rdf:RDF>

关于递送上下文以及其中数据的定义将继续发展。从而,RDF天生的可扩展性以及因此而对动态变化的词汇表的支持使得RDF成为一个表达递送上下文的理想框架。



7. RDF规范的其它部分

第1节 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#intro) 指出了RDF 规范包含了一系列的文档(除了这个入门外):

The Primer has already discussed the subjects of several of these documents, basic RDF concepts (in [http://www.w3.org/TR/2004/REC-rdf 这个入门文档已经讨论了这些文档的一些主题, 如基本的RDF概念(在第 2节 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#statements)), RDF/XML 语法 (在 第 3节 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#rdfxml)) 和RDF Schema (在 第 5节 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#rdfschema)). 这节简要地讲述一下剩下的文档(尽管已经有很多对 [RDF-SEMANTICS (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-rdf-semantics)]的引用), 目的是解释他们在完整的RDF规范中的角色.



7.1 RDF语义

就像前面章节讨论的那样, RDF是用以表示关于资源的陈述的, 它的表示形式是图并使用了一些特定的词汇(资源,属性,类的名字等等). RDF还是用以作为高级语言的基础, 如在 5.5节 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#richerschemas)中讨论的一些语言. 为此, RDF图的含义必须得到精确的定义.

一般来说,到底什么组成了RDF图的"含义"依赖于很多因素, 包括在用户团体中解释用户以特定方式定义的类和属性的一些惯例, 自然语言书写的注释, 对其他具有内容的信息的链接. 如2.2节 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#rdfmodel)所述, 大部分以这种形式表达的含义不能直接被机器处理, 尽管这些含义可能被人们解释RDF信息时用到,或被程序员在编写软件以对RDF信息作出各种处理时用到. 然而, RDF陈述也具有一种"形式化"的语义, 它决定了机器用一种数学的精确方式, 从一个给定的RDF图中可以得到的结论. 文档 RDF 语义 (http://www.w3.org/TR/rdf-mt/) [RDF-SEMANTICS (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-rdf-semantics)] 用一个规范说明形式语言语义的技术, 称为模型论, 来定义这个形式化语义. [RDF-SEMANTICS (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-rdf-semantics)] 也定义了RDF语言的扩展RDF Schema和单独的数据类型的语义扩展. 换句话说, RDF模型论语义提供了所有RDF概念的理论基础. 基于在模型论中定义的语义, RDF图可以容易地翻译到具有相同含义的逻辑表达式上.



7.2 测试用例

文档 RDF 测试用例 (http://www.w3.org/TR/rdf-testcases/) [RDF-TESTS (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-rdf-tests)] 为用文字描述的RDF规范补充了测试用例(例子), 这些用例对应于RDF核心工作组解决的一些特定的技术问题. 为了方便描述这些用例, 那个测试用例文档引入了一个称为 N-Triples (http://www.w3.org/TR/rdf-testcases/#ntriples)的表示法, 这也是本入门文档中所用的三元组表示法的基础. 这些测试用例以机器可读的方式发布在这个测试用例文档所在的Web站点, 因此, 开发人员可以把这些作为自动化测试RDF软件的基础.

这些测试用例被划分为以下几类:

  • 肯定的和否定的语法分析器(Parser)测试: 他们测试RDF/XML Parser是否能够为合法的RDF/XML 输入文档产生正确的N-Triples输出图, 或为不合法的RDF/XML.输入文档正确地报告错误.
  • 肯定的和否定的蕴涵(Entailment)测试: 他们测试是否能够从指定的RDF陈述集合中得到正确的或不正确的结论.
  • 带有数据类型的蕴涵测试: 他们是用到了数据类型的肯定的或否定的蕴涵测试, 因此需要对测试中用到的数据类型的支持.
  • 其他测试: 他们是不在上述类别中的测试.

这些测试用例不是对RDF的完全规格说明,也没有优先于其他规范文档的意思。相反,它们是用来阐明RDF核心工作组(RDF Core Working Group)在RDF的设计方面的意图。开发人员也许会觉得这些测试用例很有帮助,如果那些规范在某些细节的措辞上不够清晰的话



8. 参考文献


8.1 规范性文献

[RDF-CONCEPTS]
Resource Description Framework (RDF): Concepts and Abstract Syntax (http://www.w3.org/TR/2004/REC-rdf-concepts-20040210/), Klyne G., Carroll J. (Editors), W3C Recommendation, 10 February 2004. This version (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/) is http://www.w3.org/TR/2004/REC-rdf-primer-20040210/. The latest version (http://www.w3.org/TR/rdf-concepts/) is http://www.w3.org/TR/rdf-concepts/.
[RDF-MIME-TYPE]
MIME Media Types (http://www.iana.org/assignments/media-types/), The Internet Assigned Numbers Authority (IANA). This document is http://www.iana.org/assignments/media-types/ . The registration for application/rdf+xml is archived at http://www.w3.org/2001/sw/RDFCore/mediatype-registration .
[RDF-MS]
Resource Description Framework (RDF) Model and Syntax Specification (http://www.w3.org/TR/1999/REC-rdf-syntax-19990222/), Lassila O., Swick R. (Editors), World Wide Web Consortium, 22 February 1999. This version (http://www.w3.org/TR/1999/REC-rdf-syntax-19990222/) is http://www.w3.org/TR/1999/REC-rdf-syntax-19990222/. The latest version (http://www.w3.org/TR/REC-rdf-syntax/) is http://www.w3.org/TR/REC-rdf-syntax/.
[RDF-SEMANTICS]
RDF Semantics (http://www.w3.org/TR/2004/REC-rdf-mt-20040210/), Hayes P. (Editor), W3C Recommendation, 10 February 2004. This version (http://www.w3.org/TR/2004/REC-rdf-mt-20040210/) is http://www.w3.org/TR/2004/REC-rdf-mt-20040210/. The latest version (http://www.w3.org/TR/rdf-mt/) is http://www.w3.org/TR/rdf-mt/.
[RDF-SYNTAX]
RDF/XML Syntax Specification (Revised) (http://www.w3.org/TR/2004/REC-rdf-syntax-grammar-20040210/), Beckett D. (Editor), W3C Recommendation, 10 February 2004. This version (http://www.w3.org/TR/2004/REC-rdf-syntax-grammar-20040210/) http://www.w3.org/TR/2004/REC-rdf-syntax-grammar-20040210/. The latest version (http://www.w3.org/TR/rdf-syntax-grammar/) is http://www.w3.org/TR/rdf-syntax-grammar/.
[RDF-TESTS]
RDF Test Cases (http://www.w3.org/TR/2004/REC-rdf-testcases-20040210/), Grant J., Beckett D. (Editors), W3C Recommendation, 10 February 2004. This version (http://www.w3.org/TR/2004/REC-rdf-testcases-20040210/) is http://www.w3.org/TR/2004/REC-rdf-testcases-20040210/. The latest version (http://www.w3.org/TR/rdf-testcases/) is http://www.w3.org/TR/rdf-testcases/.
[RDF-VOCABULARY]
RDF Vocabulary Description Language 1.0: RDF Schema (http://www.w3.org/TR/2004/REC-rdf-schema-20040210/), Brickley D., Guha R.V. (Editors), W3C Recommendation, 10 February 2004. This version (http://www.w3.org/TR/2004/REC-rdf-schema-20040210/) is http://www.w3.org/TR/2004/REC-rdf-schema-20040210/. The latest version (http://www.w3.org/TR/rdf-schema/) is http://www.w3.org/TR/rdf-schema/.
[UNICODE]
The Unicode Standard, Version 3, The Unicode Consortium, Addison-Wesley, 2000. ISBN 0-201-61633-5, as updated from time to time by the publication of new versions. (See http://www.unicode.org/unicode/standard/versions/ (http://www.unicode.org/unicode/standard/versions/) for the latest version and additional information on versions of the standard and of the Unicode Character Database).
[URIS]
RFC 2396 – Uniform Resource Identifiers (URI): Generic Syntax (http://www.isi.edu/in-notes/rfc2396.txt), Berners-Lee T., Fielding R., Masinter L., IETF, August 1998, http://www.isi.edu/in-notes/rfc2396.txt.
[XML]
Extensible Markup Language (XML) 1.0, Second Edition (http://www.w3.org/TR/2000/REC-xml-20001006), Bray T., Paoli J., Sperberg-McQueen C.M., Maler E. (Editors), World Wide Web Consortium, 6 October 2000. This version (http://www.w3.org/TR/2000/REC-xml-20001006) is http://www.w3.org/TR/2000/REC-xml-20001006. The latest version (http://www.w3.org/TR/REC-xml) is http://www.w3.org/TR/REC-xml.
[XML-BASE]
XML Base (http://www.w3.org/TR/2001/REC-xmlbase-20010627/), Marsh J. (Editor), World Wide Web Consortium, 27 June 2001. This version (http://www.w3.org/TR/2001/REC-xmlbase-20010627/) is http://www.w3.org/TR/2001/REC-xmlbase-20010627/. The latest version (http://www.w3.org/TR/xmlbase/) is http://www.w3.org/TR/xmlbase/.
[XML-NS]
Namespaces in XML (http://www.w3.org/TR/1999/REC-xml-names-19990114/), Bray T., Hollander D., Layman A. (Editors), World Wide Web Consortium, 14 January 1999. This version (http://www.w3.org/TR/1999/REC-xml-names-19990114/) is http://www.w3.org/TR/1999/REC-xml-names-19990114/. The latest version (http://www.w3.org/TR/REC-xml-names/) is http://www.w3.org/TR/REC-xml-names/.
[XML-XC14N]
Exclusive XML Canonicalization Version 1.0 (http://www.w3.org/TR/2002/REC-xml-exc-c14n-20020718/), Boyer J., Eastlake D.E. 3rd, Reagle J. (Authors/Editors), World Wide Web Consortium, 18 July 2002. This version (http://www.w3.org/TR/2002/REC-xml-exc-c14n-20020718/) is http://www.w3.org/TR/2002/REC-xml-exc-c14n-20020718/. The latest version (http://www.w3.org/TR/xml-exc-c14n/) is http://www.w3.org/TR/xml-exc-c14n/.



8.2 参考性文献

[3GPP]
3GPP TS 26.234. (http://www.3gpp.org/specs/specs.htm) 3rd Generation Partnership Project; Technical Specification Group Services and System Aspects; Transparent end-to-end packet switched streaming service; Protocols and codecs V5.2.0 (2002-09). This document (http://www.3gpp.org/specs/specs.htm) is available at http://www.3gpp.org/specs/specs.htm via directory ftp://ftp.3gpp.org/specs/2002-09/Rel-5/26_series/.
[ADDRESS-SCHEMES]
Addressing Schemes (http://www.w3.org/Addressing/schemes.html), Connolly D., 2001. This document (http://www.w3.org/Addressing/schemes.html) is http://www.w3.org/Addressing/schemes.html.
[BATES96]
Indexing and Access for Digital Libraries and the Internet: Human, Database, and Domain Factors (http://is.gseis.ucla.edu/research/mjbates.html), Bates M.J., 1996. This document (http://is.gseis.ucla.edu/research/mjbates.html) is http://is.gseis.ucla.edu/research/mjbates.html.
[BERNERS-LEE98]
What the Semantic Web can represent (http://www.w3.org/DesignIssues/RDFnot.html), Berners-Lee T., 1998. This document (http://www.w3.org/DesignIssues/RDFnot.html) is http://www.w3.org/DesignIssues/RDFnot.html.
[CC/PP]
Composite Capability/Preference Profiles (CC/PP): Structure and Vocabularies (http://www.w3.org/TR/2004/REC-CCPP-struct-vocab-20040115/), Klyne G., Reynolds F., Woodrow C., Ohto H., Hjelm J., Butler M., Tran, L., W3C Recommendation, 15 January 2004. This version (http://www.w3.org/TR/2004/REC-CCPP-struct-vocab-20040115/) is http://www.w3.org/TR/2004/REC-CCPP-struct-vocab-20040115/. The latest version (http://www.w3.org/TR/CCPP-struct-vocab/) is http://www.w3.org/TR/CCPP-struct-vocab/.
[CG]
Conceptual Graphs, Sowa J., ISO working document ISO/JTC1/SC32/WG2 N 000, 2 April 2001 (work in progress). Available at http://users.bestweb.net/~sowa/cg/cgstand.htm (http://users.bestweb.net/~sowa/cg/cgstand.htm).
[CHARMOD]
Character Model for the World Wide Web 1.0 (http://www.w3.org/TR/2002/WD-charmod-20020220/), Dürst M., Yergeau F., Ishida R., Wolf M., Freytag A., Texin T. (Editors), World Wide Web Consortium, 20 February 2002 (work in progress). This version (http://www.w3.org/TR/2002/WD-charmod-20020220/) is http://www.w3.org/TR/2002/WD-charmod-20020220/. The latest version (http://www.w3.org/TR/charmod/) is http://www.w3.org/TR/charmod/.
[CIM]
Common Information Model (CIM): CIM 10 Version, EPRI, Palo Alto, CA: 2001, 1001976. This document (http://www.epri.com/attachments/286161_1001976(1).pdf) is available at http://www.epri.com/attachments/286161_1001976(1).pdf (267pp.).
[COWAN]
Metadata, Reuters Health Information, and Cross-Media Publishing (http://seminars.seyboldreports.com/2002_new_york/files/presentations/014/cowan_john.ppt) , Cowan J., 2002. Presentation at Seybold New York 2002 Enterprise Publishing Conference. This document (http://seminars.seyboldreports.com/2002_new_york/files/presentations/014/cowan_john.ppt) is http://seminars.seyboldreports.com/seminars/2002_new_york/presentations/014/cowan_john.ppt. An accompanying transcript (http://seminars.seyboldreports.com/2002_new_york/files/transcripts/doc/transcript_EP7.doc) is http://seminars.seyboldreports.com/2002_new_york/files/transcripts/doc/transcript_EP7.doc
[DAF]
Utility Management System (UMS) Data Access Facility (http://www.omg.org/technology/documents/formal/UMS_Data_Access_Facility.htm), version 2.0, Object Management Group, November 2002. This document (http://www.omg.org/technology/documents/formal/UMS_Data_Access_Facility.htm) is available at http://www.omg.org/technology/documents/formal/UMS_Data_Access_Facility.htm.
[DAML+OIL]
DAML+OIL (March 2001) Reference Description (http://www.w3.org/TR/daml+oil-reference), Connolly D., van Harmelen F., Horrocks I., McGuinness D.L., Patel-Schneider P.F., Stein L.A., World Wide Web Consortium, 18 December 2001. This document (http://www.w3.org/TR/daml+oil-reference) is http://www.w3.org/TR/daml+oil-reference.
[DC]
Dublin Core Metadata Element Set, Version 1.1: Reference Description (http://dublincore.org/documents/2003/06/02/dces/), 02 June 2003. This version (http://dublincore.org/documents/2003/06/02/dces/) is http://dublincore.org/documents/2003/06/02/dces/. The latest version (http://dublincore.org/documents/dces/) is http://dublincore.org/documents/dces/.
[DIPRINC]
Device Independence Principles. (http://www.w3.org/TR/di-princ/) Gimson, R., Finkelstein, S., Maes, S., Suryanarayana, L., World Wide Web Consortium, 18 September 2001 (work in progress). This version (http://www.w3.org/TR/2001/WD-di-princ-20010918/) is http://www.w3.org/TR/2001/WD-di-princ-20010918. The latest version (http://www.w3.org/TR/di-princ/) is http://www.w3.org/TR/di-princ/.
[DWZ01]
XML for CIM Model Exchange (http://www.langdale.com.au/PICA/) , deVos A., Widergreen S.E., Zhu J., Proc. IEEE Conference on Power Industry Computer Systems, Sydney, Australia, 2001. This document (http://www.langdale.com.au/PICA/) is http://www.langdale.com.au/PICA/.
[GO]
Gene Ontology: tool for the unification of biology (http://www.geneontology.org/GO_nature_genetics_2000.pdf), The Gene Ontology Consortium, Nature Genetics, Vol. 25: 25-29, May 2000. Available at http://www.geneontology.org/GO_nature_genetics_2000.pdf (http://www.geneontology.org/GO_nature_genetics_2000.pdf)
[GRAY]
Logic, Algebra and Databases, Gray P., Ellis Horwood Ltd., 1984. ISBN 0-85312-709-3, 0-85312-803-0, 0-470-20103-7, 0-470-20259-9.
[HAYES]
In Defense of Logic, Hayes P., Proceedings from the International Joint Conference on Artificial Intelligence, 1975, San Francisco. Morgan Kaufmann Inc., 1977. Also in Computation and Intelligence: Collected Readings, Luger G. (ed), AAAI press/MIT press, 1995. ISBN 0-262-62101-0.
[KIF]
Knowledge Interchange Format, Genesereth M., draft proposed American National Standard NCITS.T2/98-004. Available at http://logic.stanford.edu/kif/dpans.html (http://logic.stanford.edu/kif/dpans.html).
[LBASE]
LBase: Semantics for Languages of the Semantic Web (http://www.w3.org/TR/2003/NOTE-lbase-20031010/), Guha R. V., Hayes P., W3C Note, 10 October 2003. This version (http://www.w3.org/TR/2003/NOTE-lbase-20031010/) is http://www.w3.org/TR/2003/NOTE-lbase-20031010/. The latest version (http://www.w3.org/TR/lbase/) is http://www.w3.org/TR/lbase/.
[LUGER]
Artificial Intelligence: Structures and Strategies for Complex Problem Solving (3rd ed.), Luger G., Stubblefield W., Addison Wesley Longman, 1998. ISBN 0-805-31196-3.
[MATHML]
Mathematical Markup Language (MathML) Version 2.0 (http://www.w3.org/TR/2001/REC-MathML2-20010221/), Carlisle D., Ion P., Miner R., Poppelier N. (Editors); Ausbrooks R., Buswell S., Dalmas S., Devitt S., Diaz A., Hunter R., Smith B., Soiffer N., Sutor R., Watt S. (Principal Authors), World Wide Web Consortium, 21 February 2001. This version (http://www.w3.org/TR/2001/REC-MathML2-20010221/) is http://www.w3.org/TR/2001/REC-MathML2-20010221/. The latest version (http://www.w3.org/TR/MathML2/) is http://www.w3.org/TR/MathML2/.
[MMS-CTR]
Multimedia Messaging Service Client Transactions Specification. (http://www.openmobilealliance.org/) WAP-206-MMSCTR-20020115-a. This document is available at http://www.openmobilealliance.org/.
[NAMEADDRESS]
Naming and Addressing: URIs, URLs, … (http://www.w3.org/Addressing/), Connolly D., 2002. This document (http://www.w3.org/Addressing/) is http://www.w3.org/Addressing/.
[OWL]
OWL Web Ontology Language Reference (http://www.w3.org/TR/2004/REC-owl-ref-20040210/), Dean M., Schreiber G (Editors); van Harmelen F., Hendler J., Horrocks I., McGuinness D.L., Patel-Schneider P.F., Stein L.A. (Authors), W3C Recommendation, 10 February 2004. The latest version (http://www.w3.org/TR/owl-ref/) is http://www.w3.org/TR/owl-ref/.
[PRISM]
PRISM: Publishing Requirements for Industry Standard Metadata (http://www.prismstandard.org/), Version 1.1, 19 February 2002. The latest version (http://www.prismstandard.org/) of the PRISM specification is available at http://www.prismstandard.org/.
[RDFISSUE]
RDF Issue Tracking (http://www.w3.org/2000/03/rdf-tracking/), McBride B., 2002. This document (http://www.w3.org/2000/03/rdf-tracking/) is http://www.w3.org/2000/03/rdf-tracking/.
[RDF-S]
Resource Description Framework (RDF) Schema Specification 1.0 (http://www.w3.org/TR/2000/CR-rdf-schema-20000327/) , Brickley D., Guha, R.V. (Editors), World Wide Web Consortium. 27 March 2000. This version (http://www.w3.org/TR/2000/CR-rdf-schema-20000327/) is http://www.w3.org/TR/2000/CR-rdf-schema-20000327/.
[RSS]
RDF Site Summary (RSS) 1.0 (http://purl.org/rss/1.0/spec), Beged-Dov G., Brickley D., Dornfest R., Davis I., Dodds L., Eisenzopf J., Galbraith D., Guha R.V., MacLeod K., Miller E., Swartz A., van der Vlist E., 2000. This document (http://purl.org/rss/1.0/spec) is http://purl.org/rss/1.0/spec.
[RUBY]
Ruby Annotation (http://www.w3.org/TR/2001/REC-ruby-20010531/), Sawicki M., Suignard M., Ishikawa M., Dürst M., Texin T. (Editors), World Wide Web Consortium, 31 May 2001. This version (http://www.w3.org/TR/2001/REC-ruby-20010531/) is http://www.w3.org/TR/2001/REC-ruby-20010531/. The latest version (http://www.w3.org/TR/ruby/) is http://www.w3.org/TR/ruby/.
[SOWA]
Knowledge Representation: Logical, Philosophical and Computational Foundations, Sowa J., Brookes/Cole, 2000. ISBN 0-534-94965-7.
[SVG]
Scalable Vector Graphics (SVG) 1.1 Specification (http://www.w3.org/TR/2003/REC-SVG11-20030114/), Ferraiolo J., Fujisawa J., Jackson D. (Editors), World Wide Web Consortium, 14 January 2003. This version (http://www.w3.org/TR/2003/REC-SVG11-20030114/) is http://www.w3.org/TR/2003/REC-SVG11-20030114/. The latest version (http://www.w3.org/TR/SVG11/) is http://www.w3.org/TR/SVG11/.
[UAPROF]
User Agent Profile. (http://www.openmobilealliance.org/) OMA-WAP-UAProf-v1_1. This document is available at http://www.openmobilealliance.org/.
[WEBDATA]
Web Architecture: Describing and Exchanging Data (http://www.w3.org/1999/04/WebData), Berners-Lee T., Connolly D., Swick R., World Wide Web Consortium, 7 June 1999. This document (http://www.w3.org/1999/04/WebData) is http://www.w3.org/1999/04/WebData.
[XLINK]
XML Linking Language (XLink) Version 1.0 (http://www.w3.org/TR/2001/REC-xlink-20010627/), DeRose S., Maler E., Orchard D. (Editors), World Wide Web Consortium, 27 June 2001. This version (http://www.w3.org/TR/2001/REC-xlink-20010627/) is http://www.w3.org/TR/2001/REC-xlink-20010627/. The latest version (http://www.w3.org/TR/xlink/) is http://www.w3.org/TR/xlink/.
[XML-SCHEMA2]
XML Schema Part 2: Datatypes (http://www.w3.org/TR/2001/REC-xmlschema-2-20010502/), Biron P., Malhotra A. (Editors), World Wide Web Consortium. 2 May 2001. This version (http://www.w3.org/TR/2001/REC-xmlschema-2-20010502/) is http://www.w3.org/TR/2001/REC-xmlschema-2-20010502/. The latest version (http://www.w3.org/TR/xmlschema-2/) is http://www.w3.org/TR/xmlschema-2/.
[XPACKAGE]
XML Package (XPackage) 1.0 (http://www.xpackage.org/specification/xpackage-draft-20030306.html) , Wilson G., Editor’s Working Draft, 6 March 2003. This version (http://www.xpackage.org/specification/xpackage-draft-20030306.html) is http://www.xpackage.org/specification/xpackage-draft-20030306.html. The latest version (http://www.xpackage.org/specification/) is http://www.xpackage.org/specification/.



9. 致谢

本文档得益于RDF 核心工作组 (http://www.w3.org/2001/sw/RDFCore/)中诸多成员的共同努力。尤其感谢Art Barstow, Dave Beckett, Dan Brickley, Ron Daniel, Ben Hammersley, Martyn Horner, Graham Klyne, Sean Palmer, Patrick Stickler, Aaron Swartz, Ralph Swick 以及 Garret Wilson,正是他们以及其它许多研究人员在对上一个版本的RDF入门提出了许多宝贵意见之后,才得以产生本文。

另外,Pat Hayes, Sergey Melnik 和 Patrick Stickler也对本文做出了重要贡献,他们领导开发了RDF规范系列中所描述的RDF数据类型工具。

Frank Manola 还要感谢, MITRE 公司 (http://www.mitre.org/),Frank的主管, 在其完成本文的绝大部分时间里所给予的大力支持,RDF核心工作组的活动得到了该公司资助的研究授权。






附录A:更多关于统一资源标识符(Uniform Resource Identifiers,URIs)的更多信息

注意:附录A旨在提供一个关于URIs的简要介绍。URIs的权威规范是RFC 2396 (http://www.isi.edu/in-notes/rfc2396.txt)[URIS (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-uri)],如需了解更多信息请参阅该文档。关于URIs的补充论述可以在下列地址处获得:Naming and Addressing: URIs, URLs, … (http://www.w3.org/Addressing/) [NAMEADDRESS (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-nameaddress)]。

2.1节 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#basicconcepts)所述,Web提供了一种通用形式的标识符——统一资源标识符(Uniform Resource Identifier) (http://www.isi.edu/in-notes/rfc2396.txt)(URI), 用于标识(命名)Web上的资源。与URLs不同,URIs并不局限于标识有网络位置或使用其它计算机访问机制的资源。已有许多不同的URI方案(URI scheme)被开发并正在用于不同用途,比如:

  • http: (超文本传输协议(Hypertext Transfer Protocol[译注:简称HTTP]),用于标识网页)
  • mailto: (email地址),例如mailto:em@w3.org
  • ftp: (文件传输协议(File Transfer Protocol[译注//简称FTP]))
  • urn: (统一资源名称(Uniform Resource Names[译注:简称URN]),用于标识永久与位置无关的资源),例如urn:isbn:0-520-02356-0(标识一本书)

现有URI方案(URI schemes)的列表可在Addressing Schemes (http://www.w3.org/Addressing/schemes.html) [ADDRESS-SCHEMES (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-address-schemes)]获得。一个不错的想法是考虑在各种专门的标识用途中利用现有URI方案,而不是试图创造一种新的方案。

URI由谁创建和如何使用并不是由某个人或组织控制的。然而某些URI方案(比如URL的http:) 要依赖于集中式系统(比如DNS),而其它一些方案(比如freenet:)则是完全分散式的。这意味着,如其它类型的名称一样,人们不需要特别的权威或权限来为事物创建URI。而且,任何人都可以创建URIs来引用不为他们所拥有的事物,就像在日常语言中任何人都可以用任何他们乐意的名称来称呼不为他们所有拥的事物一样。

2.1节 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#basicconcepts)所谈到的,RDF使用URI引用(URI references)[URIS (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-uri)]来命名RDF陈述中的主体、谓词和客体。一个URI引用(或简称URIref)是一个可以在末尾附加(也可以不附加)片段标识符(fragment identifier)[译注//片段标识符这一术语有历史渊源,它的实际作用也许并不是标识某个片段。]的URI。举例来说,URI引用 http://www.example.org/index.html#section2 包含了URI http://www.example.org/index.html 和(以“#”字符分隔的)片段标识符Section2。RDF URIrefs中可以包含Unicode [UNICODE (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-unicode)]字符(参见[RDF-CONCEPTS (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-rdf-concepts)]),以允许在URIrefs中使用多种语言。

URIrefs可以是绝对的(absolute)相对的(relative)。一个绝对(absolute)URIref是对一个与URIref所在上下文无关的资源的引用,例如URIref http://www.example.org/index.html。相对(relative)URIref是绝对URIref的一种简略记法,其中略去了绝对URIref中的部分前缀。被略去的部分需要通过相对URIref所在上下文中的信息获得。例如,当相对URIref otherpage.html 出现在资源 http://www.example.org/index.html 中时,它所对应的绝对URIref为 http://www.example.org/otherpage.html。 一个没有URI部分的URIref[译注//即一个不含任何字符的URIref(空URIref)或一个只包含片段标识符的URIref]被认为是对当前文档的引用(即它所在的文档)。于是,文档里的空URIref[译注//即不包含任何字符的URIref]等价于该文档自身的URIref;而一个只包含片段标识符(fragment identifier)的URIref等价于它所在文档的URIref加上该片段标识符。例如,在 http://www.example.org/index.html 里,如果 #section2 作为一个URIref出现的话,它将被看作等价于绝对 URIref http://www.example.org/index.html#section2.

[RDF-CONCEPTS (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-rdf-concepts)]中提到 RDF graphs(RDF的抽象模型)不使用任何相对URIrefs,即RDF陈述中的主体、谓词和客体(以及类型文字中的数据类型)的标识必须是与上下文无关的。然而,某个特定的具体RDF语法(比如RDF/XML)可以允许在某些情况下将相对URIrefs作为一种绝对URIrefs的简略写法。RDF/XML的确允许这样使用相对URIrefs,前面的一些RDF/XML示例已经说明了这一点。更多细节请参见[RDF-SYNTAX (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-rdf-syntax)]。

RDF和Web浏览器都使用URIrefs来标识事物,然而它们在解释URIrefs的方式上略有不同。因为在RDF中,URIrefs被用来标识事物,而浏览器还用URIrefs来获取事物。通常,这并没有经常有实际的区别,但在某些情况下区别是显著的。一个显而易见的区别是:当一个URIref被用在浏览器中时,它被期望标识某个可实际获取的资源,即某个确实位于该URI所标识的位置的资源。然而在RDF中,一个URIref可以被用来表示像人这样的不能在Web上获取的事物。人们在用RDF时有时会有这样的惯例:即当一个URIref被用于标识某个RDF资源时,人们习惯于在该URI所标识的位置放一个包含关于这个资源的描述性信息的页面,这样可在浏览器中用该URIref来获取信息。这在某些情况下,这是非常有用的,尽管它在原始资源的标识和描述它的Web页面(详见2.3节 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#structuredproperties))的标识的区分上造成了一些困难。然而,这一惯例在RDF定义中并没有被明确规定,RDF本身不假定URIref标识任何可获取的事物。

另一个区别是它们对带片段标识符的URIref的不同处理方式。在URLs(标识某HTML文档)中通常用片段标识符(fragment identifiers)来标识URL所标识文档中的某个特定位置。按正规的HTML用法,URI引用(URI references)是用于获取资源的,因此下面两个URIrefs:

 http://www.example.org/index.html
http://www.example.org/index.html#Section2

是相关的(它们都引用了同一个HTML文档,而第二个标识第一个中的一个位置)。但是正如前面谈到的,在RDF中,URI引用纯粹被用于标识资源,而不是获取资源,并且RDF也不假定上述两个URIrefs之间存在任何关系。就RDF来说,它们在语法上是不同的URI引用,因此它们可以引用着不相关的事物。这并不意味着由HTML定义的限制关系不存在,而只表明RDF不会仅根据URI引用的URI部分相同而假定它们之间存在某个关系。

就这一点再进一步地,RDF不假定具有相同前导字符串的URI引用(不论是否包含片段标识符)之间存在任何关系。例如,就RDF来说,下面两个URIrefs:

 http://www.example.org/foo.html
http://www.example.org/bar.html

没有特定的关系,尽管它们有共同的前导字符串 http://www.example.org/。 对于RDF来说,它们仅仅是不同的资源,因为它们的URIrefs是不同的。(尽管它们可能确实是位于同一目录的两个文件,但RDF不假定这一点或任何其他关系存在于它们之间。)



附录B:关于可扩展标记语言(Extensible Markup Language,XML)的更多信息

注意:附录A旨在提供一个关于XML的简要介绍。XML的权威规范是[XML (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-xml)],如需了解更多信息请参阅该文档。

可扩展标记语言(Extensible Markup Language) (http://www.w3.org/TR/2000/REC-xml-20001006)[XML (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-xml)]被设计为允许任何人设计他们自己的文档格式并依照该格式书写文档。像HTML文档(网页)一样,XML文档包含文本。文本主要由平凡文本内容(plain text content)和以标签(tag)为形式的标记(markup)的构成。标记使得处理程序可以解释各个内容片断(称作元素(elements))。XML内容和(在某些特例中)标签(tags)可以包含Unicode[UNICODE (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-unicode)]字符,以允许直接表达多种语言的信息。在HTML中,允许的标签集合以及它们的解释是由HTML规范定义的。而XML允许终于用户定义他们自己的标记语言(markup languages)(标签及标签可出现的结构),以满足在他们的特定需求(第3节 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#rdfxml)所描述的RDF/XML语言就是这样一种XML标记语言)。例如,下面这段简短的文字就是用一个基于XML的标记语言书写的:

 <sentence><person webid="http://example.com/#johnsmith">I</person> 
just got a new pet <animal>dog</animal>.</sentence>

以标签为界的元素(<sentence>,<person>等)反映了与这段文字相关的特定结构。这些标签允许理解这些特定元素以及它们的构造方式的程序正确地解释上面的文字。比如,本例中的一个元素是<animal>dog</animal>,它包含首标签<animal>、元素内容和一个相应的尾标签</animal>。这个animal元素以及person元素被嵌套在sentence元素中。如果按下面的方式来书写这个句子,也许嵌套体现得更为清楚(并更接近于某些将在后面出现的更"结构化的"XML):

 <sentence>
<person webid="http://example.com/#johnsmith">I</person>
just got a new pet
<animal>dog</animal>.
</sentence>

在某些情况下,一个元素可以没有内容。可以用两种方式来书写这样的元素:不在首、尾标签括起的部分写入内容,比如<animal></animal>,或者用被称作空元素标签(empty-element tag)的简写形式,比如<animal/>。

在某些情况下,首标签(或空元素标签)除了包含标签名称(tag name)以外,也可以包含限定信息(以属性(attributes)的形式出现)。例如,<person>元素的首标签包含属性webid="http://example.com/#johnsmith"(可能是标识被引用的那个人)。一个属性(attribute)包含名称、等号和值(用引号括起)。

这一具体的标记语言使用单词“sentence”、“person”和“animal”作为标签名称,以试图传达元素的某些含义;它们传达含义给懂英语的读者,或一个专门解释该词汇表的程序。然而,这里没有内嵌的含义。例如,对于不懂英语的读者或一个不理解这些标记的程序而言,元素<person>也许没有任何含义。以下面这段文字为例:

 <dfgre><reghh bjhbw="http://example.com/#johnsmith">I</reghh> 
just got a new pet <yudis>dog</yudis>.</dfgre>

对一个机器来说,这段文字和前面的例子有着完全相同的结构。然而,对于懂英语的读者来,他不会明白这段文字表达了什么,因为这里的标签不是英文单词。此外,别人也许已在他们的标记语言中使用了相同的单词,而具有完全不同的含义。例如,在另一个标记语言中“sentence”可能引用一个被定罪的罪犯必须在服役机构服役的时间。因此,必须提供附加的机制来帮助保持XML词汇的条理性。

为避免混淆,有必要对元素进行唯一标识。在XML中,这是通过使用XML命名空间(Namespaces) (http://www.w3.org/TR/REC-xml-names/)[XML-NS (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-namespaces)]实现的。一个命名空间(namespace)即一种标识部分Web(空间)的方式,它作为一个特定集合的名称的限定符(qualifier)。为一个XML标记语言创建命名空间是通过为它创建URI来实现的。通过使用命名空间的URI来限定标签名称,任何人都可以创建他们自己的标签,并正确地区分于别人创建的具有相同拼写的标签。一个时常被遵循的惯例是:创建一个网页来描述标记语言(以及其中标签的含义)并使用该网页的URL作为命名空间的URI。然而,这只是一个惯例,XML和RDF都没有假定一个命名空间URI标识的是一个可获取的Web资源。下面的例子展示了XML命名空间的使用。

 <user:sentence xmlns:user="http://example.com/xml/documents/">
<user:person user:webid="http://example.com/#johnsmith">I</user:person>
just got a new pet <user:animal>dog</user:animal>.
</user:sentence>

本例中,属性(attribute)xmlns:user="http://example.com/xml/documents/"为上述XML片段声明了一个命名空间。它将前缀(prefix)user映射到命名空间URI http://example.com/xml/documents/ 上。这样,XML内容可以使用限定名称(简称QNames)作为标签,比如user:person。QName以标识命名空间的前缀打头,后面紧跟一个冒号,然后是一个用于标签或属性名称的内部名(local name)。通过使用命名空间URIs来区分名称的分组,并用命名空间的URIs来限定标签(如本例中这样),就不必为标签名称冲突而担心了。两个拼写相同的标签仅当它们的命名空间URIs也相同时才被认为是相同的标签。

每个XML文档必须是良构的(well-formed)。这意味着XML文档必须满足许多语法条件,例如,每个首标签必须有一个与之匹配的尾标签,并且元素之间的嵌套必须是正确的(元素之间不能重叠)。[XML (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-xml)]定义了完整的良构条件集合。

另外,一个XML文档可以自由选择是否包含一个XML文档类型声明(document type declaration)。文档类型声明对文档的结构定义了附加的限制,并支持在文档中使用预定义的文本单元。文档类型声明(通过DOCTYPE引入XML文档)包含或指向定义了文档语法的声明。这个语法被称为文档类型定义(document type definition,简称DTD)。DTD中的声明指定了哪些XML元素(elements)和属性(attributes)可以在符合该DTD的XML文档中出现、这些元素和属性的关系(例如哪些元素可以嵌套在另一些元素中,哪些属性可以在另一些元素中出现),以及元素或属性是必须的还是可选的。文档类型声明可以指向文档外部的一组声明(称作外部子集,它们可被用来在多个文档间共享一些公用的声明),也可以包含直接在文档中出现的声明(称做内部子集),或者既包含内部子集也包含外部子集。一个文档的完整DTD是它的内部子集与外部子集的总和。例47 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example47)是一个带有文档类型声明的XML文档的简单例子:

例47:一个带有文档类型声明的XML文档

 <?xml version="1.0"?> 
<!DOCTYPE greeting SYSTEM "http://www.example.org/dtds/hello.dtd">
<greeting>Hello, world!</greeting>

本例中,文档仅有外部DTD子集,系统标识符(system identifier)[译注//系统标识符一词有其历史渊源,将它理解为一种标识符就可以了,不要对其中的“系统”二字产生误解。]为 http://www.example.org/dtds/hello.dtd 给出了它的位置(一个URIref)。

如果一个XML文档有与之关联的文档类型声明,并且符合该文档类型声明中的限制,则该XML文档是有效的(valid)。

一个RDF/XML文档仅需是良构的(well-formed)XML;它不用被验证是否符合某个XML DTD或XML模式(XML Schema),并且[RDF-SYNTAX (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-rdf-syntax)]也没有指定一个可用于验证RDF/XML的规范性DTD(但[RDF-SYNTAX (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-rdf-syntax)]在附录中为RDF/XML给出了一个非规范性的模式)。关于XML DTD语法的更详尽的讨论超出了本文档的范围。欲了解更多关于XML DTDs以及XML验证的信息,请参见[XML (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#ref-xml)]和众多关于XML的书籍。

然而,有一个XML文档类型声明的使用与RDF/XML相关的,并且是用在定义XML实体中。实际上,XML实体定义是将一个名称与一个字符串相关联。当实体名称在文档中的别处[译注//指除了它被定义的地方以外]出现时,XML处理器(XML processors)将用相应的字符串来替换该实体名称。这为长字符串(比如URIrefs)的书写提供了一种简略方式,并有助于增强XML文档的可读性。使用只包含XML实体声明的文档类型声明是合法的,并且有时是有用的,即使在文档不用被验证时(比如在RDF/XML中)。

在RDF/XML文档中,实体通常在文档内部声明,即只使用内部DTD子集(这样做的一个原因是RDF/XML不用被验证,而非验证的XML处理器不被要求处理外部DTD子集)。例如,在RDF/XML文档的开始部分提供如例48 (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/#example48)所示的文档类型声明将允许在文档中分别用&rdf;、&rdfs;和&xsd;作为命名空间rdf、rdfs和xsd所对应URIrefs的简写。

例48:一些XML实体声明

 <?xml version='1.0'?> 
<!DOCTYPE rdf:RDF [
<!ENTITY rdf "http://www.w3.org/1999/02/22-rdf-syntax-ns#">
<!ENTITY rdfs "http://www.w3.org/2000/01/rdf-schema#">
<!ENTITY xsd "http://www.w3.org/2001/XMLSchema#">
]>
<rdf:RDF
xmlns:rdf = "&rdf;"
xmlns:rdfs = "&rdfs;"
xmlns:xsd = "&xsd;">
...RDF statements...
</rdf:RDF>



附录C:改动

本文档仅对建议推荐标准版本(Proposed Recommendation version) (http://www.w3.org/TR/2003/PR-rdf-primer-20031215/)仅作了微小的编辑与排字上的改动。关于建议推荐标准版本(Proposed Recommendation version) (http://www.w3.org/TR/2003/PR-rdf-primer-20031215/)对更早版本所做的改动请参见它的改动记录 (http://www.w3.org/TR/2003/PR-rdf-primer-20031215/#changes).


rdf_metadata_button.40.gif (http://www.w3.org/TR/2004/REC-rdf-primer-20040210/metadata.rdf)



翻译后记

W3C RDF Primer推荐标准是一个重要的W3C规范,也是W3C RDF系列规范中一个内容相对简单、适于入门者阅读的文档。鉴于目前还没有系统学习RDF的中文文档,相信这个规范的中译文将帮助更多朋友深入了解RDF。RDF Primer推荐标准于2004年7月6日被确定列入W3CHINA.ORG开放翻译计划(OTP) (http://zh.transwiki.org/)的工作计划,并于7月8日在W3CHINA.ORG讨论区 (http://bbs.w3china.org/)发布了“关于启动翻译 W3C RDF Primer 的倡议” (http://bbs.w3china.org/dispbbs.asp?boardID=2&ID=8689)一文。该倡议得到了众多语义万维网研究人员的热情支持,翻译计划随即启动。

本文档翻译的顺利完成是团队协作的结果。翻译小组成员均为语义万维网领域研究人员,翻译分工如下:

章节 译者 校对
摘要 forwar(詹子鹏)
目录 admin(徐涵)
第一章 简介 admin(徐涵) orangebench(刘升平)
第二章 资源描述语句 forwar(詹子鹏) orangebench(刘升平)
第三章 RDF的XML语法 admin(徐涵) trevol(朱礼军)
第四章 其它RDF能力特征 orangebench(刘升平) npubird(汪鹏)
第五章 5.1-5.2 trevol(朱礼军) admin(徐涵)
第五章 5.3-5.5 orangebench(刘升平) admin(徐涵)
6.1 都柏林核心元数据计划 Ontoweb orangebench(刘升平)
6.2 PRISM forwar(詹子鹏) orangebench(刘升平)
6.3 XPackage weekend(暴雨) orangebench(刘升平)
6.4 RSS 1.0: RDF Site Summary trevol(朱礼军) monbit(张钋)
6.5 CIM/XML nybon(倪跃) orangebench(刘升平)
6.6 基因本体联盟 nybon(倪跃) orangebench(刘升平)
6.7 设备能力与用户偏好描述 orangebench(刘升平) admin(徐涵)
第七章 RDF规范相关文档 admin(徐涵) orangebench(刘升平)
附录 admin(徐涵) orangebench(刘升平)
致谢 trevol(朱礼军)
统稿 trevol(朱礼军)



Npubird(汪鹏)、Monbit(张钋)等人参加了多个章节的初审。由于RDF Primer中有大量的新词汇,译者力求精准,但是难免会有错误发生,欢迎您发表任何意见.请访问 http://bbs.w3china.org/dispbbs.aspboardID=2&ID=8689 (http://bbs.w3china.org/dispbbs.aspboardID=2&ID=8689)

2006年03月14日

转自:http://ir.hit.edu.cn/cgi-bin/newbbs/topic.cgi?forum=20&topic=54

语义网
一种能让计算机理解的新型Web内容形式,将引发对新的未知可能性的探索

作者: TIM BERNERS-LEE, JAMES HENDLER and ORA LASSILA    

语义网概述
至今为止,WWW大部分都被用作为人们服务的文档媒体,而不是能够自动控制的信息。为网页扩展面向计算机的数据,并且增加专为计算机使用的文档,我们就可以把Web变成一个语义网络。

 

计算机会根据关键名称定义的超链接和逻辑推理规则发现语义数据的含义。这种基础设施的最终结果就是能够刺激开发自动化的网络服务,例如强大的代理。

普通用户能够用现成的有语义标记功能的软件编写语义网页,增加新的定义和规则。
电话铃响时, 屋里的音响正大声播放着甲壳虫的“We Can Work It Out”。 彼得拿起电话,电话给带音量控制的本地设备发出信号,音乐声降低了。彼得的姐姐露西正从医生的办公室打来电话:“妈妈需要找一位专家看看, 然后得进行一系列的理疗,大约是两周一次。我会让我的代理来安排这些预约的。” 彼得立刻同意帮忙开车接送。

在医生的办公室里,露西在手持网络浏览器上给她的语义网络代理下指令。代理立即从医生的代理处查到了妈妈的治疗处方,在诊所清单中进行查找,从中找出那些在母亲家方圆20英里的范围内,在信用评级服务中评级为出色或很好,在母亲的保险计划范围之内的诊所。然后,它尝试将可能的预约时间(由各家诊所通过其网页提供)和彼得及露西的繁忙的日程进行匹配。(以红色字体标出的字表明它们是通过语义网络来给代理定义其语义或含义的。)

几分钟之后,代理给他们提供了一个方案。彼得对此不太满意。从母亲家到这个医院要横穿整个城镇,而他从医院返回的时间又恰好是交通高峰时间。他设置了更多的时间和地点方面的限制,让自己的代理重新进行搜索。在这个任务的执行过程中,露西的代理充分信任彼得的代理。

几乎一瞬间,新的方案又出来了:医院离家近了,时间也提前了。但是,同时有两点警告。首先,彼得要重新安排他的一些不太重要的预约。彼得查了一下,没什么问题。另一点是,这家医院不在保险公司的理疗医院的清单上。代理为解除彼得的顾虑,说, “通过其他方式,可以保证予以确认服务类型和保险计划,需要细节内容吗?”

彼得表示同意,“给我提供所有的细节”。几乎同时,露西也登记表示赞同,事情就这么定下来了。(当然,彼得为了了解细节安排,晚上又让代理解释它怎么找到那家诊所的,因为那家并不在通常的清单上。)

表达含意
彼得和露西能够通过代理执行这些任务,不是靠今天的World Wide Web,而是得益于将来由此演变而来的语义网。大部分今天Web上的内容是设计给人阅读的,而不是让计算机程序按其意义进行操作的。计算机能熟练地解析网页的版面,知道哪里是标题,哪里有与其他页面的链接。但是,一般来说,计算机没有可靠的方法来处理语义,比方说能告诉我们:这是Hartman and Strauss 诊所的网页,它能连接到Hartman医生的简历。

语义网将结构赋予网页上有意义的内容。在这样的环境下,漫游于各个页面之间的软件代理就能容易地为用户完成一些复杂的任务了。到达医院网页的代理将不仅知道存在类似“治疗、药物、体格检查”的关键字,还知道Hartman医生周一、周三、周五在这家医院上班,脚本程序对日期范围采用年月日格式,并按此格式返回预约时间。另外,无需高性能的机器和人工智能,它就能“知道”所有这些情况。这些语义是由医院办公室主任编码在网页中的。他并未学习过基本的计算机科学课程,他只是使用市场上的软件,利用理疗协会网页的资源,自己完成的。

语义网并非独立的另一个Web,而是现在的Web的一个延伸。在其中,信息有定义完好的含意,更利于人机之间的合作。将语义网融入现在Web结构的初步努力已经在进行中了。不久的将来,当机器有更强的能力去处理和“理解”现在它仅仅进行显示的数据时,我们将看到很多重要的新功能。

World Wide Web本质的特性便是其广泛性全球性。超文本链接的威力在于“任何事物之间都可以相链接”。因此,无论是潦草的草稿,还是精致的作品,无论是商业信息还是学术内容,无论何种文化和语言,网络技术对它们都应该是一视同仁的。信息在各个方面有所不同,其中的一个区别就是,有些信息是主要提供给人使用的,而有些则主要是给机器用的。比如,电视广告、诗歌主要是给人看的,而数据库、程序和传感器输出等主要是供机器读的。到目前为止,Web大多数开发成为人们阅读文档的媒体,而在提供可自动处理的数据和信息方面,则发展较慢。语义网就是想弥补这方面的不足。  

和Internet一样,语义网将尽可能分散化(Decentralize)。这种类似Web的系统能够在各个层次产生大量令人激动的事物,包括从大企业到个人用户,能够提供今天还不能或很难预见的好处。分散化需要一定的妥协:应当抛弃网络互联必须保持完全一致性的想法,因为那样可能动不动就跳出那句声名狼藉的“错误 404:网页没有发现”。而允许一定的不完全一致性,网络的相互链接数目会呈指数性增长。

知识表现
为使语义网工作,计算机必须能访问结构化的信息集合以及一套推理规则,据此进行自动推理。在Web被开发出之前很久,人工智能研究人员就已经研究过这样的系统。这个技术通常称为知识表现,和Web出现之前的超文本的境地类似:它的确是个好主意,也有一些非常好的范例,但是它还无法影响和改变世界。它蕴含了能产生重要应用的种子,但是要充分发挥其潜能,它必须和一个全球系统联系在一起。


今天的Web搜索

传统的知识表现通常是集中化的, 要求每个人对于共同的概念,如“父母”和“汽车”,使用完全一样的定义。但是,集中化控制比较死板,而且这种系统的规模和范围增长过快,很快会变得难以管理。

除此之外,这些系统往往小心地对允许问的问题加以限制,这样计算机才能给与可靠的回答。问题就像数学中的哥德尔理论:任何足够复杂的系统如果是可用的,就必然存在不可解决的问题。 也就像那个最基本的悖论的复杂版本: “本句话是错误的。” 为避免此类问题,传统的知识表现系统通常各自都有针对数据作推理的一套有限和特殊的规则。例如,一个基于家庭数据库的家谱系统,可能包含规则“叔叔的妻子是婶婶”。即使数据可以由一个系统传到另一个系统,规则则不然,由于规则所处的环境完全不同了,它往往不能运用到另一个系统中了。

相反,语义网的研究者认为要获得多样性,必然会有自相矛盾的情况或无法回答的问题出现。描述规则的语言要尽量具有表达力,让Web能尽可能广泛地进行推理。这个思想和传统的Web相似:在Web开发的早期,恶意批评者指出它永远无法是一个组织良好的库; 没有集中的数据库和树状结构,人们无法确保找到任何东西。 他们曾经是正确的。但是,系统的表现能力使我们能获得大量的信息,而搜索引擎(十年前看起来不切实际)现在能从中对许多材料产生出非常完整的索引。因此,摆在语义网面前的挑战是,提供一种语言,能同时表达数据以及根据数据进行推理的规则,并且允许任何现存的知识表现系统中的规则都能输出到Web上。

在Web上增加逻辑性—— 使用规则去推理、选择行为的步骤并回答问题的方法—— 是语义网组织面临的一个任务。 这个任务涵盖了数学和工程化决策,使其更加复杂。逻辑必须强大到能够描述复杂的对象属性,但也不能太复杂,导致代理可能被一些悖论的问题问倒。幸运的是,通常我们大部分想表达的意思就像“六头螺钉是一种机器螺钉”这样的句子,稍加一些词汇表,用现在的语言就能将其表达出来。

开发语义网的两个重要技术已经就绪,它们是eXtensible Markup Language (XML) 和 Resource Description Framework (RDF)。 XML让每个人都能创建自己的标签,例如、 ,来对网页或页面的部分文字进行注释。 脚本,或者说是程序,可以将这些标签运用到复杂的应用中,不过程序编写者必须知道网页作者是如何使用每一个标签的。简而言之,XML允许用户在文档中加入任意的结构,但无需说明这些结构的含意 [见 "XML 和第二代Web," by Jon Bosak and Tim Bray; Scientific American, May 1999]。


——————————————————————————–

语义网能使机器理解含语义的文档和数据,而不是语音和笔迹。


——————————————————————————–


含意由RDF来表达。RDF中的代码包含一组组的三元组,每个三元组相当象句子中的主语、动词和宾语。这些三元组可以用XML的标签来描写。在RDF中,文档中的声明通常是某个事物(人、网页或其他任何东西)对于某些值(另一个人、另一网页)拥有某些属性(例如“是姐姐”,“是作者”)。这种结构用于描述由机器处理的大量数据,是非常自然的方法。如同使用网页上的链接一样,主语和宾语分别由Universal Resource Identifier (URI)识别。(URL, Uniform Resource Locators, 是最普通的URI。) 动词也由URI识别,这样任何人只要通过在Web上定义一个URI,就能定义新概念、新动词。

一词多义使人类语言变得丰富,对自动处理而言却不是什么好事。想象一下,我雇了小丑信使服务,叫他们在客户生日的那天送去气球。但是,当服务将我的数据库中的地址传到它的数据库中时,并不知道我这里的“地址”指的是开票地址,大部分都是邮局信箱号码。结果,我雇的小丑去逗邮局工人们乐了,当然这并不是坏事,但是我最初的意图并非如此。 要解决这个问题,可以给每个概念应用不同的URI。这样,邮寄地址、开票地址等等都可以互相区分开。

三元组RDF 构成相关事物的网上信息。RDF使用URI 来对文档中的信息进行编码,而URI能够确保概念并非只是文章中的词,还能将其和人人都能在网上找到的一个唯一定义相联系。比方说,假设我们可以访问到人们的许多信息,包括他们的地址。如果我们要寻找住地位于特定邮政编码的人,我们需要知道哪个数据的哪个字段分别代表姓名和邮编。通过URI, RDF能这样声明“(field 5 in database A) (is a field of type) (zip code)”,而不必描述每个名词。

本体论(Ontology)
当然,事情并未到此结束。因为两个数据库可能对同一概念,例如邮政编码,采用不同的标识符,程序若要进行两个数据库之间信息的比较和合并,它就必须了解这两个标识符表示的是同一事物。在理想的情况下,对于遇到的任何数据库,程序必须有办法来发现这种同意的标识符。

对该问题的一个解决方法就是语义网的第三个基本组成部分,信息的集合(Collection),称为ontology。在哲学上,ontology是有关存在的本质,以及何种事物存在的理论,这是它作为一门学科所研究的理论。人工智能和网络研究人员共同选择了这个词作为术语。在他们看来,ontology 是一份正式定义名词之间关系的文档或文件。一般Web上的ontology包括分类和一套推理规则。

分类定义对象的类别及其之间的关系。例如,地址可以定义为属于一种位置的类型,城市代码可以定义为仅用于位置,等等。类、子类,实体间的关系对于网上应用是非常强大的工具。 通过给类指定属性,允许子类继承类的属性,我们能够表达实体之间的大量关系。如果城市代码必须属于城市类型,而城市通常有自己的网址,那么即使没有数据库直接将城市代码和网址相连,我们也能讨论与城市代码相关的网址。

Ontology中的推理规则提供进一步的功能。一个ontology可能表达如下的规则:“如果城市代码属于某一州代码,而一个地址使用了城市代码,则该地址具有相应的州代码。”程序便能据此进行推理,比方说,Cornell大学位于Ithaca, 则它一定在纽约州,而纽约州属于美国,所以它的地址应该遵照美国的标准。计算机并不会真正“理解”这些信息,但是它现在能以对人类更有用更具意义的方法来对这些名词进行操作了。  

随着网上出现ontology页面,对于名词及其它的一些问题的解决办法初露端倪。网页上使用的名词或XML代码的含意,能够通过由页面指向的ontology来定义。当然,如果我指向的ontology定义地址包含邮编,而你指向的ontology定义地址包含邮政编码,和以前同样的问题仍存在。如果ontology(或其他网上服务)提供相等关系:我们俩的ontology中的一个或两个,说明我的邮编等同于你的邮政编码,则这种混淆也是可以解决的。

派小丑去为客户服务的计划已经可以部分解决了,只要两个数据库指向对地址的不同定义。程序中不同的地址概念应用不同的URI,将不会将它们混淆,而且会进一步发现它们实际上是有联系的。程序然后能应用某种服务,就一些“邮政编码”(在第一个ontology中定义),通过重新组织和删除邮箱号及其他不合适的地址,能转换为实际的地址(第二个ontology)。ontology所提供的结构和语义能让企业家更容易地提供这样一种服务,并使之对使用者完全透明。

Ontology通过许多方法增强网络的功能。通过简单的方法,它们就能改进网上搜索的准确性,使搜索程序只寻找那些指向精确概念的网页,而不是仅仅通过模糊关键字查到的所有页面。更高级的应用将使用ontology将页面上的信息关联到相关的知识结构和推理规则,这样的例子可见http://www.cs.umd.edu/~hendler 。在该网页上,你将看到题为"Dr. James A. Hendler." 的普通页面。作为人,我们能很快看到通过链接找到的一份简短的简历,知道Hendler 在布朗大学获得博士学位。计算机程序也试图查找这样的信息,然而,让它猜测在简历中的这个信息是什么意思,让它懂得其中的语言,是非常复杂的。

对于计算机,该页面链接到定义计算机科学系有关信息的ontology页面。比如教授在大学工作,他们通常有博士学位。网页上的进一步Markup (一般的浏览器不显示)使用ontology的概念来指明:Hendler 从URI http://www.brown.edu/ (布朗大学网页)描述的实体处获得其博士学位。计算机也能发现Hendler是一个特别研究项目的成员,有一个特别的email 地址,等等。所有这些信息都能由计算机处理,可以用来回答询问(例如,Dr. Hendler 从哪里获得学位),这类询问如果由人来查,在搜索引擎不同的网页间要查上好一阵子。

这个Markup 能更便于开发程序来回答一些复杂的问题,而其答案不在单独一个网页上。假设你想找找去年在贸易洽谈会上遇见的Cook小姐,你不记得她的名,但是你知道她为你的一个客户工作,而且她的儿子是在你的母校就读。智能搜索程序筛选出所有含人名“Cook”的人的网页(不选所有有关Cooks, Cooking ,Cook岛等的网页),找到其中为你的客户之一工作的,然后通过其子女的链接,看他们是否在正确的地点上学。

代理

代理

当许多程序被开发用来从不同的资源收集网页内容,处理信息和其他程序交换结果,将真正实现语义网络的力量。当出现更多的机器可读的网页内容和自助服务(包括其他的代理),这种软件代理的效率将呈指数级增长。语义网络提倡这样的协同作用,即使各代理之间并非明确设计为在一起工作,当数据随语义到达时,代理之间也能传送数据。

代理功能的一个重要方面是由语义网络的统一语言所写的“Proof”的交换,该语言通过应用规则和信息(如ontology中所指定的)表达逻辑推理。比如,某个在线服务找到了Cook 小姐的联系信息,而令人惊讶的昵她在Johannesburg。当然,你要核对一下,所以你的计算机让服务来证明它的回答,服务立即将其内在的推理理由翻译成语义网络的统一语言,你计算机中的界面引擎证实了这个Cook 女士确实符合你的查询要求,如果你还有疑问,它能显示出相关的网页。尽管离真正发挥语义网络的潜能还很远,已经有一些程序可以按这种方法利用目前的统一语言初级版本来交换“证明”。

另一个重要的特性将是数字签名。数字签名是一段加密的数据,计算机和代理可以据此证明所附的信息是由特定的可靠来源提供。当你的会计应用程序收到一条信息,说明你欠某个在线零售商一定的金额,你当然想证明这是确实的,而不是由邻家那个黑客小子发来的假信息。代理应该对在语义网上读到的声明保持警觉,检查确认其信息来源之后才能相信。 (我们希望更多的人学会在网上这样操作!)

在没有语义的情况下,现在已经存在了许多自动的网上服务, 但是如果没有语义,其他一些程序,例如代理,则无法对执行某个特定功能的服务进行定位。这个过程称为服务发现,它的实现需要存在一种共同的语言来描述服务,让其他的代理都能“理解”该服务的功能并知道如何利用其功能。服务和代理可以宣传它们的功能,比方说,将这些功能描述放到类似于黄页的目录下。

目前有一些低层的服务发现的方案,例如,微软的Universal Plug and Play, 它专门用于连接不同类型的设备,还有Sun Microsystems的Jini,它的目的在于连接服务。但是,这些尝试仅仅是在结构或句法的级别上解决问题,较多地依赖于对一些事先确定的功能描述的标准化。标准化这个方法能达到的功能也就到此为止了,因为我们无法预见未来所有的需求。


——————————————————————————–

经过正确设计,语义网络能够从整体上帮助人类知识的进化。


——————————————————————————–


相反,语义网则灵活得多。通过交换ontology,这之中提供了讨论中需要的词汇,消费者和生产者的代理之间能达成共同的理解。当发现新的ontology时,代理甚至可以“提升”出新的推理能力。语义的应用也更易于去利用仅仅部分符合请求的服务。

通常的处理过程将涉及“价值链”的建立,信息的各个组成部分从一个代理传向另一个代理,每个代理都对其“增加价值”,以构成用户所要求的最终产品。别搞错:要按需建立复杂的价值链,一些代理除了语义网之外,还将利用人工智能技术。然而,语义网将为此类技术更为可行提供基础框架。

综合以上所有特性,就能实现本文最初提到的彼得和露西的代理实例。他们的代理将任务细分,分配给服务广告中找的其他服务和代理。例如,它们可以通过可靠的服务获取诊所清单,决定它们中的哪些符合特定的保险计划和治疗方案。诊所清单也可以由其他搜索服务提供。这些活动构成了一条链,大量在网上传播的(几乎没有什么费用)数据逐步筛减为彼德和露西所需的少量数据,以满足他们的日程安排和其他一些要求。

下一步,语义网将要突破虚拟的理论世界,延伸到实际应用中去。 URI能指向任何事物,包括物理实体,意味着我们能使用URI语言来描述诸如电话、电视机等设备。 这些设备可以将它们的功能加以宣传。它们能做什么,软件代理等如何对它们进行控制。这样的语义解决方案较Universal Plug and Play等的低层方案更为灵活,它打开了一扇通往更多神奇的可能性的门。

例如,现在的家庭现代化需要仔细对各个设备进行配置,以使它们协同工作。如果存在设备功能的语义描述,将帮助我们用最少的人工干预就实现自动化。一个小小的例子便是,当彼得答电话时,音响的音量自动调低了。对于音量控制这个功能,不需要为每个设备都一一编程,只要对该功能编码一次,就可以应用到所有宣布带有音量控制的本地设备,如电视机、DVD机,甚至是晚上带回家只用上一次的媒体播放器。

在这一领域,已经采取了第一步的具体行动,即对设备的功能(如屏幕大小)描述研究开发一个标准和用户喜好。该标准建立于RDF之上,称为Composite Capability/Preference Profile (CC/PP)。最初,它将让电话以及其他非标准的网上客户描述它们的特性,这样网上内容就可以按照它们的功能进行剪裁了。之后,当增加处理ontology和逻辑的语言完全多样性后,设备将能自动挑选出并使用服务和其他设备,来增强功能或增加信息。不难想象,有一天,你家的微波炉会向冷冻食品生产商的网址咨询最佳烹饪参数。

知识的进化

精确搜索

语义网并不“仅仅”是执行单个任务的工具。如果设计合理,语义网还能从整体上帮助人类知识的发展。

人类的努力都无外乎这样一个永远的矛盾:那就是小部分人独立高效行动,但是又必须融入更大群体。一小部分人能迅速有效地进行创新,不过这就产生了一个小团体,它的概念其他人无法理解。在一个大群体中进行协调,不但慢,而且需要大量的交流。世界就在这两个极端之间忙碌着,把小团体中的个人想法,逐步推向更广的范围,让更多的人随着时间的推移而逐步理解。  

一个基本的过程就是,当需要一种更通用的语言时,将一些亚文化加以整合。两个团体通常各自独立开发了非常相似的概念,对它们之间的联系加以描述带来不少好处。就像英汉字典或度量对照表,关系能疏通交流和协作,即使概念的共性未能达成一个共同的名词。

在语义网中,每个概念由URI定义,任何人花最少的功夫就能表达他们发明的新概念。它的统一逻辑语言将这些概念逐步连到全球的Web上。这样的构架将人类的知识和工作开放给软件代理进行有意义的分析,为我们提供一起生活、工作、学习的新工具。


——————————————————————————–

参考信息:

Weaving the Web: The Original Design and Ultimate Destiny of the World Wide Web by Its Inventor.
Tim Berners-Lee, with Mark Fischetti. Harper San Francisco, 1999.
An enhanced version of this article is on the Scientific American Web site, with additional material and links.

World Wide Web Consortium (W3C): www.w3.org/

W3C Semantic Web Activity: www.w3.org/2001/sw/

An introduction to ontologies: www.SemanticWeb.org/knowmarkup.html

Simple HTML Ontology Extensions Frequently Asked Questions (SHOE FAQ): www.cs.umd.edu/projects/plus/SHOE/faq.html

DARPA Agent Markup Language (DAML) home page: www.daml.org/


——————————————————————————–

作者简介

TIM BERNERS-LEE, JAMES HENDLER 和 ORA LASSILA 致力于语义网技术。Berners-Lee 是World Wide Web Consortium (W3C) 的理事,以及麻省理工学院计算机科学实验室的研究员。他在1989年发明了Web,当时他就希望能够包含更多语义技术。

Hendler 是马里兰大学的计算机科学教授,多年来致力于Web上下文知识表现的研究。他和他的研究生团队开发了SHOE, 也是第一个基于Web的知识表示语言,展示了本文中描述的大部分代理功能。Hendler 还在阿另顿国防高级研究项目所负责基于代理的计算研究。

Lassila 是在波士顿的诺基亚研究中心的研究员,也是诺基亚风险基金的曜席科学家,以及W3C顾问组成员. 正因为看到今天Web上建立代理和自动化任务的困难之处,他才参与创建了W3C的RDF规范,这个规范对今天众多语义网络研究奠定了基础。