2006年08月31日

 

 

2006年08月16日

www.putclub.com (bbs.putclass.com)

一个不错的网站,上面有大量的英语学习资料,可以练习听力。

另外可以在上面下载语音复读机,下面是它的界面,简单易用,花20RMB,就可以注册啦,当然不注册也不影响正常的使用。

还有大量语音学习资料。找了好久的日语学习资料居然就在上面。

 

 

2006年08月03日

本体研究及其应用进展

李健康, 张春辉

本文从本体论的概念演变、理论体系研究、相关标准、研究应用情况及其发展前景等方面做一概要性介绍。

1  本体论概念演变

简单介绍了,本体的演变过程。并介绍了由Gruber 提出的: “ 本体是概念化的明确的规范说明Studer 对本体诸多定义进行概括分析后认为, 本体论的概念包括四个主要方面:

(1) 概念化(conceptualization) : 客观世界现象的抽象模型, 其表示的含义独立于具体的环境状态;

(2) 明确(explicit) : 概念及它们之间联系都被精确定义;

(3) 形式化(f ormal) : 精确的数学描述, 计算机可读;

(4) 共享(share) : 本体中反映的知识是其使用者共同认可的, 是相关领域中公认的概念集, 它所针对的是团体而不是个体。

然后给出了自己的定义:

尽管定义有很多不同的方式, 但是从内涵上来看, 不同研究者对于本体的认识是统一的, 都把本体当作是领域(可以是特定领域的, 也可以是更广的范围) 内部不同主体(人、机器、软件系统等) 之间进行交流(对话、互操作、共享等) 的一种语义基础, 即由本体提供一种明确定义的共识。这种共识的目标主要是为机器服务。

2 可控词表、分类法、叙词表、元数据、元模型、本体等之间的差别

首先探讨了它们的共同特点。然后介绍了它们之间主要的区别。

2.1   控制词表(Control Vocabulary)

指预先设定的用来描述特殊信息资源的可接受的词的列表。

2.2 分类法( Taxonomy)

是广泛规定的分级的科学。信息科学采用该概念将信息有序化、系统化的分级进行相似特征群组的类聚。

2.3 叙词表( Thesaurus)

叙词表又称为主题词表, 它是一种语义词典, 由术语及术语之间的各种关系组成, 能反映某学科领域的语义相关概念。

2.4元数据

2.5元模型

2.6 本体

本体的目标是促进机器之间或机器与人之间的交流, 而可控词表、分类法、叙词表主要是规范人与人之间的知识交流。

3  本体论相关理论

3.1 本体的描述语言

介绍了一些本体的描述语言。

3.2   本体描述方法或建模元语

Perez 等用分类法组织分析已有本体, 归纳出5 个基本的建模元语(Modeling Primitives), 即一个完整的本体应该具有5 个部分: (classes) 或概念(concepts) 、关系(relations) 函数(functions)、、 公理(axioms)、实例(instances)

3.3 本体分类

Guarino 以详细程度和领域依赖度两个维度作为对本体划分的基础, 详细程度高的称作参考(reference) 本体, 详细程度低的称为共享(share) 本体。依照领域依赖程度, 可以细分为顶级、领域、任务和应用本体等4 : 顶级本体、领域本体、任务本体、应用本体。

另外, 根据主题可分为知识表示本体、通用本体、领域本体、术语本体和任务本体; 根据形式化程度分为完全非形式化、结构非形式化、半形式化、形式化的本体。

3.4  构建本体方法论

Gruber 1995 年提出的5 条构建规则: 明确性和客观性、完全性、一致性、最大单调可扩展性、最小承诺。

3.5 本体的评估

当前对构造本体的方法及方法的性能评估还没有一个统一的标准, 因此, 还是一个需要进一步研究的方向。

3.6 本体的用途

构建一个本体可以解决以下问题: 在用户间或软件代理间达成对于信息组织结构的共同理解和认识、可以复用专业领域知识、使专业领域内的假设变得更加明确、从操作性知识中分离出领域知识、分析专业领域的知识。

4  本体相关描述语言

2004 2 10 , W3C 发布了支持语义网的两个技术标准: 资源描述语言( 修订版) ( Resource Description Framework , RD F) Web 本体语言(Web Ontology Language , OWL)

4.1 XML

简介,优点,缺点。

4.2 RDF RDF. Schema 概述

RDF 定义了一种用以描述资源及其相互关系的简单模型,RDF 通过属性和值描述了资源以及资源之间的关系, 但并没有提供描述这些属性及属性间关系的机制。RDF. Schema 提供了这种表达机制。

4.3 XML RDF 的结合及其不足〔

XML RDF 在处理语义上存在的问题是:

同一概念可有多个词汇表示;

同一个词汇有多种概念(含义)

4.4   OWL 概述

OWL 目前是本体的标准描述语言。

OWL 分三个子语言:OWL Lite OWL DL OWL Full

然后就:相应功能简介、用户在选择使用哪种语言时的主要考虑、这三种子语言与RDF 的关系等问题进行了论述。

 

5  本体论的研究和应用

研究热点具体体现了三个方面: 理论深化研究; 信息系统中的应用,主要包括处理信息组织、信息检索和异构信息系统互操作问题; 本体作为一种能在知识层提供知识共享和复用的工具在语义网中的应用。

5.1 本体论理论研究

5.1.1 本体概念研究

5.1.2 本体构建研究

5.1.3  本体映射研究

5.1.4 本体进化研究

5.2 本体在信息系统中的应用

5.3 本体和语义网

首先介绍了语义web的一些基本概念。然后提出,本体主要有如下几个方面的应用:  电子商务网站、搜索引擎、Web 服务。

5.4 本体论在数字图书馆中的应用发展

5.4.1 应用案例

5.4.2 图书馆面临的挑战

5.4.3 应付挑战的策略

本体要想得到广泛运用,就需要一个描述本体以便进行信息交换的标准语言,即本体描述语言。RDFSOILDAML+OILOWL都是本体描述语言,其中OWL是语义Web发展过程中的一个重要的里程碑,它已经经过广泛的讨论并得到比较一致的认可。

本体描述语言的发展

 

                          图   本体语言的发展

DAML-ONT[1]是由美国DAML(DARPA Agent Markup Language)委员会支持下开发的本体描述语言,它与RDFS紧密耦合,缺乏充分的语义规范;与此同时,欧洲信息技术委员会资助项目On-To-Knowledge研究设计了另一个用于万维网的本体描述语言OIL[2](Ontology Inference Layer)DAML+OIL是上述两个组织协商的产物,它在DAML-ONT的基础之上,结合OIL的语言组件发展而成。W3C总结了上述几种语言的开发经验,于20042月正式推出OWL[3] (Web Ontology Language)OWL是语义网发展过程的里程碑,它经过了广泛的讨论,并得到了比较一致的认可。

 




[1] DAML-ONT Initial Release. 官方网站:  http://www.daml.org/2000/10/daml-ont.html

[2] An Informal Description of Standard OIL and Instance OIL.  http://www.ontoknowledge.org/oil/downl/oil-whitepaper.rdf

[3] Deborah L.McGuinness, Frank van Harmelen. OWL Web Ontology Language Overview, W3C Recommendation 10 February 2004, online: http://www.w3.org/TR/owl-features/, 2006-4-14.

 

ontology研究综述 

邓志鸿  唐世渭   北京大学计算机系

0  引言

1 ontology

1.1  ontology定义

概括介绍了ontology的定义。首先从哲学,人工智能上予以了介绍,然后介绍了Gruber,Borst,Studer等人给出的定义。重点介绍了,Studer给出的定义,包括四层:概念模型,明确,形式化,共享。

1.2 ontology的建模原语

提出Perze提出的5个基本的建模原语。类,关系,函数,公理,实例。

给出了上述5个建模原语的基本定义,然后介绍了关系的类型:partofkindofinstanceofattributeof。并对上述四种类型进行了基本的解释。

1.3 ontology与语义网络

主要介绍了他们二者之间的区别。

1.4 ontology描述语言

ontology的表示方式:非形式化,半非形式化,半形式化,形式化语言。

描述:ontolinguacyclloom等。

并对描述的三种方式进行了简单的介绍。

1.5 已有的ontology及其分类

介绍了广泛使用的5个:wordnetframenetgumsensusmikrokmos

介绍了guarino关于ontology的分类:顶级(toplevel),领域(domain)、任务(task)、应用(application)。并对每个分类进行了详尽的解析。

随后简单介绍了perezbenjamins的细分,分为10类。

1.6  构造ontology的规则

介绍了gruber提出的5条规则:

明确性和客观性,完全性,一致性,最大单调可扩展性,最小承诺。

2 ontology的研究与应用

三类:理论上的研究、在信息系统中的应用、在语义web中的应用。

2.1 ontology的理论研究

概念及概念的分类,ontology上的代数,有代表性的是guarino等人对概念及其分类进行的研究工作。

概念分类理论的基础是概念的元特性。

基本的元特性包括:持久特性,非持久特性,反持久特性,半持久特性,载体表识特性,支持标识特性及外部依赖特性。

2.2 ontology在信息系统中的应用

首先介绍了信息检索的方式:全文检索,数据检索,知识检索。

然后提出了基于ontology的信息检索的基本设计思想。

介绍了信息检索的著名项目:(ontoagentontobrokerskc

2.3 ontology与语义web

首先介绍了语义web的层次。

然后介绍了xml的一些基本概念,提出了元数据的概念,并对rdf进行了介绍。

针对xmlrdf都不能解决的同义词,多义词问题,引出了ontology的应用。

ontology描述语言:ontolingualoom

xml描述语言:shoeomlxolriboweb,rdfsoil

ontology的著名项目:oilshoedaml

3.结束语