| |
 |
|
[Semantic Web]国内语义Web研究综述(一)  |
Lee 发表于 2006/2/15 11:05:54 |
摘 要:语义Web并非一个独立的Web,而是当前Web的延伸,其目标是让计算机能够“理解和处理”现在的Web仅仅能显示的数据,并为人们提供各种智能服务。目前在世界范围内对语义Web的研究尚处于起步阶段,与国外相比,我国对语义Web的研究相对较晚。本文试图对国内关于语义Web的研究做一简要的综述,在把握当前研究现状的基础上,明确今后主要的研究方向与重点问题。
关键词:语义Web 语义网 资源描述框架 本体 本体论 代理
1 基本概况
当前对语义Web的概念还没有形成统一的定义,对语义Web的理解表述不一。如语义Web是“第三代Web,其目标是实现机器自动处理信息,它提供诸如信息代理、搜索代理、信息过滤等智能服务”[1];语义Web“不同于现存的万维网,其数据主要供人类使用,新一代WWW中将提供也能为计算机所处理的数据,这将使得大量的智能服务成为可能”[2];语义Web研究活动的目标是“开发一系列计算机可理解和处理的表达语义信息的语言和技术,以支持网络环境下广泛有效的自动推理”[3]。语义Web的创始人Tim Berners-Lee对语义Web的定义如下:“语义Web是一个网,它包含了文档或文档的一部分,描述了事物间的明显关系,且包含语义信息,以利于机器的自动处理”[4]。尽管对语义Web的理解与描述不同,但仍能从这些描述与理解中看出语义Web的一些基本特征:(1)语义Web不同于现在WWW,它是现有WWW的扩展与延伸;(2) 现有的WWW是面向文档而语义Web则面向文档所表示的数据;(3) 语义Web将更利于计算机“理解与处理”,并将具有一定的判断、推理能力。
语义Web的实现依赖于三大关键技术:XML、RDF和Ontology。本文将在第3小节对它们进行讨论。
虽然语义Web给我们展示了WWW的美好前景以及由此而带来的互联网的革命,但语义Web的实现仍面临着巨大的挑战[2]:(1)内容的可获取性,即基于Ontology而构建的语义Web网页目前还很少;(2)本体的开发和演化,包括用于所有领域的核心本体的开发、开发过程中的方法及技术支持、本体的演化及标注和版本控制问题;(3)内容的可扩展性,即有了语义Web的内容以后,如何以可扩展的方式来管理它,包括如何组织、存储和查找等;(4)多语种支持;(5)本体语言的标准化。
虽然与国外相比我国对语义Web的研究相对落后,但从1999年至2004年4月发表的论文来看,(1)论文数量逐年递增。2002年发表相关论文22篇,分别是2000年(6篇)和2001年(4篇)年论文数量的3.7倍和5.5倍,2003年发表论文38篇,是2002年的1.7倍,这说明随着时间的推移,对语义Web的研究已经引起了我国学者的高度重视;(2)研究内容越来越广泛而深入,大致可分为三个层次:
第一层次,即对语义Web及其关键技术的描述与介绍,主要包括语义Web的含义[2][5][6][7]、体系结构[8][9]、关键技术(RDF、Ontology) [10][11][12][13][14][15][16][17][18][19]、面临的挑战等[2];
第二层次是关于语义Web及其关键技术对相关学科或研究领域的影响与启示,包括信息管理[20][21][22][23]、信息检索[3][20][24][25][26][27][28][29][30][31][32][33][34]、知识库系统[35][36][37][38]、数字图书馆[39][40][41][42]、数据挖掘[43]、电子商务[44][45]、机器翻译[46]、智能代理[47][48][49]、需求分析[50][51]、元数据描述与交换[52][53][54]、网络信息资源和知识的表达[55][56]等;
第三个层次则是针对语义Web及其关键技术所做的具体试验与应用,包括RDF的应用与存储[57][58]、基于RDF/XML的搜索引擎的设计与实现[59]、语义Web的试探性实现[60][61][62][63][64]、Ontology的构建[65][66][67][68][69][70]、基于Ontology的查询系统设计[71][72]、Ontology在图书服务网络、知识图书馆和数字图书馆中的应用[73][74][75]、Ontology与主题词表相结合实现对元数据的查询[76]等。
|
|
|
| |
 | |
|
| Blog 信 息 |
blog名称:风落沙 日志总数:348 评论数量:550 留言数量:52 访问次数:1612264 建立时间:2005年1月28日 |
|
| 友 情 连 接 |
|

|
|
|

| |
|