都柏林核心元素集

更新时间:2024-01-19 19:08

都柏林核心元素集(Dublin Core Element Set,以下简称DC)是一个致力于规范Web资源体系结构的国际性元数据解决方案,它定义了一个所有Web资源都应遵循的通用的核心标准,其内容较少,也比较通用,因此得到了其他相关标准的广泛支持。面向其他类型资源的元数据标准,基本上都兼容DC标准,并对它作了扩展。它已经成为Internet的正式标准RFC2413和美国国家信息标准Z39.85。

产生

1995年3月,由OCLC(Online Computer library Center,联机计算机图书馆中心)和NCSA(National Center for Supercomputing Applications,美国国家超级计算应用中心)联合在美国俄亥俄州的都柏林镇召开的第一届元数据研讨会上,产生了一个精简的元数据集——都柏林核心元素集(Dublin Core Element Set),简称DC。其目的是,如何用一个简单的元数据记录来描述种类繁多的电子信息,使非图书馆专业人员也有能够了解和使用这种著录格式,达到有效地描述和检索网上资源。

内容

说明:通过上述15项可以看出,元数据解决方案比较全面地概括了电子资源的主要特征,涵盖了资源的重要检索点(1、2、3项)、辅助检索点或关联检索点(5、6、10、11、13项),以及有价值的描述性信息(4、7、8、9、12、14、15项);其次,它简洁和规范。这15个元素不仅可以用于电子文档,也适用于各类电子化的公务文档,以及产品、商品、藏品目录等,具有很高的实用性。

作品特点

简易性

DC只有15个元素,通俗易懂,如题名项不分正题名、副题名还是并列题名等统称为题名即Title;著者项也没有细分第一责任者、其他责任者等而统一用著者即Creator加以标识,使用起来非常简单。都柏林核心希望能够同时为非编目人员及资源描述专家所用,且多数元素的语义都能被普遍理解,这正适应了数字图书馆信息量迅速膨胀,由专业人员进行著录已是不可能的事实。

通用性

不针对某个特定的学科或领域,支持对任何内容的资源进行描述,这个有助于统一其他内容标准并普遍为人们所了解的描述符集合增加了跨学科的语义互操作性的可能。

可选择性

著录项目可以简化,只要确保最低限度的7个元素(题名、出版者、形式、类型、标识符、日期和主题)就可以了。

可重复与可修饰性

其所有元素都可重复使用,解决了多著者与多出版等重复元素的著录问题,对于需要详细著录的资料,引进了DC修饰词。

国际通用性

获得万维网上资源发现界国际范围的认同,对有效的发现架构之发展非常关键。

灵活的可扩展性

提供了更加精心制作的描述模型(如MARC编目)以外的经济的选择,既可以嵌入在HTML(RFC2731)中,也可基于XML进行描述,与当今互联网上的相关置标语言标准有很强的亲和性;允许资料以地区性规范出现,并保持元数据的一些特性,从而适应更丰富的资源标准内部的结构和更详细描述的语义编码。

限定词

基本的都柏林核心集过于简单,但更多的、复杂的应用要求进一步指定元素的语义内容。元素的限定词提供了一种指定语义内容的方法。比如,采用配置限定词可以指定Subject元素的来源或指定一个认证系统(如ISBN或ISSN)。又比如,在Author元素标签中使用类型(type)限定词可以给出作者的姓名、电子邮件地址和电话号码等。限定词指定的方法还需要进一步完善。都柏林核心集的扩展也可以通过对局部元素的使用进行定义的方法实现。局部元素的名字应以“X-”作为开始标识,这样Web搜索引擎能够很容易地识别或忽略局部扩展名。

DC的限定词主要分为三种类型:语言限定(lang),模式(scheme),类型(type)。

沿革发展

DC-1

第一届元数据研讨会(DC-1)于1995年3月在美国俄亥俄州的都柏林召开,由OCLC/NCSA主持。本次会议的目的在于培养对当前的需求、力量、缺陷以及解决方案的一般性认识以及就建立一个描述网络资源的元数据元素核心集达成共识,目标是定义一个能为全球所理解和接受的最小的元数据元素集。本次研讨会设定了一个包含13个元素的都柏林核心元素集,即都柏林核心(Dublin Core,简称DC),都柏林核心是在网络环境中帮助发现文件类对象所需要的最小元数据集,而对它的结构和句法问题则作为一个执行细节没有进行详细说明,13个文件类对象的信息检索所需要的元数据元素为:主题(Subject)、题名(Title)、作者(Author)、出版者(Publisher)、相关责任者(OtherA—gent)、出版日期(Date)、对象类型(ObjectType)、格式(Form)、标识(Identifier)、关联(Relation)、来源(Source)、语种(Language)、覆盖范围(Coverage)。

DC-2

1996年4月1—3日,第二届元数据研讨会(DC-2)在英国的渥维克召开,由OCLC/UKOLN(英国图书馆和信息联网办公室)主持。本届研讨会最主要提出了一个建立元数据的容器结构的建议,这种容器结构可以包含都柏林核心以及其他一些不同类型的元数据,都柏林核心的13个元素则没有改变。这次会议所产生的元数据结构之概念基础,被称为渥维克框架,这个框架和元内容框架成为第五届元数据研讨会上所提出的资源描述框架发展的核心。

DC-3

1996年9月24—25日,第三届元数据研讨会(DC-3)在美国都柏林召开,由CNI(网络信息联盟)/OCLC主持。会议专门围绕在网络环境中描述图像和图像数据库方面的问题展开了讨论,并最终对都柏林核心的几个元素进行了修改,以使它们不至于太以文本为中心,另外,在原来13个元素的基础上又新增了2个元素:描述(Description)、权限管理(Rights management)。

DC-4

1997年3月3—5日,第四届元数据研讨会(DC-4)在澳大利亚首都堪培拉召开,由NLA(澳大利亚国家图书馆)/DSTC(分布式系统技术中心)/OCLC主持。会议确定了SCHEME(系统,又称模式)、LANG(语种)和TYPE(属性类型)三种堪培拉修饰词,修饰词的增加使句法问题变得更为复杂,但同时又提出两种嵌入堪培拉修饰词的解决方法:内容超载法和附加特征法。

DC-5

1997年10月6—8日,第五届元数据会议(DC-5)在芬兰的首都赫尔辛基召开,本次会议由OCLC和芬兰国家图书馆共同组织了这次研讨会,万维网联盟(W3C)元数据工程的代表提交了万维网元数据新规范草案:资源描述框架(RDF),并证明此框架符合在一系列都柏林核心工作会议上提出的基本架构和编码安排,并就有关都柏林核心的15个未限定元素进行了确定,添加额外的子元素并使其正式化,用子结构来支持模式限定词,确立了都柏林核心正式的数据模型。

DC-6

1998年11月2—4日,第六届都柏林核心元数据研讨会(DC-6)在美国的华盛顿特区召开,由LC(美国国会图书馆)/OCLC共同主持。本次会议提出应用RDF数据模型建立都柏林核心数据模型,认为RDF中有足够的完整性来支持都柏林核心建模的目标,并为都柏林核心的应用定义了实施框架。

DC-7

1999年10月25—27日,第七届元数据会议(DC-7)在德国的法兰克福召开,由DDB(德国图书馆)/OCLC主持。目的是巩固每个DC工作组的发展、分享应用DC的经验,以及提高DC在不同元数据系统中的互操作性,并于1999年12月22日形成了DC修饰词1.0工作草案(DC修饰词是对15个元素的语义进行限定和修饰的词,修饰词的语义包含于未修饰词中,范围上对未修饰词的语义进行限定,在深度上对未修饰词的语义进行延伸),会议还首次对应用DC进行网络资源揭示的几个项目作了介绍。

DC-8

2000年10月4—6日,第八届元数据会议(DC-8)在加拿大的渥太华召开,由NLC(加拿大国家图书馆)主持。会上DCMI(Dublin Core Metadata Initiative,DCMI)负责人Stuart Weibel总结了DCMI在2000年在DC修饰词、DC标准化、DC作为元数据的语法、教育界的DC、DC登记、应用属性等方面工作的进展情况,并对元数据的结构问题(如何利用子结构更好地容纳元数据)、应用属性、都柏林核心注册(开放式元数据注册系统)、特殊领域的元数据(教育界、政府部门、研究界等都柏林核心)作为重点议题进行了研究。

应用

经过多年的研究发展,DC已能较好地解决网络资源的发现、控制和管理问题,并对当今数字图书馆的研究也很有意义。因此,世界上研究及采纳DC的各种项目已遍及美洲、欧洲、大洋洲、亚洲等地,涉及社会学、政治、图书馆、教育、商业、科学研究等多个领域,DC已被翻译成了泰、日、德、法、葡、丹麦、挪威、芬兰、瑞典等国家的几十种语言。芬兰、丹麦已选用DC作为官方电子资源的描述方式.1998年9月,因特网工程任务组(IETF)也正式接受了DC这一网络资源的描述方式,将其作为一个正式标准予以发布( RFC2413)。

免责声明
隐私政策
用户协议
目录 22
0{{catalogNumber[index]}}. {{item.title}}
{{item.title}}