用例:Europeana

From Semantic Web Standards

【用例标题】

Europeana用例 {牧羊人:邹庆)

【原文链接】

http://www.w3.org/2005/Incubator/lld/wiki/Use_Case_Europeana


【按语(点评)】

对Europeana了解还不多,所以暂不评论。


一、用例名称

Europeana (为存取数字化对象的元数据聚集)


二、用例拥有者

Antoine Isaac


三、背景和现状

Europeana提供连接档案馆,图书馆,博物馆和音频-视频资料的横跨欧洲的服务。 它聚集从众多文化遗产提供者来的元数据。并允许用一种统一的方式用元数据通过网站或者应用程序接口来检索众多的对象集合。它旨在使进一步重用和引用它所指向的数字化对象。

它很像已经实施的一些聚集或者联合编目项目如WorldCat [1], CultureGrid [2]...

目前的最大障碍在使用众多的不同元数据格式:让提供者提交统一模式的元数据是可能的,但这往往导致丢失有用的信息。 链接不管是项目的聚集对象集合中对象和上下文相关信息(contextual information)间的,还是在这些对象和外部数据源(如wikipedia)之间,也都很难被收割(或创建), 维护和利用。 例如通过使用知识组织系统(KOS)这些链接可能表示为指向相似的概念或者同样的人物。重用这些对象和与其相随的数据也被严格定义的存取方式(网站和应用程序接口)所阻碍。


四、目标

两个简短的陈述 (1)在此情景中不引证到关联数据,能完成,达到什么状况, (2)如何使用关联数据技术来达到这个目标。

(1) 可被确定的三个子目标:

   * 收割对象元数据和数字化对象的链接
   * 上下文对象
   * 提供对象的存取

(2) 关联数据可帮助:

   * 收割连接到的未被提供者维护的资源的对象元数据
   * 加强多个元数据模型间的语义互操作,允许多层次的一般化共存于同一知识库中
   * 通过提供链接资源丰富现有元数据
   * 允许利用更丰富和多样的数据来增强检索过程
   * 为第三方提供低层的,便利的存取,使他们能重用和存取数字化对象


五、用例情境描述

提供者可能提供尽量准确的对象元数据,映射到一个保证最低互操作的核心词表。 他们可包括指向其它资源(关联数据)的指引使其能被Europeana收割。也可提供以知识管理系统或者规范数据形式的上下文相关数据.

通过连接对象描述到知识管理系统或者将知识管理系统连接起来,European使元数据丰富化。

对象描述和上下文数据被利用于合适的检索机制中 (比较:语义检索用例)可使用户能提取更贴近他们信息需求的对象,或能以更娱乐/更偶然的方式来探索对象空间。

元数据和其对象使在其它系统中(取决于提供者的协议)合适的重用和参考指引到它们成为可能


六、目标读者

   * 一般大众
   * 学者和学生
   * 提供者(博物馆,图书馆,(音频-视频)档案馆)
   * 愿意提供数字化文化对象存取的第三方服务提供者

七、用例中关联数据的应用 关联数据和其它语义互联网技术的应用方式:

   * 通过消化对象和其它上下文相关的关联数据间的链接(如果数据提供者提供的话)来更好收割上下文相关对象元数据
   * 应用RDF/OWL公理 (如:子属性或者子类链接)允许多层次一般化共存于同一知识库
   * 丰富现有元数据,使易于表达和维护Europeana还未被提供者连接的不同资源间的链接
   * 通过利用对象和它们上下文相关的资源间的以更加丰富方式(如概念的多语言标签,概念间的语义关系)描述的链接来增强检索过程
   * 通过HTTP提供对元数据的直接存取以使第三方能重用元数据

八、现有工作(可选)

   * 用RDF来对馆藏和(匹配的)知识组织系统进行语义检索实验: Europeana语义检索思想实验室[3], CultureSampo [7]
   * 数据聚集者探索关联数据: SOCH [4], CultureGrid [5] 

九、相关词汇(可选)

参考模型(在Europeana数据模型中被重用或被采纳) - dcterms, SKOS, OAI-ORE, CIDOC-CRM, FRBR

参考值域词表 - VIAF, Geonames, ULAN, TGN, DDC, UDC, Iconclass, dbPedia

由单一提供者(使用词表提交对象)维护的任何值域词表都相关。

十、问题和局限

   * 多样性的数据(元数据规范 + 知识组织系统) 需要元数据规范间的映射和知识组织系统语义的匹配
   * 数据量带来的规模伸缩性问题
   * 原始数据(如在对象元数据中没有指向知识组织系统的关系)需要语义的丰富化
   * 转向语义互联网或关联数据环境产生的对数据提供者的技术障碍

十一、相关用例和非预期应用(可选)

   * 发布20世纪新闻界档案用例 探索一个提供者如何发布有价值的关联数据被Europeana这样的提供者所摄取。开放图书馆数据用例目标在于发布丰富的数据能用作在图书馆领域参考的FRBR和FRAD实体集。 
   * 规范数据丰富化用例可被类比为语义匹配很必要用来解决知识组织系统的异构性和规范数据. 通过使大量的本地知识组织系统和规范数据可用,Europeana也可为此用例提供素材。
   * 语言技术用例特色在于名字实体的识别,一个关键的工具来联系描述得很糟的对象到更丰富的资源,或者跨越语言的障碍。
   * 书目网络用例通过使用对象丰富化的语义层来提高检索结果, 主题检索用例使用现有的单一的知识组织系统来实现。

十二、范围和主题

范围:

   * 用户需求 > 浏览 / 探索 / 选择
   * 用户需求 > 提取 / 查询
   * 用户需求 > 存取 / 获取
   * 用户需求 > 整合 / 上下文化
   * 上下文 > 通讯 > 在线存取
   * 系统> 图书馆和非图书馆系统的链接
   * 信息资产 > 书籍,期刊文章,词典和受控词表, 多媒体资料, 档案资料
   * 信息生命周期: 基本上所有的

主题: 也许太多相关话题

十三、参考文献(可选)