Authority data enrichment cn

From Semantic Web Standards

规范数据丰富化

解读序

【用例标题】

  • Authority Data Enrichment
  • 规范数据丰富化

【原文链接】

http://www.w3.org/2005/Incubator/lld/wiki/Use_Case_Authority_Data_Enrichment

【牧羊人】

  • 范炜

【按语(点评)】

用例思维导图:

http://www.flickr.com/photos/34395265@N02/5200643950/

用例名称

规范数据丰富化

用例拥有者

  • Kai Eckert
  • Alexander Haffner

背景和现状

  • 规范控制是为书目实体创建和维护规范数据
  • 规范数据类型

人名、家族、团体、作品、主题

  • 谁家的孩子

图书馆、档案馆、博物馆

  • 规范控制作用

帮助编目者区分不同的资源和在逻辑上把相似或相同特征的资源归在一起。

  • 集中化组织和管理模式、独立且可依赖的代理
  • 已有规范数据的联合、国家层面到国际合作
  • VIAF 虚拟国际规范文档

目标

  • 丰富化对已有规范数据扩充更多的信息(属性和关系)
  • 通过关联数据链接方式达到外部数据集的重用,取代拷贝/合并(Copying&Merging)方式

目标读者

用例情境描述

  • 需求

一位图书馆员打算扩充机构数据集中的一条规范数据记录

  • 步骤
    1. 在一个或多个远程数据提供者那里搜索等价的规范实体
    2. 在搜索结果中识别并选择一个等价实体
  • 关键点
    • 双方表征要一致
    • 哪些属性和关系对丰富化本地表征更重要

用例中关联数据的应用

  • 技术理念
    • SPARQL Endpoint服务,通过具体资源特征与关系搜索等价实体
    • 关联数据词汇把同一现实世界的资源类型对应起来
    • 在自身应用中使用远程数据
  • 实现方式
    • 在自身应用中重用远程已用词汇来描述和集成远程数据
    • 通过本地已用词汇和远程词汇的对应来"理解"和透明地集成远程数据

现有工作

  • 为VIAF开发必要的功能。目前采用OAI-PMH收割数据记录从国际上许多图书馆中分析人名实体及其等价,主要是人名规范文档及关联的题名记录
  • 通过匹配和链接全世界的人名规范文档到VIAF,说明VIAF理念在大规模数据上也可实现

相关词汇

  • 规范数据数据表征
    • FOAF:人名,团体
    • RDA第二组元素:人名,团体和家族
    • RDA第一组元素;作品
    • SKOS:主题词表
  • 等价关系表征
    • owl:sameAs 人名,团体,家族,作品
    • skos:exactMatch skos概念
    • skos:closeMatch skos概念

问题和局限

  • 总体来说,等价识别非常困难
  • 关联数据方面
    • 如果数据在本地数据库中,一致性数据的起源就很重要,可能很难操作。元元数据使用的必要性。
    • 数据来源的可信赖程度

不同远程数据来源的不一致性

  • 已有方式和词汇问题
    • 不一致词汇的使用
    • 当前skos:semanticrelations处理的实体数据不是skos:Concept。现实世界资源与skos:Concept关联的认可方式仍然缺失。

相关用例

  • 使用集中式规范数据去个体化“非个体化”的规范数据
  • 如果找不到等价实体,标记本地实体是唯一的
  • 规范数据的互联帮助用户搜索到其他图书馆相关实体,比如同一作者写的书籍。如果所有数据被开放为关联数据,这种扩展搜索很容易提供。
  • 一个外部用户打算对特定资源做丰富化

图书馆关联数据维度/主题

  • 主题
    • 概念模型与KOS/知识表征问题描述图书馆和博物馆规范和KOS作为关联数据。
    • 语义网环境问题跨数据集的链接词汇互联(交叉链接)
    • 对图书馆数据应用语义网技术遗留数据
    • 数据管理与分布关联数据管理,托管和保存
  • 维度
    • 识别用户需求
    • 规范数据系统->图书馆系统
    • 系统->图书馆和非图书馆系统连接
    • 注册信息资产
    • 浏览用户需求

参考文献