用例: Polymath 虚拟图书馆

From Semantic Web Standards

Polymath “关于博学者”虚拟图书馆 (牧羊人: lxmsmile 娄秀明)

【原文链接】:http://www.w3.org/2005/Incubator/lld/wiki/Use_Case_Polymath_Virtual_Library

【点评】:本用例致力于利用关联数据技术建立起一个“关于博学者”的虚拟图书馆,该特色图书馆的系统框架是“作者”,以“作者”为中心,可以按照时间线、机构、地理位置、学科主题、与其他责任者关系等方式进行整合,建立一张关联数据云图。同时,该项目也注意从可获取的LOD中获取有用的URIs,并且在LOD中也提供其自己的数据。该用例实践中存在的问题是自动获取URIs时,LOD中标识对象的标签不可能与记录的名称完全匹配。

一、用例名称

“关于博学者”的虚拟图书馆


二、用例拥有者

伊格纳西奥拉的腊门迪基金会(Fundación Ignacio Larramendi) (http://www.larramendi.es)

联系人: Xavier Agenjo

联系方式:xavier.agenjo@larramendi.es


三、背景和现状

“关于博学者”的虚拟图书馆的意在对不同时期的西班牙、拉美裔(Hispano-American)、巴西及葡萄牙的博学者的有关信息、数据、数字化文本及网站进行整合。整合的学科信息内容包括:思想学、哲学、政治、科学等;语种包含了西班牙、拉美裔、葡萄牙、巴西人使用的任何一种书写语言(如:拉丁语,阿拉伯语,希伯来语,西班牙语,葡萄牙语等);从时间上看包含了塞内卡公元前一世纪到现在的内容。详细内容可参考该网站:http://www.larramendi.es/i18n/estaticos/contenido.cmd?pagina=estaticos/bibliotecaIL。


“关于博学者”的虚拟图书馆系统的骨架是作者。为每个作者创建一条MARC21/RDA规范记录,并且通过作者生平事迹相关信息丰富该条记录信息。通过特殊属性(如专业、职员、性别、会员等属性)的分类加强彼此关系及各个站点之间的导航链。其他可以作为属性:出生及死亡日期、出生及死亡地点、语言或者文字的使用类型。通过上述这种方法,每条规范记录整合的信息可以说来源广泛。


规范记录是通过对不同可信资源的斟酌后创建的,这些可信资源可以是规范文档、百科全书、传记辞典等。描述作者的信息源来源复杂广泛,主题可以从用拉丁语描述的中世纪哲学到用西班牙语描述的现代科学。不过对作者描述进行描述的信息源,可以有若干个共同信息源如:LCSH和VIAF。在实践中,与某一作者关联的数据,该数据的发现是通过手工完成的。


关于每个作者的描述做完之后,即在做完MARC/RDA记录之后,腊门迪基金会会扫描或者编辑那些作者的电子版作品或者将其在网上提供(格式如下:HTML, PDF, ePUB, MOBI等)。


同样,每个作者还与其他责任者(译者、出版者、评论者等)产生关联,其他责任者也是原创作品的传播途径。选择信息来源及电子版本的标准对系统来说非常重要,从这种点出发我们开发了不同的工具,通过这些工具用户可以提供信息,这些信息一般是关于作者及其作品的信息源和网站内容评论的。


四、目标

1实现了对西班牙,西班牙裔、巴西人和葡萄牙的思想家的信息、数据及作品的重要收集。

2通过半自动丰富数据提高了这次收集的效率。半自动的丰富数据其主要方式是从可获取的LOD中获取URIs,并且在LOD中提供其自己的数据,目的是提高数据的可见性及使用率(主要是西班牙裔和欧洲的资源整合者)。


五、目标读者

学者、数字化文本编辑者、图书馆、网站编辑者、资源整合者(西班牙裔及欧洲)


六、用例情境描述

用户可以检索某一具体作者相关信息,可以看到其生平事迹信息及其作品的基本介绍。

用户可以直接在相关网站上看到作者的电子版文本,用户还可以通过导航访问其他站定。

用户可以选择自己感兴趣的作品,可以下载,也可以建立自己的图书馆方便随时查询。

用户通过对其他信息源的查询获取更多附加信息,包括存在争议的数据信息。

用户可以添加评论、突出争议数据信息、补充信息或建立同其他信息源链接。

用户在站点内可以浏览其他作者的相关信息,这些作者可能是同一时期、同一地点、使用同种语言、作品关于同一主题的;或者是同属于一个机构;或者同一学派运动推行者。

此外,相同的导航元素也可以作为检索的主题。

七、用例中关联数据的应用

关联数据技术在“关于博学者虚拟图书馆”利用,一是利于提高从不同信息源获取链接的处理效率;二是利于这些不同信息源的推广传播。这些数据源包含的数据可以是个人及团体名称、人物生平事迹、地理名称、学科主题等等。一旦这些不同信息源的数据整合成一张关联数据云图,这些数据源之间的节点就会大大提高搜索和检索能力。这些数据源的整合可以按照不同的方式整合,可以按照时间线、地理名称或者根据作品、人物、机构或运动的学科关系整合。

作为一个特殊主题而又有着复杂关系网的“关于博学者虚拟图书馆”,其致力于建立起资源整合器(西班牙裔或欧洲)之间的特殊关系,前提是这些资源整合器里,“关于博学者虚拟图书馆”已经提供了RDF格式或者使用RDFa格式的内容(译者注:可能理解不准确,欢迎补充)。

八、现有工作(可选)

LCSH 和 NACO浏览器

LinkedLCCN

BBC Music


九、相关词汇(可选)

VIAF

LCSH

RAMEAU

Linked Data Services der DNB

Instituto Geográfico Nacional (España)

EDM

DBpedia


十、问题和局限(可选)

自动获取URIs可以发现一个问题,在LOD中标识对象的标签不可能与记录的名称完全匹配。这不仅存在于消除歧义机制中(马德里,西班牙,马德里,美国,马德里,墨西哥),还存在于在数据查找和建立时同其他数据相同时的描述中。完全自动处理解决不了这个问题,至少在多语种及多脚本环境中是解决不了的。SPARQL同具有分布式检索协议的SRU / OpenSearch的结合或许对此有帮助。

十一、扩展阅读 http://www.larramendi.es/i18n/estaticos/contenido.cmd?pagina=estaticos/bibliotecaIL (in Spanish)