RDF para la codificación de tesauros

La utilidad de RDF para la representación de tesauros no tardó mucho tiempo en ser descubierta, y ya en el año 2000 se propone el primer schema RDF para la codificación de tesauros. Posteriormente surgen otras propuestas hasta la llegada de SKOS-Core del que hablaremos ampliamente más adelante, pero aquí nos referiremos con detalle únicamente a la propuesta del proyecto CERES como principal antecedente, ya que es la que abre la vía de desarrollo de este tipo de especificaciones3.

Esta primera propuesta fue impulsada por la California Resources Agency 4, y se define a partir del estándar americano para la elaboración de tesauros monolingües Z39.19-1993, cuyo correspondiente internacional es la norma ISO-27885. El objetivo de esta iniciativa es el de proporcionar un método para el intercambio de tesauros entre aplicaciones, ya sea en su totalidad o parcialmente. La razón por la cual se escoge RDF/XML reside en que este lenguaje permite especificar de forma natural las distintas relaciones que existen entre los conceptos que forman el tesauro. A esto le debemos añadir el auge de este tipo de tecnologías que ya existía en Internet en la fecha de elaboración de esta propuesta.

La forma en la que trabaja esta propuesta es muy sencilla, ya que se basa en la utilización básica de XML para que los documentos puedan ser analizados por cualquier parser de XML. Los recursos en esta especificación son considerados como instancias de Descriptor, Category o EntryTerm. A su vez estos, son subtipos de Term. Esta implementación utiliza las formas de producción typedNode para todos estos recursos.

A su vez las siguientes propertyTypes pueden ser especificadas para los Term:

SN: Notas aclaratorias (Scope Notes) para los descriptores
CN: Notas del catalogador (Cattaloger Notes) para los descriptores
HN: Notas históricas (Historical Notes) para los términos
Source: Indicación de la fuente de un término
Status: Indicación del status de un término

Todas estas propertyTypes son a su vez recursos de dos propertyTypes, Label y Term (Descriptor | EntryTerm | Category) que ya hemos visto antes.

IC: Descriptor dentro de una categoría
CAT: Categoría del descriptor
UF: Término de entrada (EntryTerm) para el cual se debe usar un descriptor preferente
TT: Cabeza de jerarquía (Topmost Term) para un descriptor
BT: Término general (Broader Term) para un descriptor
RT: Término relacionado (Related Term) para un descriptor
NT: Término específico para un descriptor
USE: Descriptor preferente por el cual se debe sustituir un término de entrada (EntryTerm)

Mediante la utilización de las anteriores propertyTypes obtenemos una representación de los términos que componen el tesauro que se codifica mediante la sintaxis siguiente:

$<$ ?xml version="1.0"? $>$
$<$ ?xml:namespace ns='http://www.w3.org/TR/WD-rdf-syntax/' prefix='RDF' ? $>$
$<$ ?xml:namespace ns='http://www.w3.org/TR/WD-rdf-schema/' prefix='RDFS' ? $>$
$<$ ?xml:namespace ns='http://ceres.ca.gov/thesaurus/' prefix='Z19' ? $>$

$<$ RDF:RDF $>$

$<$ Category RDF:id="01" $>$
$<$ Label $>$Natural Environment$<$ /Label $>$
$<$ IC$>$
$<$Label$>$Biosphere$<$/Label$>$
$<$Descriptor RDF:resource='0101'/$>$ $<$/IC$>$
$<$IC$>$
$<$Label$>$Lithosphere$<$/Label$>$
$<$Descriptor RDF:resource='0102'/$>$
$<$/IC$>$
$<$/Category$>$

$<$Descriptor RDF:id='0101'$>$
$<$Label$>$Biosphere$<$/Label$>$
$<$CAT$>$
$<$Label$>$Natural Environment$<$/Label$>$
$<$Category RDF:resource='01'/$>$
$<$/CAT$>$
$<$TT$>$
$<$Label$>$Biosphere$<$/Label$>$
$<$Descriptor RDF:resource='0101'/$>$
$<$/TT$>$
$<$NT$>$
$<$Label$>$Ecosystems$<$/Label$>$
$<$Descriptor RDF:resource='010101'/$>$
$<$/NT$>$
$<$/Descriptor$>$

Como se puede ver por los ejemplos mostrados en este caso, la aplicación de RDF al marcado de tesauros es bastante sencilla y funcional, lo cual permitió la adopción de este modelo por varias entidades 6 de importancia. No obstante, a día de hoy ninguna de ellas conserva este modelo, ya que si bien en su momento proporcinaba una buena solución, el avance de las tecnologías de marcado y la proliferación de recomendaciones del W3c más adaptadas a su utilización sobre sistemas de organización del conocimiento, provocó un abandono progresivo de este modelo y la evolución hacia otros más elaborados.

root 2004-06-12