SWAD-Europe extra-producto final: Informe del Taller para Desarolladores 8 - La Web Semántica en América Latina

[English version]

Nombre del Proyecto:
Semantic Web Advanced Development for Europe (SWAD-Europe)
Número del Proyecto:
IST-2001-34732
Denominación del Objetivo:
3 Dissemination and Implementation (Difusión e Implantación)
Descripción del Objetivo:
http://www.w3.org/2001/sw/Europe/plan/workpackages/live/esw-wp-3
Título del Objetivo:
Extra deliverable: Developer Workshop Report 8 (Informe del 8º Taller para Desarolladores)
URI:
http://www.w3.org/2001/sw/Europe/reports/dev_workshop_report_8
Autor:
Charles McCathieNevile
Resumen:
Este informe relata el taller 8º para desarolladores del proyecto SWAD-E, que tuvo lugar los días 21 y 22 de Agosto de 2004 en Buenos Aires, Argentina. El taller presentó aspectos diversos de la Web Semántica y de su desarollo tanto en Europa, como en América Latina.
Estatus:
Borrador final. La primera versión de este informe se publicó el 5 de Septiembre 2004. Esta versión se publicó el $Date: Monday 20 September 2004 - 19:21:49$. Este informe puede actualizarse o modificarse a lo largo de la vigencia del proyecto SWAD-Europe, por ejemplo, para proporcionar nueva información sobre los temas y/o contenidos del taller.

Contenido:


Sumario ejecutivo

  1. Introducción.
  2. Motivación.
  3. El Taller.
  4. Resultados.

Apéndice A. Proyectos y Herramientas.


Sumario Ejecutivo

Este taller reunió a diversas personas hispanohablantes (en su mayor parte procedentes de países de América Latina pero también de España y de los Estados Unidos) interesadas en el desarollo de tecnologías para la Web Semántica. Se realizó en idioma castellano.

Fue alojado por el Departamento de Diseño de Sistemas de la Universidad Argentina John F. Kennedy en Buenos Aires. Los asistentes al taller pertenecen a los cuatro ámbitos a los que está dirigido el proyecto SWAD-E: aproximadamente la mitad de los asistentes procedían del mundo académico, y el resto, distribuidos entre desarolladores de sistemas, tanto de código abierto como comerciales, y personas del sector de la información gubernamental.

Además la discusión fue anotada en directo a través de IRC, lo que posibilitó una mayor participación de carácter global ya que, a través del canal #RDFIG asistieron también distintos miembros de la comunidad de la web semántica en Europa, dando al taller y a las discusiones que tuvieron lugar en él, una dimensión de interés mundial.

Algunos de los resultados fueron:

1. Introducción

Este informe es parte del proyecto SWAD-Europe (en inglés) y representa un producto final del Objetivo 3, Difusión e implantación (Work package 3: Dissemination and Implementation - en inglés). En él se describen los objetivos, la realización y los contenidos, así como los principales resultados del taller "La Web Semántica en América Latina", que tuvo lugar los días 21 y 22 Agosto de 2004 en Buenos Aires (Argentina) en idioma castellano.

Los objetivos del taller fueron, entre otros:

2. Antecedentes

Existen algunos trabajos sobre la Web Semántica desarrollados o promovidos desde varios países de América Latina, pero en muchos casos tienen lugar o están publicados sólo en inglés, lo que hace muy difícil que las personas interesadas en estos temas encuentren información en español. A partir de esta realidad, incluso, de esta carencia, varios miembros de la lista Web-Semantica-Ayuda sugirieron la posibilidad de celebrar un taller en castellano en América Latina, de tal forma que un mayor número de miembros de la comunidad de desarrolladores de América Latina, pudiese conocer estas tecnologías en su propio idioma y de esta forma potenciar el trabajo y la cooperación de la comunidad hispanohablante. Es importante destacar también como antecedente que, el éxito del taller del SWAD-E en castellano, celebrado de Madrid el 13 de junio de 2004, titulado Introducción al uso de la Web Semántica (ver informe), motivó y facilitó la organización de este taller para América Latina, celebrado en la ciudad de Buenos Aires donde, las 30 plazas disponibles se cubrieron inmediatamente con una amplia lista de espera.

El taller fue liderado por Charles McCathieNevile, representando al W3C en el proyecto SWAD-Europe, y alojado por el Departamento de Diseño de Sistemas de la Universidad Argentina John F. Kennedy. El comité organizador estuvo formado por:

Hay que agredecer a todos ellos su magnífico trabajo, ya que sin su participación en la organización, el taller, y gran éxito que tuvo, no habría sido posible.

3. El taller

3.1. Presentaciones

Además de diversas discusiones y debates sobre temas de especial relevancia para la comunidad de la Web Semántica y para el grupo hispanohablante que asistió al taller, a lo largo del mismo, se realizaron algunas presentaciones formales, cuyo contenido se describe brevemente a continuación.

Introducción a la Web Semántica con CWM

Esta presentación estuvo a cargo de Charles McCathieNevile del proyecto SWAD-Europe y miembro del W3C, quien realizó una introducción a la Web Semántica (concepto, estándares, uso de RDF y RDFS para la creación de vocabularios, etc.) a través de ejemplos prácticos. Charles, presentó también algunas herramientas específicas: para crear RDF (como foaf-a-matic o Hera, ambas en español -la primera traducida por Leandro M. López y la segunda desarrollada originalmente en español), herramientas para buscar información (como foafnaut), dedicando especial atención al uso y funcionamiento del procesador cwm para tratar información en RDF. (Esta presentación anotada a través de IRC).

El vocabulario FOAF (Amigo de un Amigo) y su extensión con información sobre qué idiomas lee, escribe o habla alguien

Leandro Mariano López (más conocido en el entorno de desarollo de la Web Semántica por "Inkel") fue la persona encargada de tratar este tema, presentación y discusión subsiguiente en el taller. Inkel mantiene un Weblog en español sobre la Web Semántica y Programación Web, y es traductor de varios documentos, especificaciones y herramientas relevantes para la Web Semántica, también es el creador del esquema habla, lee, escribe (speaks, reads and writes, SRW). En su presentación, Inkel explicó el origen y fundamentos del vocabulario FOAF, realizando una descripción muy precisa del mismo a través de algunos ejemplos. Inkel lideró también una discusión sobre FOAF, vocabulario RDF utilizado para describir personas y las relaciones entre ellas, que tiene ya un amplísimo uso en la comunidad de la SW, prestando especial atención a la motivación e implantación de las extensiones a este esquema para manejar información sobre los idiomas que una persona habla, lee o escribe. (Esta presentación anotada a través de IRC).

TemaTres

Diego Ferreyra, trabaja en el Ministerio de Educación de Argentina, en una consultoría dedicada a las Tecnologías de la Información y las Comunicaciones (TICs) en el ámbito de la educación, además participa en un proyecto inglés para el desarrollo de un motor de montaje multimedial dinámico. Diego presentó TemaTres, una aplicación Web desarrollada por él en Argentina para gestionar lenguajes documentales. TemaTres está fundamentalmente orientada al manejo y gestión de tesauros jerárquicos, aunque también podría utilizarse para desarrollar otras estructuras de navegación web o como complemento a un gestor de contenidos, una biblioteca digital, etc. En su presentación hizo hincapié en la discusión sobre la estructura de los tesauros especialmente adaptable a la representación en RDF y en cómo TemaTres permite la visualización tanto según el estándar americano ZThes, como en el formato RDF de SKOS-Core, y cómo se utiliza el Dublin Core para la codificación del lenguaje documental utlizado; también planteó algunos de los desarrollos futuros de la aplicación introduciendo un debate sobre la posibilidad de generar los tesauros directamente en RDF. Hay una demonstración de TemaTres disponible que utiliza algunos tesauros de pruebas. (Esta presentación anotada a través de IRC).

Búsqueda y Navegación Semántica

Esta presentación estuvo a cargo de María de los Angeles Martín, profesora e investigadora del Grupo de I+D en Ingeniería del Software de la Universidad de La Pampa. Mª de los Ángeles, presentó su proyecto de creación de una ontología sobre métricas e indicadores y un sistema de búsqueda y navegación semántica para un sistema de catalogación propuesto sobre este tema. Además de hablar de este proyecto realizado en la Universidad de La Pampa, hizo una amplia exposición sobre los niveles o capas de la Web Semántica y los lenguajes implicados, explicando las diferencias entre XML schema y RDFS, el alcance de RDFS y de OWL, etc.; también realizó una revisión tanto de las metodologías utilizadas para la creación de ontologías, incidiendo en la elegida por ellos Methontology, (ver una presentación sobre Methontology), como de los lenguajes de consulta para RDF, distinguiendo tres niveles: sintáctico, estructural y semántico, así como de las distintas arquitecturas de navegación semántica aplicables, destacando la búsqueda y navegación semántica (SeRQL). (Esta presentación anotada a través de IRC. Ver fichero de la presentación en formato pdf - 1.5MB).

Grupo Metadatos, Universidad de Chile

Claudio Gutiérrez, profesor del Departamento de Ciencias de la Computación de la Universidad de Chile y uno de los investigadores principales del grupo de investigación sobre Metadatos de esta misma Universidad y miembro del Centro de Investigación de la Web (CIW), presentó el trabajo de este grupo de metadatos: objetivos, motivación e intereses del grupo, proyectos terminados o en curso, aplicaciones desarrolladas, p.ej. un generador de metadatos DC en castellano, un wiki sobre metadatos, o DepMark (proyecto para la creación de metadatos asociada a todos los Departamentos de Computación de las universidades de Chile donde todos los valores están tomados de un archivo RDF), etc. Además de presentar el grupo Metadatos.cl, Claudio concluyó con una certera revisión a las ideas y percepciones del estado actual de la Web Semántica, destacando los problemas que, a su juicio, dificultan el desarrollo, que despertaron la reflexión y la discusión de todos los participantes: problemas de carácter social, de difusión y capacitación, de almacenamiento, de portabilidad e interoperabilidad o el pobrema de la disgregación de la Web Semántica, entre otros. (Esta presentación anotada a través de IRC).

Dublin Core en español: Metadatos, DC, etc.

Eva Méndez es profesora e investigadora de la Universidad Carlos III de Madrid, mantiene el mirror en español de la DCMI y es co-administradora de la lista de discusión en español sobre este estándar de metadatos (DCMI-ES). Eva centró su presentación en los esquemas de metadatos distinguiendo entre el DC, como un modelo de propósito general y una infraestructura operacional de la Web semántica, y los distintos y múltiples esquemas de metadatos de propósito específico basados en el carácter vertical y disciplinar de la Web, destacando que hoy en día los productos de las tecnologías de la Web Semántica constituyen "islas semánticas". Eva habló también de la formalización de los estándares en el caso del DC (ISO 15836-2003) y de los estándares de facto como RDF/RDFS; lideró un debate sobre la aplicación del Dublin Core en proyectos en español y de la utilidad de los metadatos que condujo a un debate sobre la "visibilidad web" y la "nueva visiblidad" que supone la codificación RSS. Su presentación destacó también el valor de trabajar sobre el tema en castellano, en vez de en inglés, para el mundo de desarollo hispanohablante. (Esta presentación y discusión anotada a través de IRC).

Annotea, EARL, y la web fiable

Finalmente Charles McCathieNevile presentó más concretamente algunos de los pasos que se han ido dando para llegar a una web más semántica a la par que más fiable. En esta presentación Charles explicó los casos de Annotea, EARL que fomentan el uso de una gestión de confianza, y por ello la han implantado como parte de sus vocabularios, a la espera de una estandarización más "oficial" o formal de una infraestructura para gestionar la confianza en los datos que se encuentran en la Web. (Esta presentación y discusión anotada a través de IRC).

3.2. Asistencia

De forma presencial, asistieron regularmente al taller unas 30 personas. La mitad de ellas proceden de varias universidades de América del Sur, principalmente de Argentina pero también de España, el resto de asistentes estuvo compuesto por un grupo de personas donde podemos distinguir: desarolladores independientes, empresas locales o regionales (incluso una empresa española), así como algunas personas que pertenecen a organismos gubernamentales argentinos o tienen relación directa con ellos.

También, a través del canal de IRC, participaron distintos miembros de la comunidad internacional de la Web Semántica, de tal forma que algunas de las discusiones se fueron traduciendo al inglés en tiempo real, permitiendo a los no hispanohablantes participar de forma activa y más amplia, en las discusiones que se produjeron en el seno del taller en Argentina.

Algunas de las organizaciones representadas en el taller fueron:

4. Resultados

Como ya se ha ido apuntando a lo largo de este informe, en el taller se presentaron, además de otros temas puntuales, los principales conceptos y estándares vinculados a la noción de Web Semántica, el modelo RDF y su sintaxis, etc. a desarrolladores y a las personas interesadas que asistieron al taller (bien presencialmente, bien a través de IRC), todo ello en idioma español; incluso algunas herramientas y proyectos se explicaron en detalle (ver el Apéndice A). A raíz de este taller, la comunidad hispanohablante a la que estaba dirigido se ha introducido, entre otras cosas, al el uso de IRC con el "chump" que permite la colaboración a distancia, de tal forma que se han sumado a la metodología de trabajo internacional para el desarrollo de la Web Semántica.

Despues del taller, se han unido a la lista Web-Semantica-Ayuda más personas de la comunidad hispanohablante y también cada vez es más frecuente la participación de estas personas en el canal #rdfig, habiendo mejorado igualmente, tanto la cantidad y flujo de mensajes como la calidad técnica de éstos. De este nuevo nivel de las discusiones y desarrollo sobre las tecnologías de la Web Semántica, esperamos que mejore igualmente el reconocimiento internacional del trabajo hecho en español, y también que se incremente la práctica y calidad técnica de los trabajos de esta comunidad.

Este taller ya ha demostrado algunas de las contribuciones previsibles a futuro como la motivación de algunas presentaciones en castellano, por ejemplo sobre el tema de la "Web Semántica fiable".

Están disponibles en línea tanto la cuenta de la discusión como las páginas de notas (primer día, segundo día) con enlaces interesantes y/o relevantes comentados por los asistentes y otras personas de la comunidad de la Web Semántica que participaron en este taller (el archivo con los comentarios y la discusión está fundamentalmente en castellano, que fue la lengua principal del desarrollo del taller, pero también hay algunas traducciones de las intervenciones o participaciones realizadas directamente en inglés de las personas que asistieron en el canal).

A través de la evaluación formal del taller, los asistentes han opinado que los contenidos fueron apropiados y el desarrollo del mismo adecuado y bien planificado, aunque algunos de ellos han sugerido que hubiera sido muy interesante tener más tiempo para prolongar las interesantes discusiones que surgieron, o para profundizar en algunos de los temas que se trataron, como por ejemplo: las relaciones entre RDF y otras tecnologías para tareas o dominios específicos, o cómo elegir y usar vocabularios, incluso también, cuándo crear un nuevo esquema o ampliar uno existente. Muchos participantes han sugerido también más tiempo para dedicar al trabajo práctico, en particular, de las dos primeras presentaciones. Esperamos que todos estos temas y otros se sigan debatiendo a través de los foros electrónicos, tanto en español como internacionales.

Muchos de los participantes en el taller plantearon la presentación y realización de algún proyecto conjunto, bien a través de los organismos públicos de investigación latinoamericanos, fundamentalmente argentinos, bien a través de algún proyecto internacional o de cooperación. También se crearon estrechas relaciones personales entre los asistentes en torno a la Web Semántica para planificar actividades académicas y de investigación relacionadas, tanto a nivel institucional (algunas Universidades argentinas participantes, como la Kennedy, crearon, a partir del taller grupos especializados en investigación sobre la Web Semántica), o bien a nivel dominios de aplicación particulares (ámbito de la biblioteconomía, de la accesibilidad Web, o de la ingeniería del software, entre otros). Igualmente algunos de los asistentes propusieron organizar, en Argentina en este caso, periódicamente "Web Semántica demo day", al estilo de los "linux demo day" que ya se vienen organizando en este país, de tal forma que puedan divulgar y profundizar en las tecnologías de la Web Semántica, y así ir ampliando la comunidad de desarrolladores y usuarios a nivel local y regional.

A tenor de estos resultados, se pueden valorar el taller como altamente positivo y conforme al objetivo 3 del SWAD-E de difusión e implantación.

Apéndice A: Proyectos y herramientas

Amaya (inglés)
Navegador/editor para la Web, desarollado como proyecto de código abierto liderado por el W3C y INRIA. Incluye una interfaz para hacer anotaciones de tipo Annotea e implanta un sistema de marcadores en RDF. Esta herramienta tiene, entre otros idiomas, una interfaz en español.
Annotea (inglés)
Protocolo para establecer un sistema de anotaciones en RDF sobre cualquier contenido web. El proyecto, financiado en parte por SWAD-E, incluye el desarollo de un servidor (aunque también existen otros servidores disponibles), una implantación de cliente en Amaya, así como el propio protocolo.
Chump (inglés)
Programa que permite a guardar comentarios sobre temas de interés en un canal IRC, creando automáticamente una página de sumario con enlaces a recursos de interés relacionados con el tema debatido en el canal, además de la historia cronológica completa de toda la discusión.
CWM (inglés)
Procesador para RDF desarollado como proyecto de código abierto y liderado por Tim Berners-Lee y Dan Connolly. En el taller se presentó una completa introducción a su uso en castellano.
DepMark
Aplicación Java para el marcado y gestión de metadatos asociados a los Departamentos de Computación de las universidades chilenas, desarrollado por el grupo de investigación de metadatos (vid. Metadatos.cl) de la Universidad de Chile.
Doap-a-matic (inglés, francés y español)
Aplicación de plantilla web que sirve para crear descripciones DOAP (Descripción De Un Proyecto) en diferentes idiomas. De igual forma que foaf-a-matic, crea ficheros de descripción FOAF en RDF sobre personas, Doap-a-matic crea descripciones en RDF de proyectos, y está dirigido particularmente a los proyectos de software de fuente abierta. Esta herramienta ha sido desarrollada como una aplicación multilingüe por Vincent Tabard y Emmanuell Gutiérrez y Restrepo de la Fundación Sidar hizo una versión en español para que se presentara en este taller.
DOAP (inglés)
Descripción de un Proyecto (Description Of A Project). Proyecto para crear un vocabulario RDF para describir proyectos de software libre. Además de desarrollar un RDFS y ejemplos para describir proyectos de software de fuente abierta, DOAP pretende proporcionar herramientas para soportar el proyecto en todos los lenguajes de programación más populares o usados.
EARL (inglés)
Lenguaje para la evaluación e informe (Evaluation and Report Language).Vocabulario RDF para describir la conformidad de un recurso con una lista dada de requisitos. Existe documentación sobre del código EARL a través de ejemplos, disponible en español.
FOAF
Esquema Amigo de un Amigo (Friend of a Friend). FOAF es un vocabulario RDF (RDF escrito en XML) que sirve para describir, sobre todo, personas y sus relaciones: a quien conoce, de quien es amigo y de quien no, cuáles son sus proyectos actuales y cuáles los pasados, etc.
Foaf-a-matic
Aplicación web que permete de crear un fichero del vocabulario RDF-FOAF a través de un simple formulario o plantilla. Desarollado originalmente por Leigh Dodds, tiene una traducción al castellano realizada por Leandro Mariano López (inkel).
Foafnaut
Buscador gráfico de personas, hecho en SVG por Jim Ley, para localizar información FOAF.
Foaf Explorer (inglés)
Visualizador web y navegador de relaciones para el esquema Friend-of-a-Friend y otros vocabularios RDF relacionados. Foaf Explorer ha sido creado por Leigh Dodds y se basa en el analizador de RDF Raptor (Redland).
Generador Dublin Core
Herramienta en español para generar, a partir de una plantilla web, información Dublin Core sobre documentos en línea. Este generador de metadatos Dublin Core en español ha sido desarrollado por el Grupo Metadatos (Metadatos.cl) en la Universidad de Chile.
Grupo Metadatos (Metadatos.cl)
Sitio del grupo de investigación de la Universidad de Chile sobre metadatos y otras tecnologías relacionadas. Creado bajo el auspicio del CIW (Centro de Investigación de la Web) de esa misma universidad. Este grupo se dedica a la investigación sobre metadatos y otras tecnologías que tienen implicación directa en la construcción de la Web Semántica. Este sitio incluye también un Wiki sobre metadatos (mitad en español, mitad en inglés), así como enlaces a distintos proyectos y aplicaciones desarrollados o en desarrollo en el seno del grupo.
Hera
Herramienta creada por la Fundación Sidar, que permite hacer una evaluación de una página web, reflejando su conformidad con las directrices del W3C para Acccesibilidad de Contenido Web (WCAG) generando un informe en RDF-EARL, al que se le añaden especificidades de otros vocabularios particulares.
Jena (inglés)
Procesador RDF desarollado en Java por Hewlett Packard y financiado en parte por el proyecto SWAD-E.
Kowari (inglés)
Base de datos Open Source, escalable masivamente, construida expresamente para el almacenamiento y recuperación de metadatos, que trabaja de forma nativa con RDF. De forma semejante a lo que hacen las BB.DD relacionales en Kowari se almacena información y se recupera gracias a un lenguaje de interrogación; sin embargo, a diferencia de las bases de datos, está optimizado para el almacenamiento y recuperación de muchas clases de sentencias en forma "sujeto-predicado-objeto".
Raptor (inglés)
Procesador RDF en C desarollado en parte por el proyecto SWAD-E.
RDFPic Extended (inglés, francés, español mezclados)
Herramienta desarollado por Vincent Tabard en colaboración con la Fundación Sidar, basado en la herramienta RDFPic del W3C. Esta versión funciona con una infraestructura de Apache/PHP, mucho mas común que Jigsaw que usa la versión original.
Redland (inglés)
Infraestructura para herramientas RDF. Desarollado por el proyecto SWAD-E, permite usar una sistema RDF a través de muchos lenguajes de programación (p.ej. C, Ruby, PERL, etc.).
SKOS-Core (inglés) (hay una tradução para o Português)
Vocabulario creado por el SWAD-E que permite la descripción en RDF de sistemas de organización del conocimiento tales como tesauros, glosarios, vocabularios, taxonomías, esquemas de clasificación, etc.
TemaTres
Aplicación para la gestión de tesauros que puede presentar sus datos en forma de SKOS (un vocabulario RDF para tesauros) Sobre este tema, ver también el artículo: Automatización de tesauros y su utilización en la Web Semántica de José Ramón Pérez Aguëra, presentado en el otro taller en español sobre la Web semántica, celebrado en junio en Madrid).