WWW5

Cinquième Conférence Internationale World Wide Web

6-10 mai 1996, Paris, France

Table ronde 5 : Caractéristiques des ressources uniformes : des métadonnées pour les masses

Mercredi 8 mai 1996 - 9:00-10:30


Président de la table ronde

Mark Madsen
APM/ANSA Limited
Poseidon House, Castle Park
Cambridge CB3 0RD, GB
Téléphone : +44-1223-568934
Télécopie : +44-1223-359779
msm@ansa.co.uk

Membres de la table ronde

Description de la table ronde

Les caractéristiques des ressources uniformes (Uniform Resource Characteristics, URC) sont des descriptions de ressources Web, telles que les enregistrements de contrôle bibliographique ou de configuration. Elles participent à divers objectifs sur le Web, tels que les suivants :

Catalogage et indexation des ressources Web : lorsque ces ressources ne constituent pas des documents statiques, mais des services interactifs, le degré d'abstraction fourni par une description en termes d'URC est essentiel.

Résolution de services : une URC peut indiquer plusieurs occurences d'une même ressource (par exemple, un ensemble de miroirs de pages très sollicitées) et contient suffisamment d'informations pour que l'occurence appropriée soit sélectionnée.

Les applications Web faisant appel aux URC requièrent au moins trois formes d'interfonctionnement :

  1. La possibilité pour des applications développées séparément d'échanger des descriptions respectant un schéma de description communément accepté.
  2. La possibilité de transcrire des descriptions d'un schéma dans un autre avec une perte minimale d'informations.
  3. La possibilité pour deux applications utilisant le même schéma descriptif, mais des protocoles de transfert différents, d'échanger des descriptions à l'aide d'une passerelle.

Pour que ces formes d'interfonctionnement soient disponibles, le cadre requis doit spécifier :

  1. La structure des types de données et une fonction de requête minimale, ainsi que les règles de configuration des types de données et des requêtes à partir de et vers au moins deux formats d'enregistrement.
  2. Le mode de transmission de ces formats d'enregistrement par le biais de protocoles de transfert Internet bien établis.
  3. Au moins deux syntaxes pour la définition de nouveaux types de données.
  4. La syntaxe d'un très petit nombre d'éléments descriptifs, tels que les URL et les types de contenu, nécessaires à l'extraction de ressources sur le réseau, est appropriée à toutes les URC à utiliser et relève des standards de l'EIFT.

Afin de présenter toutes les formes d'interfonctionnement, l'objectif est également de standardiser quelques sous-types d'URC et quelques réalisations de structures URC au sein de protocoles de transfert Internet répandus. La table ronde traitera des problèmes et des obstacles qui surviennent lors du développement de schémas d'URC et dressera un bilan des progrès effectués dans ce domaine.


Prises de position et informations biographiques


Ressources et services disposant de connaissances propres - Mark Madsen

Les aspects dynamiques du Web prennent de plus en plus d'importance avec l'introduction de nouvelles technologies pour la gestion de code mobile (tel que Java ou Spinergy), pour l'intégration de systèmes objets (tels que CORBA) par le biais de passerelles, comme dans le cas du système ANSAweb, ou pour l'utilisation de protocole dynamique, comme dans le cas de Black Widow de PostModern Computing. Récemment encore, tout élément du Web était considéré comme document statique dont les caractéristiques pouvaient être déduites des métadonnées minimales contenus dans les en-têtes de type de contenu HTTP. Avec la disparition de cette métaphore, il devient important de pouvoir décrire les caractéristiques des ressources de types aussi variés qu'inattendus. Ces ressources peuvent être des documents d'un nouveau type, des flux d'informations créés à la volée, comme c'est le cas avec la vidéo, ou des agents pouvant migrer d'un noeud Internet à un autre.

Dans chacun de ces cas, l'objet en lui-même et le service qu'il offre doivent être décrits sous une forme permettant à des clients ou à d'autres services de comprendre et d'être compris lors de la spécification de la qualité d'un service ou de la recherche de réponses appropriées à des requêtes contextuelles. Par conséquent, la structure URC doit être développée de sorte à ce que des objets arbitraires soient référencés et codés, et intègrent des connaissances propres afin de pouvoir prendre, ou prendre part à, des décisions concernant la manière de parvenir à leurs objectifs ou à ceux de leurs créateurs. En outre, tous ces processus doivent pouvoir être automatisés de façon fiable.

Mark Madsen est architecte système chez APM/ANSA à Cambridge. Il a occupé des postes de chercheur dans les universités de Cape Town, Sussex, Lancaster, Portsmouth et Leicester. Depuis 1980, il prend part à des projets aussi variés que l'estimation des demandes en logements, les simulations de systèmes physiques, les analyses et évaluations de traitements biomédicaux, les systèmes multimédias distribués en temps réel et la conception de systèmes d'information distribués. Depuis son entrée chez APM en 1995, il contribue au développement de l'architecture ANSAweb et poursuit actuellement les recherches ANSA sur le WWW tout en travaillant sur les problèmes de sécurité Internet en tant que chef du projet E2S. Mark Madsen a été désigné co-président du groupe de travail URC au sein de l'Internet Engineering Task Force.


Des métadonnées pour un meilleur monde de l'information - Leslie Daigle

Un modèle de base des transactions d'informations sur Internet repose sur trois composants : un besoin d'informations, une tâche ou activité de traitement des informations et des ressources d'informations. Ainsi, le besoin en informations d'un client peut-il être satisfait par une tâche de traitement qui puisera dans des ressources spécifiques. Le modèle Web d'interaction de base répartit le traitement entre le client et les ressources de la transaction (le serveur gère un ensemble de ressources et les transmet sur demande ; le client présente la ressource d'une manière appropriée au système local). Toutefois, de plus en plus de services intègrent, au niveau du serveur, un composant important du traitement de la transaction (par exemple, des services de recherche complexes avec des interfaces basiques), ce qui conduit à un déséquilibre de la validation de la transaction.

Pour que les interactions avec les ressources Internet soient plus sophistiquées, les clients doivent pouvoir récupérer une partie de la tâche de traitement qui prend en charge ces interactions. Pour ce faire, le client doit pouvoir présenter ses besoins aux services, mais ces derniers doivent également pouvoir fournir des descriptions de leurs ressources. Le contenu de ces descriptions de ressources peut varier considérablement d'une application à l'autre (par exemple, les descriptions destinées à la récupération de morceaux de musique seront différentes de celles destinées à la représentation de données géospaciales). Toutefois, la représentation des descriptions de ressources doit avoir une structure standard sur Internet. Elle doit également permettre la création de descriptions de ressouces détaillées et propres aux applications, tout en restant indépendantes de toute application, ou groupe d'applications, potentielle. Ces descriptions de ressources constituent des objets de données vitaux dans la mise en oeuvre de transactions d'informations reposant sur un équilibre entre clients et services sophistiqués.

Leslie Daigle travaille chez Bunyip Information Systems Inc. depuis 1993. Au départ employée à temps partiel alors qu'elle travaillait pour son doctorat d'informatique de l'Université de McGill, elle a progressivement évolué vers un poste à plein temps. En tant que chef du projet Silk, client de Bunyip en recherche de ressources bureautiques sur Internet, elle était le principal chercheur dans le développement de la technologie URA (Uniform Resource Agent, agent de ressources uniformes). Leslie Daigle participe aux travaux de l'Internet Engineering Task Force, notamment dans les domaines des UR* et du développement des services de répertoires. A présent vice-président du secteur Recherche chez Bunyip, Leslie Daigle souhaite plus que jamais poursuivre son doctorat dans le domaine des systèmes de recherche multimédia et elle ne manque jamais une occasion de débattre des insuffisances de la technologie de recherche reposant uniquement sur du texte.


Le bon côté des URN - Renato Iannella

Les métadonnées peuvent résoudre l'un des plus grands problèmes de l'Internet et du Web actuellement : l'extraction de très mauvaise qualité des informations. Les groupes de travail URI portant sur le développement de technologies, afin que les URC soient rapidement déployées, aborderont ce type de problèmes.

Si nous tentons d'offrir au Web des services évolutifs de recherche de ressources, je suis intimement persuadé que les URC et les URN sont étroitement liées. Pour participer au processus, nous devons tous avancer rapidement dans ce développement, afin d'exploiter les bénéfices que les services d'indexation à forte qualité peuvent apporter à la communauté du Web.

Il faudra prendre en charge divers schémas d'URC pouvant décrire des documents, des données géospatiales, des services dynamiques, et de nombreux autres types de ressources. Des normes souples et extensibles doivent être définies pour permettre l'échange et la sémantique de ces URC. L'identification des URC avec les URN est un passage obligatoire.

Renato Iannella est chercheur senior au Systems Technology Centre de Brisbane en Australie. Il y dirige le département Resource Discovery Unit qui s'occupe des technologies utilisées dans la recherche et la récupération de ressources sur Internet. Renato Ianella participe aux travaux de l'Internet Engineering Task Force sur les ressources uniformes.


Simplification des URC - Dan LaLiberte

Les URC (Universal Resource Characteristics) sont restées au stade de conception pendant de nombreuses années. L'une des raisons à ce retard dans leur conception, leur mise en oeuvre et leur déploiement, réside dans leur très grande complexité. Mais ironiquement, c'est en étendant la portée du problème des URC que celui-ci peut se simplifier à un niveau plus élevé de généralité.

Il est vain d'essayer de trouver un accord sur ce qui distingue les objets eux-mêmes des descriptions ou des métadonnées. Nous devrions simplement reconnaître qu'une distinction peut être faite, et que les métadonnées représentent tout type de données très structurées. Le contexte de l'utilisation des données définit si elles doivent servir de métadonnées. Les références aux URC ou aux ressources devraient toutes utiliser les URI, et pas particulièrement les URL ou les URN.

Avec ces bases générales, nous devons encore trouver une entente sur les types et les formats de métadonnnées nécessaires, mais cette question pourraît être déléguée à différentes communautés d'utilisateurs et validée dans la pratique, avant de tenter de l'accepter globalement.

Daniel LaLiberte a rejoint le National Center for Supercomputing Applications en 1988. Il a travaillé sur des outils scientifiques de visualisation et de coopération. Actuellement, il travaille sur les aspects architecturaux du World Wide Web, dont la recherche d'informations, les URI et les fonctions d'annotation. Il a obtenu une licence d'informatique à l'Université du Minnesota en 1978 et est actuellement étudiant de troisième cycle dans cette matière à l'Université de l'Illinois, Urbana-Champaign, où il étudie l'ingénierie logicielle, les langages de programmation et l'évolution de l'organisation des informations. Daniel LaLiberte est co-auteur des premières versions de documents Internet sur les schémas de noms de ressources uniformes pour le groupe travaillant sur les identificateurs de ressources uniformes (Uniform Resource Identifiers) de l'Internet Engineering Task Force.


Spécification du contenu sémantique - Stu Weibel

Pour de nombreuses personnes, les URC sont une notion très abstraite. Au niveau le plus élevé, on peut se représenter les URC comme étant une description de ressource de tout type imaginable, qui peut être recherchée, extraite ou échangée entre clients et serveurs de fonctionnalié inconnue et changeante.

Le Net regroupe plusieurs communautés dans le même environnement opérationnel, nécessitant l'échange de métadonnées structurées et formelles provenant de divers models descriptifs. Les personnes sont souvent persuadées qu'elles parlent du même problème, mais la perspective unique de leur propre communauté influence leur vision et les conduit dans des directions différentes. Les solutions qui ne peuvent s'accommoder de la diversité des besoins des nombreux dépositaires ne s'imposeront pas.

Le Warwick Metadata Workshop (atelier de Warwick sur les métadonnées) a conduit à la proposition d'une architecture abstraite d'ensembles modulaires de métadonnées, incluant, entre autres, les descriptions de ressources, les termes et conditions, l'évaluation des contenus et les droits de propriété intellectuelle. Ces schémas de métadonnées peuvent être définis et maintenus par différentes communautés, mais pourraient être créés de sorte à fonctionner en accord afin de satisfaire les besoins des nombreux dépositaires.

Les contenus sémantiques des URC doivent être spécifiés par les experts des contenus ayant fait autorité dans leur communauté respective. Les registres de métadonnées (se rapprochant de la notion de registre MIME) fourniront la structure de l'explication et de la maintenance formelle des nombreux ensembles de métadonnées qui verront le jour.

Le défi que doivent relever les développeurs d'URC consiste à fournir un mécanisme suffisamment souple et robuste pour échanger les descriptions de ressources sans contraindre la sémantique et la syntaxe indépendantes des futurs ensembles de métadonnées.

Stuart Weibel travaille depuis 1985 au Bureau de Recherche de l'OCLC. Il a géré des projets dans les domaines du catalogage automatisé, de la capture de documents, de l'analyse de structure et de l'édition électronique. Il coordonne actuellement des projets de recherche sur les informations mises en réseau, qui comprennent des applications intégrant la technologie World Wide Web et des travaux sur la standardisation du protocole Internet. Le Dr Weibel participe à l'Internet Engineering Task Force (IETF) au sein des groupes travaillant sur le langage de marquage hypertext (Hypertext Markup Language) et les identificateurs de ressources uniformes. Il est également membre fondateur du Comité de la Conférence Internationale World Wide Web (IW3C2). Il participe également au groupe de travail sur la conservation des informations numériques et à celui de l'ALCTS sur l'accès bibliographique aux ressources électroniques.


mailto Envoyer un courrier aux organisateurs


INRIA EC ERCIM W3C
Créé le : 9 avril 1996
Dernière mise à jour : 30 mai 1996