Logo

Szemantikus Web: Bevezető

Herman Iván, a W3C Hivatalok Vezetője
Budapest, 2002 Szeptember 24

  1. Title Page
  2. Út a Szemantikus Web felé
  3. Mire van szükség?
  4. Egy példa
  5. Állítások
  6. Resource Description Framework
  7. Egyszerű RDF
  8. Az URI-k alapvető szerepe
  9. Új állítások hozzáillesztése
  10. RDF Tárolók
  11. RDF tárolók (folyt.)
  12. Bonyolultabb állítások konstruálása
  13. További gondolatok, példák
  14. RDF leírás kapcsolása XML-hez
  15. Hogyan használjuk az RDF leírást?
  16. Az RDF önmagában kevés...
  17. RDF Sémák
  18. Példabeli objektumok definíciói
  19. Kapcsolatok definiciói
  20. A Webontológia irányába...
  21. Ontológiák
  22. Web Ontologies Language (OWL)
  23. Néhány OWL példa
  24. W3C specifikációk
  25. Kapcsolódó specifikációk (folyt.)
  26. Nyilvános W3C fórumok
  27. Néhány eszköz
  28. Alkalmazási példák
  29. Alkalmazási példák (folyt.)
  30. Alkalmazási példák (folyt.)
  31. További információk
Logo

Szemantikus Web: Bevezető

Herman Iván, a W3C Hivatalok Vezetője

W3C Magyar Hivatalának Megnyitóünnepsége

Budapest, 2002 Szeptember 24

http://www.w3.org/2002/Talks/2409-Budapest-IH/

Logo

Út a Szemantikus Web felé

  • A hálózaton az információk megtalálhatók
    • természetes nyelveken (angol, magyar, kínai,...)
    • grafikus, multimédiás, stb. formában
  • Emberek számára ez meg is felel, de a gépek nem értik!
  • Elosztott rendszerek esetén:
    • automatikus módszerek is szerepet játszanak
    • szoftver ágensek megpróbálják értelmezni az információkat
    • az adott célterületen precíz szóhasználat szükséges

Herman Iván, a W3C Hivatalok VezetőjeBudapest, 2002 Szeptember 241 (30)
Logo

Mire van szükség?

  • Hogy egy (adat)forrás saját magát is le tudja írni
    • az erre szokásos terminológia: „metaadat”
    • a metaadatot XML-ben (vagy más, gép által olvasható formában)

      is lehessen reprezentálni

    • a metaadathoz a szókészletet is definiálni kell
    • az ágenseknek következtetéseket kell tudniuk levonni a metaadatokból

    A „Szemantikus Web” következtetéseket lehetővé tevő infrastruktúra a Weben

  • A „Szemantikus Web” kiterjeszti a Web jelenlegi lehetőségeit

    („globálisan összefüggő adatbázis”)

Herman Iván, a W3C Hivatalok VezetőjeBudapest, 2002 Szeptember 242 (30)
Logo

Egy példa

  • A kép tartalmát szövegesen is le szeretnénk írni

    (fontos az elérhetőséghez):

    • adjunk meg metaadatot, amely leírja a képet
    • legyen egy eszköz, amely (a metaadat alapján)

      egyszerű kimenetet állít elő

    • használjunk szabványosított metaadat formalizmust
W3C tagok alakulása 2002-ig

Herman Iván, a W3C Hivatalok VezetőjeBudapest, 2002 Szeptember 243 (30)
Logo

Állítások

  • A metaadat állítások sorozata:
  • A mi esetünkben, például:
    • „a teljes ábra típusa egy grafikon, a grafikon «vonalas» típusú”
    • „a grafika felirata egy (SVG) szövegelem”
    • „a jelmagyarázat egyben egy hiperlink”
    • „a hiperlink erre és erre a «URI»-ra mutat”
    • „a teljes ábra a jelmagyarázatból, tengelyekből és adatgörbékből áll”
    • „a görbék a teljes jogú és társult tagokat, illetve as összes tagot ábrázolják”
  • Az állítások a forrásokra vonatkoznak:
    • SVG elemek, általános hivatkozások,...

Herman Iván, a W3C Hivatalok VezetőjeBudapest, 2002 Szeptember 244 (30)
Logo

Resource Description Framework

(RDF, Forrásleíró Keretrendszer)

Az állításokat a következő módon modellezhetjük:

  • Forrás: egy elem, egy URI, literál, ...
  • Kapcsolat: irányított reláció két forrás között
  • Állítás: két forrás egy őket összekapcsoló relációval

RDF az ilyen típusú állítások általános modellje

  • kifejezhető XML-ben, de más szintaxissal is (pl. n3)

Herman Iván, a W3C Hivatalok VezetőjeBudapest, 2002 Szeptember 245 (30)
Logo

Egyszerű RDF

Egy egyszerű RDF gráf kóddal

Herman Iván, a W3C Hivatalok VezetőjeBudapest, 2002 Szeptember 246 (30)
Logo

Az URI-k alapvető szerepe

  • A forrásokat egyértelműen azonosítják
  • Ez az egyértelműség lényeges a konzisztens állításokhoz
  • URI-k lehetnek
    • Protokoll függőek (http://, mailto:)
    • Protokoll/hely függetlenek (URN-s, PURL)

Herman Iván, a W3C Hivatalok VezetőjeBudapest, 2002 Szeptember 247 (30)
Logo

Új állítások hozzáillesztése

Kicsit komplikáltabb RDF gráf

Herman Iván, a W3C Hivatalok VezetőjeBudapest, 2002 Szeptember 248 (30)
Logo

RDF Tárolók

RDF gráf Bag-el

Herman Iván, a W3C Hivatalok VezetőjeBudapest, 2002 Szeptember 249 (30)
Logo

RDF tárolók (folyt.)

  • A tárolók előre definiált RDF kapcsolattípusokat használnak:
    • rdf:type
    • rdf:_1, rdf:_2, rdf:_3, stb.
  • rdf:Bag és rdf:li röviditések az XML kódoláshoz
  • További tároló típusok: Seq, Alt

Herman Iván, a W3C Hivatalok VezetőjeBudapest, 2002 Szeptember 2410 (30)
Logo

Bonyolultabb állítások konstruálása

Nagyobb RDF gráf, kóddal

Herman Iván, a W3C Hivatalok VezetőjeBudapest, 2002 Szeptember 2411 (30)
Logo

További gondolatok, példák

Herman Iván, a W3C Hivatalok VezetőjeBudapest, 2002 Szeptember 2412 (30)
Logo

RDF leírás kapcsolása XML-hez

  • Az rdf:about használható a kapcsoláshoz
    • ez egy URI, vagyis hivatkozhatunk bármely XML dokumentumra
  • A leíráshoz névterek is használhatók. Például, SVG esetén:
  <svg ...>
  ...
    <metadata>
      <rdf:RDF
         xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#">
      ...
      </rdf:RDF>
    </metadata>
   ...
  </svg>

Herman Iván, a W3C Hivatalok VezetőjeBudapest, 2002 Szeptember 2413 (30)
Logo

Hogyan használjuk az RDF leírást?

A példánkban használatos eszköz

  1. felhasznál egy nyilvános RDF elemzőt a metaadat feldolgozására
  2. feloldja a hivatkozásokat az SVG elemek eléréséhez
  3. felhasználja az ott lévő információkat az output előállításához
    • pl. szövegelem tartalmak, hiperlink adatok, leírások
  4. kombinálja ezeket egy általános szöveggel
  5. végül egy (formázott) szöveget generál

Herman Iván, a W3C Hivatalok VezetőjeBudapest, 2002 Szeptember 2414 (30)
Logo

Az RDF önmagában kevés...

Milyen szókészletet használjunk („Contains”, „ChartType”, stb.)?

  • RDF-ben nincs kapcsolat a (szokásos) adattípusokkal
    • a Labelled összefüggés értéke boolean kellene hogy legyen

      annak matematikai ételmében

    • az RDF kovetkező verziójában ez szerepelni fog
  • Meg kell egyeznünk egy adott szókészletben
    • az RDF Sémák (Schemas) használata az első lépés:
      • milyen kapcsolatok használhatók?
      • mely forrásokra érvényesek a kapcsolatok?

Herman Iván, a W3C Hivatalok VezetőjeBudapest, 2002 Szeptember 2415 (30)
Logo

RDF Sémák

  • Egy objektum alapú terminológia források definiálására
    • leírja a források osztályait
    • minden a Resource alosztálya
  • A forrásokon kapcsolatok definiálhatók
    • értékkészlet és értelemezési tartomány („range” és „domain”), vagy
    • specializáció (subPropertyOf) segítségével
RDF Séma osztályok összképe

Herman Iván, a W3C Hivatalok VezetőjeBudapest, 2002 Szeptember 2416 (30)
Logo

Példabeli objektumok definíciói

(Megj.: ez is RDF...):

<rdfs:Class rdf:ID="SvgEntity">
 <rdfs:comment>The class of SVG elements</rdfs:comment>
 <rdfs:subClassOf 
   rdf:resource="#http://www.w3.org/2000/01/rdf-schema#Resource"/>
</rdfs:Class>
<rdfs:Class rdf:ID="graphicsShape">
 <rdf:comment>This should be: Rectangle, Circle, ... </rdf:comment>
 <rdfs:subClassOf 
   rdf:resource="#http://www.w3.org/2000/01/rdf-schema#Literal"/>
</rdfs:Class>
<rdfs:Class rdf:ID="boolean">
 <rdfs:comment>This should be true or false</rdfs:comment>
 <rdfs:subClassOf 
   rdf:resource="#http://www.w3.org/2000/01/rdf-schema#Literal"/>
</rdfs:Class>

Herman Iván, a W3C Hivatalok VezetőjeBudapest, 2002 Szeptember 2417 (30)
Logo

Kapcsolatok definiciói

<rdf:Property rdf:ID="IsAnchor">
  <rdfs:domain rdf:resource="#SvgEntity"/>
  <rdfs:range rdf:resource="#boolean"/>
</rdf:Property>
<rdf:Property rdf:ID="Labelled">
  <rdfs:domain rdf:resource="#SvgEntity"/>
  <rdfs:range rdf:resource="#boolean"/>
</rdf:Property>
<rdf:Property rdf:ID="LabelledBy">
  <rdfs:subPropertyOf rdf:resource="#Labelled"/>
  <rdfs:range rdf:resource="#SvgEntity"/>
</rdf:Property>

Íme a teljes (RDF) séma...

Herman Iván, a W3C Hivatalok VezetőjeBudapest, 2002 Szeptember 2418 (30)
Logo

A Webontológia irányába...

Az RDF Sémák csak az alapmechanizmust adják:

  • nem lehet következtetéseket levonni a szókészlet elemeiről:
    • „ha ez az állítás igaz, akkor az az állítás is igaz”
    • „ha ez az állítás igaz, akkor az az állítás nem igaz”
  • nincs megfeleltetés a különböző szókészletek között
  • nincsenek többszörös szülőosztályok, komplex megszorítások, ...

Herman Iván, a W3C Hivatalok VezetőjeBudapest, 2002 Szeptember 2419 (30)
Logo

Ontológiák

A Szemantikus Webnek szüksége van ontológiák felépítésére.

„Az ontológia kifejezéseket és összefüggéseket határoz meg egy adott tudásterület leírásához”

A cél: Egy Webontológia nyelv („Web Ontologies Language”),

amely a következőkön alapszik:

  • RDF és RDF Sémák
  • korábbi munkák:
    • DAML (DARPA projekt), OIL (EU projekt)
    • DAML+OIL (DAMN és OIL egyesítése)
  • a logika, tudásreprezentáció, stb., gyakorlati eredményei

Herman Iván, a W3C Hivatalok VezetőjeBudapest, 2002 Szeptember 2420 (30)
Logo

Web Ontologies Language (OWL)

  • Jelenleg a legaktívabb munka a Szemantikus Web területén
  • A munkacsoport 2001-ben alakult
  • Az első nyilvános dokumentumok 2002 júliusában jelentek meg

Herman Iván, a W3C Hivatalok VezetőjeBudapest, 2002 Szeptember 2421 (30)
Logo

Néhány OWL példa

<rdf:Property rdf:ID="Link">
  <owl:unionOf>
    <rdfs:Property rdf:resource="#IsAnchor"/>
    <rdfs:Property rdf:resource="#ContainsAnchor"/>
  </owl:unionOf>
</rdf:Property>
<rdf:Property rdf:ID="NotLink">
  <owl:complementOf rdf:resource="#Link"/>
</rdf:Property>
<rdf:Property rdf:ID="isConnected">
  <owl:TransitiveProperty/>
</rdf:Property>
<rdf:Property rdf:ID="InstanceOf"/>
  <owl:FunctionalProperty/>
</rdf:Property>
<rdf:Property rdf:ID="GraphicsType">
  <owl:equivalentTo rdf:resource="http:../#GrafikaTípus"/>
</rdf:Property>

Herman Iván, a W3C Hivatalok VezetőjeBudapest, 2002 Szeptember 2422 (30)
Logo

W3C specifikációk

RDF Primer
URI: http://www.w3.org/TR/rdf-primer

a témával most ismerkedőknek...

RDF Syntax and Grammar
URI: http://www.w3.org/TR/rdf-syntax-grammar/

XML kódolási szabályok

Model Theory
URI: http://www.w3.org/TR/rdf-mt/

az RDF szemantika (gráfokon alapuló) pontos definiciója

RDF Test Cases
URI: http://www.w3.org/TR/rdf-testcases/

Herman Iván, a W3C Hivatalok VezetőjeBudapest, 2002 Szeptember 2423 (30)
Logo

Kapcsolódó specifikációk (folyt.)

RDF Schema Specification
URI: http://www.w3.org/TR/rdf-schema/
OWL Features Synopsis
URI: http://www.w3c.org/TR/owl-features/

bevezető az ontológialeírásnyelvbe

OWL Reference
URI: http://www.w3c.org/TR/owl-ref/
OWL Abstract Syntax
URI: http://www.w3c.org/TR/owl-absyn/

Herman Iván, a W3C Hivatalok VezetőjeBudapest, 2002 Szeptember 2424 (30)
Logo

Nyilvános W3C fórumok

Semantic Web/RDF Interest Group
vitafórum, alkalmazások
URI: http://www.w3.org/RDF/Interest
RDF Logic
nyilvános levelezési lista mélyebb szakmai vitákhoz
URI: http://lists.w3.org/Archives/Public/www-rdf-logic/
Annotation and Collaboration
nyilvános levelezési lista RDF-alapú annotációs rendszerekről
URI: http://lists.w3.org/Archives/Public/www-annotation/
W3C Szemantikus Web honlapja
URI: http://www.w3.org/2001/sw/

Herman Iván, a W3C Hivatalok VezetőjeBudapest, 2002 Szeptember 2425 (30)
Logo

Néhány eszköz

Grafikus szerkesztők
pl. IsaViz (Xerox Research) vagy RDF Author (Univ. of Bristol)
RDF fejlesztőeszközök (interpreter, stb.)
pl. HP Laboratórium Jena rendszere
Redland (RDF fejlesztési környezet Python-ban)
Kiértékelők
pl. http://www.w3.org/RDF/Validator/

Herman Iván, a W3C Hivatalok VezetőjeBudapest, 2002 Szeptember 2426 (30)
Logo

Alkalmazási példák

Dublin Core
szókészlet elosztott digitális könytárak számára

- az egyik legelső metaadat szókészlet RDF-ben

- URI: http://www.dublicore.org

PRISM
„Publishing Requirements for Industry Standard Metadata”

- hírek, katalógusok, stb., tartalmát összegyűjti, kezeli,...

- a Dublin Core kiterjesztése

- pl. szól a digitális jogok követéséről is

- URI: http://www.prismstandard.org

Herman Iván, a W3C Hivatalok VezetőjeBudapest, 2002 Szeptember 2427 (30)
Logo

Alkalmazási példák (folyt.)

Web Content Syndication (RSS)
HTML lapokból való híranyag automatikus generálására

- létezik egy Yahoo vitafórum is:

- URI: http://purl.org/rss/

- íme két példa a W3C híranyagának felhasználására:

- Meerkat and NewsIsFree

XMP (Adobe)
RDF metaadatok az összes Adobe file formátumban

- az eszköz mindenki számára elérhető!

- URI: http://www.adobe.com/products/xmp/main.html

Herman Iván, a W3C Hivatalok VezetőjeBudapest, 2002 Szeptember 2428 (30)
Logo

Alkalmazási példák (folyt.)

TAP
több ezer „valódi” forrásokból álló RDF adatbázis

- kategorizált referenciákkal

- eszköztár egy ilyen adatbázis kezelésére

- URI: http://tap.standford.edu

Artiste projekt
„egyesített művészeti analízis és navigációs környezet”

- az RDF hidat képez a különboző művészeti adatbázisok

terminológiái között

- URI: http://www.artisteweb.org/index2.html

Herman Iván, a W3C Hivatalok VezetőjeBudapest, 2002 Szeptember 2429 (30)
Logo

További információk

Ez az előadás:
http://www.w3.org/2002/Talks/2409-Budapest-IH/
Szemantikus Web Honlap
http://www.w3.org/2001/sw/
További információk a W3C-ről:
http://www.w3.org/Consortium/
Levelezési címem:
ivan@w3.org

Herman Iván, a W3C Hivatalok VezetőjeBudapest, 2002 Szeptember 2430 (30)