W3C | Preklady

XML v desiatich bodoch

XML, XLink, Namespace, DTD, Schema, CSS, XHTML ... Pre začiatočníka môže byť ťažké zistiť, kde s XML začať. Týchto desať bodov sa pokúša zhrnúť jeho základy a umožniť tak nováčikovi, aby ho pochopil. A ak vediete kurz o XML, prečo nezačať týmto súhrnom?

1. XML slúži k štrukturalizácii dát

Štrukturované dáta — to sú tabuľky, adresáre, konfigurácie, obchodné transakcie, technické výkresy... XML je súbor pravidiel (môžete si ho predstaviť aj ako smernicu alebo konvenciu) tvorby textových formátov, ktoré umožňujú štruktúrovať vaše dáta. XML nie je programovací jazyk a k jeho zvládnutiu nieje potrebné mať znalosti o programovaní. XML uľahčuje počítaču tvoriť, čitať a zapisovať dáta a zaistiť jednoznačnosť štruktúry dát. XML sa vyhlo bežným nevýhodám popisovacích jazykov: je rozšíriteľné, nezávislé na platforme a podporuje lokalizáciu. XML plne vyhovuje štandardu Unicode.

2. XML vyzerá trochu ako HTML

Rovanko ako HTML, i XML používa tzv. tagy (názvy uzatvorené medzi lomenými zátvorkami '<' a '>') a atribúty (v tvare názov="hodnota"). Zatiaľ čo HTML presne špecifikuje, čo ktorý tag či atribút znamená a ako bude v prehliadači zobrazený text vnútri, XML používa tagy iba k ohraničeniu častí dát, a ich interpretácia je ponechaná aplikácii, ktorá dáta číta. Inými slovami, pokiaľ je v XML tag <b>, nepredpokladá sa, že bude obsahovať tučné písmo. Podľa situácie to môže znamenať napr. bydlisko, body, brat, b... (a kto povedal, že to musí byť slovo obsahujúce "b"?).

3. XML je text, ale nie je určený na čítanie

Programy vytvárajúce tabuľky, kontakty a iné štrukturované dáta ich väčšinou zapisujú na disk, a to buď v binárnom alebo textovom formáte. Výhoda textového formátu je, že umožňuje ľuďom nahliadnuť na dáta s obyčajným textovým editorom. Textový formát tiež uľahčuje vývojárom ladenie programov. Ako HTML i XML sú textové súbory, ktoré ľudia nemusia čítať, ale pokiaľ je to potrebné, môžu. XML je však oproti HTML o niečo prísnejší, čo sa týka formátu. Zabudnutý tag alebo atribút bez úvodzoviek robí XML súbor neplatným, zatiaľ čo HTML to niekde dokonca výslovne povoľuje. Oficiálna XML špecifikácia zakazuje aplikáciám "domýšľať si", čo tvorca poškodeného XML súboru zamýšľal, a pokiaľ objaví chybu, musí načítavanie zastaviť a ohlásiť chybu.

4. XML nešetrí miestom

Pretože XML je textový formát a používa tagy k oddeleniu dát, je XML súbor skoro vždy väčší než porovnateľné dáta v binárnom formáte. S tým sa pri návrhu XML počítalo. Výhody textového formátu sú evidentné (viď bod 3) a nevýhody sú kompenzované na inej úrovni. Miesto na disku je stále lacnejšie a kompresné programy ako zip alebo gzip zvládajú zmenšiť objem dát veľmi dobre a veľmi rýchlo. Navyše komunikačné protokoly ako modemový protokol a HTTP/1.1, hlavný protokol na webe, komprimujú dáta za behu a  šetria tak kapacitu liniek skoro ako binárne formáty.

5. XML celá skupina technológií

XML 1.0 je špecifikácia definujúca, čo sú tagy a atribúty. Na základe XML 1.0, "XML rodina" vytvára niekoľko modulov, ktoré ponúkajú rôzne služby plniace časté a dôležité potreby. Xlink popisuje štandardnú cestu ako pridať do XML súboru hypertextové odkazy. XPointer slúži k odkazovaniu na časti XML dokumentov. XPointer je niečo ako URL, ale namiesto odkazov na dokumenty na webe odkazuje dovnútra XML dokumentu. CSS — štýlovací jazyk, sa dá aplikovať na XML podobne ako na HTML. XSL je vylepšený jazyk pre zapisovanie štýlov. Je založený na XSLT — transformačnom jazyku používanom na pridávanie, odoberanie a úpravu tagov a atribútov. DOM je štandardizácia funkcií pre manipuláciu s XML (a HTML) súbormi v programovacích jazykoch. XML Schema 1XML Schema 2 pomáhajú vývojárom presne definovať štruktúru ich vlastných formátov založených na XML. K dispozícii je niekoľko ďalších modulov, ďalšie sa vyvíjajú. Viď W3C's technical reports page.

6. XML je staronové

Vývoj XML začal v roku 1996 a stal sa doporučením W3C od februáru 1998, čo môže budiť dojem, že ide o nevyspelú technológiu. V skutočnosti táto technológia nie je úplne nová. Pred XML existovalo SGML — vyvíjané v osemdesiatych rokoch, štandard ISO od roku 1986, široko používaný pre rozsiahle dokumentácie. Vývoj HTML začal v roku 1990. Tvorci XML prevzali to najlepšie zo SGML podľa skúsenosti s HTML a vytvorili niečo rovnako mocné ako SGML, ale jednoduchšie na používanie. Aj keď niektoré evolúcie sú nerozoznateľné od revolúcií... A je treba povedať, že zatiaľ čo SGML je určené skôr pre technickú dokumentáciu než dáta iného druhu, u XML je to naopak.

7. XML vedie HTML k XHTML

Dôležité použitie XML, formát dokumentov XHTML, je nástupcom HTML. XHTML má mnoho elementov rovnakých ako HTML. Syntax bola pozmenená, aby vyhovovala pravidlám XML. Dokument, ktorý je založený na XML ("XML-based"), dedí syntax XML a rôzne ju obmedzuje (napr. XHTML povoľuje <p>, ale nie napr. <r>); tiež dáva syntaxi význam (XHTML určuje, že <p> je odstavec (paragraph, pozn. prekladateľa) a nie napr. policajt, pokuta, pelendrek alebo čokoľvek iné).

8. XML je modulárne

XML dovoľuje definovať nový formát kombináciou a opätovným použitím iných formátov. Keďže by dva formáty vyvíjané nezávisle na sebe mohli mať definované rovnaké názvy elementov alebo atribútov, musíme si pri ich kombinovaní dávať pozor. Aby sa predišlo zámene, XML obsahuje mechanizmus menných priestorov (namespaces). XSL a RDF sú dobré príklady XML-založených formátov používajúcich menné priestory. XML Schema je navrhnutá tak, aby umožňovala použitie menných priestorov pri návrhu štruktúry dát. Potom je ľahké vytvoriť novú schému kombináciou dvoch iných a spojiť tak štruktúru dokumentu.

9. XML je základom RDF a Sémantického Webu

Systém popisu zdrojov od W3C (Resource Description Framework, RDF) je XML formát podporujúci popis zdrojov a uplatnení metadát, ako sú hudobné "playlisty", katalógy fotografií, knižnice, atď. RDF vám umožní napríklad identifikovať ľudí na webovom fotoalbume podľa informácií vo vašom adresári, potom môže váš e-mailový program pre týchto ľudí pripraviť správu. Tak ako HTML spojovalo dokumenty, menu a formuláre do webovej aplikácie a naštartovalo originálny Web, RDF poskytuje nástroje na ešte väčšiu integráciu, aby posunulo Web o trochu bližšie ku Sémantickému Webu. Tak ako sa ľudia musia dohodnúť na význame slov používaných v komunikácii, i počítače musia mať význam termínov definovaný, aby mohli komunikovať efektívne. Formálne popisy termínov z určitej oblasti (nakupovanie, výroba, ...) sa nazávajú "ontológia" a sú nevyhnutnou súčasťou Sémantického Webu. RDF, ontológia a reprezentácia významov tak, aby mohli počítače ľuďom pomôcť v práci, to sú témy Aktivity Sémantického Webu ("Semantic Web Activity").

10. XML je nelicencované, platformovo nezávislé a široko podporované

Voľbou XML za základ projektu získate prístup k obsiahlej skupine nástrojov (z ktorých jeden dokonca môže byť to, čo potrebujete!) a odborníkov so skúsenosťami v tejto technológii. Voľba XML je niečo ako keď si zvolíte SQL pre databázu: stále musíte vytvoriť vlastnú databázu a programy na jej obsluhu, ale existuje mnoho nástrojov a ľudí, ktorí vám môžu pomôcť. A keďže XML je k dispozícii bez licencie, môžete vytvoriť vlastný software pracujúci s XML bez toho, aby ste niečo niekomu platili. Rastúca podpora a veľký počet vývojárov vám naviac dajú istotu, že sa nemusíte viazať k jedinému výrobcovi softwaru. XML nie je vždy najlepšou voľbu, ale vždy sa oplatí ho zvážiť ako možnosť.


Preložil Jozef Izso, anglický originál.

W3C Communications Team, w3t-comm@w3.org
Revised 13 Nov. 2001 (last update: $Date: 2004/08/24 13:05:48 $)
Created 27 Mar 1999 by Bert Bos
(Predchádzajúca verzia)