Bildemedia på webben

Håkon Wium Lie <howcome@w3.org>
World Wide Web Consortium, INRIA, Sophia-Antipolis, Frankrike

Dette dokumentet finnes i elektronisk form på: http://www.w3.org/pub/WWW/People/howcome/p/webben/

Artikkelen bygger på et foredrag som ble holdt på seminaret "Utdanning uten ord?", Høgskolen i Lillehammer, 11-13 oktober 1995. Revidert august 1996 og februar 1997.

Sammendrag

WWW ("webben") er et distribuert hypermedia system som på få år har etablert seg som en av de viktigste tjenestene på Internett, og antagelig den som trekker flest nye brukere til nettet. Denne artikkelen belyser tre konflikter der bildemedia står sentralt:

(1) Et av vendepunktene i webbens korte historie var muligheten for å kombinere bilder og tekst i samme dokument. Måten bilder ble introdusert på er fortsatt omstridt, men bilder tar i dag mer nettkapasitet enn tekst.

(2) Webben baserer seg på dokumentformat som verdsetter logisk struktur framfor visuell presentasjon. Mangelen på typografisk kontroll har gjort at enkelte informasjonsleverandører lager bilder av tekst i stedet for å sende over teksten i lesbar form. Bildene har ingen fordommer mot kontroll av fonter, farger og utlegg, men de tar mer kapasitet enn tekst og hindrer ikke-visuell tilgang til webben.

(3) Bildemateriale på webben publiseres i komprimert form. I desember 1994 hevdet Unisys å ha patent på komprimeringsteknologien i et av de mest brukte bildeformatene (GIF). Dette førte til sterke reaksjoner på nettet, og man har siden sett utviklingen av et alternativt format (PNG) som benytter anledningen til legge til ny funksjonalitet.

Hva er webben?

World Wide Web (WWW, eller "webben") er et distribuert hypermedia system på Internett ("nettet"). Med en nettleser (et program på ens egen maskin) kan en søke fram og hente ut tekst, bilder og lyd fra tjenermaskiner på nettet. Informasjonen er hyperlenket på tvers av dokumenter og tjenermaskiner. Brukerterskelen er lav, og det er tilsvarende enkelt å selv publisere informasjon. I løpet av få år har webben etablert seg blant de viktigste tjenestene på nettet (sammen med elpost, diskusjonsgrupper og prategrupper). Når journalister skal presentere Internett for sitt publikum er det webben som først trekkes fram: det enkle grensesnittet og de fargerike bildene gjør det attraktivt.

Denne artikkelen omhandler bildemediets plass på webben. Spesielt vil tre konflikter der bildemedia står sentralt belyses.

Bakgrunn

Webbens korte historie begynner rundt 1990. Da la Tim Berners-Lee og Robert Cailliau ved CERN fram et prosjektforslag med tittel "WorldWideWeb: Proposal for a HyperText Project".

CERN er et europeisk forskningssenter for kjernefysikk, med stor informasjonsflyt. Målet med prosjektet var først å lette distribusjon av elektronisk informasjon internt på CERN. Fokus var primært på tekst, "hypertext" er da også med i tittlen på prosjektforslaget. Ikke-tekstlig informasjon nevnes også:

Nodes can in principle also contain non-text information such as diagrams, pictures, sound, animation etc. The term hypermedia is simply the expansion of the hypertext idea to these other media. Where facilities already exist, we aim to allow graphics interchange, but in this project, we concentrate on the universal readership for text, rather than on graphics.

Prosjektet utviklet tidlig et enkelt, strukturert, hypertekst oppmerkingsspråk, Hypertext Markup Language (HTML). Men "strukturert" menes i denne sammenheng at man oppmerker hva som er overskrift, avsnikk, fotnote osv. i stedet for hvordan dokumentet skal presenteres for brukeren. F. eks. er toppnivå overskrift i dette documentet oppmerket som:

  <H1>Bildemedia på webben</H1>

HTML er basert på Standard Generalized Markup Language (SGML), et rammeverk for å beskrive strukturerte dokumenter. SGMLs historie går tilbake til rundt 1970, og SGML-kulturen har tradisjonelt vært elitisk og skeptisk til ikke-tekstlige media.

Konflikt 1: <IMG>

Fram til 1993 gikk arbeidet i WWW-prosjektet på CERN framover med normal hastighet. Spesifikasjonene var hele tiden fritt tilgjengelige, og utviklingen ble diskutert på åpne elektroniske meldingslister. Tjenermaskiner dukket opp flere steder i verden, og også utenfor CERN begynte man å skrive programvare. I Mosaic-prosjektet ved NCSA utviklet Marc Andreessen en grafisk nettleser. Den ble gjort fritt tilgjengelig på nettet under navnet Xmosaic i januar 1993. Programmet var det beste man hadde sett på webben til da, og Tim Berners-Lee applauderte selv med "Brilliant!". Selv om grensesnittet var grafisk var den første versjonen av Xmosaic kun i stand til å vise tekst. Det skulle ikke vare lenge: 25. februar foreslår Marc Andreessen et nytt merke i HTML: <IMG>. Responsen fra TimBL er denne gang noe mer dempet: "But I hadn't wanted a special tag.". Det er flere grunner til at <IMG> møtte motstand:

Likevel, <IMG> ble raskt implementert i Xmosaic, og i ettertid mener mange at dette var hovedgrunnen til at bruk av Xmosaic og web eksploderte i 1993. Demo-effekten av kombinasjonen bilder/tekst var meget høy, og fleste av dagens brukere ble introdusert til teknologien som et kombinert medium.

Senere forsøk på å endre <IMG> til et mer generelt merke (som eksempelvis også kunne inludere lyd) har feilet. Det eneste tekst-kulturen klarte å få inn var et ekstra attributt som signaliserer en alternativ tekst dersom nettleseren ikke viser bilder:

  <IMG SRC=firmalogo.gif ALT="Bilde av firmaet's logo">

Som den neste konflikten vil vise, unnlates ofte dette attributtet.

I dag inkluderer de fleste HTML-dokumenter flere ikoner/bilder. Statistikken er begrenset, men anslag indikerer at 40% av trafikken (målt i antall bit) på webben er still-bilder. Filmer/animasjoner står for omlag 20%, mens 30% er tekst. Resten er lydfiler, binærfiler etc. Altså: bildemedia tar dobbelt så mye nettkapasitet (40% + 20%) som tekst (30%).

Bildematerialet på webben kan grovt sett deles inn i:

Den siste gruppen er tema for konflikt nummer 2.

Konflikt 2: avbildning av tekst

Som tidligere nevnt er HTML et strukturert dokumentformat hvor forfatter ikke kontrollerer hvordan dokumentet presenteres for leseren. Papirbasert forlagsvirksomhet har tradisjonelt hatt full kontroll over presentajonen, og aksepterer vanskelig det endrede maktforholdet der leseren, sammen med sin nettleser, kan velge fonter og farger. En måte å oppnå full kontroll på er å lage bilder av teksten. I et bilde vil en typograf kunne uttrykke fonter, farger og utlegg til den minste bit. Mens den grafiske nettleseren i figur 1 viser fram fargebilder med avbildet tekst, vil brukere med tekstbaserte nettlesere ofte finne lite nytting informasjon. Se figur 2.

Skjermbilde fra Netscape

Figur 1 viser hvordan Dagbladets overfører sin forside: som bilder.

Skjermbilde fra en tekst-basert nettleser

Figur 2 viser hvordan Dagbladets forside ser ut for en som ikke har en grafisk nettleser: ingen nyttig informasjon. Man avspises med en linje om hvem som har "tilrettelagt" informasjonen.

Mange grupper taper på avbildningen:

Likevel, en vil kunne forstå at aviser, med århundrer av typografisk tradisjon, ønsker å ta noe med seg over i den elektroniske verden. En framtidig mulighet er å bruke stilsett (style sheets) som kombinererer det beste fra to verdener: et dokuments struktur, og en presentasjon der også forfatteren får influere. Stilsett er samlinger av hint for hvordan et dokument skal presenteres:

  H1 { font-family: 60pt palatino }

Eksempelet over viser hvordan en linje i et stilsett beskriver formatteringen av overskrifter i HTML. Omlag 10 linjer av tilsvarende kompleksitet beskriver stilarten brukt i figur 3.

Et dokument formattert med stilsett

Figur 3. Stilsett kombinererer det beste fra to verdener: et dokuments struktur, og en presentasjon der også forfatteren får influere. Skjermbildet er laget med Arena, en nettleser som forsøksvis implementerer stilsett.

I august 1996 lanserte Microsoft en kommersiell nettleser som støtter stilsett (Microsoft Internet Explorer 3), og Netscape fulgte opp i februar 1997 (Netscape Navigator 4). Med støtte fra de to dominerende nettleserne er det ventet at stilsett vil kunne erstatte mange av bildene som inneholder tekst. Dette vil dempe koflikten mellom bilder og tekst på webben.

Konflikt 3: PNG mot GIF

Bildemateriale på webben publiseres i komprimert form. I desember 1994 hevdet Unisys å ha patent på komprimeringsteknologien (LZW) i et av de mest brukte bildeformatene (GIF). Dette førte til sterke reaksjoner på nettet. Unisys ble kraftig kritisert for å forsøke "skattlegging" av nettet som kun av historiske årsaker bruker GIF som overføringsformat. Unisys måtte klarifisere sitt standpunkt og la særlig vekt på at webben fortsatt kunne bruke GIF fritt:

For organizations introducing World Wide Web servers and "Home Page" offerings, most will not be required to secure a license from Unisys. Most organizations acquire software from other developers to create their offerings on their servers. Therefore, only the software firms who sell the enabling software for profit would be expected to secure a licensing agreement from Unisys.

Det er lite unikt ved GIF som bildeformat, og Unisys var med rette engstelig for at webben skulle finne andre overføringsformat. Holdningen på nettet var klar: ingen skal få eie bildeformatet vårt! En elektronisk dugnad startet straks arbeidet med en ny standard, og de ble støttet av Compuserve, en kommersiell elektronisk oppslagstavle som hadde vært Unisys sitt første legale angrepsmål. I mai ble spesifikasjonen til det nye bildeformatet PNG lagt fram. Det er for tidlig å si om PNG vil overta GIF sin rolle på webben, men den er teknisk mer avansert og inneholder funksjonalitet som vil kunne gjøre bilder på webben mer spennende.

Sluttord

Konfliktene beskrevet ovenfor handler om et nytt medium. Men, det er ikke første gang tekst og bilder er i kamp. Et sitat fra Neil Postman's "Amusing ourselves to death" gir litt perspektiv:

That the image and the word have different functions, work at different levels of abstraction, and require different modes of response will not come as a new idea to anyone.. The new imagery, with photography at its forefront, did not merely function as a supplement to language, but bid to replace it as our dominant means for constructing, understanding and testing reality.. By the end of the nineteenth century, advertisers had discovered that a picture was not only worth a thousand words, but, where sales were concerned, was better.

Det er å håpe at bildemedia på webben ikke kun fører til øket salg og dødlig fornøyelse.


howcome 951010, 960816, 970227