BRAVE NEW WORD

HVORFOR OG HVORDAN DU BØR UNNGÅ WORD-FORMATET,
BÅDE SOM VEDLEGG I EPOST OG SOM LAGRINGSMEDIUM

© Thomas Gramstad 2001
Dette dokumentet er tilgjengelig under GNU Free Documentation License.

LINUXmagasinet nr. 5 2001



  1. HVA ER GALT MED WORD-FORMATET?
  2. FEM TOMMELFINGERREGLER FOR EPOST
  3. WORD-FORMATET UEGNET SOM LAGRINGSMEDIUM
  4. WORD PÅ LINUX
  5. KILDER

Denne artikkelen er både for Windows-brukere og for Linux-brukere som vil vite hvordan de skal forholde seg til Word-formatet. Altså Word-dokumenter i formatet .doc, enten sendt som vedlegg i epost, eller brukt som lagringsmedium for dokumenter.

Mange mennesker både sender og mottar/åpner nærmest automatisk og helt ukritisk slike Word-vedlegg de mottar i epost (eller de greier ikke å åpne dem, noe jeg kommer tilbake til nedenfor). Men det å sende og å åpne Word-vedlegg er en dårlig vane som kan og vil skape problemer for deg selv og andre. Kanskje du har vært heldig og unngått problemene til nå, men vært trygg, de kommer - spesielt hvis du åpner dem på Windows-plattformen.

HVA ER GALT MED WORD-FORMATET?

Hva er det egentlig som er så problematisk med Word-formatet?

  1. Word-vedlegg kan være bærere av virus eller andre eksekverbare filer og innebærer dermed høy risiko for ødeleggelser og tap og mye ekstraarbeid. Den aller verste virustypen, makrovirus, finnes kun i Word.
  2. Word-dokumenter er store og plasskrevende meldinger som er en belastning både for diskplass og nettverk.
  3. Word-dokumenter er flyktige og ubestandige, fordi kompatibiliteten med tidligere og fremtidige versjoner av Word er dårlig. Dvs. at et Word-dokument du tar vare på idag, kan være vanskelig eller umulig å åpne om noen år, når du har en senere versjon av Word. Du mister kontrollen over dokumentene dine. Du kan miste alt innholdet ditt, alt du noen gang har skrevet, dersom du lagrer det i Word-format. Dette er i ferd med å bli et stort samfunnsproblem. Vi har leirtavler som er tusenvis av år gamle og som kan leses den dag i dag, men 10 år gamle Word-dokumenter er å regne som tapt i historiens evige mørke. (Åpne dokumentformater som ren tekst, HTML, XML etc. gir derimot varige dokumenter, som du selv har kontroll over.) Word er ikke ett format, det er mange, og dette er et stort problem.
  4. Word-dokumenter er versjonsavhengige. Hvis du vil utveksle et Word-dokument med noen som bruker en annen versjon av Word enn deg, er sjansen stor for at dere får problemer med å lese hverandres dokumenter. (Microsoft ønsker at det skal være slik. Ved å legge inn slik versjons-inkompatibilitet kan man tvinge alle Word-brukerne til å kjøpe den siste versjonen av Word (som kommer i ny utgave med kosmetiske endringer hvert år), slik at alle kundene må betale på nytt og på nytt for den samme programvaren.)
  5. Word-dokumenter er plattform- og applikasjonsavhengige, dvs. at det er problematisk, brysomt eller tungvint å aksessere/åpne Word-dokumenter på andre plattformer eller applikasjoner enn Microsoft (for eksempel Mac, Linux, Unix, Lotus osv.) - det krever at du må ha og starte opp et spesialprogram utenfor epostklienten din for å kunne åpne og lese vedlegget, hvis du i det hele tatt klarer å åpne det.
  6. Dette er også et politisk spørsmål: plattform-avhengigheten kommer av at Word er proprietær og lukket programkode, dvs. at kildekoden for formatet er lukket/hemmelig og ikke er fritt tilgjengelig. Dette er i siste instans en trussel mot demokratisk tilgang til informasjon og ytringsfrihet, fordi den som eier formatet får altfor stor makt i forhold til forfatter, leser og allmennheten (tenk om papir hadde vært et proprietært, lukket format: da kunne den som eide papir-formatet ha hindret hvem som helst i å skrive eller lese, og ville også kunne slette eller gjøre utilgjengelig tidligere skrifter ved å endre papirformatet).
  7. Flere og flere nettsteder opererer etterhvert med brannmurer som ikke tillater åpning av Word-vedlegg, for å øke sin datasikkerhet (jfr. virusfaren).
  8. Det nye "geniale" lisenssystemet til Microsoft går ut på at du ikke kan eie programmet, bare leie (lisensiere) retten til å bruke det i en viss (begrenset) tid. Kort fortalt: Slutter du å betale denne Microsoft-skatten slutter programmet å virke. Det kan bli svært dyrt for arkivarer rundt om å være nødt til å betale skatten hvert år for en haug av MS-produkter, bare for å opprettholde muligheten til å kikke på sine egne data!

FEM TOMMELFINGERREGLER FOR EPOST

Følgende 5 forholdsregler eller tommelfingerregler for epost vil spare deg for en rekke problemer og gjøre din datahverdag mye greiere:

  1. Unngå vedlegg der du kan, og unngå spesielt Word-vedlegg og andre vedlegg som kan være eksekverbare. Send plain text/ren tekst i alle tilfeller der dette er mulig.

  2. Hvis du må sende vedlegg, velg et format som er mest mulig plattformuavhengig og åpent og som ikke inneholder eksekverbare filer. (Virus er eksekverbare filer. Hvis du ikke har eksekverbare filer i eposten din, så har du ikke virus. Så enkelt er det.). Eksempler på gode formater er HTML og XML. Også PDF og RTF er bedre enn Word-formatet (men merk at det nylig har blitt oppdaget PDF-virus). Men de to første er de beste, og om ikke så lenge vil nok XML være det beste og vanligste alternativet.

  3. Vurdér om det er bedre å legge dokumentet ut på en webside og sende mottakeren URL'en til websiden, fremfor å sende hele dokumentet i epost. Velg denne løsningen dersom du ikke har spesielle grunner for ikke å gjøre det. Dette gjelder spesielt de tre første formatene (HTML, XML, PDF). PDF gir ganske store filer; HTML fungerer bedre på websider enn i epost fordi formatteringen er ikke lik i ulike epostklienter, kan overstyres av mottaker, ikke fungerer i det hele tatt i noen klienter, og tar 4-6 ganger så mye plass som en plain text-melding. Dessuten kan "HTML-epost" medføre scripts som igjen kan inneholde virus (dette gjelder f.eks. "HTML-epost" med Flash.) Poenget er altså å unngå scripts og alle andre eksekverbare vedlegg i epost.

  4. Word-vedlegg (.doc) er helt uegnet som utvekslingsformat og bør for enhver pris unngås i epost. Du kan likevel til nød bruke Word som tekstbehandlingsprogram på din maskin - poenget er å unngå Word-formatet i epost (altså som utvekslingsformat). Skal du utveksle dokumenter med noen via epost bør du konvertere eller lagre dokumentet i et annet format før du sender det. (Også dersom du skal lagre dokumentet og bruke det igjen mer enn et år senere bør du unngå Word-formatet, se nedenfor.)

  5. Hvis du likevel må utveksle et Word-dokument med noen, så hold deg alltid til disse to enkle sikkerhetsrutinene:
    1. Dersom du skal sende et Word-dokument, avtal dette med mottaker på forhånd, før du sender dokumentet avgårde.
    2. Dersom du mottar et Word-dokument som du ikke har bedt om eller avtalt å få, så slett dokumentet umiddelbart, uten å åpne det (selv om du kjenner avsender-adressen).

Hvis du følger disse tommelfingerreglene, vil du oppleve at din datahverdag blir mye tryggere og enklere. Plutselig bestemmer du selv over maskinen din, istedenfor å være prisgitt alle slags plutselige ulykker og ødeleggelser som ellers oppstår utenfor din kontroll! Etter å ha fulgt disse tommelfingerreglene en stund vil du plutselig oppdage at du ikke eller sjelden opplever alle de problemene som de av dine venner som ikke følger dem stadig klager over. Kanskje du til og med får status som den lokale dataeksperten fordi du nesten aldri har problemer lenger.

WORD-FORMATET UEGNET SOM LAGRINGSMEDIUM

Word .doc? Mener du Word 2.0, Word 6.0, Word-for-Mac (hvilken versjon?), Word 97, Word XP, eller noe annet? Word er som sagt ikke ett format men mange, og når avsender og mottaker bruker forskjellige versjoner av Word, så blir det som oftest problemer. Spesielt finnes det ikke foroverkompatibilitet: nye versjoner av Word-dokumenter kan ikke leses av gamle versjoner av Word. Dette er bevisst prispolitikk fra Microsofts side for å presse alle til å oppgradere og kjøpe (eller leie) ny dyr programvare fra Microsoft. Men også den andre veien, å lese gamle Word-dokumenter inn i en nyere versjon, kan være problematisk. Word er altså en haug av flyktige, hemmelige og inkompatible formater. Dette gjør at Word-formatet er helt uegnet som lagringsmedium for dokumenter.

Poenget med dataformater for lagring av data er jo å ha eller lett kunne skaffe seg tilgang til dataene sine senere, i fremtiden. Da må man kunne grave frem en spesifikasjon og skrive ny programvare som kan lese formatet senere, når formatet ikke er i vanlig bruk lenger. Slik fungerer det med åpne dataformater. Men Microsoft har aldri vært interessert i dette. De har utelukkende vært interessert i at folk skal klare å trykke trykksverte på papir. Velspesifiserte dataformater strider helt klart mot dette ønsket. Effektiv datakommunikasjon strider også mot dette ønsket. Å langtidslagre et dokument som er produsert med Word tar faktisk mindre plass om man skriver det ut og tar bilde av det enn om man tar vare på den elektroniske "teksten". Telefaxen ble i sin tid popularisert fordi det var for mye jobb å kommunisere japanske skrifttegn med andre midler - folk foretrakk rett og slett å skrive for hånd, og da måtte man sende bilder av dokumentene deres - telefacsimile. En kunne spørre seg om det er bedre å lagre tekstlige dokumenter på denne måten med høy kontrast og fin oppløsning enn å lagre dem elektronisk søkbare; folk i en fjern fremtid vil alltids finne ut av og reprodusere våre bilder, mens all den magiske kodingen vi gjør med tekst kan komme til å gå tapt. Derfor er ikke dette som har blitt beskrevet som 'halv-steganografiske dokument-"formater"' fra Microsoft noen god idé når man skal lagre informasjon.

Hva med reverse engineering av Word-formatene for å kunne kikke på sine egne gamle data? (Reverse Engineering betyr å ta noe fra hverandre for å se hvordan det virker, og deretter sette det sammen igjen, kanskje på en litt annen eller bedre fungerende måte. Man kan i prinsippet 'reverse engineere' alle slags maskiner og oppfinnelser, og uttrykket er vanlig i IT-bransjen, der det ofte brukes om programvare: ut fra hvordan et dataprogram virker, kan man finne ut hvordan det er oppbygd. Reverse engineering er altså mekking med programvare.) Ett ord: DMCA. Digital Millenium Copyright Act, den amerikanske loven som forbyr og gjør straffbart reverse engineering. Tilsvarende lover er vedtatt i EU, og overnasjonale lover og samarbeid gjør disse lovene gjeldende i flere og flere land. Og copyright-eierne har aggressivt begynt å håndheve disse lovene. Du risikerer dermed streng straff for reverse engineering, selv om formålet kun er å få tilgang til dine egne data!

Vi kan også tenke oss at Microsoft faktisk går nedenom en eller annen gang i en ikke alt for fjern framtid, og at Word 2031 var siste frigitte versjon. Etter det er det ikke lenger noen som vedlikeholder Word. Etterhvert som nye og bedre CPUer kommer på markedet forsvinner også datamaskiner som kan kjøre Word 2031 fra arkivene rundt om. Dessuten er det ikke en gang sikkert at Word-programmet lar seg kjøre etter at bobestyrereren har avsluttet jobben sin og skrudd av lisensserverne.

Hvordan skal du nå få lest langtidslagrede dokumenter som du har lagret i .doc-formatet knyttet til Word 2031? Siden formatet er proprietært, lukket og hemmelig, og dessuten antagelig kryptert, har det aldri eksistert noen dokumentasjon som du kan ta fram for å mekke ett tredjepartsleseprogram. Dermed er dokumentene tapt.

WORD PÅ LINUX

Hva om du sitter på Linux (eller en annen Unix-variant) og mottar et Word-dokument? Pussig nok er problemene med Word-vedlegg mindre på Linux enn de er under Windows! Det er to grunner til dette. Den ene er at Words muligheter for å gjøre skade (f.eks. pga. virus-angrep, scripts etc.) er mindre på Linux. Dette skyldes dels inkompatibilitet mellom systemene, og dels at sikkerheten på Linux generelt er bedre, både gjennom en mer modularisert arkitektur og ved at prosessers adgangsrettigheter vanligvis er satt opp på en fornuftig måte på Linux. Den andre grunnen er at det er utviklet en del programvare for Linux for nettopp å kunne konvertere Word-vedlegg til et åpent, leselig format, f.eks. plain text, eller rich text. Et kjent slikt program er Antiword. De forskjellige Office-pakkene som finnes på Linux kan også importere og konvertere Word-dokumenter, f.eks. Abiword og KOffice. Spesielt Suns Staroffice, nå også som OpenOffice, kan anbefales. Den kan importere og åpne flere Word-formater enn Word selv kan, og den kan også lagre dokumenter i Word-format (hvis du av en eller annen grunn skulle ønske dette). Alle disse programmene og Officepakkene kan lastes ned fritt fra nettet fra sine respektive nettsteder.

Selv foretrekker jeg likevel å sende et standardbrev (se under Kilder nedenfor) tilbake til avsender der jeg ber om å få tilsendt dokumentet på nytt, i et åpent format, og henviser til grunnene nevnt ovenfor om hvorfor Word-vedlegg bør unngås i epost. Jeg bruker sjelden (les: aldri) Office-programmer, da jeg synes at hele Office-konseptet er feil eller unødvendig, og jeg vil ikke tvinges til å fyre opp en svær Office-pakke, eller et annet spesialprogram, bare for å kunne lese en enkelt epostmelding. Jeg ser det også som en god gjerning og viktig utdanningsoppgave å fortelle folk hvordan de kan klare å holde seg borte fra det stygge mangehodete trollet som Word og dets mange innbyrdes inkompatible formater og alle dets øvrige utallige vederstyggeligheter utgjør. Dette er også den linjen jeg vil anbefale deg å følge, enten du er på Linux eller Windows, selv om det altså finnes noen verktøy og muligheter for å åpne Word-vedlegg begge steder. For deg på Windows er argumentet enkelt: ved å ikke åpne Word-vedlegg du ikke har bedt om å få, og helst ikke i det hele tatt, sparer du deg selv for en rekke alvorlige angrep på og trusler mot maskinen din. For deg på Linux er argumentet at du slipper merarbeid med å lagre, konvertere og åpne dokumenter som er beregnet for et annet programvaremiljø, og du slår et lite slag mot Microsofts dominans og monopolisme samt den dårlige sikkerheten på desktopen, som i så stor grad opprettholdes ved hjelp av at Microsoft fremelsker bevisstløshet hos brukerne.

La ikke Brave New Word-trollet herse med deg! Husk: Word is a four-letter Word. Lykke til!

Til slutt vil jeg anbefale artiklene og dokumentene nedenfor for ytterligere informasjon og til fri bruk.

KILDER

Word-dokument? Nei takk!
http://folk.uio.no/thomas/word-neitakk.html
Et standardformular du kan bruke når noen sender deg et Word-vedlegg.

Les også Børre Ludvigsens svarbrev (både norsk og engelsk versjon):
http://abdallah.hiof.no/~borrel/msword.txt

Skikk og bruk med elektronisk post av Bjørn Ness:
http://www.usit.uio.no/it/avis/nr3-2000/skikkogbruk.html
Dette dokumentet er retningsgivende for Universitetet i Oslo og de gode tipsene og rådene som gis her kan med fordel brukes andre steder også.

Her kan du lese et opprop fra aksjonen for åpne formater og standarder 21. mai 2001:
Microsoft! Stopp hærverket på nettet!
http://people.opera.com/howcome/2001/msft/seddel.html

Internett slik du vil ha det, av Gisle Hannemyr:
http://hjem.sol.no/gisle/ms01.html

Hvem skal eie formatene? av Thomas Gramstad
http://www.efn.no/hvem-eier-formatet.html

INTERFACE: 'Forced upgrading' in the World of Word by Zeid Nasser
http://archives.star.arabia.com/980820/TE1.html



Dette dokumentets adresse:
http://folk.uio.no/thomas/fri/brave-new-word.html

Forfatterens adresse:
thomas@gramstad.no


Sist oppdatert av   Thomas Gramstad     3. mai   2002.

Support the Blue Ribbon Campaign for Free Speech! Best Viewed With Any Browser Valid XHTML 1.0! Frames Free! Ribbon Campaign Created with GNU Emacs www.linux.org - a GNU and better computer for you