Bildet inneholder en person(meg) som holder ett ark med ett navn på. Bildet er lagret på formatet jpeg og er 26 kilobytes stort.
Hvis man lagrer bildet på andre formater forandrer filstørrelsen seg drastisk. På gif-format blir det 188 kB, på png-format blir det 234 kB, på tiff-format blir det 1,2 MB og på PostScript-format blir det 2,5 MB stort. Alle konverteringene er gjort med standard valg for kvalitet og komprimering i xv.
|
|
|
Her er bildet av meg hvor jeg har brukt steganografi for å skjule meldingen MortenBakken
|
|
Bokstavene er godt adskilt. Det originale bildet er 6,2 kB stort og det tersklede er 6,5 kB. Det tersklede bildet er altså 0,3 kB større enn det originale. Da har det vel ikke blitt komprimert i noen særlig grad.
Skulle jeg lagret navnet mitt i UTF-8 ville jeg trengt 13 bytes. 6 bytes for fornavnet, 1 for mellomrom og 6 for etternavnet. Navnet mitt inneholder ingen spesialtegn så det behøves kun 1 byte per tegn.
Resultatet av tekstgjenkjenningen ble vel så som så. Den klarte å klassifisere 3 av 12 bokstaver riktig. Noen var nære på, sånn som en o som ble en q og en m som ble snudd opp ned og tolket som en w, mens andre igjen var helt på jordet. SimpleOCR klarte å finne ett objekt per bokstav, det var ingen bokstaver som hang sammen. I og med at jeg skrev navnet mitt med store og nogenlunde tydelige bokstaver, men allikevel fikk såpass få riktige gjenkjenninger, kan man vel si at dette viser hvor vanskelig det er å lage robust tekstgjenkjenning.
Skrevet av Morten Bakken
Tilbake til hovedsiden