Deloppgave 2: Sampling og kvantisering av lydsignaler

Skrevet av: Daniel S. E. Andersen

Figur 1: Plott av Tale1.wav

Figur 1: Tale1.wav

Plott av lydsignal:

Ut i fra dette plottet så ser vi at amplituden varierer rundt 0. Maksamplituden i mitt utsnitt er rundt 3500, men jeg observerte rundt amplituder opptil rundt 10000 når jeg hørte gjennom hele signalet. Plottet i figur 1 er et utsnitt på 0.006 sekunder

Figur 2: Frekvensspekter av Tale1.wav

Figur 2: Tale1.wav

Samplingsrate:

Linkene til talefilene er:

Tale1.wav
Tale2.wav
Tale3.wav
Tale4.wav

Den første filen (tale1.wav) er samplet med en frekvens på 44.1kHz, tale2.wav med 22kHz, tale3 med 11kHz og tale4 med 8kHz. Alle filene er gjort med 16 bits representasjon. Lydkvaliteten faller henholdsvis med samplingsraten. Den første lydfilen har det vi kaller "cd-kvalitet". Siden menneskets terskel for høye frekvenser ligger rundt 20kHz og for å få riktig lydbilde så må man måle lyden 2 ganger per tidsenhet, så må vi sample dobbelt for å få med hele lydbildet. Vi ser at 44kHz er litt mer enn det dobbelte, men det er en slags "sikkerhetsmargin". Dersom man sampler under denne samplingsraten, så mister man deler av lydbildet.
Alle filene er som sagt representert med 16 bits. Med en 16 bits representasjon av lyd så kan vi representere 65536 forskjellige frekvenser, noe som er mer enn nok til å representere alle de 44100 frekvensene i en fil med 44.1kHz samplingrate. Dersom vi senker bitrepresentasjonen så vil antall frekvenser vi kan representere minke, dvs at det er flere frekvenser som vil gå som samme frekvens. Senker vi f.eks bitrepresentasjonen til 15 bits, så vil vi kun kunne representere 32768 forskjellige frekvenser Dette er for lite når man har 44.1kHz som samplingsrate.

Kvantisering:

Kvantisering er hvordan vi representerer de forskjellige frekvensene. Dersom en lydfil ikke innholder mer enn 30000 frekvenser, så er det liten vits å representere den filen med 16 bits siden dette kun vil være bortkastet lagringsplass. Tale1.wav består kun av tale og bruker derfor ikke hele spekteret av de 44100 forskjellige frekvensene. Dette tilsier at vi skal kunne senke bitrepresentasjonen av filen uten å miste noe særlig med lydkvalitet. Jeg klare å senke bitrepresentasjonen av tale1.wav ned til 12 bits uten å kunne høre noen merkbar forskjell. Figur 3 nedenfor viser signalplottet.

Figur 3: 12 bits Tale1.wav

Dersom man ønsker å lage et lydsignal med hørbare kvantiseringseffekter så er det bare å senke bitrepresentasjonen ytterligere. Jeg senket bitrepresentasjonen så langt ned som til 5 bits. Da blir lyden uklar og man kan tydelig se fra signalplottet at flere frekvenser blir representert likt. Dette gir oss et "hakkete" plott der man ser klare overganger istedenfor jevne slik som i de andre plottene (Se figur 4)

Figur 4: 5 bits Tale1.wav

Kilder:

-Information technology: Inside and outside, David Cyganski, John A. Orr, Prentice hall

-Foiler INF1040

Valid XHTML 1.0!