|
|
|
||||||||||||||||||||||||||
ST-IN 116 - Informatiske metoder i StatistikkInformasjon fra forelesningskatalogen og studiehåndboken Foreleser: Tobias Dahl (tobias@ifi.uio.no) Gruppelærer: Peter Acklam (jacklam@math.uio.no)
Bakgrunn for kursetBruk av datamaskin er idag helt nødvendig for å utføre statistiske analyser som ligger utenfor de helt trivielle anvendelser. Datamaskinen har samtidig endret statistikk-faget vesentlig de siste år. Dette har medført kunnskap om hvordan datamaskinen kan brukes effektivt har blitt mer og mer viktig. Tidligere har denne kunnskapen blitt innført på hovedfagsnivå. Ved å nå inføre dette kurset allerede på 100-nivå, har målsetningen vært å
Kursets innholdKurset vil bestå av 4 hoveddeler: Innføring i S-PlusS-Plus er idag en av de mest populære statistikk-pakker og er den pakken vi bruker i mange senere kurs. De fleste av våre studenter bruker også S-Plus i hovedfagsarbeid. God beherskelse av S-Plus vil derfor være til god nytte senere i studiet.
Numeriske metoderOfte ønsker vi å bruke modeller som ikke faller innenfor "standardmodellene". Dette kan medføre at de beregninger vi må utføre for å estimere ukjente parametre, eller for å velge modeller kan bli svært kompliserte. Typisk vil vi enten måtte beregne et komplisert integral (Bayes analyse, ST115) eller vi må optimere en komplisert likelihood funksjon. Kurset vil ikke gå dypt inn i numeriske metoder, da det finnes egne kurs for dette (MA-IN 127), men vi vil demonstrere hvordan vi kan bruke disse metodene for statistiske problemstillinger. Stokastisk simuleringStokastisk simulering er et kraftig verktøy som kan brukes for å
Vi vil se hvordan simulering kan utføres, men ikke minst demonstrere hva det kan brukes til gjennom mange konkrete anvendelser. Data-intensive metoderTradisjonelt har statistiskere jobbet med svært enkle modeller (linear regresjon, Gaussisk støy). De antagelser vi gjør er ofte lite realistiske, men er gjort for at matematikken skal bli pen, og enkle formler kommer ut. Med dagens kraftige datamaskiner, er det imidlertid mulig å bruke mer avanserte modeller og metoder. Vi vil se på noen slike metoder:
Foreløbig forelesningsplanDette er en tidsplan for forelesningene fram til november. Planen kommer til å bli endret underveis, etter behov for utdypnig av emnene. Utdelte notater er gitt som linker for de respektive dager. VIKTIG: Undervisning i S-Plus vil bli gitt på regneøvelsene. En introduksjon til språket vil bli gitt i løpet av de første tre ukene. Notater fra forelesningene
Læremidler
S-PlusDet finnes en egen side med mer dokumentasjon om S-Plus. S-Plus på mat-fak maskineneS-Plus er nå installert på mat-fak maskinene. Det kan startes ved
Oppkall av S-Plus fra emacs er foreløbig ikke lagt opp på disse maskinene.
For å gjøre biblioteker tilgjengelig, gi kommandoen
assign("lib.loc", where=0,
c("/site/s-plus/Snetlib", "/site/s-plus/Slocal"))
i S-Plus. Dette gjør at S-Plus vet hvor den skal lete etter
biblioteker. Merk at du må gi denne kommandoen hver gang du går inn i
S-Plus med mindre den legges inn i S-Plus sin oppstartfile
S-Plus på matematisk instituttS-Plus er installert på linux-maskinene. Se http://www.math.uio.no/doc/splus/ for nærmere informasjon om lokale tilpasninger. For å gjøre biblioteker tilgjengelig, gi kommandoen
assign(where=0, "lib.loc",
c("/local/share/avdc/Snetlib", "/local/share/avdc/Slocal"))
i S-Plus. Dette gjør at S-Plus vet hvor den skal lete etter
biblioteker. Merk at du må gi denne kommandoen hver gang du går inn i
S-Plus med mindre den legges inn i S-Plus sin oppstartfile
Diverse dokumentasjon
RegneøvelserOppgavesamlingen er tilgjengelig som PS-fil og PDF-fil. Løsningsforslag finnes for tidligere gitte oppgaver. Oppgaver høst 2000
Oppgaver høst 1999Regneøvelsene som ble gitt ved kurset i fjor (med tilhørende datoer) er listet nedenfor. Rekkefølgen på delemnene er forandret siden i fjor, følgelig vil også rekkefølgen på oppgavene endre seg.
Gjennomgang av øvelsene vil stort sett være basert på at studentene selv ber gruppelærer gjennomgå de ting som har vært vanskelige. Obligatoriske oppgaverDet vil bli gitt 3 obligatoriske oppgaver i kurset. Datoer for innlevering vil bli gitt på forelesning (og dessuten lagt ut på nett).
Oppgavene for iår finnes her:
Oppgavene fra ifjor finnes her:
PrøveksamenDet er blitt laget en prøveeksamen for kurset. Den finnes som PS-fil og PDF-fil og kan leveres inn når som helst før 13. november. Gjennomgåelse av prøveeksamen vil skje 20. november. Datasett
Enkelte datasett er hentet fra MASS-biblioteket. S-Plus rutiner
og Peter J. Acklam (jacklam@math.uio.no) |