Matematisk statistik

Kursusindhold

Kurset omfatter grundlæggende elementer i statistikkens teori og metode, herunder begreber som statistiske modeller, likelihood og likelihoodfunktion, estimation, konfidensområder, hypoteseprøvning, lineær regression, generaliserede lineære modeller, og asymptotisk teori.

Specielt gennemgår vi teorien for den generelle lineære normale model på endeligdimensionale reelle vektorrum i detaljer. Der er tale om en abstrakt matematisk fremstilling, hvorved vi får mulighed for at give en geometrisk formulering af centrale resultater om fordelingen af estimatorer og teststørrelser.

Den resterende del af kurset sigter mod at demonstrere fordelene ved den abstrakte forståelse af den lineære normale model. Vi opnår fortrolighed med modellens simpleste manifestationer (lineær regression samt et- og tosidet variansanalyse), hvorefter vi kaster os over flerfaktormodeller, der nemmest beskrives som k-sidede variansanalyser. Flerfaktormodellerne giver en god ramme for at diskutere generelle statistiske problemer omkring fortolkning, validering og selektion af modeller, netop fordi flerfaktormodellerne ofte giver mulighed for at regne ting igennem og få eksplicitte svar.

Endelig udvider vi den linære normale model til de såkaldte random effects modeller (mixed models, varianskomponentmodeller), der kan motiveres ved at selve designet af eksperimentet bag data inducerer en mere kompleks afhængighedsstruktur mellem de indsamlede data. Der lægges også vægt på, at den studerende opnår øvelse i at selv at kunne vælge en relevant statistisk model til konkrete data.

Engelsk titel

Mathematical Statistics

Uddannelse

Bacheloruddannelsen i matematik
Bacheloruddannelsen i matematik-økonomi
Bacheloruddannelsen i forsikringsmatematik
Bacheloruddannelsen i naturvidenskab og it

Målbeskrivelse

Viden:

  • Grundig forståelse af den statistiske problemstilling
  • Grundig forståelse af likelihoodfunktionen og dens betydning
  • Grundig forståelse af statistiske grundbegreber og vigtige statistiske modeller, samt disses anvendelser
  • Basalt kendskab til anvendelse af simulation som redskab
  • Basalt kendskab til den statistiske programpakke R 
  • Grundig forståelse af de teoretiske aspekter vedr. den lineære normale model og forståelese af de teoretiske aspekter vedr. generaliserede lineære modeller.
  • Solidt kendskab til væsentlige eksempler på lineære normale modeller herunder lineære regressionsmodeller, flerfaktormodeller samt random effects modeller (hierarkiske modeller)


Færdigheder:

Ved kursets afslutning forventes den studerende at kunne:

  • Opstille og analysere generelle statistiske modeller, herunder udlede likelihoodfunktioner og deraf afledte funktioner
  • Finde fordelingsmæssige egenskaber for estimatorer, teststørrelser og konfidensintervaller
  • Sammenligne og tage stilling til valg af estimatorer og teststørrelser, både teoretisk og vha. simple simulationsstudier
  • Anvende den lineære normale model og generaliserede lineære modeller, herunder opskrive relevante modeller, udføre estimation, modelkontrol, hypotesetest og beregne konfidensområder

  • Fortolke statistiske modeller for flerfaktorforsøg samt udregne estimatorer, teststørrelser mv. i normalfordelingsmodeller med partielt balancerede design ved hjælp af ortogonal dekomposition af middelværdiunderrummet

  • Forstå og redegøre for forskellene mellem modeller med uafhængige variable og modeller med hierarkisk korrelationsstruktur, og at kunne udregne estimatorer, teststørrelser mv. i modeller med faktorforsøg som involverer tilfældige effekter

  • Benytte R til analyser og simulationer


Kompetencer:

Den studerende skal efter endt kursus kunne:

  • Analysere data med brug af simple statistiske modeller
  • Gennemføre simple statistiske argumenter vedr. estimation, hypoteseprøvning og konfidensområder
  • Gennemføre simple simulationseksperimenter
  • Identificere relevante generaliserede lineære modeller og lineære normale modeller, herunder varianskomponentmodeller, på baggrund af konkrete data
  • Gennemføre, præsentere og diskutere resultaterne af en statistisk analyse baseret på lineære normale og generaliserede lineære modeller

4 timers forelæsninger, 4 timers øvelser og 2 timers "lektiecafe" (regn-selv med hjælp fra instruktor) per uge i 15 uger.

Eksempel på litteratur brugt i kurset:

Ernst Hansen. Introduktion til Matematisk Statistik. Københavns Universitet. Seneste udgave.

Hertil supplerende noter.

Mål- og integralteori (MI) samt SS eller tilsvarende

ECTS
15 ECTS
Prøveform
Praktisk skriftlig prøve, 4 timer med opsyn.
De studerende skal medbringe computer med R til eksamen. Computeren skal have usb-port.
OBS: Hvis eksamen afholdes på ITX, stiller ITX computer til rådighed, og egen computer, tablet eller mobiltelefon må IKKE medbringes. Lærebøger og noter medbringes i papirform eller på USB-stik.
Hjælpemidler
Alle hjælpemidler tilladt
Bedømmelsesform
7-trins skala
Censurform
Ekstern censur
Kriterier for bedømmelse

Den studerende skal på tilfredsstillende måde godtgøre at han/hun lever op til fagets målbeskrivelse.

Enkeltfag dagtimer (tompladsordning)

  • Kategori
  • Timer
  • Eksamen
  • 4
  • Forelæsninger
  • 60
  • Teoretiske øvelser
  • 90
  • Forberedelse
  • 258
  • Total
  • 412