Logikken i statistisk kontrol: Test af sociologiske forklaringer med regressionsanalyse

Kursusindhold

BAGGRUND FOR KURSET

Sociologien har en lang tradition for teoretisk informerede kvantitative undersøgelser. En af de mest anvendte forskningsstrategier inden for kvantitativ metode er statistisk kontrol. Statistisk kontrol muliggør undersøgelser af sammenhænge mellem to eller flere variable, når der er taget højde for sammenhængen med et tredje sæt af variable, nemlig kontrolvariablene. Sådan en forskningsstrategi er ikke kun et empirisk anliggende. Kontroltanken bør bruges aktivt til at udforske og teste teoretiske forklaringer og teoretisk udledte hypoteser, altså hvad man passende med Robert K. Merton kan kalde theories on the middle range, dvs. specialiserede forklaringer af afgrænsede sociale fænomener.

Temaet for dette kursus er, hvordan et indgående kendskab til statistisk kontol i regressionsanalyse kombineret med teoretisk-analytisk arbejde kan hjælpe den studerende til at undersøge og teste sociologiske forklaringer af sociale fænomener. Formålet er dermed at lære at bruge regressionsanalysen kreativt til at besvare afgrænsede sociologiske problemstillinger. Kurset giver den fornødne teoretiske viden og praktiske kendskab (gennem masser af praktiske øvelser) til selv at kunne lave denne type sociologiske undersøgelser, ligesom den giver et beredskab til at kunne læse den store sociologiske litteratur, som anvender de principper, som kurset gennemgår. Kurset henvender sig til studerende, der står foran en større opgave, her især bachelorprojektet eller specialet, fordi kurset giver den studerende konkrete teknikker til at kunne teste teoretiske forklaringer, mekanismer og påstande med.

Informeret brug af statistisk kontrol i sociologien blev udviklet af Paul Lazarsfelds arbejder i efterkrigstiden på Columbia University (her især Lazarsfelds princip om elaborering). Selvom Lazarsfeld oprindeligt arbejdede med statistisk kontrol i krydstabeller, kan tanken nemt (faktisk overraskende nemt) overføres til regressionsanalyse, som bl.a. Otis Dudley Duncan og Hubert M. Blalock har vist. Formålet med en analyse bliver at studere sammenhæng mellem A og B, udtrykt ved AxB. Denne sammenhæng kan man betinge på en tredje variabel, dvs. bryde sammenhængen ned med hensyn til en tredje variabel, C. Denne betingelse eller ”kontrol” udtrykkes ved AxB|C, dvs. vi studerer nu den betingede sammenhæng mellem A og B givet C. Kurset viser, hvordan denne relativt simple strategi kan bruges til teoretisk informeret empirisk forskning.
 

REGRESSIONSANALYSEN SOM VÆRKTØJ

Regressionsanalyse handler om statistiske sammenhænge mellem variable. I multipel regressionsanalyse, dvs. hvor der er mere end én forklarende variabel, siger man, at de estimerede sammenhænge er partielle. Disse partielle sammenhænge er udtrykt ved regressionskoefficienter. Kurset handler om disse partielle sammenhænge, nemlig hvad der sker, når man kontrollerer en sammenhæng mellem fx Y og X for en tredje variabel, Z, samt hvordan man kan bruge denne viden til at teste teoretiske forklaringer eller udsagn med. Kurset handler derfor om teoretisk informeret forlæns modelsøgning. Kurset forholder sig kritisk til baglæns modelsøgning, der kritiseres for at være ”data mining”, dvs. induktiv forskning, der ikke baserer sig på teoretiske udledte udsagn, der kan testes.

I kurset skal vi ind i regressionsmaskinen – ind i den logik, som statistisk kontrol baserer sig på. Derfor er dette kursus også en nødvendig og vigtig udbygning til de kvantitative grundkursers lærdom. Man får et praktisk kendskab til, hvordan regression kan kobles til sociologisk teori – her især i forhold til at teste teoretisk udledte udsagn. Herudover lægger kurset vægt på numerisk og grafisk præsentation af resultater fra analyser, der baserer sig på statistisk kontrol. Præsentationsdelen er vigtig, også i forhold til anvendelse af regressionsanalyse uden for en snæver forskningsmæssig kontekst.
 

Kurset gennemgår fire overordnede kontrolstrategier i regressionsanalyse:

(1) Test af en teori/forklaring ved hjælp af statistisk kontrol af en sammenhæng mellem A og B, hvor man kontrollerer sammenhængen for en (eller flere) tredje variabel, C, der ligger bag sammenhængen og dermed muligvis forklarer den observerede sammenhæng. Spørgsmålet om spuriøse eller falske sammenhænge optræder her.

(2) Test af en teori/forklaring ved hjælp af statistisk kontrol af en sammenhæng mellem A og B, hvor man kontrollerer sammenhængen for en (eller flere) tredje variabel, C, der ligger mellem A og B og dermed medierer sammenhængen mellem A og B. Spørgsmålet om indirekte effekter optræder her.

(3) Test af to teoretisk udledte udsagn op mod hinanden ved typisk at udvikle en hypotese (og finde passende data), der kan skelne mellem to teoretiske udsagn.

(4) Brug af interaktionseffekter til at teste heterogenitet i effekter. Hvordan man kan bruge interaktionseffekter til at vurdere om en sammenhæng af interesse varierer over forskellige grupper.

Kurset fokuserer primært på de to første strategier ved at vise, hvordan regressionsanalyse kan bruges til at besvare hvorfor-spørgsmål og hvordan-spørgsmål: Hvorfor observerer vi en sammenhæng mellem A og B? Skyldes det en bagvedliggende årsag, C? Hvordan hænger A og B sammen? Hvad er mekanismerne, C?

Kurset berører også nogle af de begrænsninger, der ligger i brugen af regressionsanalyse. Herbert Blumers kritik af brugen af "variablen" i sociologiske analyser diskuteres, ligesom nogle af de problemer, nyere forskning i identifikationen af kausal mekanismer med kvantitative data har påvist, tages op. Sidst diskuteres der andre muligheder for statistisk kontrol, her især brug af matching og invers sandsynlighedsvægtning.

 

INTEGRATIONEN AF TEORI OG EMPIRI: AT TESTE TEORETISKE FORKLARINGER

Kursets teoretiske forudsætninger er den løst definerede gren inden for sociologien, man kan kalde ”analytisk sociologi” eller ”positiv sociologi”. Denne form for sociologi anlægger et mere ”videnskabeligt” blik på socialforskning (dog uden at reducere det til et spørgsmål om naiv positivisme), her især spørgsmålet om udviklingen af teorier, der kan eftervises empirisk. Denne tradition står i modsætning til relativistiske tilgange som fx forskellige former for socialkonstruktivisme. Den grundlæggende pointe, kurset fremsætter, er, at data ikke i sig selv tilvejebringer information om forventede sammenhænge mellem forskellige sociale fænomener. Derimod er det nødvendigt med teoretisk styring (dvs. et analytisk apparat) for at kunne fortolke sammenhængene i data.

Kurset stimulerer den studerende til at tænke sociologisk teori på en særlig måde, nemlig som "theories on the middle range", hvormed Merton gav sociologien den rolle at udvikle og teste specialiserede forklaringer af afgrænsede sociale fænomener. Den teoretiske sociologi består af mange ”grand theories”, og disse teorier er generelt svære at eftervise, bl.a. fordi de er vagt formulerede eller så generelle, at de er svære at oversætte til empirisk observerbare størrelser. Kurset forsøger imidlertid at vise, at en mulig strategi i forhold til at få greb om disse teorier i forbindelse med at teste deres forklaringer er deduktivt at udlede udsagn på hypoteseform fra teorien. Den deduktive øvelse bliver altså den teoretiske øvelse, hvor teorien omsættes til få testbare udsagn, som kan angribes med statistisk kontrol i regressionsanalyse.

Sidst forsøger kurset at vise (nok mere implicit end eksplicit), at der er en logisk komponent i videnskabelig forskning – også i sociologi – som hverken kan reduceres til en normativ begrundelse for valget af en teori eller kan siges at være forskellig for hhv. kvalitative og kvantitative analyser. En grundlæggende pointe er her, at en kvantitativ metode som regressionsanalysen rent faktisk kan besvare kvalitative spørgsmål, dvs. give svar på hvorfor og hvordan og ikke kun hvor meget. Her fremhæves det, at det måske i virkeligheden forholder sig sådan, at kvantitativ sociologisk metode som oftest har som sit formål at teste kvalitative hypoteser eller udsagn.
 

HVAD TAGER DU MED DIG FRA KURSET?

- Metodisk og praktisk kendskab til brugen af statistisk kontrol i sociologien.

- At bruge regressionsanalyse på en fantasifuld måde til at undersøge sociologiske problemstillinger.

- Stimuleret metodisk bevidsthed og forståelse af, hvor kraftigt (og vigtigt) et værktøj regressionsanalyse egentlig er.

- Praktisk kendskab til forskellige teknikker i regressionsanalyse, som nemt kan overføres til egne opgaver, fx en større opgave som bachelorprojektet eller specialet.

- Forudsætning for at kritisk at kunne forholde sig til en (meget) stor del af den empiriske sociologi, nemlig den, der bruger regressionsanalyse.

Engelsk titel

The Logic of Statistical Control: Testing Sociological Explanations with Regression Analysis

Uddannelse

KA Metode og forskningspraksis (2015 studieordningen)
Kan placeres i alle fagpakker

KA Metodefag (2005 studieordningen)
Specialiseringslinie: Metode

Målbeskrivelse

VIDEN

Den studerende skal kunne redegøre for principperne bag brugen af statistisk kontrol med regressionsanalyse, hvilket involverer redegørelse for

- bagvedliggende og mellemliggende variable,

- spuriøsitet (confounding),

- mediering,

- direkte, indirekte og totale effekter,

- forlæns modelsøgning og

- gennemsnitlige marginale prædiktioner (forudsagte værdier)

Den studerende skal desuden kunne

- hvordan ovenstående emner kan anvendes i sociologiske undersøgelser

- reflektere over muligheder og begrænsninger ved anvendelsen af regressionsanalyse i sociologisk forskning.

 

FÆRDIGHEDER

Faget giver den studerende et praktisk kendskab til brugen af statistisk kontrol i regressionsanalyse i statistikprogrammet Stata. Den studerende skal kunne

 - udføre en forlæns modelsøgning, herunder fortolke ændringer i regressionskoefficienter i relation til en given sociologisk problemstilling.

- udføre en medieringsanalyse, herunder fortolke direkte, indirekte og totale effekter i relation til en given sociologisk problemstilling.

- numerisk og grafisk præsentere sine resultater på intuitiv vis.

- kritisk vurdere sine empiriske resultater i relation til en given problemstilling på en måde, der signalerer forståelse af muligheder og begrænsninger ved anvendelse af statistisk kontrol i regressionsanalyse.

 

KOMPETENCER

Efter endt undervisning skal den studerende kunne

- tilegne sig videregående kvantitative metoder som fx kvasi-eksperimentelle metoder og multilevel-analyse.

- omsætte sin viden og færdigheder i analyser ved fx at kunne planlægge og gennemføre rapporter, der anvender statistisk kontrol i regressionsanalyse

Kombination af klassisk forelæsning og masser af praktiske øvelser.

Elektronisk pdf-kompendium med uddrag fra grundbøger og videnskabelige artikler.

 

Omfang af pensum:

7,5 ECTS: 600 sider.

10 ECTS: 800 sider.

Dette kursus har adgangsbegrænsninger. Kurset vil som udgangspunkt ikke blive udbudt igen. Du kan således ikke planlægge efter, at det udbydes i senere semestre, end hvad der fremgår af denne kursusbeskrivelse.

VEJLEDENDE ARBEJDSBELASTNING
Antallet af undervisningstimer er ens for både 7,5 og 10 ECTS.

10 ECTS
Forelæsninger: 28
Undervisningsforberedelse: 120
Øvelser: 20
Projektarbejde: 33
Eksamensforberedelse: 74
I alt: 275

ECTS
Se eksamensbeskrivelse
Prøveform
Skriftlig aflevering
Individuel/gruppe. Ved en skriftlig opgave forstås en opgave, der besvarer et eller flere stillede spørgsmål. Der eksamineres her på baggrund af fagets pensum, dvs. den litteratur, der er fastlagt af underviseren. Den skriftlige opgave må maximalt fylde 10 sider. Ved gruppebesvarelser tillægges 5 sider pr. ekstra studerende. Se detaljer for prøveform i studieordningen og den generelle eksamensvejledning på KUnet.
Bedømmelsesform
7-trins skala
Censurform
Ingen ekstern censur
Kriterier for bedømmelse

Se målbeskrivelsen

ECTS
Se eksamensbeskrivelse
Prøveform
Skriftlig aflevering
Individuel/gruppe. Ved en skriftlig opgave forstås en opgave, der besvarer et eller flere stillede spørgsmål. Der eksamineres her på baggrund af fagets pensum, dvs. den litteratur, der er fastlagt af underviseren. Den skriftlige opgave må maximalt fylde 10 sider. Ved gruppebesvarelser tillægges 5 sider pr. ekstra studerende. Se detaljer for prøveform i studieordningen og den generelle eksamensvejledning på KUnet.
Bedømmelsesform
7-trins skala
Censurform
Ingen ekstern censur
Kriterier for bedømmelse

Se målbeskrivelsen

  • Kategori
  • Timer
  • Forelæsninger
  • 28
  • Undervisningsforberedelse
  • 75
  • Forberedelse
  • 20
  • Øvelser
  • 9
  • Eksamen
  • 74
  • Total
  • 206