Political Data Science

Kursusindhold

Det moderne menneske efterlader i hidtil uhørt grad spor efter sin færden. Adfærd – både online og offline – bliver i stigende grad registreret og kan f.eks. anvendes til at måle politiske standpunkter og forudsige politisk adfærd blandt individer og grupper, som det førhen var utænkeligt at komme i kontakt med. Samtidig er offentlige myndigheder begyndt i stigende grad at registrere og indsamle data på egne indsatser med henblik på at evaluere og optimere dem. Hvad der er tale om, er intet mindre end en revolution i tilgængeligheden af politisk data – data, der både kan bruges til at finde løsninger på konkrete samfundsmæssige problemstillinger samt bringe politologiske teorier længere frem, end man hidtil har troet muligt.

 

Kurset Political Data Science har til formål at give de studerende redskaberne til at indsamle og behandle denne slags nye og ofte ustrukturerede data. Desuden skal vi arbejde med metoder, der anvender disse data til at forudsige adfærd og måle komplekse koncepter. Formålet med kurset er at klæde de studerende på til selv at give sig i kast med nogle af de metoder og værktøjer, som er nybrud i politologien. Det kan både klæde de studerende på til at anvende metoderne i et speciale såvel som i et dataorienteret job efter studierne.

 

De følgende vil være de centrale emner i kurset:

 

  • Data: Tænke over politisk data i bred forstand (f.eks. tekst-som-data). Konceptualisere fejlkilder og overveje etiske udfordringer.
  • Datamanipulation: Anskaffe, rengøre og forberede data til analyse.
  • Visualisering: Præsentere data og modeller på en intuitiv og appetitvækkende facon, der effektivt kommunikerer ens centrale pointer.
  • Klassifikation og forudsigelse: Anvende superviseret maskinlæring til at træne modeller, der kan forudsige virkelig adfærd.
  • Måling: Konceptualisere komplekse fænomener samt måle dem vha. usuperviseret maskinlæring.
  • Data Science & Political Science: Brug af Political Data Science til teoribygning og -vurdering samt til løsning af samfundsrelevante problemer.

 

Kurset vil indeholde en blanding af teori og redskaber, og den anvendte del af kurset vil foregå i R. Teorien vil blandt andet omfatte forskelle mellem kausalestimation og forudsigelse, centrale koncepter i maskinlæring og moderne målingsteori. Kurset kan både stå alene og supplere kurset Videregående kvantitative metoder i studiet af politisk adfærd.

 

Neden for ses et foreløbigt udkast til en lektionsplan, hvori der formentlig vil forekomme ændringer.

 

  1. Intro til Political Data Science og politisk data
  2. R Workshop
  3. Data- og modelvisualisering I
  4. Data- og modelvisualisering II
  5. Scraping af hjemmesider
  6. Indsamling af data vha. API
  7. Estimation vs. forudsigelse
  8. Superviseret maskinlæring I
  9. Superviseret maskinlæring II
  10. Målemodeller I (usuperviseret maskinlæring)
  11. Målemodeller II (usuperviseret maskinlæring)
  12. Text-as-data I
  13. Text-as-data II
  14. Opsamling
Engelsk titel

Political Data Science

Uddannelse

Bachelorstuderende (2012-studieordningen): 10 ECTS

Bachelorstuderende (2017-studieordningen): 7.5 ECTS

Kandidatstuderende: 7,5 ECTS

Målbeskrivelse

Knowledge:

  • Forstå principperne for effektiv data- og modelvisualisering.
  • Forstå forskellen på estimation og forudsigelse, samt hvordan de kan underbygge hinanden i løsningen på et konkret problem.
  • Forstå forskelle og ligheder mellem modeller, der er orienteret mod hhv. måling, forudsigelse og (kausal) estimation.
  • Forstå problemer ift. modelspecifikation, overfitting og p-hacking samt hvordan opdeling af data i trænings- og testset kan løse dem.
  • Tænke kritisk over hvilke problemer, der er forbundet med analyse af forskellige former for data (herunder data i form af politiske tekster).

 

Skills:

  • Importere, rengøre og manipulere data i R.
  • Anvende R til at gennemføre transparente og reproducerbare analyser.
  • Anvende principper for data- og modelvisualisering til selvstændigt at fremstille visualiseringer, der på effektiv vis kommunikerer en pointe.
  • Hente ustruktureret data fra hjemmesider eller gennem APIs og gøre dem klar til analyse.
  • Analysere en politologisk problemstilling vha. de teknikkerne, der introduceres i faget.
  • Tænke kreativt over, hvordan nye former for data (herunder data i form af politiske tekster) kan bruges til at måle politologiske fænomener samt gennemføre sådan en måling.

 

Competences:

  • Anvende målings- og forudsigelsesteknikker på kvantitative data til at løse relevante samfundsvidenskabelige spørgsmål.
  • En dyb forståelse af hvordan samfundsvidenskabelig data genereres og indsamles, samt hvordan analysen af dem kan bidrage til løsninger på samfundsmæssige problemer.

Den enkelte holdundervisning vil typisk være inddelt i to dele. Først introducerer underviseren teori, principper og metoder samt viser deres anvendelse i den statistiske softwarepakke R. I anden del vil de studerende typisk selv løse konkrete opgaver relateret til dagens tema i R. En vigtig del af den løbende feedback til foregå i den løbende opgave løsning.

Faget vil bygge på en række tekster i form af bogkapitler, tidsskriftsartikler og blogposts, men vi vil gennemgående gøre brug af følgende bøger (hvoraf to er gratis tilgængelige online):

 

  • Claus Wilke (2019): Fundamentals of Data Visualization. O’Reilly Media, Inc. Gratis online adgang: https://serialmentor.com/dataviz/index.html
  • James, G., Witten, D., Hastie, T., & Tibshirani, R. (2013). An introduction to statistical learning (Vol. 112). New York: Springer.
  • Wickam, H. & Grolemund, G. (2016). R for Data Science. O’Reilly Mediam Inc. Gratis online adgang: https://r4ds.had.co.nz/index.html

     

Faget vil gøre brug af den statistiske softwarepakkerne R og RStudio til at implementere metoderne, der introduceres i faget. R er et gratis, open source program, der frit kan downloades.

Det forudsættes, at man har gennemført de obligatoriske metodekurser på bacheloruddannelsen i statskundskab eller tilsvarende.

Det er ikke en forudsætning at have kendskab til R i forvejen, men det er en forudsætning at have mod på at arbejde i R.

Jeg kommer med stor sandsynlighed også til at undervise to hold i Metode 2 på Statskundskab (undervisning hver anden uge) samt afholde en række forelæsninger på samme fag.

Skriftlig
Mundtlig
Individuel
Kollektiv
Løbende feedback i undervisningsforløbet
ECTS
7,5 ECTS
Prøveform
Portfolio
Porteføjleeksamen
Bedømmelsesform
7-trins skala
Censurform
Ingen ekstern censur
Kriterier for bedømmelse
  • Karakteren 12 gives for den fremragende præstation, dvs. hvor den studerende med ingen eller få og uvæsentlige mangler og på selvstændig og overbevisende måde er i stand til at indfri målbeskrivelsen for udbuddet.
  • Karakteren 7 gives for den gode præstation, dvs. hvor den studerende, om end med adskillige mangler, på sikker vis er i stand til at indfri målbeskrivelsen for udbuddet.
  • Karakteren 02 gives for den tilstrækkelige præstation, dvs. den minimalt acceptable præstation, hvor den studerende kun usikkert, mangelfuldt og/​eller uselvstændigt er i stand til at indfri målbeskrivelsen for udbuddet.

Enkeltfag dagtimer (tompladsordning)

  • Kategori
  • Timer
  • Holdundervisning
  • 28
  • Total
  • 28