Grundlæggende Data Science (GDS)

Kursusindhold

Dette kursus gennemgår de forskellige komponenter der indgår i en komplet data science pipeline, fra indsamling, processering og oprensning af data, til implementation af statistiske modeller, og udforskning af data gennem visualisering. Kurset vil omhandle håndtering af data fra flere kilder, og der lægges vægt på fundamentelle udfordringer i data science, såsom bias i data, og hvordan dette kan påvirke beslutningstagning på baggrund og trænede modeller.

Engelsk titel

Fundamentals of Data Science (GDS)

Uddannelse

Bacheloruddannelsen i bioinformatik
Bacheloruddannelsen i datalogi
Bacheloruddannelse i Machine Learning og Datavidenskab

Målbeskrivelse

Viden om

  • Model design og implementation
    • Basale begreber i modellering
    • Struktureret model design
    • Model test strategier
  • Data udforskning og visualisering
    • Eksplorativ data analyse
    • Nøglebegreber i visualisering

 

Færdigheder

  • Skrive scripts til indsamling og processering af data, og indlæsning af struktureret tekst
  • Design af modulær pipeline til dataanalyse af et konkret problem
  • Design af meningsfulde visualiseringer

 

Kompetencer

Den studerende forstår de centrale udfordringer i at designe et effektivt data science work-flow, der understøtter data fra flere kilder og flere forskellige analyser. Den studerende

  • er i stand til at designe og forstå modulære data science pipelines
  • kan producere meningsfulde visualiseringer af data
  • kan klart og præcist dokumentere data science workflows, metoder og resultater

Forelæsninger, øvelser og projekt

Offentliggøres på kursets Absalon-side ved kursusstart.

Den studerende bør have grundlæggende viden om programmering, algoritmer, lineær algebra, matematisk analyse og statistik. Denne viden kan opnås via følgende kurser:
PoP
MASD og MAD eller MatIntro og SS
DMA eller IDMA (tidligere kaldet DMFS). IDMA kan følges sideløbende i blok 3.
LinAlgDat (LinAlgDat kan følges sideløbende i blok 4)

Kurset er en delmængde af det nedlagte kursus Data Science (DS). Du bør altså ikke tage NDAB2300U Grundlæggende Data Science (GDS), hvis du allerede har bestået NDAB21002U Data Science (DS).

Kollektiv
Løbende feedback i undervisningsforløbet
ECTS
7,5 ECTS
Prøveform
Skriftlig aflevering, i løbet af kurset
Prøveformsdetaljer
Et gruppeprojekt, der afleveres i løbet af kurset, gruppeprojektet er en rapport med specificerede individuelle bidrag.
Krav til indstilling til eksamen

3-5 individuelle obligatoriske opgaver, hvoraf alle undtagen 1 skal afleveres og godkendes for at kvalificere sig til eksamen. 

Hjælpemidler
Alle hjælpemidler tilladt

For programming tasks specifically, the use of GitHub Copilot or similar AI-based programming tools is permitted. The finite list of allowed AI-tools will be announced in Absalon.

Bedømmelsesform
7-trins skala
Censurform
Ingen ekstern censur
Flere interne bedømmere.
Reeksamen

Reeksamen afholdes som en mundtlig eksamen 30 minutter uden forberedelse i hele pensum, alle hjælpemidler er tilladt.

Kvalificering til reeksamen opnås ved genaflevering og godkendelse af de obligatoriske opgaver senest 3 uger før reeksamen. 

Kriterier for bedømmelse

Se målbeskrivelsen.

Enkeltfag dagtimer (tompladsordning)

  • Kategori
  • Timer
  • Forelæsninger
  • 36
  • Forberedelse (anslået)
  • 78
  • Teoretiske øvelser
  • 36
  • Projektarbejde
  • 56
  • Total
  • 206

Kursusinformation

Undervisningssprog
Dansk
Kursusnummer
NDAB23000U
ECTS
7,5 ECTS
Niveau
Bachelor
Varighed

1 blok

Placering
Blok 3
Skemagruppe
A (tirs 8-12 + tors 8-17)
Kapacitet
Ingen begrænsning – medmindre du tilmelder dig i eftertilmeldingsperioden (BA og KA) eller som merit- eller enkeltfagsstuderende.
Studienævn
Studienævn for Matematik og Datalogi
Udbydende institut
  • Datalogisk Institut
Udbydende fakultet
  • Det Natur- og Biovidenskabelige Fakultet
Kursusansvarlig
  • Desmond Elliott   (2-71724d71763b78823b7178)
Gemt den 14-02-2024

Are you BA- or KA-student?

Are you bachelor- or kandidat-student, then find the course in the course catalog for students:

Courseinformation of students