Hopp til hovedinnhold

Introduksjon til datavitenskap (DAT540)

Kurset skal gi kunnskap og erfaring innen datavitenskapelige oppgaver og gjøre studenten kjent med datavitenskapelig prosjektsyklus.


Dette er emnebeskrivelsen for studieåret 2022-2023

Fakta
Emnekode

DAT540

Versjon

1

Vekting (Sp)

10

Semester undervisningsstart

Høst

Antall semestre

1

Vurderingssemester

Høst

Undervisningsspråk

Engelsk

Innhold

Evnen til å innhente og analysere data har blitt en av de viktigste utfordringene i nesten alle fagområder, sektorer og næringer. I dette kurset blir studentene kjent med grunnleggende verktøy og prosesser som brukes i datavitenskap ("Data Science")

Studentene jobber gjennom hele dataflyten, fra innhenting, rensing og modellering, til lagring av dataene. Arbeidet utføres ved bruk av Python-stakken, som består av blant annet: IPython, NumPy, Pandas, Matplotlib og Jupyter Notebooks.

Studentene lærer å strukturere sitt arbeid ved hjelp av CRISP-DM og Data Science -prosessen ("Ask, Get, Explore, Model, Communicate and Visualize").

Læringsutbytte

Kunnskap:

  • Utvikle og kjøre programmer for å laste, analysere, rense, transformere, slå sammen, omforme og lagre data.
  • Sammenligne vanlige Python, NumPy og Pandas datastrukturer og bruke en av disse til en definert oppgave. Bruke IPython shell og Jupyter notebook for undersøkende databehandling.
  • Utvikle og kjøre enkle algoritmer for maskinlæring eller data mining.

Ferdigheter:

  • Gjøre dataanalyse etter CRiSP-DM og Data Science Prosess.
  • Lage gode visualiseringer av data analysen med bruk av matplotlib.
  • Optimalisere dataanalysen ved å bruke tilgjengelig struktur og metoder.
  • Evaluere, kommunisere og forsvare resultater fra dataanalysen.

Generelle kvalifikasjoner:

  • Løse dataanalyseoppgaver i sanntid ved bruk av en strukturert fremgangsmåte.
Forkunnskapskrav
10 studiepoeng i programmering, databaser eller programvareutvikling
Anbefalte forkunnskaper
DAT120 Grunnleggende programmering, STA500 Sannsynlighetsregning og statistikk 2
Eksamen / vurdering

Prosjektarbeid og skriftlig eksamen

Vurderingsform Vekting Varighet Karakter Hjelpemiddel
Prosjektarbeid i gruppe 3/5 Bokstavkarakterer
Skriftlig eksamen (Multiple Choice) 2/5 3 Timer Bokstavkarakterer

Prosjektarbeid i grupperProsjektet gjennomføres i grupper. Prosjektarbeid skal utføres til de tider og i gruppene som tildeles og publiseres. Fravær på grunn av sykdom eller andre årsaker skal snarest meldes til foreleser.En prosjektrapport, inkludert kildekode, inngår i vurderingen. Studentene må gjennomføre en gruppevis muntlig presentasjon av prosjektet for å få karakter i emnet.Dersom en student stryker i prosjektarbeidet, må han/hun ta denne delen på nytt neste gang emnet foreleses.

Fagperson(er)
Instituttleder: Tom Ryen
Arbeidsformer

Arbeidet vil bestå av 6 timer forelesning, laboratorium, veiledet gruppearbeid per uke.

Det forventes at studentene bruker ytterligere 6-8 timer i uken på selvstudium, gruppediskusjoner og utviklingsarbeid.

Åpent for
Applied Data Science, master i teknologi/siv.ing. Datateknologi, master i teknologi/siv.ing. Utveksling ved Det teknisk- naturvitenskapelige fakultet
Litteratur
Pensumlisten finner du i Leganto