Hopp til hovedinnhold

Introduksjon til datavitenskap DAT540

Kurset skal gi kunnskap og erfaring innen datavitenskapelige oppgaver og gjøre studenten kjent med datavitenskapelig prosjektsyklus.


Dette er emnebeskrivelsen for studieåret 2021-2022. Merk at det kan komme endringer.

Fakta
Emnekode

DAT540

Vekting (SP)

10

Semester undervisningsstart

Høst

Antall semestre

1

Vurderingsemester

Høst

Undervisningsspråk

Engelsk

Tilbys av

Det teknisk-naturvitenskapelige fakultet, Institutt for data- og elektroteknologi

Læringsutbytte

Kunnskap:

  • Utvikle programmer for å laste, analysere, rense, transformere, slå sammen, omforme og lagre data.
  • Sammenligne vanlige Python, NumPy og Pandas datastrukturer og bruke en av disse til en definert oppgave. Bruke IPython shell og Jupyter notebook for undersøkende databehandling.
  • Utvikle enkle algoritmer for maskinlæring eller data mining.

Ferdigheter:

  • Gjøre dataanalyse etter CRiSP-DM og Data Science Prosess.
  • Lage gode visualiseringer av data analysen med bruk av matplotlib.
  • Optimalisere dataanalysen ved å bruke tilgjengelig struktur og metoder.
  • Evaluere, kommunisere og forsvare resultater fra dataanalysen.

Generelle kvalifikasjoner:

  • Løse dataanalyseoppgaver i sanntid ved bruk av en strukturert fremgangsmåte.
Innhold
Evnen til å innhente og analysere data har blitt en av de viktigste utfordringene i nesten alle fagområder, sektorer og næringer. I dette kurset blir studentene kjent med grunnleggende verktøy og prosesser som brukes i datavitenskap ("Data Science"). Studentene jobber gjennom hele dataflyten, fra innhenting, rensing og modellering, til lagring av dataene. Arbeidet utføres ved bruk av Python-stakken, som består av blant annet: IPython, NumPy, Pandas, Matplotlib og Jupyter Notebooks. Studentene lærer å strukturere sitt arbeid ved hjelp av CRISP-DM og Data Science-prosessen ("Ask, Get, Explore, Model, Communicate and Visualize").
Forkunnskapkrav
10 studiepoeng i programmering, databaser eller programvareutvikling.
Eksamen / vurdering

Prosjektarbeid med muntlig fremføring

Vurderingsform Vekting Varighet Karakter Hjelpemiddel
Muntlig fremføring 40/100 A - F
Individuell innleveringsoppgaver 60/100 A - F

Prosjektet fullføres i grupper. Prosjektarbeidet skal gjøres på tidspunkter og i gruppene som er tildelt og publisert. Fravær på grunn av sykdom eller andre årsaker skal meddeles emneansvarlig snarest mulig.Både prosjektarbeid og muntlig fremføring må gjennomføres før endelig karakter fastsettes. Hvis en student ikke består prosjektoppgaven, må hun/han ta dette om igjen neste gang kurset undervises.2 - 4 innleveringsoppgaver skal løses individuelt. Både prosjekt og innleveringsoppgave må være bestått for å få endelig karakter i emnet.

Fagperson(er)
Emneansvarlig: Antorweep Chakravorty
Ansvarlig laboratorieøvelser: Nikita Rajendra Karandikar
Emneansvarlig: Antorweep Chakravorty
Instituttleder: Tom Ryen
Arbeidsformer
Arbeidet vil bestå av 6 timer forelesning, laboratorium, veiledet gruppearbeid per uke. Det forventes at studentene bruker ytterligere 6-8 timer i uken på selvstudium, gruppediskusjoner og utviklingsarbeid (åpen lab).
Åpent for
Applied Data Science, master Datateknologi - Master program Utveksling ved Det teknisk- naturvitenskapelige fakultet
Emneevaluering
Skjer vanligvis gjennom skjema og/eller i samtaler etter til gjeldende retningslinjer.
Litteratur
Søk etter pensumlitteratur i Leganto