Emne

Introduksjon til datavitenskap (DAT540)

Fakta

Emnekode DAT540

Vekting (stp) 10

Semester undervisningsstart Høst

Undervisningsspråk Engelsk

Antall semestre 1

Vurderingssemester Høst

Timeplan Vis timeplan

Litteratur Pensumlisten finner du i Leganto

Intro

Emnet skal gi kunnskap og erfaring innen datavitenskapelige oppgaver og gjøre studenten kjent med datavitenskapelig prosjektsyklus.

Innhold

Evnen til å innhente og analysere data har blitt en av de viktigste utfordringene i nesten alle fagområder, sektorer og næringer. I dette emnet blir studentene kjent med grunnleggende verktøy og prosesser som brukes i datavitenskap ("Data Science")

Studentene jobber gjennom hele dataflyten, fra innhenting, rensing og modellering, til lagring av dataene. Arbeidet utføres ved bruk av Python-stakken, som består av blant annet: IPython, NumPy, Pandas, Matplotlib og Jupyter Notebooks.

Studentene lærer å strukturere sitt arbeid ved hjelp av CRISP-DM og Data Science -prosessen ("Ask, Get, Explore, Model, Communicate and Visualize").

Læringsutbytte

Kunnskap:

  • Utvikle og kjøre programmer for å laste, analysere, rense, transformere, slå sammen, omforme og lagre data.
  • Sammenligne vanlige Python, NumPy og Pandas datastrukturer og bruke en av disse til en definert oppgave. Bruke IPython shell og Jupyter notebook for undersøkende databehandling.
  • Utvikle og kjøre enkle algoritmer for maskinlæring eller data mining.

Ferdigheter:

  • Gjøre dataanalyse etter CRiSP-DM og Data Science Prosess.
  • Lage gode visualiseringer av data analysen med bruk av matplotlib.
  • Optimalisere dataanalysen ved å bruke tilgjengelig struktur og metoder.
  • Evaluere, kommunisere og forsvare resultater fra dataanalysen.

Generelle kvalifikasjoner:

  • Løse dataanalyseoppgaver i sanntid ved bruk av en strukturert fremgangsmåte.

Forkunnskapskrav

10 studiepoeng i programmering, databaser eller programvareutvikling

Anbefalte forkunnskaper

Grunnleggende programmering (DAT120), Sannsynlighetsregning og statistikk 2 (STA500)

Eksamen / vurdering

Prosjektarbeid i gruppe

Vekt 3/5

Karakter Bokstavkarakterer

Skriftlig eksamen (Multiple Choice)

Vekt 2/5

Varighet 3 Timer

Karakter Bokstavkarakterer

Eksamenssystem Inspera assessment

Trekkfrist 13.11.2025

Eksamensdato 27.11.2025

Skriftlig eksamen (multiple choice) er digital.

Prosjektet gjennomføres i grupper. Prosjektarbeid skal utføres i de gruppene som tildeles og publiseres. Fravær på grunn av sykdom eller andre årsaker skal snarest meldes til foreleser.

En prosjektrapport, inkludert kildekode, inngår i vurderingen.

Dersom en student stryker i prosjektarbeidet, må han/hun ta denne delen på nytt neste gang emnet foreleses.

Arbeidsformer

Arbeidet vil bestå av 6 timer forelesning, laboratorium, veiledet gruppearbeid per uke.

Det forventes at studentene bruker ytterligere 6-8 timer i uken på selvstudium, gruppediskusjoner og utviklingsarbeid.

Åpent for

Enkeltemner på masternivå ved Det teknisk-naturvitenskapelige fakultet
Data Science Computational Engineering Datateknologi Industriell økonomi Kybernetikk og robotteknologi - Master i teknologi/siv.ing. - 5 år
Utveksling ved Det teknisk-naturvitenskapelige fakultet

Opptakskrav

Søkeren må oppfylle opptakskravet til et av studieprogrammene som emnet er åpent for.

Emneevaluering

Fakultetet avgjør om det skal gjennomføres tidligdialog i alle emner eller i utvalgte grupper av emner. Formålet er å få tilbakemeldinger fra studentene for forbedringer i semesteret. I tillegg skal det gjennomføres en digital emneevaluering minst hvert tredje år for å innhente studentenes erfaringer.

Litteratur

Book Python for data analysis : data wrangling with pandas, NumPy, and Jupyter McKinney, Wes, McKinney, Wes, Sebastopol, O'Reilly, xvi, 561 sider, [2022]; ©2022, isbn:9781098104030, Både 2. og 3. utgave kan benyttes / Both the 2nd and 3rd edition can be used Book Building machine learning systems with Python : explore machine learning and deep learning techniques for building intelligent systems using scikit-learn and TensorFlow Coelho, Luis Pedro,, Richert, W., Birmingham, England :, Packt, 1 online resource (394 pages), 2018., isbn:1-78862-222-7, View online Book Python data science handbook : essential tools for working with data VanderPlas, Jacob T., Sebastopol, Calif. :, O'Reilly, XVI, 529 sider ;, cop. 2017., isbn:978-1-491-91205-8,
Emnebeskrivelsen er hentet fra Felles studentsystem Versjon 1