MENY
Dette er studietilbudet for studieår 2019-2020. Endringer kan komme.


Kurset skal gi kunnskap og erfaring innen datavitenskapelige oppgaver og gjøre studenten kjent med datavitenskapelig prosjektsyklus.

Læringsutbytte

Kunnskap:
  • Utvikle programmer for å laste, analysere, rense, transformere, slå sammen, omforme og lagre data.
  • Sammenligne vanlige Python, NumPy og Pandas datastrukturer og bruke en av disse til en definert oppgave. Bruke IPython shell og Jupyter notebook for undersøkende databehandling.
  • Utvikle enkle algoritmer for maskinlæring eller data mining.

Ferdigheter:
  • Gjøre dataanalyse etter CRiSP-DM og Data Science Prosess.
  • Lage gode visualiseringer av data analysen med bruk av matplotlib.
  • Optimalisere dataanalysen ved å bruke tilgjengelig struktur og metoder.
  • Evaluere, kommunisere og forsvare resultater fra dataanalysen.

Generelle kvalifikasjoner:
  • Løse dataanalyseoppgaver i sanntid ved bruk av en strukturert fremgangsmåte.

Innhold

Evnen til å innhente og analysere data har blitt en av de viktigste utfordringene i nesten alle fagområder, sektorer og næringer. I dette kurset blir studentene kjent med grunnleggende verktøy og prosesser som brukes i datavitenskap ("Data Science"). Studentene jobber gjennom hele dataflyten, fra innhenting, rensing og modellering, til lagring av dataene. Arbeidet utføres ved bruk av Python-stakken, som består av blant annet: IPython, NumPy, Pandas, Matplotlib og Jupyter Notebooks. Studentene lærer å strukturere sitt arbeid ved hjelp av CRISP-DM og Data Science-prosessen ("Ask, Get, Explore, Model, Communicate and Visualize").

Forkunnskapskrav

10 studiepoeng i programmering, databaser eller programvareutvikling.

Eksamen/vurdering

Vekting Varighet Karakter Hjelpemiddel
Prosjektarbeid med muntlig fremføring1/1 A - F
Prosjektet fullføres i grupper. Prosjektarbeidet skal gjøres på tidspunkter og i gruppene som er tildelt og publisert. Fravær på grunn av sykdom eller andre årsaker skal meddeles emneansvarlig snarest mulig.
Både prosjektarbeid og muntlig fremføring må gjennomføres før endelig karakter fastsettes. Gruppemedlemmene kan få ulik karakter basert på den muntlige gjennomgangen.
Hvis en student ikke består prosjektoppgaven, må hun/han ta dette om igjen neste gang kurset undervises.

Vilkår for å gå opp til eksamen/vurdering

Obligatoriske innleveringsoppgaver
Emnet starter med 4 obligatoriske innleveringsoppgaver som skal løses individuelt. Alle obligatoriske oppgaver må være godkjent innen en gitt frist for at studenten skal kunne få starte med prosjektet.

Fagperson(er)

Emneansvarlig
Antorweep Chakravorty
Studiekoordinator
Nina Egeland
Instituttleder
Tom Ryen

Arbeidsformer

Arbeidet vil bestå av 6 timer forelesning, laboratorium, veiledet gruppearbeid per uke. Det forventes at studentene bruker ytterligere 6-8 timer i uken på selvstudium, gruppediskusjoner og utviklingsarbeid (åpen lab).

Åpent for

Anvendt Data Science, master
Datateknologi - Master program

Emneevaluering

Skjer vanligvis gjennom skjema og/eller i samtaler etter til gjeldende retningslinjer.

Litteratur

(Obligatorisk) Python for Data Analysis 2nd Edition, McKinney, O'Reilly ISBN: 978-1491957660
(Valgfri) Python Data Science Handbook, VanderPlas, O'Reilly ISBN: 978-1491912058
(Valgfri) Building Machine Learning Systems with Python 2nd Edition, Coelho and Richert, PACKT ISBN: 978-1784392772


Dette er studietilbudet for studieår 2019-2020. Endringer kan komme.

Sist oppdatert: 11.12.2019