Emne

Informasjonsgjenfinning og tekstutvinning (DAT640)

Fakta

Emnekode DAT640

Vekting (stp) 10

Semester undervisningsstart Høst

Undervisningsspråk Engelsk

Antall semestre 1

Vurderingssemester Høst

Timeplan Vis timeplan

Litteratur Pensumlisten finner du i Leganto

Introduksjon

Emnet tilbyr en innføring i teknikker og metoder for behandling, uthenting og søk i store tekstlige datasamlinger. Emnet tar for seg ulike applikasjoner og gir en "hands-on" eksperimentering med "state-of-the-art" algoritmer ved hjelp av eksisterende programvareverktøy og datasamlinger.

Innhold

NB! Dette er et valgemne og dersom det er færre enn 10 studenter oppmeldt pr. 20. august, kan dette medføre at emnet ikke tilbys.

  • Tekstpreprosessering, indeksering
  • Representasjonslæring (ordinnbygging)
  • Kategorisering av tekst
  • Søkemotorarkitektur
  • Gjenfinningsmetoder (vektor-rom modell, probabilistiske modeller, learning-to-rank, nevrale modeller)
  • Gjenfinningsevaluering
  • Query modellering, relevant tilbakemelding
  • Websøk (lenkeanalyse)
  • Semantisk søk (kunnskapsbaser, enhetsgjenfinning, enhetslenking)
  • Informasjonstilgang med samtaleagenter
  • Transformatorer og store språkmodeller

Læringsutbytte

Kunnskap:

  • Teori og praksis innen datautvinning og informasjonssøk. Ulike metoder og teknikker vil bli gjennomgått.

Ferdigheter:

  • Prosessere og forberede storskala tekstlige datasamlinger for utvinning og søk.
  • Bruke clustering, klassifisering og rangeringsmetoder til en rekke informasjonstilgangsoppgaver.
  • Evaluere resultater og utføre feilanalyse.

Generell kompetanse:

  • Forstå styrker og begrensninger av populære datautvinning- og informasjonssøkteknikker. Kunne identifisere gode forretningsapplikasjoner og være aktiv deltaker og lede slike prosjekter.

Forkunnskapskrav

Ingen

Eksamen / vurdering

Prosjektoppgave

Vekt 1/2

Karakter Bokstavkarakterer

Trekkfrist 31.10.2025

Skriftlig eksamen

Vekt 1/2

Varighet 4 Timer

Karakter Bokstavkarakterer

Hjelpemiddel Alle trykte eller håndskrevne hjelpemidler tillatt. Bestemt, enkel kalkulator tillatt, Alle hjelpemidler er tillatt – det er ikke tillatt å samarbeide / få hjelp av andre personer i arbeidet med eksamensoppgaven

Eksamenssystem WISEflow

Trekkfrist 19.11.2025

Eksamensdato 03.12.2025

Prosjektet er en kombinasjon av individuelle oppgaver og gruppeoppgaver. Prosjektgrupper blir satt opp av faglærer.

Det tilbys ikke kontinuasjonsmuligheter på prosjektoppgaven. Studenter som ikke består prosjektoppgaven, kan ta denne delen på nytt neste gang emnet har ordinær undervisning.

Digital skriftlig eksamen.

Begge vurderingsdeler må være bestått for å oppnå samlet karakter i emnet.

Arbeidsformer

6 timer forelesning/laboratorieøvinger pr. uke.

Overlapping

Emne Reduksjon (SP)
Websøk og data mining (DAT630_1) , Informasjonsgjenfinning og tekstutvinning (DAT640_1) 5

Åpent for

Enkeltemner på masternivå ved Det teknisk-naturvitenskapelige fakultet
Data Science Data Science - master i teknologi/siv.ing., deltid Datateknologi Datateknologi - master i teknologi, deltid Kybernetikk og robotteknologi - Master i teknologi/siv.ing. - 5 år
Utveksling ved Det teknisk-naturvitenskapelige fakultet

Opptakskrav

Søkeren må oppfylle opptakskravet til et av studieprogrammene som emnet er åpent for.

Emneevaluering

Fakultetet avgjør om det skal gjennomføres tidligdialog i alle emner eller i utvalgte grupper av emner. Formålet er å få tilbakemeldinger fra studentene for forbedringer i semesteret. I tillegg skal det gjennomføres en digital emneevaluering minst hvert tredje år for å innhente studentenes erfaringer.
Emnebeskrivelsen er hentet fra Felles studentsystem Versjon 1