MENY
Dette er studietilbudet for studieår 2019-2020. Endringer kan komme.


Kurset tilbyr en innføring i teknikker og metoder for behandling, uthenting og søk i store tekstlige datasamlinger. Kurset tar for seg ulike applikasjoner og gir en "hands-on" eksperimentering med "state-of-the-art" algoritmer ved hjelp av eksisterende programvareverktøy og datasamlinger.

Læringsutbytte

Kunnskap:
  • Teori og praksis innen datautvinning og informasjonssøk. Ulike metoder og teknikker vil bli gjennomgått.

Ferdigheter:
  • Prosessere og forberede storskala tekstlige datasamlinger for utvinning og søk.
  • Bruke clustering, klassifisering og rangeringsmetoder til en rekke informasjonstilgangsoppgaver.
  • Evaluere resultater og utføre feilanalyse.

Generell kompetanse:
  • Forstå styrker og begrensninger av populære datautvinning- og informasjonssøkteknikker. Kunne identifisere gode forretningsapplikasjoner og være aktiv deltaker og lede slike prosjekter.

Innhold

  • Søkemotorarkitektur
  • Tekstpreprosessering og indeksering
  • Gjenfinningsmetoder (vektor-rom modell, probabilistiske modeller, learning-to-rank, nevrale modeller)
  • Gjenfinningsevaluering
  • Query modellering, relevant tilbakemelding
  • Websøk (gjennomsøking, indeksering, lenkeanalyse)
  • Semantisk søk (kunnskapsbaser, enhetsgjenfinning, enhetslenking)
  • Gruppering av tekst
  • Kategorisering av tekst
  • Emneanalyse (PLSA, LSA)

Forkunnskapskrav

Ingen.

Eksamen/vurdering

Prosjektoppgave og skriftlig eksamen
Vekting Varighet Karakter Hjelpemidler
Prosjektoppgave2/5 A - F
Skriftlig eksamen3/54 timerA - F

Fagperson(er)

Emneansvarlig
Krisztian Balog
Instituttleder
Tom Ryen

Arbeidsformer

6 timer forelesning/laboratorieøvinger pr. uke.

Overlapping

Emne Reduksjon (SP)
Websøk og data mining (DAT630_1) 5

Åpent for

Studenter tatt opp på masterprogram ved Det teknisk-naturvitenskapelige fakultet.

Emneevaluering

Skjer vanligvis gjennom skjema og/eller samtaler i henhold til gjeldende retningslinjer.

Litteratur

Text Data Management and Analysis: A Practical Introduction to Information Retrieval and Text Mining (Zhai and Massung), ACM and Morgan & Claypool Publishers, 2016.


Dette er studietilbudet for studieår 2019-2020. Endringer kan komme.

Sist oppdatert: 15.12.2019