Kursplan - Dataanalys, klustring och klassificering
Omfattning
7.5 hp
Kurskod
MAA512
Giltig från
Hösttermin 2019
Utbildningsnivå
Avancerad nivå
Successiv fördjupning
A1N (Avancerad nivå, har endast kurs/er på grundnivå som förkunskapskrav).
Huvudområde(n)
Akademi
Akademin för utbildning, kultur och kommunikation
Fastställd
2018-12-07
Litteraturlistor
Kurslitteraturen är preliminär till 8 veckor innan kursstart. Kurslitteratur kan vara giltig över flera terminer.
-
Introduction to Machine Learning
2020
Övrigt
Additional material in the form of Lecture notes might be provided during the course.
Syfte
Kursens syfte är att ge kunskaper i olika metoder för lösning av klustrings- och klassificeringsproblem inom dataanalys. Kursen ska ge både förståelse i hur metoderna fungerar samt ge träning i hur de kan användas på olika praktiska problem och tillämpningar. Kursen ska omfatta konkreta exempel på tillämpningar där klustring och klassificering förekommer, samt ge exempel på andra aspekter av dataanalys såsom evaluering av resultat och vanliga datatransformationer.
Lärandemål
Efter avklarad kurs ska studenten kunna:
1. beskriva olika metoder för klassificering och klustring av data samt diskutera några av deras egenskaper, för- och nackdelar,
2. självständigt lösa klustrings- och klassificeringsproblem utifrån givna data,
3. beskriva och tillämpa olika typer av enkla datatransformationer samt metoder för dimensionsreducering i problem inom dataanalys,
4. beskriva vad som menas med "Kernel-tricket", matematiken bakom metoden och hur det kan användas inom klustring eller klassificering,
5. utvärdera resultatet av en klassificering eller klustring,
6. ge exempel på tillämpningar där klustrings- och klassificeringsproblem uppstår.
Innehåll
- Klustringsmetoder såsom: k-means, Expectation Maximization (EM), DBSCAN.
- Klassificeringsmetoder såsom: Naive Bayes, Support Vector Machines (SVM), Linear Discriminant Analysis (LDA).
- Metoder för dimensionsreducering såsom: Principal Component analysis (PCA), Non-negative Matrix Factorization (NNMF).
- Hilbertrum, positivt definita funktioner, reproducerande kärna för Hilbertrum.
- Vanliga datatransformer: z-transform, vinklar/klockslag till kartesiska koordinater, "Kernel-tricket" applicerade på t.ex. SVM och Kernel k-means.
- Metoder för utvärdering: korsvalidering, precision, recall, F-measure, receiver operating characteristic (ROC)
- Diskussion och exempel på tillämpningar av klustring och klassificering av olika typer av data.
Särskild behörighet
Linjär algebra, 7,5 hp eller Tillämpad matrisanalys, 7,5 hp eller motsvarande och Sannolikhetslära och statistisk teori, 7,5 hp eller Statistisk inferensteori 7,5 hp eller motsvarande och Programmeringens grunder, 7,5 hp eller motsvarande. Dessutom krävs Svenska B/Svenska 3 samt Engelska A/Engelska 6. I de fall kursen ges på engelska görs undantag från kravet på Svenska B/Svenska 3.
Examination
LAB1, 1,5 hp, Betyg Underkänd (U) eller Godkänd (G): datorbaserade laborationer examinerar lärandemål 1, 3, 5, 6.
PRO1, 3 hp, Betyg Underkänd (U), Godkänd (G) eller Väl Godkänd (VG): Självständig lösning av ett givet problem, examinerar lärandemål 2, 3, 5.
TEN1, 3 hp, Betyg Underkänd (U), Godkänd (G) eller Väl Godkänd (VG): Tentamen, examinerar lärandemål 1, 3, 4.
En student som har ett intyg från MDU avseende sin funktionsnedsättning har möjlighet att anmäla önskemål om anpassning vid salstentamina eller annan examinationsform i enlighet med Regler och anvisningar för examination på grundnivå och avancerad nivå vid Mälardalens högskola (2020/1655). Det är examinator som, utifrån det intyg som utfärdats, beslutar om eventuell anpassning och i så fall vilken anpassning som ska gälla.
Misstankar om vilseledande vid examination (fusk) anmäls, enligt högskoleförordningen, till universitetets rektor och prövas av universitetets disciplinnämnd. Om disciplinnämnden anser att en student gjort sig skyldig till en disciplinförseelse fattar nämnden beslut om en disciplinär åtgärd, vilket är varning eller avstängning.
Betyg
Väl godkänd, godkänd, underkänd
Övergångsbestämmelser och övriga föreskrifter
I enlighet med Regler och anvisningar för examinationsärenden på grundnivå och avancerad nivå vid Mälardalens högskola erbjuds studenter som varit registrerad på respektive kurs tre tillfällen för omprov (utöver de ordinarie omprov som är inplanerade inom ramen för att kursen gavs sista gången) under de två kommande terminerna som följer efter att kursen gavs sista gången. Efter att de tre examinationstillfällen har erbjudits upphör kursen.