Kursplan - Maskininlärning med Big Data
Omfattning
7.5 hp
Kurskod
DVA453
Giltig från
Hösttermin 2019
Utbildningsnivå
Avancerad nivå
Successiv fördjupning
A1N (Avancerad nivå, har endast kurs/er på grundnivå som förkunskapskrav)
Huvudområde(n)
Datavetenskap
Akademi
Akademin för innovation, design och teknik
Fastställd
2017-01-31
Reviderad
2019-01-25
Litteraturlistor
Kurslitteraturen är preliminär till 8 veckor innan kursstart. Kurslitteratur kan vara giltig över flera terminer.
-
Böcker
Understanding machine learning: from theory to algorithms
Suggested literature.
ISBN: 978-1-107-05713-5
An Introduction to Statistical Learning: with Applications in R
Suggested literature. ISBN 978-1-4614-7137-0 ISBN 978-1-4614-7138-7 (e-bok)
ISBN: 978-1-4614-7138-7
Case-Based Reasoning A Textbook
Suggested literature. ISBN 978-3-642-40166-4 ISBN 978-3-642-40167-1 (e-bok)
Feature extraction [electronic resource] : foundations and applications / Isabelle Guyon ... [et al.] (eds.).
Suggested literature ISBN 978-3-540-35487-1 ISBN 978-3-540-35488-8 (e-bok)
Big Data Concepts, Theories, and Applications
Suggested literature.
ISBN: 978-3-319-27763-9
Learning Spark : Lightning-Fast Big Data Analytics [electronic resource]
Suggested literature.
Introduction to Machine Learning with Python
Suggested literature.
ISBN: 9781449369415
Python machine learning: unlock deeper insights into machine learning with this vital guide to cutting-edge predictive analysis
Suggested literature.
ISBN: 1-78355-513-0
Data Science for Business : What You Need to Know about Data Mining and Data-analytic Thinking [electronic resource]
Suggested literature.
Artiklar
Big data analytics: a survey
pp. 1-32, 2015 Suggested literature.
A survey of open source tools for machine learning with big data in the Hadoop ecosystem
pp. 1-36 Suggested literature.
Challenges of Big Data analysis
pp. 293-314, 2014 Suggested literature.
Selection of relevant features and examples in machine learning
pp. 245-271, 12 Suggested literature.
Feature selection for classification
pp. 131-156 Suggested literature.
Case-based reasoning: foundational issues, methodological variations, and system approaches
pp. 39-59 Suggested literature.
Retrieval, reuse, revision and retention in case-based reasoning
pp. 215-240 Suggested literature.
MLlib: machine learning in apache spark
pp. 1235-1241 Suggested literature.
Syfte
Den snabba utvecklingen av digital teknik och framsteg inom kommunikationer gör att det idag produceras en gigantisk mängd data varje dag med komplexa strukturer som kallas "Big data" och detta växer dessutom exponentiellt. Syftet med kursen är att ge studenterna insikter i grundläggande begrepp inom maskininlärning med Big data samt den senaste forskningsutvecklingen inom området. Studenterna kommer att lära sig om problem och industriella utmaningar av flera fallstudier inom området. Vidare kommer studenterna att lära sig att använda verktyg för att utveckla system som använder algoritmer för maskininlärning i Big data.
Lärandemål
Efter avslutad kurs ska studenten kunna:
1. beskriva de grundläggande principerna för maskininlärning och Big Data
2. uppvisa förmåga att identifiera de viktigaste utmaningarna för att använda Big Data med maskininlärning
3. visa förmåga att välja lämpliga algoritmer för maskininlärning för att lösa ett givet problem för Big Data
4. visa förmåga att använda verktyg för analys av stora datamängder och presentera analysresultatet
Innehåll
Modul 1. Inledning och bakgrund: introduktionen syftar till att granska maskininlärning (ML) och bearbetningstekniker för Big Data och relaterade delämnen med fokus på underliggande teman.
Modul 2. Fallstudier: presenterar fallstudier från olika tillämpningsområden och diskuterar viktiga tekniska frågor t.ex. bullerhantering, feature extraction, urval och inlärningsalgoritmer för att utveckla sådana system.
Modul 3. Maskininlärningstekniker vid analys av Big Data: denna modul består av grundläggande förståelse för inlärningsteori, klusteranalys, djupinlärning (deep learning) och andra klassificeringstekniker lämpliga för utvecklingsarbete och problem angående konstruktion av system som använder Big Data.
Modul 4. Dataanalyser med verktyg: presenterar verktyg skrivna med öppen källkod t.ex. KNIME och Spark med exempel som vägleder genom den grundläggande analysen av Big Data.
Särskild behörighet
90 hp, varav 60 hp inom datavetenskap eller motsvarande, inklusive minst 15 hp programmering. Dessutom krävs Svenska B/Svenska 3 samt Engelska A/Engelska 6. I de fall kursen ges på engelska görs undantag från kravet på Svenska B/Svenska 3.
Examination
Inlämningsuppgift (INL1), (Modul 1), 1,0 hp, (examinerar lärandemål 1), betyg Underkänd (U) eller Godkänd (G)
Inlämningsuppgift (INL2), (Modul 2), 1,5 hp, (examinerar lärandemål 2), betyg Underkänd (U) eller Godkänd (G)
Inlämningsuppgift (INL3), (Modul 3), 2,0 hp, (examinerar lärandemål 3), betyg Underkänd (U) eller Godkänd (G)
Projekt (PRO1), (Modul 4), 3 hp, (examinerar lärandemål 4), betyg Underkänd (U) eller Godkänd (G)
En student som har ett intyg från MDU avseende sin funktionsnedsättning har möjlighet att anmäla önskemål om anpassning vid salstentamina eller annan examinationsform i enlighet med Regler och anvisningar för examination på grundnivå och avancerad nivå vid Mälardalens högskola (2020/1655). Det är examinator som, utifrån det intyg som utfärdats, beslutar om eventuell anpassning och i så fall vilken anpassning som ska gälla.
Misstankar om vilseledande vid examination (fusk) anmäls, enligt högskoleförordningen, till universitetets rektor och prövas av universitetets disciplinnämnd. Om disciplinnämnden anser att en student gjort sig skyldig till en disciplinförseelse fattar nämnden beslut om en disciplinär åtgärd, vilket är varning eller avstängning.
Betyg
Tvågradig skala