Kursplan - Maskininlärning med Big Data
Omfattning
7.5 hp
Kurskod
DVA453
Giltig från
Hösttermin 2018
Utbildningsnivå
Avancerad nivå
Successiv fördjupning
A1N (Avancerad nivå, har endast kurs/er på grundnivå som förkunskapskrav).
Huvudområde(n)
Datavetenskap
Akademi
Akademin för innovation, design och teknik
Fastställd
2017-01-31
Reviderad
2018-02-01
Litteraturlistor
Kurslitteraturen är preliminär till 8 veckor innan kursstart. Kurslitteratur kan vara giltig över flera terminer.
-
Böcker
Understanding machine learning : from theory to algorithms
New York, NY : Cambridge University Press, 2014 - xvi, 397 p.
ISBN: 978-1-107-05713-5 LIBRIS-ID: 16717946
Learning From Data
ISBN: 9781600490064 LIBRIS-ID: 13914157
An Introduction to Statistical Learning : with Applications in R
New York, NY : Springer New York, 2013. - XIV, 426 p. 150 illus., 146 illus. in color.
ISBN: 978-1-4614-7138-7 LIBRIS-ID: 14557777
Case-Based Reasoning A Textbook
Feature extraction [electronic resource] : foundations and applications / Isabelle Guyon ... [et al.] (eds.).
Springer-Verlag,
Deep learning
Cambridge, MA : MIT Press, [2016] - xxii, 775 pages
ISBN: 978-0-262-03561-3 LIBRIS-ID: 19973915
Big Data Concepts, Theories, and Applications
1st ed. 2016. : Cham : Springer International Publishing, 2016. - VIII, 437 p. 97 illus., 17 illus. in color.
ISBN: 978-3-319-27763-9 LIBRIS-ID: 19419072
Learning Spark : Lightning-Fast Big Data Analytics [electronic resource]
Introduction to Machine Learning with Python
O'Reilly Media, 2016 - 400 s.
ISBN: 9781449369415 LIBRIS-ID: 17554477
Python machine learning : unlock deeper insights into machine learning with this vital guide to cutting-edge predictive analysis
Birmingham : Packt Publishing Limited, 2015 - 425 s.
ISBN: 1-78355-513-0 LIBRIS-ID: 18646485
Data Science for Business : What You Need to Know about Data Mining and Data-analytic Thinking [electronic resource]
Artiklar
Big data analytics: a survey
Journal of Big Data, vol. 2, no. 1, 2015
A survey of open source tools for machine learning with big data in the Hadoop ecosystem
Journal of Big Data, vol. 2, no. 1, 2015
Challenges of Big Data analysis
National Science Review, vol. 1, no. 2, 2014
Selection of relevant features and examples in machine learning
Artificial Intelligence, vol. 97, no. 12, 1997
Feature selection for classification
Intelligent Data Analysis, vol. 1, no. 14, 1997
Case-based reasoning: foundational issues, methodological variations, and system approaches
AI Commun., vol. 7, no. 1, 1994
Retrieval, reuse, revision and retention in case-based reasoning
The Knowledge Engineering Review, vol. 20, no. 03, 2005
MLlib: machine learning in apache spark
J. Mach. Learn. Res., vol. 17, no. 1, 2016
Syfte
Den snabba utvecklingen av digital teknik och framsteg inom kommunikationer gör att det idag produceras en gigantisk mängd data varje dag med komplexa strukturer som kallas "Big data” och detta växer dessutom exponentiellt. Syftet med kursen är att ge studenterna insikter i grundläggande begrepp inom maskininlärning med Big data samt den senaste forskningsutvecklingen inom området. Studenterna kommer att lära sig om problem och industriella utmaningar av flera fallstudier inom området. Vidare kommer studenterna att lära sig att använda verktyg för att utveckla system som använder algoritmer för maskininlärning i Big data.
Lärandemål
Efter avslutad kurs ska studenten kunna:
1. beskriva de grundläggande principerna för maskininlärning och Big Data
2. uppvisa förmåga att identifiera de viktigaste utmaningarna för att använda Big Data med maskininlärning
3. visa förmåga att välja lämpliga algoritmer för maskininlärning för att lösa ett givet problem för Big Data
4. visa förmåga att använda verktyg för analys av stora datamängder och presentera analysresultatet
Innehåll
Modul 1. Inledning och bakgrund: introduktionen syftar till att granska maskininlärning (ML) och bearbetningstekniker för Big Data och relaterade delämnen med fokus på underliggande teman.
Modul 2. Fallstudier: presenterar fallstudier från olika tillämpningsområden och diskuterar viktiga tekniska frågor t.ex. bullerhantering, feature extraction, urval och inlärningsalgoritmer för att utveckla sådana system.
Modul 3. Maskininlärningstekniker vid analys av Big Data: denna modul består av grundläggande förståelse för inlärningsteori, klusteranalys, djupinlärning (deep learning) och andra klassificeringstekniker lämpliga för utvecklingsarbete och problem angående konstruktion av system som använder Big Data.
Modul 4. Dataanalyser med verktyg: presenterar verktyg skrivna med öppen källkod t.ex. KNIME och Spark med exempel som vägleder genom den grundläggande analysen av Big Data.
Undervisning
Video-baserade föreläsningar på nätet, problembaserat lärande, tilldelade vetenskapliga artiklar (läsa, söka på nätet), chatt-rum/diskussionsforum.
Särskild behörighet
100 hp, varav 70 hp inom datavetenskap eller motsvarande, inklusive minst 30 hp programmering eller mjukvaruutveckling. Minst 12 månaders dokumenterad arbetslivserfarenhet inom mjukvaruutveckling eller relaterad verksamhet. Dessutom krävs Svenska B/Svenska 3 samt Engelska A/Engelska 6. I de fall kursen ges på engelska görs undantag från kravet på Svenska B/Svenska 3.
Examination
Inlämningsuppgift (INL1), (Modul 1), 1,0 hp, (examinerar lärandemål 1), Betyg Underkänd (U) eller Godkänd G
Inlämningsuppgift (INL2), (Modul 2), 1,5 hp, (examinerar lärandemål 2), Betyg Underkänd (U) eller Godkänd G
Inlämningsuppgift (INL3), (Modul 3), 2,0 hp, (examinerar lärandemål 3), Betyg Underkänd (U) eller Godkänd G
Projekt (PRO1), (Modul 4), 3 hp, (examinerar lärandemål 4), Betyg Underkänd (U) eller Godkänd G
En student som har ett intyg från MDU avseende sin funktionsnedsättning har möjlighet att anmäla önskemål om anpassning vid salstentamina eller annan examinationsform i enlighet med Regler och anvisningar för examination på grundnivå och avancerad nivå vid Mälardalens högskola (2020/1655). Det är examinator som, utifrån det intyg som utfärdats, beslutar om eventuell anpassning och i så fall vilken anpassning som ska gälla.
Misstankar om vilseledande vid examination (fusk) anmäls, enligt högskoleförordningen, till universitetets rektor och prövas av universitetets disciplinnämnd. Om disciplinnämnden anser att en student gjort sig skyldig till en disciplinförseelse fattar nämnden beslut om en disciplinär åtgärd, vilket är varning eller avstängning.
Betyg
Godkänd, underkänd