Machine learning
Overordnede kursusmål
At give deltagerne kendskab til:
* en generel struktur til datamodellering
* en række grundlæggende og bredt anvendte machine learning metoder
* Python som værktøj til dataanalyse, datamodellering, og machine learning
Kurset sætter således deltagerne i stand til at benytte machine learning til modellering af real-world data.
See course description in English
Læringsmål
- Forklare de vigtigste trin der er involveret i datamodellering fra forberedelse af data, modellering af data til evaluering og formidling af resultaterne.
- Diskutere centrale machine learning begreber som featureudtrækning, kryds-validering, generalisering og overindlæring, prædiktion, curse of dimensionality og bias-varians tradeoff.
- Matche praktiske problemer til standard datamodelleringsproblemer såsom dimensionalitetsreduktion, regression, klassifikation, tæthedsestimering og gruppering (clustering).
- Skitsere hvordan relevante machine learning metoder virker samt beskrive deres forudsætninger, begrænsninger og styrker.
- Anvende og modificere machine learning algoritmer i Python.
- Anvende visualiseringsteknikker og statistik til at evaluere modelpræstationer, identificere mønstre og problemer med data.
- Udvælge, kombinere og modificere datamodelleringsmetoder for at analysere data og formidle resultaterne af analysen.
- Anvende struktureret datamodellering indenfor en bred vifte af anvendelsesområder såsom medicoteknik, bio-informatik, kemi, elektronik og computer science.
Kursusindhold
Struktureret datamodellering.
Dataforbedredelse og featureudtrækning.
Beskrivende statistikker.
Similaritetsmål.
Kostfunktioner (inkl. maximum likelihood).
Optimeringsmetoder til machine learning.
Overindlæring, generalisering, regularisering og bias-varians trade-offs.
Krydsvalidering.
Statistisk evaluering og sammenligning af machine learning modeller.
Visualisering og fortolkning af modeller.
Dimensionalitetsreduktion (inkl. principal komponent analyse).
Klassifikationsmetoder (beslutningstræer, logistisk og multinomial regression, nærmeste nabo, naiv Bayes, feed forward neurale netværk og ensemblemetoder).
Regressionsmetoder (regressionstræer, lineær regression, nærmeste nabo, feed forward neurale netværk og ensemblemetoder).
Gruppering (k-means, hierarkisk gruppering og miksturmodeller).
Tæthedsestimering (kernel tæthedsestimering, Gaussiske miksturmodeller, og EM-algoritmen).
Anomali/outlier-detektion (inkl. tæthedsbaserede metoder).
Mulige starttidspunkter
- 36 – 49 (tirs 13-17)
Undervisningsform
Aktiviteterne skifter mellem forelæsninger, opgaveregning og øvelser i Python.
Fakultet
Bemærkninger
Kurset er et grundlæggende machine learning kursus som er relevant for alle masterretninger. Kurset giver en indføring i grundlæggende machine learning, matematikken bag metoderne samt hands-on erfaring i metodernes anvendelser. Kurset kan således stå alene.




