Introduktion til machine learning
Overordnede kursusmål
At give deltagerne kendskab til:
* en generel struktur til datamodellering
* en række grundlæggende og bredt anvendte machine learning metoder
* Python som værktøj til dataanalyse, datamodellering, og machine learning
See course description in English
Læringsmål
- Forklare de vigtigste trin der er involveret i datamodellering fra forberedelse af data, modellering af data til evaluering og formidling af resultaterne.
- Diskutere centrale machine learning begreber som featureudtrækning, kryds-validering, generalisering og overindlæring, prædiktion, curse of dimensionality og bias-varians tradeoff.
- Matche praktiske problemer til standard datamodelleringsproblemer såsom dimensionalitetsreduktion, regression, klassifikation, tæthedsestimering og gruppering (clustering).
- Forklare hvordan relevante machine learning metoder virker.
- Beskrive forudsætninger, begrænsninger og styrker af relevante machine learning metoder.
- Anvende, modificere, og implementere centrale aspekter af machine learning algoritmer i Python.
- Anvende visualiseringsteknikker og statistik til at evaluere modelpræstationer, identificere mønstre og problemer med data.
- Udvælge, kombinere og modificere datamodelleringsmetoder for at analysere data og formidle resultaterne af analysen.
Kursusindhold
Struktureret datamodellering.
Dataforbedredelse og featureudtrækning.
Beskrivende statistikker.
Similaritetsmål.
Kostfunktioner (inkl. maximum likelihood).
Optimeringsmetoder til machine learning.
Overindlæring, generalisering, regualisering og bias-varians afvejninger.
Krydsvalidering.
Statistisk evaluering og sammenligning af machine learning modeller.
Visualisering og fortolkning af modeller.
Dimensionalitetsreduktion (inkl. principal komponent analyse).
Klassifikationsmetoder (beslutningstræer, logistisk og multinomial regression, nærmeste nabo, naiv Bayes, feed forward neurale netværk og ensemblemetoder)
Regressionsmetoder (regressionstræer, lineær regression, nærmeste nabo, feed forward neurale netværk og ensemblemetoder)
Gruppering (k-means, hierarkisk gruppering og miksturmodeller).
Tæthedsestimering (kernel baseret tæthedsestimering, Gaussiske miksturmodeller, og EM-algoritmen)
Anomali/outlier-detektion (inkl. tæthedsbaserede metoder).
Mulige starttidspunkter
- 6 – 20 (tirs 13-17)
Undervisningsform
Aktiviteterne skifter mellem forelæsninger, opgaveregning og øvelser i Python.
Fakultet
Bemærkninger
Kurset er et grundlæggende machine learning kursus som er relevant for alle bachelorretninger.




