Enkeltfag Engelsk 5 ECTS

Machine learning

Overordnede kursusmål

At give deltagerne kendskab til:
* en generel struktur til datamodellering
* en række grundlæggende og bredt anvendte machine learning metoder
* Python som værktøj til dataanalyse, datamodellering, og machine learning

Kurset sætter således deltagerne i stand til at benytte machine learning til modellering af real-world data.

See course description in English

Læringsmål

  • Forklare de vigtigste trin der er involveret i datamodellering fra forberedelse af data, modellering af data til evaluering og formidling af resultaterne.
  • Diskutere centrale machine learning begreber som featureudtrækning, kryds-validering, generalisering og overindlæring, prædiktion, curse of dimensionality og bias-varians tradeoff.
  • Matche praktiske problemer til standard datamodelleringsproblemer såsom dimensionalitetsreduktion, regression, klassifikation, tæthedsestimering og gruppering (clustering).
  • Skitsere hvordan relevante machine learning metoder virker samt beskrive deres forudsætninger, begrænsninger og styrker.
  • Anvende og modificere machine learning algoritmer i Python.
  • Anvende visualiseringsteknikker og statistik til at evaluere modelpræstationer, identificere mønstre og problemer med data.
  • Udvælge, kombinere og modificere datamodelleringsmetoder for at analysere data og formidle resultaterne af analysen.
  • Anvende struktureret datamodellering indenfor en bred vifte af anvendelsesområder såsom medicoteknik, bio-informatik, kemi, elektronik og computer science.

Kursusindhold

Struktureret datamodellering.
Dataforbedredelse og featureudtrækning.
Beskrivende statistikker.
Similaritetsmål.
Kostfunktioner (inkl. maximum likelihood).
Optimeringsmetoder til machine learning.
Overindlæring, generalisering, regularisering og bias-varians trade-offs.
Krydsvalidering.
Statistisk evaluering og sammenligning af machine learning modeller.
Visualisering og fortolkning af modeller.
Dimensionalitetsreduktion (inkl. principal komponent analyse).
Klassifikationsmetoder (beslutningstræer, logistisk og multinomial regression, nærmeste nabo, naiv Bayes, feed forward neurale netværk og ensemblemetoder).
Regressionsmetoder (regressionstræer, lineær regression, nærmeste nabo, feed forward neurale netværk og ensemblemetoder).
Gruppering (k-means, hierarkisk gruppering og miksturmodeller).
Tæthedsestimering (kernel tæthedsestimering, Gaussiske miksturmodeller, og EM-algoritmen).
Anomali/outlier-detektion (inkl. tæthedsbaserede metoder).

Mulige starttidspunkter

  • 36 – 49 (tirs 13-17)

Anbefalede forudsætninger

01001/01002/01003/01004/01005/02402/02403/02002/02101/02102/02525/02631/02632/02633/02692, Grundkursus i lineær algebra og matematisk analyse, kendskab til sandsynlighedsregning og statistik, kendskab til Python.

Undervisningsform

Aktiviteterne skifter mellem forelæsninger, opgaveregning og øvelser i Python.

Bemærkninger

Kurset er et grundlæggende machine learning kursus som er relevant for alle masterretninger. Kurset giver en indføring i grundlæggende machine learning, matematikken bag metoderne samt hands-on erfaring i metodernes anvendelser. Kurset kan således stå alene.

Se kurset i kursusbasen

Tilmelding

Sprog

Engelsk

Varighed

13 uger

Institut

Compute

Sted

DTU Lyngby Campus

Kursus ID 02452
Kursustype Kandidat
Semesterstart Uge 36
Semester slut Uge 49
Dage tirs 13-17
Pris

9.250,00 kr.

Tilmelding