Enkeltfag Engelsk 5 ECTS

Introduktion til machine learning

Overordnede kursusmål

At give deltagerne kendskab til:
* en generel struktur til datamodellering
* en række grundlæggende og bredt anvendte machine learning metoder
* Python som værktøj til dataanalyse, datamodellering, og machine learning

See course description in English

Læringsmål

  • Forklare de vigtigste trin der er involveret i datamodellering fra forberedelse af data, modellering af data til evaluering og formidling af resultaterne.
  • Diskutere centrale machine learning begreber som featureudtrækning, kryds-validering, generalisering og overindlæring, prædiktion, curse of dimensionality og bias-varians tradeoff.
  • Matche praktiske problemer til standard datamodelleringsproblemer såsom dimensionalitetsreduktion, regression, klassifikation, tæthedsestimering og gruppering (clustering).
  • Forklare hvordan relevante machine learning metoder virker.
  • Beskrive forudsætninger, begrænsninger og styrker af relevante machine learning metoder.
  • Anvende, modificere, og implementere centrale aspekter af machine learning algoritmer i Python.
  • Anvende visualiseringsteknikker og statistik til at evaluere modelpræstationer, identificere mønstre og problemer med data.
  • Udvælge, kombinere og modificere datamodelleringsmetoder for at analysere data og formidle resultaterne af analysen.

Kursusindhold

Struktureret datamodellering.
Dataforbedredelse og featureudtrækning.
Beskrivende statistikker.
Similaritetsmål.
Kostfunktioner (inkl. maximum likelihood).
Optimeringsmetoder til machine learning.
Overindlæring, generalisering, regualisering og bias-varians afvejninger.
Krydsvalidering.
Statistisk evaluering og sammenligning af machine learning modeller.
Visualisering og fortolkning af modeller.
Dimensionalitetsreduktion (inkl. principal komponent analyse).
Klassifikationsmetoder (beslutningstræer, logistisk og multinomial regression, nærmeste nabo, naiv Bayes, feed forward neurale netværk og ensemblemetoder)
Regressionsmetoder (regressionstræer, lineær regression, nærmeste nabo, feed forward neurale netværk og ensemblemetoder)
Gruppering (k-means, hierarkisk gruppering og miksturmodeller).
Tæthedsestimering (kernel baseret tæthedsestimering, Gaussiske miksturmodeller, og EM-algoritmen)
Anomali/outlier-detektion (inkl. tæthedsbaserede metoder).

Mulige starttidspunkter

  • 6 – 20 (tirs 13-17)

Anbefalede forudsætninger

01001/01002/01003/01004/01005/02402/02403/02002/02101/02102/02525/02631/02632/02633/02692, Grundkursus i lineær algebra og matematisk analyse, kendskab til sandsynlighedsregning eller statistik, kendskab til Python.

Undervisningsform

Aktiviteterne skifter mellem forelæsninger, opgaveregning og øvelser i Python.

Bemærkninger

Kurset er et grundlæggende machine learning kursus som er relevant for alle bachelorretninger.

Se kurset i kursusbasen

Tilmelding

Sprog

Engelsk

Varighed

13 uger

Institut

Compute

Sted

DTU Lyngby Campus

Kursus ID 02451
Kursustype Bachelor
Semesterstart Uge 6
Semester slut Uge 20
Dage tirs 13-17
Pris

9.250,00 kr.

Tilmelding