Enkeltfag Engelsk 5 ECTS

Anvendt machine learning og big data

Overordnede kursusmål

Systematisk indsamling, oprensning, lagring og analyse af data og rapportering etablerer evnen til at reagere og handle på baggrund af dem – har potentialet til at transformere forretningen i mange virksomheder.

I kurset arbejdes med strukturerede og ustrukturerede heterogene data i forbindelse med visualisering, klynge- og klassifikationsanalyse af datasæt.

Yderligere arbejdes med cloud services til big data analyse og grundlæggende Unix/Linux administration til drift af servermiljøer.

Der udføres et projekt efter eget valg hvor kursets værktøjer og metoder anvendes. Et led i gennemførelse af projektet er søgning af projektrelevant information i en videnskabelig database, fx DTU Findit.

See course description in English

Læringsmål

  • Forstå og anvende repræsentation af datasæt i multidimensionalt.
  • Forstå og anvende værktøjer til oprensning af datasæt.
  • Forstå og anvende machine learning til visualisering af datasæt.
  • Forstå og anvende machine learning til klyngeanalyse (unsupervised classification) af datasæt.
  • Forstå og anvende machine learning til klassifikation (supervised classification) af datasæt.
  • Forstå og anvende cloud services til big data analyse.
  • Forstå og anvende grundlæggende Unix/Linux administrationsværktøjer bl.a. til opsætning af big data beregningsmiljøer.
  • Forstå og anvende en videnskabelig database, fx DTU Findit, til søgning af litteratur af relevans for et givet projektområde.

Kursusindhold

Repræsentation af data i multidimensionale heterogene datasæt.
Rensning af datasæt, inklusiv identifikation og fjernelse af outliers.
Anvendelse til machine learning baseret data visualisering;
klyngeanalyse (unsupervised classification), fx k-nearest-neighbor, hierarkisk klyngeanalyse, spectral clustering, naiive Bayes og klassifikation (supervised classification), fx logistisk regression, support vector machines, decision trees, random forests, deep neural networks, recurrent neural networks.
Anvende cloud service til big data analyse, herunder grundlæggened Unix/Linux administrationsværktøjer til opsætning af big data miljø.
Anvendelse af videnskabelig videndatabase.

Anbefalede forudsætninger

Du skal have kendskab til programmering, og ønske om at lære mere programmering. Egen PC (med Mac, Windows eller Linux) medbringes. Afhængig af dine datas størrelse må du regne med at afsætte midler til lagring og behandling af disse.

Du skal have grundlæggende viden om lineær algebra (såsom vektor/matrix multiplikation/invers, egenværdier/egenvektorer) og sandsynlighedsteori (såsom sandsynlighedstæthedsfunktion, sandsynlighedsfordelinger, central grænsesætning, bayes-sætning).

Undervisningsform

Forelæsninger og projektarbejde

Fakultet

Bemærkninger

Sektion for AI, matematik og software
Sundhedsteknologi: valgfag
IT-elektronik:valgfag
Softwareteknologi:valgfag
ITØ:valgfag

Pladsbegrænsning

Minimum 6, Maksimum: 15.

Vær opmærksom på, at dette enkeltfagskursus har et minimumskrav til antal deltagere. Derudover er der begrænsning på antallet af studiepladser. Er der for få tilmeldinger oprettes kurset ikke. Er der for mange tilmeldinger, vil der blive trukket lod om pladserne. Du får besked om, om du har fået tildelt en studieplads senest 8 dage før kursusstart.

Se kurset i kursusbasen

Tilmelding

Sprog

Engelsk

Varighed

13 uger

Institut

Engineering Technology

Sted

DTU Ballerup Campus

Kursus ID 62533
Kursustype Diplomingeniør
Semesterstart Uge 6
Semester slut Uge 20
Pris

9.250,00 kr.

Vær opmærksom på dette kursus har deltager begrænsninger. Læs mere

Tilmelding