Applied computerintensiv dataanalyse
Overordnede kursusmål
At bibringe studenten viden om avancerede computer intensive metoder til dataanalyse med applikationer indenfor fx life sciences. At anvende metoderne på en problemstilling med egne dat.
See course description in English
Læringsmål
- Relatere dele af kurset til den studerendes eget projekt
- Evaluere krydsvalidering og koncepter som overfitting
- Evaluere og anvende sparse regressions og klassifikations modeller
- Evaluere og anvende logistisk regression og support vector machines
- Evaluere og anvende klassifikations og regressions træer (CART)
- Evaluere og anvende random forests, boosting og ensemble metoder
- Evaluere og fortolke sparse latente modeller som sparse principal component analysis
- Evaluere og fortolke en række af ikke-superviserede dekompositions modeller
- Evaluere cluster modeller
- Sammenligne og vælge mellem metoderne ovenfor
Kursusindhold
Methods: Cross-validation, elastic net, sparse principal components, sparse discriminant analysis and Gaussian mixture analysis, logistic regression, support vector machine, classification and regression trees, random forests, clustering, nonnegative matrix factorization, independent component analysis, sparse coding, archetypical analysis.
Anbefalede forudsætninger
Det forudsættes at deltagerne har kendskab til statistik eller dataanalyse og kendskab til Matlab, python eller R.
Undervisningsform
En uges undervisning med øvelser. Undervisningen gives som flipped classroom med video forelæsninger og Q&A sessioner samt diskussioner om egen data og projekter ifh det lærte. Der er desuden øvelser til alle forelæsningsemnerne der giver hands-on erfaring med metoderne. Deltagerne arbejder med et projekt med deltagernes egne data og afleverer en rapport baseret på disse efter en måned. Det er altså forventet at den studerende arbejder med projektet efter undervisningsugen.
Fakultet
Pladsbegrænsning
Minimum 8, Maksimum: 60.
Vær opmærksom på, at dette enkeltfagskursus har et minimumskrav til antal deltagere. Derudover er der begrænsning på antallet af studiepladser. Er der for få tilmeldinger oprettes kurset ikke. Er der for mange tilmeldinger, vil der blive trukket lod om pladserne. Du får besked om, om du har fået tildelt en studieplads senest 8 dage før kursusstart.