Enkeltfag Engelsk 5 ECTS

Algoritmer i bioinformatik, Ph.d.

Overordnede kursusmål

At give de studerende et overblik og dybdegående forståelse af bioinformatiske maskinlæringsalgoritmer. Gøre den studerende i stand til at evaluere hvilke algoritmer, der er bedst egnede til at besvare et givent biologisk spørgsmål, og dernæst udvikle og implementere forudsigelsesværktøjer med sådanne algoritmer til at beskrive komplekse biologiske problemer relateret til f.eks. immunsystemet, vaccineudvikling, genkendelse af sygdomsgener, proteinstruktur og -funktion, posttranslationelle modifikationer.

See course description in English

Læringsmål

  • forstå detaljerne i de mest brugte algoritmer i bioinformatik.
  • udvikle computerprogrammer, der implementerer disse algoritmer.
  • vælge den algoritme, der er bedst egnet til at beskrive et givent biologisk problem.
  • forstå konceptet data redundance og homology reduktion.
  • udvikle bioinformatiske forudsigelsesalgoritmer, der kan beskrive et givent biologisk problem.
  • være i stand til – på et detaljeret niveau – at implementere og udvikle forudsigelsesværktøjer ved at bruge følgende algoritmer: Dynamisk programmering, Sekvens-klyngedannelse, Vægtmatricer, Kunstige neurale netværk, og Skjulte Markov modeller.
  • designe et projekt hvor et biologisk problem er analyseret ved brug af en eller flere maskinlæringsalgoritmer.
  • implementere, dokumentere og præsentere et kursusprojekt.

Kursusindhold

Kurset dækker de mest brugte algoritmer i bioinformatik. Vægten vil blive lagt på den præcise matematiske implementering af algoritmerne i form af computerprogrammer. I løbet af kurset vil forskellige biologiske problemer blive introduceret og analyseret med det formål at belyse styrker og svagheder ved de forskellige algoritmer. Følgende emner bliver dækket i kurset:

Dynamisk programmering: Needleman-Wunsch, Smith-Waterman, og alignment heuristics
Dataredundans og homologi-reduktion: Hobohm og andre klyngealgoritmer
Vægtmatricer: Sekvensvægtning, pseudo count-korrektion for lavt antal, Gibbs-sampling, og Psi-Blast
Skjulte Markov Modeller: Modelkonstruktion, Viterbi-dekodning, posterior dekodning, og Baum-Welsh HMM læring
Kunstige neurale netværk: Arkitekturer og sekvenskodning, feed-forward algoritme, tilbagespredning og dybe neurale netværk

Kurset består af forelæsninger, diskussioner og computerøvelser, hvor de studerende bliver introduceret til de forskellige algoritmer, deres implementation, og brug i analysen af biologiske problemer. Kurset afsluttes med et gruppeprojekt, hvor en eller flere af algoritmerne introduceret på kurset anvendes til at analysere et biologisk problem. Projektet skal dokumenteres med en rapport skrevet som en videnskabelig artikel.

Anbefalede forudsætninger

22101/22111/22113/22163, eller lignende. Være i stand til at skrive simple programmer og scripts i et Unix miljø for at løse bioinformatiske opgaver på struktureret vis, f.eks. i forbindelse med projektarbejde.

Undervisningsform

Forelæsninger, diskussioner, øvelser og projekt

Fakultet

Se kurset i kursusbasen

Tilmelding

Sprog

Engelsk

Varighed

3 uger

Institut

Sundhedsteknologi

Sted

DTU Lyngby Campus

Kursus ID 22175
Kursustype Ph.d.
Semesterstart Uge 23
Semester slut Uge 26
Dage Man-fre 8:00-17:00
Pris

10.600,00 kr.

Tilmelding