Algoritmer i bioinformatik, Ph.d.
Overordnede kursusmål
At give de studerende et overblik og dybdegående forståelse af bioinformatiske maskinlæringsalgoritmer. Gøre den studerende i stand til at evaluere hvilke algoritmer, der er bedst egnede til at besvare et givent biologisk spørgsmål, og dernæst udvikle og implementere forudsigelsesværktøjer med sådanne algoritmer til at beskrive komplekse biologiske problemer relateret til f.eks. immunsystemet, vaccineudvikling, genkendelse af sygdomsgener, proteinstruktur og -funktion, posttranslationelle modifikationer.
See course description in English
Læringsmål
- forstå detaljerne i de mest brugte algoritmer i bioinformatik.
- udvikle computerprogrammer, der implementerer disse algoritmer.
- vælge den algoritme, der er bedst egnet til at beskrive et givent biologisk problem.
- forstå konceptet data redundance og homology reduktion.
- udvikle bioinformatiske forudsigelsesalgoritmer, der kan beskrive et givent biologisk problem.
- være i stand til – på et detaljeret niveau – at implementere og udvikle forudsigelsesværktøjer ved at bruge følgende algoritmer: Dynamisk programmering, Sekvens-klyngedannelse, Vægtmatricer, Kunstige neurale netværk, og Skjulte Markov modeller.
- designe et projekt hvor et biologisk problem er analyseret ved brug af en eller flere maskinlæringsalgoritmer.
- implementere, dokumentere og præsentere et kursusprojekt.
Kursusindhold
Kurset dækker de mest brugte algoritmer i bioinformatik. Vægten vil blive lagt på den præcise matematiske implementering af algoritmerne i form af computerprogrammer. I løbet af kurset vil forskellige biologiske problemer blive introduceret og analyseret med det formål at belyse styrker og svagheder ved de forskellige algoritmer. Følgende emner bliver dækket i kurset:
Dynamisk programmering: Needleman-Wunsch, Smith-Waterman, og alignment heuristics
Dataredundans og homologi-reduktion: Hobohm og andre klyngealgoritmer
Vægtmatricer: Sekvensvægtning, pseudo count-korrektion for lavt antal, Gibbs-sampling, og Psi-Blast
Skjulte Markov Modeller: Modelkonstruktion, Viterbi-dekodning, posterior dekodning, og Baum-Welsh HMM læring
Kunstige neurale netværk: Arkitekturer og sekvenskodning, feed-forward algoritme, tilbagespredning og dybe neurale netværk
Kurset består af forelæsninger, diskussioner og computerøvelser, hvor de studerende bliver introduceret til de forskellige algoritmer, deres implementation, og brug i analysen af biologiske problemer. Kurset afsluttes med et gruppeprojekt, hvor en eller flere af algoritmerne introduceret på kurset anvendes til at analysere et biologisk problem. Projektet skal dokumenteres med en rapport skrevet som en videnskabelig artikel.
Undervisningsform
Forelæsninger, diskussioner, øvelser og projekt