Introduktion til bioinformatik
Overordnede kursusmål
Computerbaserede metoder spiller i disse år en afgørende rolle indenfor molekylærbiologi, mikrobiologi, bioteknologi og lægemiddelforskning. Store internationale sekvens- og strukturdatabaser indeholder information som i mange tilfælde helt kan erstatte eksperimentelt arbejde, og i andre tilfælde bruges til at optimere udbyttet af de eksperimentelle ressourcer. Kursets mål er således at give de studerende kendskab til de vigtigste databaser og metoder til molekylær sekvens- og strukturanalyse.
Introduktion til Bioinformatik er et praktisk orienteret kursus, med fokus på anvendelse af metoderne snarere end deres matematiske udledning. Bioinformatik præsenteres som en biologisk disciplin baseret på evolutionsteori. En stor del af undervisningen består af computer-øvelser, hvor de beregningsmæssige værktøjer anvendes baseret på deltagernes biologiske forhåndskendskab.
See course description in English
Læringsmål
- redegøre for hvordan informationen i biologiske makromolekyler, såsom DNA og protein, kan repræsenteres i et elektronisk format.
- redegøre for hvorledes en fælles evolutionshistorie påvirker DNA og protein-sekvens i beslægtede organismer.
- søge efter data i de offentligt tilgængelige sekvens- og struktur-databaser, såsom GenBank, UniProt og PDB.
- anvende programmer til visualisering af protein 3D struktur.
- fremstille og kritisk evaluere kvaliteten af DNA- og protein-alignments.
- søge i sekvensdatabaser med alignment-baserede metoder (BLAST) og kritisk evaluere pålideligheden af resultaterne.
- bestemme den sandsynlige biologiske funktion af et ukendt gen eller protein-produkt ud fra sammenligning med kendte gener / proteiner.
- anvende programmer til at fremstille multiple alignments af grupper af beslægtede sekvenser.
- fremstille fylogenetiske træer ud fra multiple alignments.
- fremstille og tolke visualiseringer af informationsindholdet i grupper af beslægtede sekvenser (“logo plots”).
Kursusindhold
Evolution på DNA-niveau. Taksonomi. Brug af taksonomi-databaser.
Biologisk information. Informationsindhold i biologiske makromolekyler. DNA sekventering – herunder fejlkilder. DNA sekvens på elektronisk form. Brug af GenBank databasen.
Proteinsekvens. Proteinstruktur-niveauer. Elektronisk repræsentation af proteinsekvens. Kilder til proteinsekvens (translation og direkte sekventering). Brug af UniProt databasen.
Proteinstruktur. Proteinstruktur bestemmelse. Kvalitet af proteinstruktur data. Brug af PDB databasen. Computerbaseret visualisering af proteinstruktur.
Parvis alignment. Alignment score, brug af “gaps”, substitutions-matricer. Globalt og lokalt alignment.
BLAST. Brug af BLAST algoritmen til søgning i sekvensdatabaser. Kritisk evaluering af søgeresultater. Iterativ BLAST (PSI-BLAST).
Multiple alignments. Brug af heuristiske metoder pga. datakompleksitet.
Konstruktion og fortolking af fylogenetiske træer ud fra multiple alignments. Brug af NJ algoritmen. Rodfæstede versus ikke-rodfæstede træer.
Vægt-matrice baserede metoder. Søgning med vægt-matrice. Konstruktion og fortolkning af LOGO plots.
Anbefalede forudsætninger
27002/27008, Basal forståelse for industrielt vigtige biologiske processer. Kendskab til cellers indre struktur, deres biologiske funktioner samt biokemiske og molekylærbiologiske processer sammen med bioteknologiske processer.
Undervisningsform
Forelæsninger og computerøvelser