Likelihood and Bayes methods in phylogeny reconstruction, WS 2009/2010

Lecture with exercises / Vorlesung mit Übung (4 Credit Points)

Language: English

Instructor: Prof. Dr. Dirk Metzler

Time:
Lecture: Thursday from 2 to 4 p.m.
Exercise: Thursday from 4 to 5 p.m.

Lecture Hall:
Großhaderner Str. 2 (B) - Kleiner Hörsaal 2

Announcement in official LMU course overview

Contents: (yes I still have to translate this...) Es geht um Methoden der "Computational Statistics" und ihre Anwendung auf aktuelle Forschungsfragen der Phylogenierekonstruktion. Zu Beginn stellen wir Maximum-Likelihood-Methoden, die schon seit längerem in diesem Gebiet etabliert sind, distanzbasierten und parsimonischen Methoden gegenüber. Anschließend geht es um Bayessche Methoden, die in den letzten Jahren in der Sequenzdatenanalyse enorm an Bedeutung gewonnen haben. Sie beruhen auf Markoffketten-Monte-Carlo-Verfahren wie Metropolis-Hastings und Gibbs-Sampling. Solche Methoden ermöglichen, Stammbäume (annähernd) gemäß ihrer a-posteriori-Verteilung (bedingt auf die gegebenen Sequenzdaten) auszugeben und somit auch die Schätzunsicherheit zu untersuchen. Zu den speziellen Verfahren, die in der Vorlesung behandelt werden, zählen die Phylogenieschätzung mit Kalibrierungszeitpunkten (anhand fossiler Daten), die Rekonzilierung von Genbäumen und Artenbäumen sowie Importance-Sampling-Verfahren für Coalecent-Genealogien, die zur Schätzung populationsgenetischer Parameter verwendet werden. Statistische Methoden basieren auf probabilistischen Modellen für die Entstehung der Daten. Wir werden uns daher mit Evolutionsmodellen für biologische Sequenzen beschäftigen (Jukes-Cantor, PAM, F81, HKY, F84, GTR, Gamma-verteilte Raten...) sowie den dazu nötigen Grundlagen über Markoffprozesse. Auch Modelle für Stammbäume mit abgeschwächter molekularer Uhr (Relaxed Molecular Clock) und das Brownsche-Bewegung-Modell für die Evolution quantitativer Merkmale werden in der Vorlesung behandelt. Ein weiteres Thema sind Sequenzevolutionsmodelle mit Insertionen und Deletionen (TKF91, TKF94,...) und darauf basierende statistische Alignment-Verfahren. In den Übungen werden theoretische Aufaben bearbeitet sowie Algorithmen implementiert und erprobt. Wir werden uns auch mit einigen Programmpaketen befassen, etwa PHYLIP, Seq-Gen, R with the ape package, RAxML, MrBayes, BEAST und Bali-Phy, ....

Target group / Zielgruppe: Studierende der Bioinformatik (geeignet etwa ab 5. Semester) Auch andere Interessenten aus den Bereichen Biologie, (Bio)Statistik, Mathematik,...

Example command files and datasets

primates.R, primates.nex, primates.phylip, Corrected and now containig also a Windows version of the R file: NJvsMPvsML.zip

Skript?

Not yet available, parts of the course are based on chapter 4 of my old skript (in german).
web page last updated: Dirk Metzler, November 5, 2009