Warum ist dieses Wissen wichtig? | Dynamische Programmierung ist eine wichtiges Verfahren der Bioinformatik. Ein sicheres Verständnis dieser Methode ist Voraussetzung für die Analyse der routinemäßig genutzten Heuristiken wie FASTA und BLAST und das Verständnis von Algorithmen, mit denen z. B. Hidden-Markov-Modelle ausgewertet werden. Daher ist es ganz wichtig, dass Sie diesen Algorithmus wirklich verstanden haben. Mit den unten folgenden Übungen können Sie dies testen. Erst beim Rechnen mit Papier und Bleistift zeigt sich Ihr Wissen! | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Bezug | Diese Übungen ergänzen das Kapitel 9 "Paarweiser Sequenzvergleich". | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Lernziel |
Nach dem Bearbeiten der
Übung sollten sie beherrschen:
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Übung | Dotplot_1 | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Dotplots sind sehr einfache und wenig empfindliche Verfahren,
um gemeinsame Teilsequenzen zu bestimmen. Sie benutzen jedoch
dieselbe Datenstruktur wie aufwändigere Alignmentverfahren.
Rekapitulieren Sie bitte, wie aus der gefüllten Matrix M das Infix
abgeleitet wird.
Gegeben seien die folgenden Sequenzen:
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Berechnen Sie mit Papier und Bleistift einen Dotplot. | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Es gelte folgende Bedingung für das Füllen der Matrix M: | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Diskutieren Sie das Ergebnis; wo liegt des längste gemeinsame Infix? | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Lösung | Hier finden Sie die Lösung zur Aufgabe. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Berechnen von Alignments mithilfe von Scores |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Nun wollen wir dynamische Programmierung
nutzen, um zwei Sequenzen zu Alignieren. Für die folgenden Übungen gelten
folgende Scorewerte:
s(C, C) = s(D, D) = +1 , Hierbei ist gap das Symbol für die Lücke. |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Hinweise |
Es empfiehlt sich, in jeder Zelle Sij
die drei Teilergebnisse einzutragen, ehe Sie die maximalen Werte suchen.
Beispielsweise ist es geschickt, die drei Werte wie folgt in einer Zelle
einzutragen. Sie müssen sich hierfür jede Zelle in vier Teilzellen
aufteilen. Zusätzlich sollten Sie die Pfade für das Backtracking
markieren.
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Übung | Ali_1, globales Alignment | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Benutzen Sie den
Needleman-Wunsch-Algorithmus, d. h. die Bedingung: Sij = max { Si-1, j + s(ai , gap) , Si-1, j-1 + s(ai , bj) , Si, j-1 + s(gap , bj) } |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Übung | Ali_2, lokales Alignment | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Hinweise | In die Felder sind, um die Berechnung zu erleichtern, die Scores aus der BLOSUM62
Matrix eingetragen. Diese Werte entsprechen den Termen
s(ai
, bj),
die nun individuell gewichtet sind.
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Lösungen | Hier finden Sie die Lösungen zu
diesen Übungen. |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Übung | Ali_3, Exon-Intron-Alignment | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Mit der folgenden übung soll klar gemacht werden, dass
Standardeinstellungen (Defaults) nicht für alle Fragestellungen die
optimalen Ergebnisse liefern.
Betrachten Sie für die folgenden Übung folgendes Szenario:
In einem Laborexperiment wird das Arylsulfatase-Gen von
Chlamydomonas reinhardtii untersucht, dessen cDNA-Sequenz schon bekannt ist
(accession number X52304). Für verschiedene Untersuchungen wird
jedoch auch dessen genomische Sequenz benötigt, die über eine PCR-Strategie
gewonnen werden soll. |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Bestimmen Sie die Intron/Exon Struktur des Gens: Wie liegen diese Gensegmente zueinander? | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Hinweise | Erstellen Sie mit den EMBOSS-Programmen needle
und water jeweils paarweise globale und lokale Alignments mit den
Standardeinstellungen. Alignieren Sie die Sequenz von Cars_genom mit
der DNA-Sequenz, die zu X52304 gehört. Helfen Ihnen die Alignments weiter, um eine
Exon-Intron-Struktur festzulegen? Nutzen Sie das Software-Angebot des EBI in Hinxton. Ändern Sie nun für das Programm water die Parameter, um ein zufriedenstellendes Alignment zu erhalten. Welche Werte müssen Sie ändern? Warum? Überlegen Sie sich, dass Sie DNA-Sequenzen betrachten und welchen Einfluss die beiden Parameter der affinen Kostenfunktion auf die Länge und Anzahl von Lücken haben. Testen Sie unterschiedliche Werte, z.B. 20 für das Öffnen von Lücken. Machen Sie sich bitte klar, in welche der beiden Sequenzen das Alignment KEINE Lücken einführen darf! |
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Übung | Ali_7, Needleman-Wunsch/Smith-Waterman | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Diese Übung soll plausibel machen, dass die sich einstellenden
Ähnlichkeitswerte beim Vergleich identischer Sequenzen vom benutzten
Alignmentverfahren abhängen. Nutzen Sie wiederum die Server des EBI, um globale und lokale Sequenzalignment für bereits vertraute Sequenzen zu berechnen. |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Vergleichen Sie paarweise MS2_HUMAN, ADAM_CROAD, SLIT_DROME. Wie unterscheiden sich die Sequenzen? | |||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Hinweise |
Lassen Sie für jedes Paar sowohl ein globales als auch ein lokales
Alignment berechnen.
Erklären Sie bitte die unterschiedlichen Ergebnisse für globale und lokale Alignments: Wie groß ist jeweils der relative Anteil identischer und ähnlicher Residuen?
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Was Sie jetzt verstanden haben sollten |
Das Berechnen von Alignments ist eine ganz wesentliche Aufgabe in der Bioinformatik. Deswegen ist ein genaues Verständnis der Verfahren enorm wichtig. Heuristiken, die optimale Algorithmen approximieren, werden verwendet, um die Geschwindigkeit von Datenbanksuchen zu erhöhen. Die dynamische Programmierung ist ein spezielles Verfahren zur Berechnung von optimalen Lösungen, das auch in anderen bioinformatischen Anwendungen eingesetzt werden kann. | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||