Warum ist dieses Wissen wichtig? | Scoringmatrizen sind neben den Parametern für das Behandeln von Lücken die wichtigsten Eingaben, die das Verhalten der Algorithmen für den Sequenzvergleich steuern. Via Scoring-Schema wird aus der Anwendungsdomäne Wissen über die Bedeutung und die Ähnlichkeit zwischen den Objekten übernommen, die durch die Symbole repräsentiert werden. Machen Sie sich klar, dass die Algorithmen rein schematisch mit Symbolen umgehen. Deswegen muss die Scoringmatrix mit Bedacht und anwendungsspezifisch gewählt werden. | |
Bezug | Die Theorie zu den Scoring-Schemata finden Sie im Kapitel 11 "Scoring-Schemata". | |
Lernziel |
|
|
Die physikalisch-chemischen Eigenschaften der Aminosäuren
bedingen, dass sie sich unterschiedlich gut substituieren (ersetzen)
können. Hier finden
Sie ein Venn-Diagramm, das aus diesen Eigenschaften abgeleitet
wurde. Mit den folgenden Übungen wollen wir uns einige Eigenschaften dieser Matrizen etwas genauer ansehen. |
||
Übung | Scores_1, PAM250-Matrix | |
Hier finden Sie die PAM250-Matrix. | ||
Die Werte in der PAM250-Matrix wurden derart arrangiert, dass Aminosäuren mit ähnlichen Eigenschaften geclustert liegen. Die für das Clustern relevanten Eigenschaften können Sie in der folgenden Übung herausarbeiten. | ||
|
||
Hinweise | Nutzen Sie zur Beantwortung das Venn-Diagramm und achten Sie auf die gemeinsamen und unterschiedlichen Eigenschaften von Aminosäurepaaren. | |
Übung | Scores_2, BLOSUM62 | |
Hier finden Sie die BLOSUM62-Matrix. | ||
Bestimmen Sie die Scores für
Suchen Sie den höchsten Score in der Matrix.
|
||
Hinweise |
Das Vorkommen von Aminosäuren ist im Kapitel 1, Tabelle 1.3 gelistet. Rekapitulieren Sie, wie die BLOSUM-Scores errechnet werden. Welche Häufigkeiten gehen ein? Eine Lösung finden Sie hier. In dieser Darstellung sind alle Einträge > 0 rot markiert. Können Sie die Lage der Werte aufgrund physikalisch-chemischer
Eigenschaften der Aminosäuren begründen? |
|
Übung | Scores_3 | |
|
||
Hinweise | Rekapitulieren Sie die Bedeutung der Nummern in den Namen der Matrizen. Wie ist die BLOSUM 62 und wie ist die PAM70 Matrix entstanden? | |
Übung | Scores_4 | |
Wird BLAST verwendet, um sehr kurze Sequenzen in der Datenbank zu suchen, wird per Default auf die PAM 30-Matrix umgestellt. | ||
|
||
Hinweise |
Berechnen Sie den Score für den Vergleich der Sequenz S = AVIL
mit sich selbst! Benutzen Sie alternativ die PAM 30- und die BLOSUM 64-Matrix. Welcher Score ist größer? Überlegen Sie sich zur Beantwortung der Frage, in welchem Schritt des BLAST-Algorithmus der Score für kurze Sequenzfragmente eine Rolle für die weitere Berechnung spielt. Was folgt hieraus allgemein für den Zusammenhang zwischen Sequenzähnlichkeit und Score-Wert bei Verwendung unterschiedlicher Scoring-Matrizen? |
|
Übung | Scores_5 | |
Die Einträge in Substitutionsmatrizen werden aus Substitutionshäufigkeiten f(asi , asj) berechnet. Wir wollen diesen Ansatz hier nachvollziehen. Dazu betrachten wir den folgenden Ausschnitt eines Blockes aus der BLOCKS-Datenbank. | ||
|
||
|
||
Was Sie jetzt verstanden haben sollten |
Die Unterschiede in den Eigenschaften der Aminosäuren werden durch die Werte repräsentiert, die in den Scoringmatrizen zu finden sind. Die beim Alignment erreichten Score-Werte hängen von der Wahl der Substitutionsmatrix ab. Diese Korrelation wird auch durch den Wert der Matrix-Entropie hergestellt, die im Abschnitt 11.8 beschrieben wird. | |