Warum ist dieses Wissen wichtig? Der Vergleich von Proteinsequenzen beruht auf dem Konzept der Homologie. Es wird unterstellt, dass sich die Proteine aus einem gemeinsamen Vorgänger entwickelt haben. Haben sich die zu vergleichenden Proteine jedoch sehr weit voneinander entfernt, ist ihre Verwandtschaft über Sequenzvergleich zum Teil nicht mehr nachweisbar. Der Vergleich der Strukturen ist unabhängig von Sequenzinformation und damit eine alternative Methode, um den Raum der Proteinstrukturen zu ordnen.

Ein klassischer Ansatz zum Strukturvergleich ist im Programm Dali umgesetzt, das Sie hier kennenlernen.

Bezug Die theoretischen Grundlagen finden Sie im Kapitel 16 "Profil-HMMs"  und im Kapitel 19 "Vergleich von Protein-3D-Strukturen".

Lernziel

Nach dem Bearbeiten der Übung sollten Sie
  • Dali anwenden,
  • Ergebnisse von Superpositionsexperimenten interpretieren
können.
   
Übung 3D_Vergl_1 Superposition von (βα)8-Fässern
 
Das (βα)8-Fass, das wir bereits kennengelernt haben, ist ein in der Natur häufig vorkommendes Strukturgerüst. In der SCOPe-Datenbank finden sich 34 Superfamilien von strukturell ähnlichen Proteinen, die als Grundmotiv diese Kombination von Sekundärstrukturelementen enthalten.

Diesen Faltungstyp weisen auch die Triosephosphate Isomerase von Thermotoga maritima (PDB-Code 1b9b) und die 2-Deoxyribose-5-Phosphat Aldolase (1p1x) von Escherichia coli auf.
   
 
Weisen Sie die Übereinstimmung der beiden Strukturen nach.
 
Paarweiser Sequenzvergleich Diese Übung wollen wir auch nutzen, um Unterschiede in der Empfindlichkeit von Vergleichsverfahren zu untersuchen.

Wir beginnen mit einem paarweisen Sequenvergleich. Besorgen Sie sich zuerst die Sequenzen der jeweiligen Ketten A der PDB-Datensätze.
Geben Sie im Suchfeld der PDB-Datenbank die Codes 1b9b bzw. 1p1x ein und benutzen Sie die Funktion Download Files/FASTA Sequence, um die Sequenzen zu sichern.
BLAST Vergleichen Sie nun die Sequenzen paarweise mittels BLAST (Protein BLAST und anschließender Wahl von ).
   
  Findet BLAST homologe Bereiche?
   
  Es zeigt sich, dass der einfache Sequenzvergleich nicht ausreicht, um eine Verwandschaft nachzuweisen.
Wir wissen aber auch, dass die Verwendung von Hidden-Markov-Modellen die Empfindlichkeit des Sequenzvergleichs deutlich steigert. Ob dies auch in diesem Fall zutrifft, wollen wir als Nächstes untersuchen.
   
Sequenzsuche mit HMMs Benutzen Sie die beiden Sequenzen, um die PFAM-Datenbank mithilfe von HMMER zu durchsuchen. In dieser Datenbank wird jede Proteinfamilie durch ein HMM charakterisiert.

Übergeben Sie die Sequenz, stellen Sie sicher, dass als HMM Database nur Pfam ausgewählt ist und Klicken Sie auf Submit.
   
  Bestimmen Sie für die beiden Sequenzen die Familie und den Clan, zu der sie gehören.
   
Beide Sequenzen gehören zum selben Clan, der Fässer mit einer Phosphatbindestelle umfasst.
Oben rechts wird auf der Seite, die den Clan beschreibt, die Anzahl der Strukturen angegeben, die zu diesem Clan gehören.
Durch Klicken auf die Anzahl wird eine Liste geöffnet. Sie können nun durch Suchen sicherstellen, dass die beiden Strukturen (1b9b und 1p1x) zu diesem Clan gehören. Damit ist die strukturelle Verwandtschaft gezeigt.
   
Vergleich der Strukturen mit DALI Eine Alternative zum Vergleich von Sequenzen ist der Vergleich der Proteinstrukturen.

Eines der anerkannt besten Verfahren ist DALI, das den paarweisen Vergleich von Strukturen erlaubt.
   
  Bestimmen Sie die strukturelle Ähnlichkeit der beiden Proteine.
   
Hinweise Wählen Sie zunächst den Reiter Pairwise.
Führen Sie nun drei Schritte aus, um in den Feldern zu  STEP 1 und STEP 2 die Codes 1b9ba bzw. 1p1xb  einzugeben.
Diese Konkatenationen definieren die Strukturen und Ketten.

Stoßen Sie anschließend den Vergleich durch Anklicken der Taste Submit an.

Es wird Ihnen eine Seite Results errechnet. Wählen Sie auf dieser die Interaktive (html) Darstellung, die eine Liste mit signifikanten strukturellen Alignments (Z-Score > 2) enthält. Studieren Sie die Daten, die auf der Ergebnisseite zusammengefasst sind:
   
  Wie groß ist der Z-Score und die RMSD-Abweichung?
   
  Beide Kennwerte machen deutlich, dass sich die Strukturen sehr ähnlich sind. Diese können Sie auch visuell überprüfen.
Superposition der Strukturen Wählen Sie den ersten (einzigen) Eintrag unter der Überschrift Summary und klicken Sie dann auf die Taste 3D Superposition (PV). In einem separaten Fenster wird die Superposition gezeigt.

  Klicken Sie auf der Ergebnisseite auch auf die Taste Structural Alignment.

Aus den oberen zwei Zeilen können Sie die strukturelle Korrespondenz der Residuen ableiten.
In den beiden unteren Zeilen sind die Sekundärstrukturelemente eingetragen und aligniert.
   
  Wo finden sich die größten Unterschiede der beiden Strukturen?
   

Was Sie jetzt verstanden haben sollten

Proteine können sich auf Sequenzniveau soweit voneinander entfernt haben, dass die Abstammung von einem gemeinsamen Vorfahren durch Sequenzvergleich nicht mehr nachweisbar ist. Algorithmen, die Strukturen vergleichen, benötigen keine Sequenzinformation. Der Vergleich von Supersekundärstrukturelementen und der 3D-Struktur ist die Grundlage für Klassifikationssysteme wie die SCOP-Datenbank.