Warum ist dieses Wissen wichtig?PSI-BLAST ist empfindlicher als BLAST, weil anstelle einer einzelnen Querysequenz ein Profil zum Suchen verwendet wird. Dieses Profil wird iterativ in mehreren Läufen entwickelt, wie Sie gleich beobachten können. Ein modernerer Algorithmus ist DELTA-BLAST, der mit einer Iterationsrunde auskommt.
 
Bezug Diese Übungen ergänzen das Kapitel 12 "FASTA und die BLAST-Suite".

Lernziel

Nach dem Bearbeiten der Übung sollten Sie
  • den Algorithmus von PSI-BLAST 
verstanden haben und anwenden können.
   
ÜbungPSI-BLAST_1
  
 Manchmal werden die Archaeen noch Archaebakterien genannt, weil sie in vielerlei Hinsicht den Bakterien sehr ähnlich sind und deswegen lange als Teilgruppe der Bakterien betrachtet wurden. In der folgenden Übung sollten Sie untersuchen, ob dies auch für das Protein gilt, dessen Sequenz hier angegeben ist.

Starten Sie den PSI-BLAST-Server, der Teil des BLAST-Servers ist.
Achten Sie bitte in der Rubrik Program Selection der BLAST-Eingabemaske darauf, dass PSI-BLAST ausgewählt ist.

 

Fragestellung Welche Funktion hat das kodierte Protein?
Zu welcher molekularen Maschinerie gehört die analysierte Sequenz?
Was schließen Sie für diese Maschinerie im Hinblick auf die Verwandtschaft der Archaeen zu Bakterien und Eukaryonten?
  
Eingabe-
Sequenz
>gi_18977936
MRGPTVVDVTPDDLWIVMESYWQEKGLVRQHLDSYNAFIERGLQEVVNEFGGIKPDIPDFEVKFGKIRVG
EPEFQEPHGQRKPLYPMDARIRNLTYAAPLYLEMIPVIKGVEQDPVEVRIGELPIMLKSKVCRLYGLSDE
ELIKLGEDPKDPGGYFIINGSERVIVSIEDIAPNRTLVEKDERQEKYIAKVFSYRHGYRALVAVERRKDG
ILYVDIPNVPKPVKFVYVMRALGLERDKDIVEAVGNDPEVQQIMFDNLEDASDITTQQEALEFIGKLVAP
GQAREYRLKRAEYVIDNNLLPHMGVSPEDRIKKAYYLGMMALKVIELSLGRRPEDDKDHYANKRLRLAGD
LLKDLFRVAFSQLVKDIQYQMTKTYQRKGDKYTFGNIHRFIRNSIRPDVLTERIEHALATGAWPGGRTGV
SQLLDRTNYMSTLSHLRRVTSPLDREQPHFEARDLHGTHWGRICPTETPEGPNCGLVKNLALMAQITTAV
PEEEIREYLMSLGIVPIEVRRPDPTLWRVYLNGVLIGTIEDGKALVQRIRQDRRSGKISDVINVAYYEDV
KEVYVNSDDGRVRRPLIIVENGVPKLTKEHVQAVKEGRLKWSDLIKMGIIEYLDAEEEENAYVAMWPWEV
TEEHTHLELMPAAILGLPASLVPYPEHNAAPRNTYGAGMAKQSLGLGWANFRIRVDTRGHLLHYPQIPLV
NSRIMKAVGYEDRPAGQNFVVAVLAYQGYNMEDAIIINKASIERGLARSTFFRTYEAEEKKYLGGQTDKF
EIPDPTVRGYRGEKYYRNLDEDGLIFPESKVEGKDVLVGRTSPPRFLEERGLGTVSLQERRETSVAVRPS
EKGVVDKVIITETGDGTKLVKVTVRDLRIPELGDKFASRHGQKGVIGLIVPQEDMPWTESGIVPDLIVNP
HGIPSRMTVGQLIEAIGGKVASLKGRRVDGTAFIGEPEEKLRKELEELGFKHTGREIMYDGITGKRLEAD
IFIGVIYYQRLHHMVADKIHARSRGPVQVLTKQPTEGRAREGGLRFGEMERDVLVGHGAAMLLIERLLEE
SDKTEVWVCENCGHIALEDKRRRRVYCPVCGEEERISKVEMSYAFKLLLDELKAMVIRPKLNLSERV
  
HinweiseFühren Sie mit oben angegebener Sequenz drei PSI-BLAST-Runden aus.

Stoßen Sie das BLASTEN durch Drücken der Taste BLAST  an.

Analysieren Sie in jeder Runde im Taxonomy-Report der BLAST Ausgabe, wie viele Organismen unter Archaeen, Bakterien und Eukaryonten gefunden wurden.

Lassen Sie insgesamt drei Iterationen ausführen (Taste Run PSI-Blast iteration x) und gehen Sie jeweils wie beschrieben vor. Erstellen Sie eine kleine Tabelle und tragen Sie die Anzahl gefundener Organismen ein.

In der Zeit, in der Sie auf die Ergebnisse warten, können Sie sich mit der Oberfläche des BLAST-Servers vertraut machen und sich zu den Programmoptionen und diversen Ausgabemöglichkeiten informieren.

Sie können auf der Seite Reformat these Results bzw. Formatting Options die Ausgabe modifizieren.

  
Übung DELTA-BLAST_1
  
  Für das folgenden Protein ist die Funktion unklar. Benutzen Sie DELTA-BLAST um es zu annotieren. Wir benutzen dieses Programm, da es die selbe Empfindlichkeit wie PSI-BLAST besitzt, aber signifikante Treffer in einer einzigen Runde identifiziert.

Eingabe-
Sequenz
>orf9
MVVKIRRAGNICRLFEEDLSQYRGEYEDCVDYLPEILFLLAELLRSESLEEVDRLKVAAALGYSVSPLDMFP
EEIYGPYSFLGDLFVSLTVLRDVVDAIGLNTVENLWRGEVRLFDLLEDCYNRVSKELGAKKKLFLKHVGLDLIG
  
Ausgabe interpretieren Finden Sie mit DELTA-BLAST ähnliche Sequenzen ? Lässt sich eine Funktion vorhersagen?
  
Hinweise

Vermutlich finden Sie keine starke Ähnlichkeit über die gesamte Sequenzlänge. Sie können auf die Analyse von Proteindomänen achten. Möglicherweise können Sie für Teilbereiche des Proteins eine Funktion vorhersagen.

Welcher Teil von orf9 ist nun annotiert? Ist mit den Treffern die Funktion von orf9 eindeutig klar?

Bitte betrachten Sie auch die Parameter, die bei dieser Analyse verwendet wurden. Sind im Vergleich zu BLAST weitere hinzu gekommen? Wenn ja: Können Sie deren Bedeutung erklären?

 

Was Sie jetzt verstanden haben sollten

PSI-BLAST und DELTA-BLAST bieten im Vergleich zu BLAST eine empfindlichere Methode zum Sequenzvergleich. Allerdings geht es noch besser: Hidden-Markov-Modelle sind noch empfindlicher und erzeugen weniger Fehler beim Sequenzvergleich. Dies wird im Kapitel 12.7 und insbesondere in Tabelle 12.3 und Abbildung 12.9 deutlich.