Warum ist dieses Wissen wichtig? | Die Zusammensetzung der Polypeptidkette, die Form und Funktion eines Proteins determiniert, ist in der DNA in Form eines Gens abgelegt. Innerhalb eines Gens codieren jeweils drei aufeinander folgende Nukleotide (derartige Tripletts werden auch Codons genannt) jeweils für ein Residuum (eine Aminosäure) innerhalb der Polypeptidkette. Da jedes Stück DNA (sofern Leserichtung und Leseraster nicht bekannt sind) in jeweils zwei Leserichtungen und jeweils drei Leserastern abgelesen werden kann, ergeben sich insgesamt 6 Möglichkeiten, ein Stück DNA in eine Proteinsequenz zu übersetzen. Im Folgenden soll Ihr Verständnis hinsichtlich dieses Translationsprozesses gefestigt werden. Falls Sie anfangs mit den Übungen Schwierigkeiten haben, soll dies als Trost dienen: Selbst Forschende, die täglich mit DNA-Sequenzen umgehen, haben ihre liebe Not mit dem reversen Komplement! | |
Bezug | Diese Übungen ergänzen die Kapitel 1 "Biologische Grundlagen" und 2 "Sequenzen und ihre Funktion". | |
Lernziel |
|
|
Übung | Trans_1 | |
Server kontaktieren | Starten Sie dieses Programm zum Übersetzen von DNA- in Proteinsequenzen. | |
DNA-Sequenz eingeben | Übernehmen Sie per copy&paste die folgenden DNA-Sequenz in das Eingabefenster: | |
>DNA_test1 attttttcgagccagaattccgtacgcgttgctggtaccttgaataagtagcaatggtgatggtgccaaaagcacccgt gagtgaaaattacgcatcggtaatcgtca |
||
Programm starten | Wählen Sie den Verbose-Mode. Starten Sie anschließend die Übersetzung durch Betätigen der entsprechenden Taste. |
|
Machen Sie sich die Bedeutung der Ausgabe klar. | ||
Ausgabe interpretieren | Wie werden diese Sequenzen aus der Eingabe generiert? Überlegen Sie sich den biologischen Hintergrund (Aufbau der DNA, Ableserichtung). In welchem Leserahmen wird die oben gegebene DNA vermutlich codieren? Überlegen Sie sich die Wahrscheinlichkeit für das Auftreten unterschiedlich langer Leserahmen. |
|
Hinweise | Stoppcodons sind in der Ausgabe durch ein "Stop" markiert. Ein kurzes Stück DNA muss nicht notwendigerweise ein komplettes Gen enthalten, das in der Regel mehr als 60 Codons enthält. Daher ist es nicht zwingen erforderlich, dass die Sequenz Start- und Stoppcodon enthält. | |
Sequenz ändern |
|
|
Hier finden sie eine Codontabelle. | ||
Datenformat | Die Art, wie oben eine Sequenz formatiert dargestellt wurde, ist ein in der Bioinformatik sehr häufig verwendetes Format und wird FASTA-Format genannt. Hier finden sie eine Beschreibung dieses Formates. | |
Was Sie jetzt verstanden haben sollten |
Im Genom sind Proteine in Form der Gene codiert. Die Proteinsequenz ergibt sich durch Translation mithilfe des genetischen Codes. Für das Identifizieren von Genen werden spezielle Algorithmen verwendet, die aus der Menge der ORFs diejenigen auswählen, die mit höchster Wahrscheinlichkeit codieren. | |