Übersetzen von DNA- in Proteinsequenzen

Warum ist dieses Wissen wichtig?

Die Zusammensetzung der Polypeptidkette, die Form und Funktion eines Proteins determiniert, ist in der DNA in Form eines Gens abgelegt. Innerhalb eines Gens codieren jeweils drei aufeinander folgende Nukleotide (derartige Tripletts werden auch Codons genannt) jeweils für ein Residuum (eine Aminosäure) innerhalb der Polypeptidkette. Da jedes Stück DNA (sofern Leserichtung und Leseraster nicht bekannt sind) in jeweils zwei Leserichtungen und jeweils drei Leserastern abgelesen werden kann, ergeben sich insgesamt 6 Möglichkeiten, ein Stück DNA in eine Proteinsequenz zu übersetzen. Im Folgenden soll Ihr Verständnis hinsichtlich dieses Translationsprozesses gefestigt werden. Falls Sie anfangs mit den Übungen Schwierigkeiten haben, soll dies als Trost dienen: Selbst Forschende, die täglich mit DNA-Sequenzen umgehen, haben ihre liebe Not mit dem reversen Komplement!

Bezug

Diese Übungen ergänzen die Kapitel 1 "Biologische Grundlagen" und 2 "Sequenzen und ihre Funktion".

Lernziel

Nach dem Bearbeiten der Übung sollten sie

eine DNA- in eine Protein-Sequenz übersetzen können,
mit dem Begriff Leseraster vertraut sein.

Übung

Trans_1

Server kontaktieren

Starten Sie dieses Programm zum Übersetzen von DNA- in Proteinsequenzen.

DNA-Sequenz eingeben

Übernehmen Sie per copy&paste die folgenden DNA-Sequenz in das Eingabefenster:

>DNA_test1
attttttcgagccagaattccgtacgcgttgctggtaccttgaataagtagcaatggtgatggtgccaaaagcacccgt
gagtgaaaattacgcatcggtaatcgtca

Programm starten

Wählen Sie den Verbose-Mode.
Starten Sie anschließend die Übersetzung durch Betätigen der entsprechenden Taste.

Machen Sie sich die Bedeutung der Ausgabe klar.

Ausgabe interpretieren

Weshalb muss mit sechs Leserahmen gerechnet werden?
Wie werden diese Sequenzen aus der Eingabe generiert?

Überlegen Sie sich den biologischen Hintergrund (Aufbau der DNA, Ableserichtung).

In welchem Leserahmen wird die oben gegebene DNA vermutlich codieren?

Überlegen Sie sich die Wahrscheinlichkeit für das Auftreten unterschiedlich langer Leserahmen.

Hinweise

Stoppcodons sind in der Ausgabe durch ein "Stop" markiert. Ein kurzes Stück DNA muss nicht notwendigerweise ein komplettes Gen enthalten, das in der Regel mehr als 60 Codons enthält. Daher ist es nicht zwingen erforderlich, dass die Sequenz Start- und Stoppcodon enthält.

Sequenz ändern

Ändern sie die eingegebene Sequenz derart, dass sie anstelle des Stoppcodons im Leserahmen -3 ein Met-Codon einhält. Verifizieren Sie Ihre Lösung durch wiederholtes Übersetzen.

Hier finden sie eine Codontabelle.

Datenformat

Die Art, wie oben eine Sequenz formatiert dargestellt wurde, ist ein in der Bioinformatik sehr häufig verwendetes Format und wird FASTA-Format genannt. Hier finden sie eine Beschreibung dieses Formates.

Was Sie jetzt verstanden haben sollten

Im Genom sind Proteine in Form der Gene codiert. Die Proteinsequenz ergibt sich durch Translation mithilfe des genetischen Codes. Für das Identifizieren von Genen werden spezielle Algorithmen verwendet, die aus der Menge der ORFs diejenigen auswählen, die mit höchster Wahrscheinlichkeit codieren.