Die Sequenzinformation eines jeden Proteins ist in Form eines Gens in der DNA-Sequenz codiert. Jeweils drei direkt aufeinander folgende Nukleotide codieren für eine Aminosäure. Eine solche Nukleotidgruppe wird Triplett oder Codon genannt. Die Abbildung der 64 Tripletts auf die 20 Aminosäuren heißt genetischer Code. Der genetische Code ist nicht überlappend, jeweils drei aufeinander folgende Nukleotide entsprechen einem Codon. Ein Gen wird durch einen feststehenden Startpunkt (Startcodon, häufig ATG) und einen feststehenden Endpunkt (Stopcodon) flankiert. Der genetische Code lautet wie folgt:
   
 
  2  
T C A G
1 T
TTT Phe
TTC Phe
TTA Leu
TTG Leu
TCT Ser
TCC Ser
TCA Ser
TCG Ser
TAT Tyr
TAC Tyr
TAA Stop
TAG Stop
TGT Cys
TGC Cys
TGA Stop
TGG Trp
T
C
A
G
3
C
CTT Leu
CTC Leu
CTA Leu
CTG Leu
CCT Pro
CCC Pro
CCA Pro
CCG Pro
CAT His
CAC His
CAA Gln
CAG Gln
CGT Arg
CGC Arg
CGA Arg
CGG Arg
T
C
A
G
A
ATT Ile
ATC Ile
ATA Ile
ATG Met
ACT Thr
ACC Thr
ACA Thr
ACG Thr
AAT Asn
AAC Asn
AAA Lys
AAG Lys
AGT Ser
AGC Ser
AGA Arg
AGG Arg
T
C
A
G
G
GTT Val
GTC Val
GTA Val
GTG Val
GCT Ala
GCC Ala
GCA Ala
GCG Ala
GAT Asp
GAC Asp
GAA Glu
GAG Glu
GGT Gly
GGC Gly
GGA Gly
GGG Gly
T
C
A
G
Der genetische Code.
In der Tabelle ist mit Zahlen
die Nukleotidposition im Codon markiert.