Die Kombination von DNA-Synthese, Lambda-Rot-Rekombination (eine Aufbasis homologe Rekombination) und CRISPR-basierter Bearbeitung, die die Erzeugung eines vollständigen synthetischen E. coli-Genoms ermöglichte, kann verwendet werden, um andere Aspekte der bakteriellen Biologie zu erforschen. Die Einführung von 133 313 synonymen Substitutionen in Caulobacter ethensis, die 123 562 Codons umcodierten, führte zur Inaktivierung von 98 Genen (124). Interessanterweise enthielten 27 der ehemaligen Gene nicht-kodierende Kontrollfunktionen, die in Protein-Codierungssequenzen eingebettet waren. Die funktionelle Grundlage dieser Geninaktivierung ist noch immer schlecht verstanden. Transkriptionale und/oder translationale Kontrollsignale an den Termini von Kodierungssequenzen sowie ungenaue Genomanmerkungen können die zugrunde liegende Ursache für die Inaktivierung des Gens sein. Die Expression von mehreren hundert synonymen Mutanten von grünem fluoreszierendem Protein (GFP) in E. coli zeigte, dass viele Synonymvarianten die bakterielle Fitness reduzieren (18). Der zugrunde liegende Mechanismus ist unabhängig von der Translation, hängt aber von der Produktion toxischer mRNA-Moleküle ab, was darauf hindeutet, dass die translationsunabhängige RNA-Toxizität ein unerkanntes Hindernis in der bakteriellen Genexpression sein kann. Der genetische Code ist allen Organismen gemeinsam und weitgehend redundant. Basierend auf der Natur der Triplet-Codierung und der Tatsache, dass es vier verschiedene Nukleotide gibt, sind nur 43 = 64 verschiedene Codons möglich. Von diesen möglichen 64 Codons sind 61 Sense-Codons, die für 20 Aminosäuren kodieren und 3 Stop-Codons sind, die für die Beendigung der Übersetzung kodieren.

Achtzehn dieser Aminosäuren sind durch mehr als ein Synonym codon kodiert. Folglich kann eine gegebene Aminosäure durch ein, zwei, drei, vier oder sechs verschiedene Codons kodiert werden (Abbildung 1). Wichtig ist, dass die beobachteten Verhältnisse von synonymen Codons sehr zufällig sind (1). Dieses Phänomen wird als Codon-Nutzungsverzerrung bezeichnet. Die Fremdproteinexpression in Escherichia coli ist bekanntlich durch das Vorhandensein oder Fehlen ungewöhnlicher Codons signifikant beeinflusst, und die heterologe Proteinexpression erfordert häufig eine Kodierungssequenzmodifikation (2). Adenoviren sind DNA-Viren, die im Großen und Ganzen als Vektoren für die menschliche Gentherapie und Impfstoffe eingesetzt werden. Insbesondere das einsträngige Adenovirus-assoziierte Virus (AAV) verfügt über die einzigartige Fähigkeit zur standortspezifischen Integration in einen transkriptionsstillen Bereich des menschlichen Genoms. AAV Rep 78 Protein hat jedoch eine hemmende Wirkung auf die Adenovirus-Replikation.

Um den hemmenden Mechanismus von Rep78 zu erforschen, wurde eine synonyme Rekodierung auf dem 1866-Nukleotid-langen Rep-Genomsegment (76) durchgeführt. Das genetisch rekodierte AAV Rep-Gen erlaubte die Identifizierung eines 135-bp langen cis-wirkenden Elements in der Rep-Sequenz. Das Reengineering dieses cis-wirkenden Elements überwand Reps hemmende Auswirkungen auf die Adenovirus-Replikation. Reengineered Rep wird leicht toleriert und erleichtert die Entwicklung verbesserter adenobasierter Gentherapievektoren. Die großangelegte Codon-Optimierung von zwei DNA-Viren, Adenovirus und Papillomavirus, hat auch dazu beigetan, zu verstehen, wie diese Viren ihre Tauglichkeit, Immunogenität und ihr onkogenes Potenzial erhöhen (81,83).