CRISPR

Aus besserwiki.de
Cascade (CRISPR-assoziierter Komplex für die antivirale Abwehr)
4QYZ.png
CRISPR-Kaskadenprotein (cyan) gebunden an CRISPR-RNA (grün) und Phagen-DNA (rot)
Bezeichner
OrganismusEscherichia coli
SymbolCRISPR
PDB4QYZ

CRISPR (/ˈkrɪspər/) (ein Akronym für clustered regularly interspaced short palindromic repeats) ist eine Familie von DNA-Sequenzen, die in den Genomen prokaryontischer Organismen wie Bakterien und Archaeen vorkommen. Diese Sequenzen stammen von DNA-Fragmenten von Bakteriophagen ab, die den Prokaryoten zuvor infiziert haben. Sie werden verwendet, um die DNA ähnlicher Bakteriophagen bei nachfolgenden Infektionen aufzuspüren und zu zerstören. Daher spielen diese Sequenzen eine Schlüsselrolle im antiviralen (d. h. Anti-Phagen-) Abwehrsystem von Prokaryoten und stellen eine Form der erworbenen Immunität dar. CRISPR finden sich in etwa 50 % der sequenzierten bakteriellen Genome und in fast 90 % der sequenzierten Archaeen.

Schematische Darstellung des prokaryotischen antiviralen Abwehrmechanismus CRISPR

Cas9 (oder "CRISPR-associated protein 9") ist ein Enzym, das CRISPR-Sequenzen als Leitfaden verwendet, um spezifische DNA-Stränge zu erkennen und zu schneiden, die komplementär zur CRISPR-Sequenz sind. Cas9-Enzyme bilden zusammen mit CRISPR-Sequenzen die Grundlage einer Technologie, die als CRISPR-Cas9 bekannt ist und zum Editieren von Genen in Organismen verwendet werden kann. Dieses Editierverfahren hat eine Vielzahl von Anwendungsmöglichkeiten, darunter die biologische Grundlagenforschung, die Entwicklung biotechnologischer Produkte und die Behandlung von Krankheiten. Die Entwicklung der Genom-Editierungstechnik CRISPR-Cas9 wurde 2020 mit dem Nobelpreis für Chemie gewürdigt, der an Emmanuelle Charpentier und Jennifer Doudna verliehen wurde.

Typ-I CRISPR-surveillance-complex (Cas, blau) mit gebundener Ziel-DNA (orange)

CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) sind Abschnitte sich wiederholender DNA (repeats), die im Erbgut vieler Bakterien und Archaeen auftreten. Sie dienen einem Mechanismus, dem CRISPR/Cas-System, der Resistenz gegen das Eindringen fremden Erbguts von Viren oder Plasmiden verschafft, und sind hierdurch ein Teil des Immunsystem-Äquivalents vieler Prokaryoten. Dieses System bildet die Grundlage der gentechnischen CRISPR/Cas-Methode zur Erzeugung gentechnisch veränderter Organismen.

Geschichte

Wiederholte Sequenzen

Die Entdeckung der geclusterten DNA-Wiederholungen erfolgte unabhängig voneinander in drei Teilen der Welt. Die erste Beschreibung dessen, was später als CRISPR bezeichnet werden sollte, stammt von dem Forscher Yoshizumi Ishino und seinen Kollegen von der Universität Osaka aus dem Jahr 1987. Sie klonierten versehentlich einen Teil einer CRISPR-Sequenz zusammen mit dem "iap"-Gen (Isozymkonversion der alkalischen Phosphatase) aus dem Genom von Escherichia coli, das ihr Ziel war. Die Organisation der Wiederholungen war ungewöhnlich. Wiederholte Sequenzen sind normalerweise hintereinander angeordnet, ohne dass unterschiedliche Sequenzen dazwischen liegen. Die Funktion der unterbrochenen gebündelten Wiederholungen war ihnen nicht bekannt.

1993 veröffentlichten Forscher des Mycobacterium tuberculosis in den Niederlanden zwei Artikel über ein Cluster unterbrochener direkter Wiederholungen (DR) in diesem Bakterium. Sie erkannten die Vielfalt der Sequenzen, die die direkten Wiederholungen zwischen den verschiedenen Stämmen von M. tuberculosis unterbrechen, und nutzten diese Eigenschaft, um eine Typisierungsmethode zu entwickeln, die als Spoligotypisierung bezeichnet wurde und bis heute in Gebrauch ist.

Francisco Mojica von der Universität Alicante in Spanien untersuchte die Wiederholungen, die in den archaeischen Organismen der Arten Haloferax und Haloarcula beobachtet wurden, und ihre Funktion. Mojicas Doktorvater vermutete damals, dass die gebündelten Wiederholungen eine Rolle bei der korrekten Aufteilung der replizierten DNA auf die Tochterzellen während der Zellteilung spielen, da Plasmide und Chromosomen mit identischen Wiederholungsanordnungen in Haloferax volcanii nicht nebeneinander bestehen können. Auch die Transkription der unterbrochenen Wiederholungen wurde zum ersten Mal festgestellt; dies war die erste vollständige Charakterisierung von CRISPR. Im Jahr 2000 führte Mojica eine Umfrage in der wissenschaftlichen Literatur durch und einer seiner Studenten suchte mit einem von ihm entwickelten Programm in veröffentlichten Genomen. Sie identifizierten unterbrochene Wiederholungen in 20 Arten von Mikroben, die zur gleichen Familie gehören. Da diese Sequenzen voneinander getrennt waren, nannte Mojica diese Sequenzen zunächst "short regularly spaced repeats" (SRSR). Im Jahr 2001 schlugen Mojica und Ruud Jansen, die nach weiteren unterbrochenen Wiederholungen suchten, das Akronym CRISPR (Clustered Regularly Interspaced Short Palindromic Repeats) vor, um die Verwirrung zu lindern, die durch die zahlreichen Akronyme zur Beschreibung der Sequenzen in der wissenschaftlichen Literatur entstanden war. Im Jahr 2002 wiesen Tang et al. nach, dass CRISPR-Wiederholungsregionen aus dem Genom von Archaeoglobus fulgidus in lange RNA-Moleküle transkribiert wurden, die anschließend zu kleinen RNAs mit Einheitslänge und einigen längeren Formen mit 2, 3 oder mehr Spacer-Wiederholungseinheiten verarbeitet wurden.

Im Jahr 2005 entdeckte der Joghurtforscher Rodolphe Barrangou, dass Streptococcus thermophilus nach wiederholten Phagenangriffen eine erhöhte Phagenresistenz entwickelt, und dass diese erhöhte Resistenz auf den Einbau zusätzlicher CRISPR-Spacer-Sequenzen zurückzuführen ist. Das dänische Lebensmittelunternehmen Danisco, für das Barrangou damals arbeitete, entwickelte daraufhin phagenresistente S. thermophilus-Stämme zur Verwendung in der Joghurtherstellung. Danisco wurde später von DuPont aufgekauft, das "etwa 50 Prozent des weltweiten Marktes für Milchkulturen besitzt", und die Technologie wurde zum Mainstream.

CRISPR-assoziierte Systeme

Einen wichtigen Beitrag zum Verständnis von CRISPR leistete Jansen mit seiner Beobachtung, dass der Prokaryoten-Wiederholungscluster von einer Reihe homologer Gene begleitet wird, die die CRISPR-assoziierten Systeme oder Cas-Gene bilden. Zunächst wurden vier Cas-Gene (Cas 1-4) erkannt. Die Cas-Proteine wiesen Helikase- und Nuklease-Motive auf, was auf eine Rolle in der dynamischen Struktur der CRISPR-Loci schließen lässt. In dieser Veröffentlichung wurde das Akronym CRISPR als universeller Name für dieses Muster verwendet. Die Funktion von CRISPR blieb jedoch rätselhaft.

Vereinfachtes Diagramm eines CRISPR-Locus. Dargestellt sind die drei Hauptkomponenten eines CRISPR-Lokus: Cas-Gene, eine Leader-Sequenz und ein Repeat-Spacer-Array. Wiederholungen sind als graue Kästen und Spacer als farbige Balken dargestellt. Die Anordnung der drei Komponenten ist nicht immer wie dargestellt. Außerdem können in einem Genom mehrere CRISPRs mit ähnlichen Sequenzen vorhanden sein, von denen nur eine mit Cas-Genen verbunden ist.

Im Jahr 2005 zeigten drei unabhängige Forschergruppen, dass einige CRISPR-Spacer von Phagen-DNA und extrachromosomaler DNA wie Plasmiden stammen. Bei den Spacern handelt es sich also um DNA-Fragmente, die von Viren stammen, die zuvor versucht haben, die Zelle anzugreifen. Die Quelle der Spacer war ein Hinweis darauf, dass das CRISPR/cas-System eine Rolle bei der adaptiven Immunität von Bakterien spielen könnte. Alle drei Studien, in denen dieser Gedanke geäußert wurde, wurden zunächst von renommierten Fachzeitschriften abgelehnt, erschienen dann aber in anderen Zeitschriften.

In der ersten Veröffentlichung von Mojica und Mitarbeitern der Universität Alicante, in der eine Rolle von CRISPR-Cas in der mikrobiellen Immunität vorgeschlagen wurde, wurde eine Rolle des RNA-Transkripts der Spacer bei der Zielerkennung in einem Mechanismus vorhergesagt, der dem RNA-Interferenzsystem eukaryontischer Zellen ähneln könnte. Koonin und Kollegen erweiterten diese RNA-Interferenz-Hypothese, indem sie Wirkmechanismen für die verschiedenen CRISPR-Cas-Subtypen entsprechend der vorhergesagten Funktion ihrer Proteine vorschlugen.

Durch experimentelle Arbeiten mehrerer Gruppen wurden die grundlegenden Mechanismen der CRISPR-Cas-Immunität aufgedeckt. Im Jahr 2007 wurde der erste experimentelle Beweis dafür veröffentlicht, dass CRISPR ein adaptives Immunsystem ist. Eine CRISPR-Region in Streptococcus thermophilus erwarb Spacer aus der DNA eines infizierenden Bakteriophagen. Die Forscher manipulierten die Resistenz von S. thermophilus gegen verschiedene Arten von Phagen, indem sie Spacer hinzufügten und entfernten, deren Sequenz mit der der getesteten Phagen übereinstimmte. 2008 identifizierten Brouns und Van der Oost einen Komplex von Cas-Proteinen (genannt Cascade), der in E. coli den CRISPR-RNA-Vorläufer innerhalb der Wiederholungen in reife, Spacer-enthaltende RNA-Moleküle, die so genannte CRISPR-RNA (crRNA), schneidet, die an den Proteinkomplex gebunden bleiben. Darüber hinaus wurde festgestellt, dass Cascade, crRNA und eine Helikase/Nuklease (Cas3) erforderlich sind, um einem bakteriellen Wirt Immunität gegen die Infektion mit einem DNA-Virus zu verleihen. Durch die Entwicklung eines Anti-Virus-CRISPR konnten sie zeigen, dass zwei Orientierungen der crRNA (sense/antisense) Immunität verleihen, was darauf hindeutet, dass die crRNA-Leitstrukturen auf dsDNA abzielen. Im selben Jahr bestätigten Marraffini und Sontheimer, dass eine CRISPR-Sequenz von S. epidermidis auf DNA und nicht auf RNA abzielt, um eine Konjugation zu verhindern. Dieses Ergebnis stand im Widerspruch zu dem vorgeschlagenen RNA-Interferenz-ähnlichen Mechanismus der CRISPR-Cas-Immunität, obwohl später ein CRISPR-Cas-System, das auf fremde RNA abzielt, in Pyrococcus furiosus gefunden wurde. Eine Studie aus dem Jahr 2010 zeigte, dass CRISPR-Cas beide Stränge von Phagen- und Plasmid-DNA in S. thermophilus schneidet.

Cas9

Forscher untersuchten ein einfacheres CRISPR-System aus Streptococcus pyogenes, das auf dem Protein Cas9 beruht. Die Cas9-Endonuklease ist ein Vier-Komponenten-System, das zwei kleine Moleküle umfasst: crRNA und trans-aktivierende CRISPR-RNA (tracrRNA). Jennifer Doudna und Emmanuelle Charpentier haben die Cas9-Endonuklease zu einem handlicheren Zweikomponenten-System umgestaltet, indem sie die beiden RNA-Moleküle zu einer "Single-Guide-RNA" verschmolzen, die in Kombination mit Cas9 das von der Guide-RNA vorgegebene DNA-Ziel finden und schneiden kann. Dieser Beitrag war so bedeutend, dass er im Jahr 2020 mit dem Nobelpreis für Chemie ausgezeichnet wurde. Durch Manipulation der Nukleotidsequenz der Leit-RNA konnte das künstliche Cas9-System so programmiert werden, dass es jede beliebige DNA-Sequenz zum Schneiden ansteuerte. Eine andere Gruppe von Mitarbeitern, bestehend aus Virginijus Šikšnys zusammen mit Gasiūnas, Barrangou und Horvath, zeigte, dass Cas9 aus dem CRISPR-System von S. thermophilus ebenfalls umprogrammiert werden kann, um eine Stelle ihrer Wahl anzusteuern, indem die Sequenz seiner crRNA geändert wird. Diese Fortschritte gaben den Anstoß zu Bemühungen, Genome mit dem modifizierten CRISPR-Cas9-System zu bearbeiten.

Gruppen unter der Leitung von Feng Zhang und George Church veröffentlichten gleichzeitig Beschreibungen der Genom-Editierung in menschlichen Zellkulturen unter Verwendung von CRISPR-Cas9 zum ersten Mal. Seitdem wurde es in einer Vielzahl von Organismen eingesetzt, darunter Bäckerhefe (Saccharomyces cerevisiae), der opportunistische Krankheitserreger Candida albicans, Zebrafisch (Danio rerio), Fruchtfliegen (Drosophila melanogaster), Ameisen (Harpegnathos saltator und Ooceraea biroi), Stechmücken (Aedes aegypti), Fadenwürmer (Caenorhabditis elegans), Pflanzen, Mäuse (Mus musculus domesticus), Affen und menschliche Embryonen.

CRISPR wurde so modifiziert, dass programmierbare Transkriptionsfaktoren entstehen, die es Wissenschaftlern ermöglichen, bestimmte Gene gezielt zu aktivieren oder auszuschalten.

Das CRISPR-Cas9-System hat gezeigt, dass es wirksame Genveränderungen in menschlichen dreikernigen Zygoten vornehmen kann, die erstmals 2015 in einer Arbeit der chinesischen Wissenschaftler P. Liang und Y. Xu. Das System schnitt bei 28 von 54 Embryonen erfolgreich das mutierte Beta-Hämoglobin (HBB) ab. 4 der 28 Embryonen wurden erfolgreich rekombiniert, wobei eine von den Wissenschaftlern vorgegebene Spendervorlage verwendet wurde. Die Wissenschaftler zeigten, dass bei der DNA-Rekombination des abgespaltenen Strangs die homologe endogene Sequenz HBD mit der exogenen Spendervorlage konkurriert. Die DNA-Reparatur in menschlichen Embryonen ist viel komplizierter und spezieller als in abgeleiteten Stammzellen.

Cas12a

Im Jahr 2015 wurde die Nuklease Cas12a (früher bekannt als Cpf1) im CRISPR/Cpf1-System des Bakteriums Francisella novicida charakterisiert. Ihr ursprünglicher Name, der aus einer 2012 erstellten Definition der TIGRFAMs-Proteinfamilie stammt, spiegelt die Prävalenz ihres CRISPR-Cas-Subtyps in den Prevotella- und Francisella-Stämmen wider. Cas12a wies mehrere wesentliche Unterschiede zu Cas9 auf: Es verursacht einen "gestaffelten" Schnitt in doppelsträngiger DNA im Gegensatz zum "stumpfen" Schnitt von Cas9, ist auf ein "T-reiches" PAM angewiesen (das alternative Zielstellen zu Cas9 bietet) und benötigt nur eine CRISPR-RNA (crRNA) für eine erfolgreiche Zielerfassung. Im Gegensatz dazu benötigt Cas9 sowohl crRNA als auch eine transaktivierende crRNA (tracrRNA).

Diese Unterschiede können Cas12a einige Vorteile gegenüber Cas9 verschaffen. Zum Beispiel sind die kleinen crRNAs von Cas12a ideal für die multiplexe Genom-Editierung, da mehr von ihnen in einem Vektor verpackt werden können als die sgRNAs von Cas9. Außerdem können die klebrigen 5′-Überhänge, die Cas12a hinterlässt, für die DNA-Assemblierung verwendet werden, die viel zielspezifischer ist als die herkömmliche Klonierung mit Restriktionsenzymen. Schließlich schneidet Cas12a die DNA 18-23 Basenpaare stromabwärts von der PAM-Stelle. Das bedeutet, dass die Erkennungssequenz nach der Reparatur nicht unterbrochen wird, so dass Cas12a mehrere Runden der DNA-Spaltung ermöglicht. Da Cas9 dagegen nur 3 Basenpaare stromaufwärts der PAM-Stelle schneidet, führt der NHEJ-Weg zu Indel-Mutationen, die die Erkennungssequenz zerstören und damit weitere Schnittrunden verhindern. Theoretisch sollten wiederholte Runden der DNA-Spaltung eine größere Chance für die gewünschte Genom-Editierung bieten. Eine Besonderheit von Cas12a im Vergleich zu Cas9 ist, dass Cas12a nach dem Schneiden seines Ziels an das Ziel gebunden bleibt und dann andere ssDNA-Moleküle unterschiedslos schneidet. Diese Eigenschaft wird als "kollaterale Spaltaktivität" oder "trans-Spaltaktivität" bezeichnet und wurde für die Entwicklung verschiedener diagnostischer Technologien genutzt.

Cas13

Im Jahr 2016 wurde die Nuklease Cas13a (früher bekannt als C2c2) aus dem Bakterium Leptotrichia shahii charakterisiert. Cas13 ist eine RNA-gesteuerte RNA-Endonuklease, was bedeutet, dass sie keine DNA, sondern nur einzelsträngige RNA spaltet. Cas13 wird von seiner crRNA zu einem ssRNA-Ziel geleitet, bindet und spaltet das Ziel. Ähnlich wie Cas12a bleibt Cas13 an das Ziel gebunden und spaltet dann unterschiedslos andere ssRNA-Moleküle. Diese Eigenschaft der kollateralen Spaltung wurde für die Entwicklung verschiedener diagnostischer Technologien ausgenutzt.

Struktur des Locus

Wiederholungen und Spacer

Das CRISPR-Array besteht aus einer AT-reichen Leitsequenz, gefolgt von kurzen Wiederholungen, die durch einzigartige Spacer getrennt sind. CRISPR-Wiederholungen haben in der Regel eine Größe von 28 bis 37 Basenpaaren (bps), können aber auch nur 23 bp und bis zu 55 bp lang sein. Einige weisen eine Dyaden-Symmetrie auf, was die Bildung einer Sekundärstruktur wie einer Stielschleife ("Haarnadel") in der RNA impliziert, während andere unstrukturiert sind. Die Größe der Spacer in verschiedenen CRISPR-Arrays beträgt in der Regel 32 bis 38 bp (Bereich 21 bis 72 bp). Neue Spacer können als Teil der Immunantwort auf eine Phageninfektion schnell entstehen. In der Regel gibt es weniger als 50 Einheiten der Repeat-Spacer-Sequenz in einem CRISPR-Array.

CRISPR-RNA-Strukturen

Cas-Gene und CRISPR-Subtypen

Kleine Cluster von Cas-Genen befinden sich häufig in der Nähe von CRISPR-Repeat-Spacer-Arrays. Insgesamt werden die 93 Cas-Gene auf der Grundlage der Sequenzähnlichkeit der kodierten Proteine in 35 Familien eingeteilt. 11 der 35 Familien bilden den Cas-Kern, zu dem die Proteinfamilien Cas1 bis Cas9 gehören. Ein vollständiger CRISPR-Cas-Locus hat mindestens ein Gen, das zum Cas-Core gehört.

CRISPR-Cas-Systeme lassen sich in zwei Klassen einteilen. Systeme der Klasse 1 verwenden einen Komplex aus mehreren Cas-Proteinen, um fremde Nukleinsäuren abzubauen. Systeme der Klasse 2 verwenden ein einziges großes Cas-Protein für denselben Zweck. Klasse 1 wird in die Typen I, III und IV unterteilt, Klasse 2 in die Typen II, V und VI. Die 6 Systemtypen sind in 19 Untertypen unterteilt. Jeder Typ und die meisten Subtypen sind durch ein "Signaturgen" charakterisiert, das fast ausschließlich in dieser Kategorie vorkommt. Die Klassifizierung basiert auch auf dem Komplement der vorhandenen Cas-Gene. Die meisten CRISPR-Cas-Systeme haben ein Cas1-Protein. Die Phylogenie der Cas1-Proteine stimmt im Allgemeinen mit dem Klassifizierungssystem überein, aber es gibt Ausnahmen aufgrund von Modulverschiebungen. Viele Organismen enthalten mehrere CRISPR-Cas-Systeme, was darauf hindeutet, dass sie kompatibel sind und möglicherweise Komponenten gemeinsam nutzen. Die sporadische Verteilung der CRISPR/Cas-Subtypen lässt vermuten, dass das CRISPR/Cas-System während der mikrobiellen Evolution einem horizontalen Gentransfer unterliegt.

Signaturgene und ihre mutmaßlichen Funktionen für die großen und kleinen CRISPR-Cas-Typen.
Klasse Cas-Typ Cas-Subtyp Signatur-Protein Funktion Referenz
1 I Cas3 Einzelsträngige DNA-Nuklease (HD-Domäne) und ATP-abhängige Helikase
I-A Cas8a, Cas5 Cas8 ist eine Untereinheit des Interferenzmoduls, die durch Erkennung der PAM-Sequenz für das Targeting der eingedrungenen DNA wichtig ist. Cas5 ist für die Verarbeitung und Stabilität von crRNAs erforderlich
I-B Cas8b
I-C Cas8c
I-D Cas10d enthält eine Domäne, die der Palmdomäne von Nukleinsäurepolymerasen und Nukleotidzyklasen homolog ist
I-E Cse1, Cse2
I-F Csy1, Csy2, Csy3 Nicht bestimmt
I-G GSU0054
III Cas10 Homolog von Cas10d und Cse1. Bindet CRISPR-Ziel-RNA und fördert die Stabilität des Interferenzkomplexes
III-A Csm2 Nicht bestimmt
III-B Cmr5 Nicht bestimmt
III-C Cas10 oder Csx11
III-D Csx10
III-E
III-F
IV Csf1
IV-A
IV-B
IV-C
2 II Cas9 Die Nukleasen RuvC und HNH erzeugen zusammen DSBs und können einzeln Einzelstrangbrüche erzeugen. Sorgt für den Erwerb funktioneller Spacer während der Adaptation.
II-A Csn2 Ringförmiges DNA-bindendes Protein. Beteiligt an der Primed-Adaptation im Typ-II-CRISPR-System.
II-B Cas4 Endonuklease, die mit cas1 und cas2 zusammenarbeitet, um Spacer-Sequenzen zu erzeugen
II-C Gekennzeichnet durch das Fehlen von entweder Csn2 oder Cas4
V Cas12 Nuklease RuvC. Fehlt HNH.
V-A Cas12a (Cpf1)
V-B Cas12b (C2c1)
V-C Cas12c (C2c3)
V-D Cas12d (CasY)
V-E Cas12e (CasX)
V-F Cas12f (Cas14, C2c10)
V-G Cas12g
V-H Cas12h
V-I Cas12i
V-K Cas12k (C2c5)
V-U C2c4, C2c8, C2c9
VI Cas13 RNA-gesteuerte RNase
VI-A Cas13a (C2c2)
VI-B Cas13b
VI-C Cas13c
VI-D Cas13d

Mechanismus

Die Phasen der CRISPR-Immunität für jede der drei Hauptarten der adaptiven Immunität.
(1) Die Akquisition beginnt mit der Erkennung der eingedrungenen DNA durch Cas1 und Cas2 und der Abspaltung eines Protospacers.
(2) Der Protospacer wird an die direkte Wiederholung neben der Leader-Sequenz ligiert und
(3) Die Einzelstrangverlängerung repariert das CRISPR und dupliziert die direkte Wiederholung. Die CRRNA-Verarbeitung und die Interferenzphasen laufen bei jedem der drei großen CRISPR-Systeme anders ab.
(4) Das primäre CRISPR-Transkript wird von Cas-Genen gespalten, um crRNAs zu erzeugen.
(5) Bei Systemen des Typs I spalten Cas6e/Cas6f an der Kreuzung von ssRNA und dsRNA, die durch Haarnadelschleifen in der direkten Wiederholung gebildet werden. Typ-II-Systeme verwenden eine trans-aktivierende (tracr) RNA zur Bildung von dsRNA, die von Cas9 und RNaseIII gespalten wird. Typ-III-Systeme verwenden ein Cas6-Homolog, das für die Spaltung keine Haarnadelschleifen in der direkten Wiederholung benötigt.
(6) Bei Systemen des Typs II und III wird das sekundäre Trimming entweder am 5'- oder am 3'-Ende durchgeführt, um reife crRNAs zu erzeugen.
(7) Reife crRNAs assoziieren mit Cas-Proteinen und bilden Interferenzkomplexe.
(8) Bei Systemen des Typs I und II sind Wechselwirkungen zwischen dem Protein und der PAM-Sequenz für den Abbau der eingedrungenen DNA erforderlich. Bei Systemen des Typs III ist für einen erfolgreichen Abbau keine PAM erforderlich, und bei Systemen des Typs III-A erfolgt die Basenpaarung zwischen der crRNA und der mRNA und nicht mit der DNA, wie es bei Systemen des Typs III-B der Fall ist.
Der genetische CRISPR-Locus bietet Bakterien einen Abwehrmechanismus, der sie vor wiederholten Phageninfektionen schützt.
Transkripte des genetischen CRISPR-Lokus und Reifung der prä-crRNA
3D-Struktur des CRISPR-Cas9-Interferenzkomplexes
CRISPR-Cas9 als molekulares Werkzeug führt gezielte Doppelstrang-DNA-Brüche ein.
Durch CRISPR-Cas9 eingeführte Doppelstrang-DNA-Brüche ermöglichen weitere genetische Manipulationen durch Ausnutzung endogener DNA-Reparaturmechanismen.

Die CRISPR-Cas-Immunität ist ein natürlicher Prozess von Bakterien und Archaeen. CRISPR-Cas verhindert die Infektion mit Bakteriophagen, die Konjugation und die natürliche Transformation, indem es fremde Nukleinsäuren, die in die Zelle gelangen, abbaut.

Überblick der drei Phasen des CRISPR/Cas9-Prozesses (nach Doudna & Charpentier 2014)

Trotz großer Fortschritte in den letzten Jahren wird der Mechanismus, durch den das CRISPR/Cas-System Prokaryoten Immunität verschafft, noch nicht genau verstanden. Man geht davon aus, dass im Immunisierungsprozess die exogene DNA durch einen Cas-Proteinkomplex erkannt und als neuer Spacer in die CRISPR-Bereiche integriert wird. Wie diese Vorgänge im Detail ablaufen, ist derzeit noch nicht vollständig aufgeklärt.

Spacer-Erwerb

Wenn eine Mikrobe von einem Bakteriophagen befallen wird, besteht die erste Phase der Immunantwort darin, die Phagen-DNA einzufangen und sie in Form eines Spacers in einen CRISPR-Locus einzufügen. Cas1 und Cas2 sind in beiden Arten von CRISPR-Cas-Immunsystemen zu finden, was darauf hindeutet, dass sie am Spacer-Erwerb beteiligt sind. Mutationsstudien bestätigten diese Hypothese und zeigten, dass die Entfernung von Cas1 oder Cas2 den Spacer-Erwerb stoppte, ohne die CRISPR-Immunantwort zu beeinträchtigen.

Mehrere Cas1-Proteine wurden charakterisiert und ihre Strukturen aufgeklärt. Cas1-Proteine haben unterschiedliche Aminosäuresequenzen. Ihre Kristallstrukturen sind jedoch ähnlich, und alle gereinigten Cas1-Proteine sind metallabhängige Nukleasen/Integrasen, die sequenzunabhängig an DNA binden. Repräsentative Cas2-Proteine wurden charakterisiert und besitzen entweder eine (einzelsträngige) ssRNA- oder (doppelsträngige) dsDNA-spezifische Endoribonuklease-Aktivität.

Im I-E-System von E. coli bilden Cas1 und Cas2 einen Komplex, in dem ein Cas2-Dimer zwei Cas1-Dimere überbrückt. In diesem Komplex übernimmt Cas2 eine nicht-enzymatische Gerüstfunktion, indem es doppelsträngige Fragmente der eindringenden DNA bindet, während Cas1 die einzelsträngigen Flanken der DNA bindet und deren Integration in CRISPR-Arrays katalysiert. Neue Spacer werden in der Regel am Anfang der CRISPR-Sequenz neben der Leader-Sequenz hinzugefügt, wodurch eine chronologische Aufzeichnung der Virusinfektionen entsteht. In E. coli ist ein histonähnliches Protein namens Integration Host Factor (IHF), das an die Leitsequenz bindet, für die Genauigkeit dieser Integration verantwortlich. IHF steigert auch die Integrationseffizienz im Typ I-F-System von Pectobacterium atrosepticum, aber in anderen Systemen sind möglicherweise andere Wirtsfaktoren erforderlich

Angrenzende Protospacer-Motive (PAM)

Die bioinformatische Analyse von Regionen des Phagengenoms, die als Spacer (Protospacer) ausgeschnitten wurden, ergab, dass diese nicht zufällig ausgewählt wurden, sondern an kurze (3-5 bp) DNA-Sequenzen angrenzten, die als Protospacer adjacent motifs (PAM) bezeichnet werden. Die Analyse von CRISPR-Cas-Systemen ergab, dass PAMs für Typ-I- und Typ-II-, nicht aber für Typ-III-Systeme bei der Übernahme wichtig sind. Bei den Systemen vom Typ I und II werden die Protospacer an den an eine PAM-Sequenz angrenzenden Positionen ausgeschnitten, wobei das andere Ende des Spacers mit einem Linealmechanismus abgeschnitten wird, wodurch die Regelmäßigkeit der Spacergröße im CRISPR-Array erhalten bleibt. Die Erhaltung der PAM-Sequenz unterscheidet sich zwischen den CRISPR-Cas-Systemen und scheint evolutionär mit Cas1 und der Leader-Sequenz verbunden zu sein.

Neue Spacer werden einem CRISPR-Array in gerichteter Weise hinzugefügt, wobei sie bevorzugt, aber nicht ausschließlich, in der Nähe der Leader-Sequenz vorkommen. Die Analyse des Typ-I-E-Systems von E. coli hat gezeigt, dass die erste direkte Wiederholung, die an die Leader-Sequenz angrenzt, kopiert wird, wobei der neu erworbene Spacer zwischen der ersten und zweiten direkten Wiederholung eingefügt wird.

Die PAM-Sequenz scheint bei der Spacer-Insertion im Typ-I-E-System eine wichtige Rolle zu spielen. Diese Sequenz enthält ein stark konserviertes letztes Nukleotid (nt), das an das erste nt des Protospacers angrenzt. Dieses nt wird zur letzten Base in der ersten direkten Wiederholung. Dies deutet darauf hin, dass die Spacer-Akquisitionsmaschinerie während der Spacer-Insertion einzelsträngige Überhänge an der vorletzten Position der direkten Wiederholung und im PAM erzeugt. Allerdings scheinen nicht alle CRISPR-Cas-Systeme diesen Mechanismus zu teilen, da PAMs in anderen Organismen nicht den gleichen Grad an Erhaltung in der Endposition aufweisen. Es ist wahrscheinlich, dass in diesen Systemen ein stumpfes Ende ganz am Ende der direkten Wiederholung und des Protospacers während der Akquisition erzeugt wird.

Insertionsvarianten

Die Analyse der CRISPRs von Sulfolobus solfataricus ergab, dass das kanonische Modell der Spacer-Insertion noch komplexer ist, da einer der sechs CRISPR-Loci neue Spacer wahllos über das gesamte CRISPR-Array verteilt einfügte, im Gegensatz zur Insertion in der Nähe der Leader-Sequenz.

Mehrere CRISPRs enthalten viele Spacer für denselben Phagen. Der Mechanismus, der dieses Phänomen verursacht, wurde im Typ-I-E-System von E. coli entdeckt. Es wurde eine signifikante Steigerung der Spacer-Akquisition festgestellt, wenn die Spacer bereits auf den Phagen abzielen, sogar bei Fehlanpassungen an den Protospacer. Für dieses "Priming" müssen die Cas-Proteine, die sowohl an der Akquisition als auch an der Interferenz beteiligt sind, miteinander interagieren. Neu erworbene Spacer, die aus dem Priming-Mechanismus resultieren, befinden sich immer auf demselben Strang wie der Priming-Spacer. Diese Beobachtung führte zu der Hypothese, dass die Akquisitionsmaschinerie nach dem Priming entlang der fremden DNA gleitet, um einen neuen Protospacer zu finden.

Biogenese

Die CRISPR-RNA (crRNA), die später die Cas-Nuklease während des Interferenzschritts zum Ziel führt, muss aus der CRISPR-Sequenz erzeugt werden. Die crRNA wird zunächst als Teil eines einzigen langen Transkripts transkribiert, das einen Großteil des CRISPR-Arrays umfasst. Dieses Transkript wird dann von Cas-Proteinen gespalten, um crRNAs zu bilden. Der Mechanismus zur Bildung von crRNAs ist bei den verschiedenen CRISPR/Cas-Systemen unterschiedlich. Bei den Systemen vom Typ I-E und Typ I-F erkennen die Proteine Cas6e bzw. Cas6f die Stammschleifen, die durch die Paarung identischer Wiederholungen entstehen, die die crRNA flankieren. Diese Cas-Proteine schneiden das längere Transkript am Rand der gepaarten Region ab, so dass eine einzelne crRNA zusammen mit einem kleinen Rest der gepaarten Wiederholungsregion übrig bleibt.

Systeme des Typs III verwenden ebenfalls Cas6, allerdings erzeugen ihre Wiederholungen keine Stammschleifen. Die Spaltung erfolgt stattdessen dadurch, dass sich das längere Transkript um Cas6 wickelt, um die Spaltung direkt stromaufwärts der Wiederholungssequenz zu ermöglichen.

Typ-II-Systemen fehlt das Cas6-Gen und sie verwenden stattdessen RNaseIII zur Spaltung. Funktionelle Systeme vom Typ II kodieren eine zusätzliche kleine RNA, die komplementär zur Wiederholungssequenz ist und als trans-aktivierende crRNA (tracrRNA) bezeichnet wird. Die Transkription der tracrRNA und des primären CRISPR-Transkripts führt zu einer Basenpaarung und zur Bildung von dsRNA an der Wiederholungssequenz, die anschließend von RNaseIII zur Bildung von crRNAs angegriffen wird. Im Gegensatz zu den beiden anderen Systemen enthält die crRNA nicht den vollständigen Spacer, sondern ist an einem Ende abgeschnitten.

CrRNAs verbinden sich mit Cas-Proteinen zu Ribonukleotidkomplexen, die fremde Nukleinsäuren erkennen. CrRNAs zeigen keine Präferenz zwischen dem kodierenden und dem nicht-kodierenden Strang, was auf ein RNA-gesteuertes DNA-Zielsystem hindeutet. Für den Typ I-E-Komplex (gemeinhin als Cascade bezeichnet) sind fünf Cas-Proteine erforderlich, die an eine einzige crRNA gebunden sind.

Interferenz

Während der Interferenzphase in Typ-I-Systemen wird die PAM-Sequenz auf dem crRNA-Komplementärstrang erkannt und ist zusammen mit der crRNA-Annealing erforderlich. In Systemen des Typs I signalisiert die korrekte Basenpaarung zwischen der crRNA und dem Protospacer eine Konformationsänderung in der Kaskade, die Cas3 zum DNA-Abbau rekrutiert.

Bei Systemen des Typs II ist ein einziges multifunktionales Protein, Cas9, für den Interferenzschritt zuständig. Cas9 benötigt sowohl die crRNA als auch die tracrRNA, um zu funktionieren, und spaltet die DNA mithilfe seiner dualen HNH- und RuvC/RNaseH-ähnlichen Endonuklease-Domänen. In Typ-II-Systemen ist eine Basenpaarung zwischen der PAM und dem Phagengenom erforderlich. Die PAM wird jedoch auf demselben Strang wie die crRNA erkannt (dem Gegenstrang zu Typ-I-Systemen).

Typ-III-Systeme benötigen wie Typ I sechs oder sieben Cas-Proteine, die an crRNAs binden. Die untersuchten Typ-III-Systeme von S. solfataricus und P. furiosus zielen beide auf die mRNA von Phagen und nicht auf das Phagen-DNA-Genom ab, wodurch diese Systeme möglicherweise in einzigartiger Weise in der Lage sind, auf RNA-basierte Phagengenome abzuzielen. Es wurde auch festgestellt, dass Systeme vom Typ III zusätzlich zur RNA auch auf DNA abzielen, wobei ein anderes Cas-Protein im Komplex, Cas10, verwendet wird. Es wurde gezeigt, dass die DNA-Spaltung transkriptionsabhängig ist.

Der Mechanismus zur Unterscheidung von eigener und fremder DNA während der Interferenz ist in die crRNAs eingebaut und daher wahrscheinlich allen drei Systemen gemeinsam. Während des ausgeprägten Reifungsprozesses der einzelnen Haupttypen enthalten alle crRNAs eine Spacer-Sequenz und einen Teil der Wiederholungssequenz an einem oder beiden Enden. Es ist die partielle Repeat-Sequenz, die das CRISPR-Cas-System daran hindert, das Chromosom anzusteuern, da die Basenpaarung jenseits der Spacer-Sequenz ein Selbstsignal darstellt und die DNA-Spaltung verhindert. RNA-gesteuerte CRISPR-Enzyme werden als Restriktionsenzyme vom Typ V eingestuft.

Entwicklung

CRISPR-assoziiertes Protein Cas2 (Anpassung der RNase)
PDB 1zpw EBI.jpg
Kristallstruktur des hypothetischen Proteins tt1823 aus Thermus thermophilus
Bezeichner
SymbolCRISPR_Cas2
PfamPF09827
InterProIPR019199
CDDcd09638
CRISPR-assoziiertes Protein CasA/Cse1 (Typ-I-Effektor-DNase)
Bezeichner
SymbolCRISPR_Cse1
PfamPF09481
InterProIPR013381
CDDcd09729
CRISPR-assoziiertes Protein CasC/Cse3/Cas6 (Typ-I-Effektor-RNase)
PDB 1wj9 EBI.jpg
Kristallstruktur eines Crispr-assoziierten Proteins aus Thermus thermophilus
Bezeichner
SymbolCRISPR_assoc
PfamPF08798
Pfam-KlanCL0362
InterProIPR010179
CDDcd09727

Es wird angenommen, dass sich die Cas-Gene in den Adaptor- und Effektor-Modulen des CRISPR-Cas-Systems aus zwei verschiedenen Vorläufermodulen entwickelt haben. Ein transposonähnliches Element namens Casposon, das für die Cas1-ähnliche Integrase und möglicherweise für andere Komponenten des Adaptionsmoduls kodiert, wurde neben dem angestammten Effektormodul eingefügt, das wahrscheinlich als unabhängiges angeborenes Immunsystem fungierte. Die hoch konservierten cas1- und cas2-Gene des Adaptionsmoduls entwickelten sich aus dem ursprünglichen Modul, während sich eine Vielzahl von Klasse-1-Effektor-cas-Genen aus dem ursprünglichen Effektor-Modul entwickelte. Die Evolution dieser verschiedenen Klasse-1-Effektor-Modul-cas-Gene wurde durch verschiedene Mechanismen gesteuert, z. B. durch Duplikationsereignisse. Andererseits entstand jeder Typ von Klasse-2-Effektor-Modulen durch nachfolgende unabhängige Einfügungen mobiler genetischer Elemente. Diese mobilen genetischen Elemente traten an die Stelle der Mehrfachgen-Effektor-Module und schufen Einzelgen-Effektor-Module, die große Proteine produzieren, die alle notwendigen Aufgaben des Effektor-Moduls erfüllen. Die Spacer-Regionen von CRISPR-Cas-Systemen werden direkt von fremden mobilen genetischen Elementen übernommen, so dass ihre langfristige Entwicklung schwer nachzuvollziehen ist. Es hat sich gezeigt, dass die nicht zufällige Evolution dieser Spacer-Regionen in hohem Maße von der Umgebung und den darin enthaltenen fremden mobilen genetischen Elementen abhängt.

CRISPR/Cas kann Bakterien gegen bestimmte Phagen immunisieren und so die Übertragung stoppen. Aus diesem Grund bezeichnete Koonin CRISPR/Cas als einen Lamarckschen Vererbungsmechanismus. Dies wurde jedoch von einem Kritiker bestritten, der anmerkte: "Wir sollten uns an [Lamarck] für das Gute erinnern, das er zur Wissenschaft beigetragen hat, nicht für Dinge, die seiner Theorie nur oberflächlich ähneln. Wenn wir CRISPR und andere Phänomene als Lamarck'sche Phänomene betrachten, verschleiern wir nur die einfache und elegante Art und Weise, wie die Evolution wirklich funktioniert. Im Zuge neuerer Studien hat sich jedoch gezeigt, dass die erworbenen Spacer-Regionen von CRISPR-Cas-Systemen tatsächlich eine Form der lamarckschen Evolution sind, da es sich um genetische Mutationen handelt, die erworben und dann weitergegeben werden. Die Evolution der Cas-Genmaschinerie, die das System ermöglicht, erfolgt hingegen durch klassische darwinistische Evolution.

Koevolution

Die Analyse von CRISPR-Sequenzen hat die Koevolution von Wirts- und Virusgenom gezeigt. Cas9-Proteine sind in pathogenen und kommensalen Bakterien stark angereichert. Die CRISPR/Cas-vermittelte Genregulierung kann zur Regulierung endogener bakterieller Gene beitragen, insbesondere bei der Interaktion mit eukaryotischen Wirten. Francisella novicida beispielsweise verwendet eine einzigartige, kleine CRISPR/Cas-assoziierte RNA (scaRNA), um ein endogenes Transkript zu unterdrücken, das für ein bakterielles Lipoprotein kodiert, das für F. novicida entscheidend ist, um die Reaktion des Wirts zu dämpfen und die Virulenz zu fördern.

Das grundlegende Modell der CRISPR-Evolution besteht darin, dass neu eingefügte Spacer die Phagen dazu bringen, ihre Genome zu mutieren, um der bakteriellen Immunantwort zu entgehen, wodurch eine Vielfalt sowohl in den Phagen- als auch in den Wirtspopulationen entsteht. Um einer Phageninfektion zu widerstehen, muss die Sequenz des CRISPR-Spacers perfekt mit der Sequenz des Phagen-Zielgens übereinstimmen. Bei Punktmutationen im Spacer können die Phagen ihre Wirte weiterhin infizieren. Eine ähnliche Stringenz ist bei PAM erforderlich, damit der Bakterienstamm phagenempfindlich bleibt.

Preise

Eine Studie an 124 S. thermophilus-Stämmen zeigte, dass 26 % aller Spacer einzigartig waren und dass verschiedene CRISPR-Loci unterschiedliche Raten des Spacer-Erwerbs aufwiesen. Einige CRISPR-Loci entwickeln sich schneller als andere, wodurch die phylogenetischen Beziehungen der Stämme bestimmt werden konnten. Eine vergleichende Genomanalyse zeigte, dass sich E. coli und S. enterica viel langsamer entwickeln als S. thermophilus. Die Stämme von S. thermophilus, die sich vor 250 Tausend Jahren auseinanderentwickelten, enthielten immer noch das gleiche Spacer-Komplement.

Die metagenomische Analyse von zwei Biofilmen aus der sauren Minendrainage zeigte, dass einer der untersuchten CRISPR-Stämme im Vergleich zum anderen Biofilm umfangreiche Deletionen und Spacer-Additionen enthielt, was auf eine höhere Phagenaktivität/Prävalenz in der einen Gemeinschaft als in der anderen schließen lässt. In der Mundhöhle wurde in einer zeitlichen Studie festgestellt, dass 7-22 % der Spacer über einen Zeitraum von 17 Monaten innerhalb eines Individuums geteilt wurden, während weniger als 2 % zwischen Individuen geteilt wurden.

In der gleichen Umgebung wurde ein einzelner Stamm mit PCR-Primern, die für sein CRISPR-System spezifisch sind, verfolgt. Die Ergebnisse für das Vorhandensein bzw. Fehlen von Spacern auf breiter Ebene zeigten eine erhebliche Vielfalt. Dieser CRISPR-Stamm fügte jedoch innerhalb von 17 Monaten 3 Spacer hinzu, was darauf hindeutet, dass sich einige Loci selbst in einer Umgebung mit signifikanter CRISPR-Vielfalt nur langsam weiterentwickeln.

Es wurden CRISPRs aus den Metagenomen analysiert, die für das menschliche Mikrobiomprojekt erstellt wurden. Obwohl die meisten von ihnen körperspezifisch sind, gibt es einige, die innerhalb einer Körperstelle von Individuen weit verbreitet sind. Einer dieser Loci stammte von Streptokokkenarten und enthielt ≈15.000 Spacer, von denen 50 % einzigartig waren. Ähnlich wie bei den gezielten Studien in der Mundhöhle zeigten einige von ihnen im Laufe der Zeit nur eine geringe Evolution.

Die CRISPR-Evolution wurde in Chemostaten mit S. thermophilus untersucht, um die Spacer-Erwerbsraten direkt zu untersuchen. In einer Woche erwarben S. thermophilus-Stämme bis zu drei Spacer, wenn sie mit einem einzigen Phagen herausgefordert wurden. Im gleichen Zeitraum entwickelte der Phage einzelne Nukleotid-Polymorphismen, die in der Population fixiert wurden, was darauf hindeutet, dass das Targeting die Replikation des Phagen ohne diese Mutationen verhindert hat.

Ein weiteres Experiment mit S. thermophilus zeigte, dass Phagen Wirte infizieren und sich in ihnen vermehren können, die nur einen Targeting-Spacer besitzen. Ein weiteres Experiment zeigte, dass empfindliche Wirte in Umgebungen mit hohen Phagentitern existieren können. Die Chemostat- und Beobachtungsstudien deuten auf viele Nuancen der CRISPR- und Phagen-(Ko)Evolution hin.

Identifizierung

CRISPRs sind unter Bakterien und Archaeen weit verbreitet und weisen einige Sequenzähnlichkeiten auf. Ihr bemerkenswertestes Merkmal sind ihre sich wiederholenden Spacer und direkten Wiederholungen. Diese Eigenschaft macht CRISPRs in langen DNA-Sequenzen leicht identifizierbar, da die Anzahl der Wiederholungen die Wahrscheinlichkeit einer falsch positiven Übereinstimmung verringert.

Die Analyse von CRISPRs in Metagenomdaten ist schwieriger, da CRISPR-Loci aufgrund ihrer repetitiven Natur oder durch Stammvariationen in der Regel nicht assembliert werden, was Assembler-Algorithmen verwirrt. Wenn viele Referenzgenome zur Verfügung stehen, kann die Polymerase-Kettenreaktion (PCR) verwendet werden, um CRISPR-Arrays zu amplifizieren und den Spacergehalt zu analysieren. Dieser Ansatz liefert jedoch nur Informationen für spezifisch ausgerichtete CRISPRs und für Organismen, die in öffentlichen Datenbanken ausreichend vertreten sind, um zuverlässige Polymerasekettenreaktionsprimer (PCR) zu entwickeln. Degenerierte wiederholspezifische Primer können verwendet werden, um CRISPR-Spacer direkt aus Umweltproben zu amplifizieren; Amplikons, die zwei oder drei Spacer enthalten, können dann rechnerisch zusammengesetzt werden, um lange CRISPR-Arrays zu rekonstruieren.

Die Alternative besteht darin, CRISPR-Arrays aus Shotgun-Metagenomdaten zu extrahieren und zu rekonstruieren. Dies ist rechnerisch schwieriger, insbesondere mit Sequenzierungstechnologien der zweiten Generation (z. B. 454, Illumina), da die kurzen Leselängen verhindern, dass mehr als zwei oder drei Wiederholungseinheiten in einem einzigen Read erscheinen. Die CRISPR-Identifizierung in rohen Reads erfolgte durch reine de novo-Identifizierung oder durch die Verwendung direkter Wiederholungssequenzen in teilweise zusammengesetzten CRISPR-Arrays aus Contigs (überlappende DNA-Segmente, die zusammen eine Konsensregion der DNA darstellen) und direkten Wiederholungssequenzen aus veröffentlichten Genomen als Aufhänger für die Identifizierung direkter Wiederholungen in einzelnen Reads.

Verwendung durch Phagen

Eine weitere Möglichkeit für Bakterien, sich gegen eine Phageninfektion zu schützen, sind chromosomale Inseln. Eine Unterart von Chromosomeninseln, die so genannte phageninduzierbare chromosomale Insel (PICI), wird bei einer Phageninfektion aus einem bakteriellen Chromosom herausgeschnitten und kann die Replikation durch Phagen hemmen. PICIs werden von bestimmten gemäßigten Staphylokokken-Phagen induziert, ausgeschnitten, repliziert und schließlich in kleine Kapsiden verpackt. PICIs nutzen mehrere Mechanismen, um die Reproduktion von Phagen zu blockieren. Beim ersten Mechanismus blockiert das von PICI kodierte Ppi auf unterschiedliche Weise die Phagenreifung, indem es spezifisch an Phagen-TerS bindet oder mit diesem interagiert und somit die Bildung des Phagen-TerS/TerL-Komplexes blockiert, der für die Verpackung der Phagen-DNA verantwortlich ist. Beim zweiten Mechanismus lenkt PICI CpmAB das morphogenetische Protein des Phagenkapsids so um, dass 95 % des Kapsids die Größe von SaPI haben und die Phagen-DNA nur ein Drittel ihres Genoms in diesem kleinen Kapsid verpacken kann, wodurch der Phage nicht lebensfähig wird. Der dritte Mechanismus umfasst zwei Proteine, PtiA und PtiB, die auf das LtrC abzielen, das für die Produktion von Virion- und Lyseproteinen verantwortlich ist. Dieser Interferenzmechanismus wird durch ein Modulatorprotein, PtiM, moduliert, das an eines der interferenzvermittelnden Proteine, PtiA, bindet und so den erforderlichen Interferenzgrad erreicht.

In einer Studie wurde gezeigt, dass der lytische ICP1-Phagen, der speziell auf Vibrio cholerae Serogruppe O1 abzielt, ein CRISPR/Cas-System erworben hat, das auf ein V. cholera PICI-ähnliches Element abzielt. Das System verfügt über 2 CRISPR-Loci und 9 Cas-Gene. Es scheint homolog zum I-F-System von Yersinia pestis zu sein. Wie das bakterielle CRISPR/Cas-System kann auch das ICP1 CRISPR/Cas-System neue Sequenzen erwerben, so dass sich Phage und Wirt gemeinsam weiterentwickeln können.

Es wurde gezeigt, dass bestimmte Archaeenviren Mini-CRISPR-Arrays tragen, die einen oder zwei Spacer enthalten. Es hat sich gezeigt, dass die Spacer in den von Viren getragenen CRISPR-Arrays auf andere Viren und Plasmide abzielen, was darauf hindeutet, dass Mini-CRISPR-Arrays einen Mechanismus zum Ausschluss heterotypischer Superinfektionen darstellen und an interviralen Konflikten teilnehmen.

Anwendungen

Es gibt mehrere Vorschläge, CRISPR biotechnologisch zu nutzen:

  • Künstliche Immunisierung gegen Phagen durch Hinzufügen passender Spacer bei industriell wichtigen Bakterien, z. B. in der Milch- oder Weinindustrie,
  • Knockdown endogener Gene durch Transformation mit einem Plasmid, das einen CRISPR-Bereich beinhaltet, mit crRNA, die zu dem stillzulegenden Gen passt,
  • Multiplex Genome Editing erlaubt das gleichzeitige Mutieren verschiedener Zielsequenzen, was die Herstellungszeit transgener Tiere wie Mäuse von bis zu zwei Jahren auf wenige Wochen verkürzt,
  • Unterscheidung verschiedener Bakterienstämme durch Vergleich der Spacer-Regionen (spoligotyping),
  • Gentherapie,
  • Fluoreszenzmarkierung.

CRISPR-Genbearbeitung

Die CRISPR-Technologie wurde in der Lebensmittel- und Agrarindustrie eingesetzt, um probiotische Kulturen zu entwickeln und industrielle Kulturen (z. B. für Joghurt) gegen Infektionen zu immunisieren. Sie wird auch bei Nutzpflanzen eingesetzt, um den Ertrag, die Dürretoleranz und den Nährwert zu verbessern.

Bis Ende 2014 wurden rund 1000 Forschungsarbeiten veröffentlicht, in denen CRISPR erwähnt wurde. Die Technologie wurde zur funktionellen Inaktivierung von Genen in menschlichen Zelllinien und Zellen, zur Untersuchung von Candida albicans, zur Veränderung von Hefen, die zur Herstellung von Biokraftstoffen verwendet werden, und zur gentechnischen Veränderung von Nutzpflanzenstämmen eingesetzt. Hsu und seine Kollegen erklären, dass die Möglichkeit, die genetischen Sequenzen zu manipulieren, ein Reverse Engineering ermöglicht, das sich positiv auf die Biokraftstoffproduktion auswirken kann. CRISPR kann auch eingesetzt werden, um Moskitos so zu verändern, dass sie Krankheiten wie Malaria nicht übertragen können. CRISPR-basierte Ansätze, bei denen Cas12a zum Einsatz kommt, wurden kürzlich bei der erfolgreichen Veränderung einer Vielzahl von Pflanzenarten eingesetzt.

Im Juli 2019 wurde CRISPR eingesetzt, um einen Patienten mit einer genetischen Störung experimentell zu behandeln. Bei der Patientin handelte es sich um eine 34-jährige Frau mit Sichelzellenanämie.

Im Februar 2020 wurden Fortschritte bei der HIV-Behandlung erzielt: 60-80 % der integrierten Virus-DNA wurde bei Mäusen entfernt, und einige Mäuse waren nach der Bearbeitung mit LASER ART, einer neuen antiretroviralen Therapie, und CRISPR völlig frei von dem Virus.

Im März 2020 wurde ein CRISPR-modifiziertes Virus in das Auge eines Patienten injiziert, um die kongenitale Leber-Amaurose zu behandeln.

In Zukunft könnte die CRISPR-Geneingabe möglicherweise zur Schaffung neuer Arten oder zur Wiederbelebung ausgestorbener Arten aus nahe verwandten Arten eingesetzt werden.

Auf CRISPR basierende Neubewertungen von Behauptungen über Beziehungen zwischen Genen und Krankheiten haben zur Entdeckung potenziell wichtiger Anomalien geführt.

CRISPR als diagnostisches Werkzeug

Schematisches Flussdiagramm der molekularen Nachweisverfahren für das COVID-19-Virus

CRISPR-assoziierte Nukleasen haben sich als nützliches Werkzeug für molekulare Tests erwiesen, da sie in der Lage sind, Nukleinsäuresequenzen in einem großen Hintergrund von Nicht-Zielsequenzen spezifisch anzuvisieren. Im Jahr 2016 wurde die Cas9-Nuklease eingesetzt, um unerwünschte Nukleotidsequenzen in Sequenzierungsbibliotheken der nächsten Generation zu entfernen, wobei nur 250 Pikogramm RNA als Ausgangsmaterial benötigt wurden. Ab 2017 wurden CRISPR-assoziierte Nukleasen auch für direkte diagnostische Tests von Nukleinsäuren bis hin zur Empfindlichkeit einzelner Moleküle eingesetzt. CRISPR-Diversität wird als Analyseziel verwendet, um Phylogenie und Diversität in Bakterien zu erkennen, wie z. B. bei Xanthomonaden (Martins et al., 2019). Die frühzeitige Erkennung von Pflanzenpathogenen durch molekulare Typisierung der CRISPRs des Pathogens kann in der Landwirtschaft eingesetzt werden, wie Shen et al. (2020) zeigen.

Durch die Kopplung von CRISPR-basierter Diagnostik mit weiteren enzymatischen Verfahren ist der Nachweis von Molekülen jenseits von Nukleinsäuren möglich. Ein Beispiel für eine gekoppelte Technologie ist das SHERLOCK-basierte Profiling of IN vitro Transcription (SPRINT). Mit SPRINT kann eine Vielzahl von Substanzen, wie z. B. Metaboliten in Patientenproben oder Verunreinigungen in Umweltproben, mit hohem Durchsatz oder mit tragbaren Point-of-Care-Geräten nachgewiesen werden. CRISPR/Cas-Plattformen werden auch für den Nachweis und die Inaktivierung von SARS-CoV-2, dem Virus, das COVID-19 verursacht, erforscht.

Struktur

Vereinfachtes Diagramm des CRISPR-Genlocus. Die grauen Boxen stellen die Repeats und die bunten Striche die Spacer dar. Die Anordnung kann in verschiedenen Organismen variieren.

Der CRISPR-Genlocus besteht wesentlich aus zwei Hauptkomponenten: dem cas-Gene enthaltenden cas-Operon und dem CRISPR-Array, der sich aus einer leader-Sequenz und einer Repeat-Spacer-Sequenz (auch Repeat-Spacer-Array genannt) zusammensetzt.

cas-Operon

Auch zum CRISPR-Genlocus gehörend ist das cas-Operon. Das cas-Operon enthält cas-Gene und die zu codierenden Proteine, die für die adaptive Immunantwort notwendig sind, z. B. Helikasen, Nukleasen, aber auch Proteine mit Eigenschaften zur RNA-Bindung. cas-Gene lassen sich in zwei Module gliedern: dem Effektor- und dem Adaptationsmodul. Unter einem Effektormodul versteht man eine Gruppe von cas-Genen, die zur Identifizierung von genetischem Material dient. Das Adaptationsmodul enthält ebenfalls cas-Gene und trägt mithilfe von Effektorproteinen zur Protospacer-Auswahl bei, die in das bakterielle Genom integriert werden können.

leader-Sequenz

In der Nähe der Repeat-Spacer-Sequenz befindet sich eine sogenannte leader-Sequenz (nicht zu verwechseln mit der Leader-Sequenz der mRNA). Die leader-Sequenz ist eine Adenin- und Thymin-reiche Sequenz mit einer Länge von 100–500 bp. Wie bei den Repeats sind leader-Sequenzen innerhalb eines Genoms zu ca. 80 % identisch, aber weisen innerhalb verschiedener Organismen starke Unterschiede auf. Als nichtcodierende Sequenz lässt sich diese in zwei Bereiche aufteilen: einem core leader und einem extended leader. Der core leader ist in mehreren Organismen konserviert und mit einer Länge von 20–300 bp in der Regel kürzer als der extended leader. Außerdem verfügt der core leader über ein Promotorelement, an dem sich Regulatorproteine binden können, um so die Genexpression, genauer die Initiation der CRISPR-Transkription, und die Spacer-Akquirierung kontrollieren zu können.

Der extended leader ist mit einer Länge von 50–500 bp länger als der core leader und enthält ebenfalls in den CRISPR-fernen Regionen konservierte Sequenzen, die vermutlich durch Genduplikation zustande gekommen sind. Die Funktionen des extended leaders sind zurzeit unbekannt. Vermutlich hat der extended leader keine wichtigen Funktionen.