banner
Heim / Nachricht / Struktur der OMEGA-Nickase IsrB im Komplex mit ωRNA und Ziel-DNA
Nachricht

Struktur der OMEGA-Nickase IsrB im Komplex mit ωRNA und Ziel-DNA

May 06, 2023May 06, 2023

Nature Band 610, Seiten 575–581 (2022)Diesen Artikel zitieren

17.000 Zugriffe

2 Zitate

107 Altmetrisch

Details zu den Metriken

RNA-gesteuerte Systeme wie CRISPR-Cas kombinieren programmierbare Substraterkennung mit enzymatischer Funktion, eine Kombination, die vorteilhaft zur Entwicklung leistungsstarker molekularer Technologien genutzt wurde1,2. Strukturstudien dieser Systeme haben aufgeklärt, wie RNA und Protein gemeinsam ihre Substrate erkennen und spalten, und so die rationale Technik für die weitere Technologieentwicklung leiten3. Jüngste Arbeiten identifizierten eine neue Klasse RNA-gesteuerter Systeme mit der Bezeichnung OMEGA, zu der IscB, der wahrscheinliche Vorfahre von Cas9, und die Nickase IsrB, ein Homolog von IscB, dem die HNH-Nukleasedomäne fehlt, gehören4. IsrB besteht nur aus etwa 350 Aminosäuren, aber seine geringe Größe wird durch eine relativ große RNA-Führung (ungefähr 300 nt ωRNA) ausgeglichen. Hier berichten wir über die kryogen-elektronenmikroskopische Struktur von Desulfovirgula thermocuniculi IsrB (DtIsrB) im Komplex mit seiner zugehörigen ωRNA und einer Ziel-DNA. Wir stellen fest, dass die Gesamtstruktur des IsrB-Proteins ein gemeinsames Gerüst mit Cas9 hat. Im Gegensatz zu Cas9, das jedoch einen Erkennungslappen (REC) verwendet, um die Zielauswahl zu erleichtern, verlässt sich IsrB auf seine ωRNA, von der ein Teil eine komplizierte ternäre Struktur bildet, die analog zu REC positioniert ist. Strukturanalysen von IsrB und seiner ωRNA sowie Vergleiche mit anderen RNA-gesteuerten Systemen verdeutlichen das funktionelle Zusammenspiel zwischen Protein und RNA und fördern unser Verständnis der Biologie und Evolution dieser verschiedenen Systeme.

Das RNA-gesteuerte IsrB-Protein ist ein Mitglied der OMEGA-Familie, das in der Transposon-Superfamilie IS200/IS605 kodiert ist. IsrB ist der wahrscheinliche Vorläufer von IscB, einem weiteren Mitglied der OMEGA-Familie, das der offensichtliche Vorfahre von Cas9 ist, wie sowohl durch phylogenetische Analyse als auch durch die gemeinsame einzigartige Domänenarchitektur gezeigt wird4,5. Wie IscB und Cas9 enthält IsrB eine RuvC-ähnliche Nukleasedomäne, die durch die Einfügung einer Brückenhelix (BH) unterbrochen wird (Abb. 1a). Im Gegensatz zu IscB und Cas9 fehlen IsrB jedoch die HNH-Nukleasedomäne, der REC-Lappen und große Teile der mit dem Protospacer benachbarten Motiv (PAM) interagierenden Domäne und ist dementsprechend viel kleiner (mit etwa 350 Aminosäuren) als Cas9 . IsrB enthält zusätzlich eine N-terminale PLMP-Domäne (benannt nach seinem konservierten Aminosäuremotiv) und eine nicht charakterisierte C-terminale Domäne (Abb. 1b). Frühere Arbeiten haben gezeigt, dass IsrB mit einer etwa 300 nt langen ωRNA assoziiert, was IsrB dazu bringt, den Nicht-Zielstrang doppelsträngiger (ds) DNA zu spalten, der ein 5′-NTGA-3′-Ziel-angrenzendes Motiv (TAM)4 enthält .

a, Locus-Architektur und Leit-RNAs für IsrB (links) und Cas9 (rechts). b, Domänenarchitektur von Streptococcus pyogenes SpCas9 (oben) und D. thermocuniculi IsrB (DtIsrB) (unten). c, Schematische Darstellung von IsrB im Komplex mit der ωRNA und der Ziel-DNA. Der partielle DNA-Duplex, der die für die Strukturstudie verwendeten TAM- und Zielsequenzen enthält, wird in Sequenzbuchstaben angezeigt. d,e, Kryo-EM-Dichtekarte (d) und Strukturmodell (e) des IsrB-ωRNA-Ziel-DNA-Komplexes. Gestrichelte Linien stellen schlecht aufgelöste Regionen der ωRNA dar. TE, Transposonende; DR, direkte Wiederholung; NUC, Nuklease; PI, PAM-interagierend; PLL, Phosphat-Lock-Loop; TI, TAM-wechselwirkend; TS, Zielstrang; NTS, Nichtzielstrang.

Um den molekularen Mechanismus des ωRNA-gesteuerten DNA-Targetings durch IsrB zu charakterisieren, analysierten wir einen ternären Komplex bestehend aus Desulfovirgula thermocuniculi IsrB (DtIsrB), einer 284-nt-ωRNA mit einem 20-nt-Leitsegment, einem 31-nt-Ziel-DNA-Strang und einem 10-nt-Ziel-DNA-Strang -nt Nicht-Ziel-DNA-Strang mittels Einzelpartikel-Kryo-EM (Abb. 1c). Wir haben eine dreidimensionale (3D) Rekonstruktion des ternären Komplexes mit einer Gesamtauflösung von 3,1 Å erhalten (Abb. 1d, Extended Data Abb. 1a – c und Extended Data Table 1). Einige Regionen der Karte, die der ωRNA entsprechen, wurden jedoch mit einer niedrigeren Auflösung aufgelöst. Um die Modellierung der RNA-Koordinaten zu verfeinern, verwendeten wir ein RNA-spezifisches Modellierungstool, auto-DRRAFTER, zusammen mit einem kovarianzbasierten Sekundärstrukturmodell, um ein anfängliches ωRNA-Modell zu erstellen. Auf der Grundlage dieses ωRNA-Modells und eines anfänglichen IsrB-Modells, das durch Proteinstrukturvorhersage generiert wurde, haben wir die IsrB-ωRNA-DNA-Struktur bestimmt (Abb. 1e und Extended Data Abb. 1d, e und 2)6,7,8.

Die Struktur zeigte, dass IsrB über einen 20-nt-Duplex zwischen der ωRNA und der Ziel-DNA weitgehend an die Ziel-DNA bindet (Abb. 1e). Die RuvC-Domäne (Reste 60–253) umfasst die drei katalytischen Motive (RuvC I–III) und drei Insertionen (BH (Reste 92–112), A (Reste 113–129) und B (Reste 161–179)) (Abb . 1b). Insertion A ist ein „Abkürzungs“-Linker zwischen BH und RuvC II; Dieser Linker wird in Cas9 durch den REC-Lappen ersetzt. Daher bezeichnen wir diese Insertion als REC-Linker (RECL). Insertion B zwischen RuvC II und III ist ein einfacher Linker, der aus einer Schleife und einer α-Helix besteht, die in der IsrB-Struktur eine Position einnimmt, die der der HNH-Domäne in Cas9 entspricht. Daher bezeichnen wir ihn als HNH-Linker (HNHL). Die C-terminale Domäne (Reste 287–351) nimmt eine Kernfalte an, die aus zwei verzerrten β-Faltblättern (β1/2/6 und β3/4/5) besteht, und bindet an den TAM-haltigen DNA-Duplex (Abb. 1e und Extended Data Abb . 3a). Wir bezeichnen diese Domäne aufgrund struktureller und funktioneller Ähnlichkeiten mit der PAM-interagierenden Domäne von Cas9 als TAM-interagierende (TI) Domäne (Extended Data Abb. 3b). Der zusätzliche β-Strang (β7) interagiert umfassend mit der Kernfalte der TI-Domäne und teilt ein gemeinsames β-Faltblatt mit dem RuvC-Kern, der die RNaseH-Faltung annimmt (Extended Data Abb. 3a). Diese Anordnung legt nahe, dass die TI- und RuvC-Domänen zusammenarbeiten, um den Abstand zwischen dem aktiven Zentrum von RuvC und der TAM-Bindungsstelle zu definieren (Abb. 1e). Die Zwischenregionen A (Reste 254–267) und B (268–286) zwischen den RuvC- und TI-Domänen scheinen funktionell analog zur Phosphat-Lock-Loop bzw. WED-Domäne von Cas9 zu sein, und wir haben diese Begriffe daher für IsrB übernommen (Abb. 1e). Die PLMP-Domäne (Reste 1–59) weist ein viersträngiges, antiparalleles β-Faltblatt (β1–4) und eine α-Helix auf und ähnelt strukturell der N-terminalen Domäne des Translationsinitiationsfaktors 3 (Abb. 1e und erweiterte Daten). Abb. 3a und 4). In dieser Domäne ist der PLMP-Motiv enthaltende Strang (β2) ausgebeult, da zwei Proline (Pro17 und Pro20) eine der Wasserstoffbrücken aufbrechen, scheint aber die Integrität eines kohärenten Strangs (β1) zu bewahren. Die PLMP-Domäne interagiert umfassend mit den RuvC- und TI-Domänen, was auf eine Rolle bei der Unterstützung ihrer Funktionen schließen lässt.

Die ωRNA besteht aus dem 20-nt-Leitsegment, dessen Basenpaare mit der Ziel-DNA verbunden sind, und dem 262-nt-ωRNA-Gerüst. Dieses Gerüst besteht aus 12 Helices (vier Stämme (S1–4) und acht Stammschleifen (SL1–8)), die sich auf drei Schichten befinden (Schicht 1, S1/3 und SL1/2/5/6; Schicht 2, S2/4 und SL3/4; Schicht3, SL7/8) (Abb. 2a,b). Alle RNA-Helices werden durch verschiedene RNA-Wechselwirkungen zusammengepackt. Die Kombinationen S1-SL1, S2-SL3 und S3-SL6 werden in jeder Kombination direkt gestapelt. S4 und SL4 sind aufgrund der direkten Stapelung zwischen A152 und U154 und der Basis-Triple-Formation zwischen A152, U179 und U183 koaxial gestapelt. SL2 und SL5 bilden einen Pseudoknoten (den wir als Adapter-Pseudoknoten bezeichnen), der von einem Basistripel aus G81, A192 und U197 abgedeckt wird (Abb. 2c). Einige RNA-Helices verbinden Schichten innerhalb der globulären ωRNA-Struktur. S2, C107, A108, G245 und A246 bilden die Nexus-Region, die in der tracrRNA von Cas9s weitgehend konserviert ist (Lit. 9) (Abb. 2a). Diese Nexus-Region und S4 sind direkt mit S1 bzw. SL5 zwischen den Schichten 1 und 2 verbunden. SL4 bildet mit der Region zwischen S2 und SL7 einen Pseudoknoten (den wir als Nexus-Pseudoknoten bezeichnen) und ermöglicht so Interaktionen zwischen den Schichten 2 und 3 ( Abb. 2a,b). Mutationen, die Basenpaare in den Pseudoknoten zerstörten, hoben die DNA-Nicking-Aktivität auf, und nachfolgende Mutationen, die Basenpaare im Adapter-Pseudoknoten wiederherstellten, stellten diese Aktivität teilweise wieder her, was die Bedeutung der Pseudoknoten für die ωRNA-Funktion hervorhebt (Abb. 2d). Diese strukturellen und biochemischen Daten zeigen, dass die ωRNA eine kompakte, kugelförmige Struktur bildet, die durch verschiedene RNA-Wechselwirkungen erreicht wird. Eine solche Struktur kann für OMEGA-Systeme von Vorteil sein: Wenn die ωRNA autonom ihre globuläre Struktur bildet und als Gerüst fungiert (im Gegensatz zur tracrRNA), benötigt das Effektorprotein keine Hilfsmotive/Domänen, um die RNA-Faltung und -Funktion zu unterstützen. Darüber hinaus könnte die Kugelform, wenn sie einen gewissen Widerstand gegen endogenen RNA-Abbau bietet, die trans-Funktion von ωRNA mit einem Effektorprotein erleichtern. Diese letztere Möglichkeit wird durch die Entdeckung eigenständiger ωRNAs gestützt, die mit dem verwandten OMEGA-Effektor IscB4 funktionieren können.

a,b, Schema (a) und Strukturmodell (b) des ωRNA-Gerüsts (Reste 21–282). S1–4, Stamm 1–4; SL1–8, Stammschlaufe 1–8; PK, Pseudoknoten. In a werden kanonische und nichtkanonische Basenpaare durch durchgezogene schwarze Linien dargestellt. Schlecht aufgelöste Bereiche werden von einem gestrichelten Kasten umschlossen. In b ist das Führungssegment der Übersichtlichkeit halber weggelassen. c, Eine Basen-Triple-Formation im Adapter-Pseudoknoten. Wasserstoffbrückenbindungen sind als gestrichelte Linien dargestellt. d, In vitro rekonstituiertes DtIsrB-ωRNA-RNP-Nicking von dsDNA-Substraten (mit TTGA TAM) mit ωRNA voller Länge oder verkürzter ωRNA. n = 3 unabhängige technische Replikate. Δ34–67, ωRNA, in der die Nukleotide 34–67 durch GAAA ersetzt wurden; 165-AGCG-168, ωRNA, in der die Nukleotide 165–168 durch AGCG ersetzt wurden; 194-GCGG-197, ωRNA, in der die Nukleotide 194–197 durch GCGG ersetzt wurden; 194-GCGG-197/81-CCGC-84, ωRNA, in der die Nukleotide 81–84 und 194–197 durch CCGC bzw. GCGG ersetzt wurden.

Die 5′-Stammregion der ωRNA (S1, SL1 und SL2) wird als Guide-Adapter-Region bezeichnet. Es scheint, dass während des evolutionären Übergangs vom OMEGA-System zum CRISPR-Cas SL2 und die absteigenden Stränge von S1/SL1 der ωRNA angepasst wurden, um das CRISPR-Array zu bilden, um die Bildung der funktionellen Cas9-CRISPR-RNA (crRNA)-tracrRNA zu ermöglichen komplex (Abb. 1a). Die Genomsequenz, die die Guide-Adapter-Region kodiert, ist wichtig für die IS200/IS605-Transposonaktivität in Bakteriengenomen10 (Abb. 2a). Wir haben einen Teil dieser Region, SL1 (ΔSL1 ωRNA), abgeschnitten und festgestellt, dass die resultierende RNA immer noch eine robuste DNA-Nicking-Aktivität durch IsrB unterstützt (Abb. 2d). Darüber hinaus haben wir ΔSL1-ωRNA mit dem IsrB-Protein und der Ziel-DNA rekonstituiert und eine Einzelpartikelanalyse durchgeführt, wodurch eine Karte mit einer Auflösung von 6,9 Å erstellt wurde (Extended Data Abb. 6a – e). Der Vergleich dieser Karte mit der der RNA voller Länge validierte die anhand unseres RNA-Modells bestimmte SL1-Position und ergab eine Konformationsähnlichkeit zwischen der RNA voller Länge und ΔSL1 (Erweiterte Daten, Abb. 6a, b). Diese Ergebnisse deuten darauf hin, dass SL1 in der Guide-Adapter-Region nicht für das Nicken der Ziel-DNA durch IsrB erforderlich ist und stattdessen möglicherweise zu anderen Funktionen beiträgt, die an der Mobilität von IsrB-kodierenden Transposons beteiligt sind. Das ωRNA-Gerüst interagiert umfassend mit allen Teilen von IsrB mit Ausnahme der HNHL-Region (Abb. 1e). Insbesondere interagiert die PLMP-Domäne mit den Tandem-Haarnadeln (SL7 und SL8) nahe dem 3′-Ende der ωRNA. Die Verkürzung von SL7/8, jedoch nicht von SL8, verringerte die Nicking-Aktivität von IsrB (Abb. 2d). Angesichts der Tatsache, dass die terminale Haarnadel (SL7) der ωRNA die Shine-Dalgarno-Sequenz enthält, die sich unmittelbar stromaufwärts der IsrB-kodierenden Region befindet, deuten diese Ergebnisse darauf hin, dass die IsrB-ωRNA-Wechselwirkung für die IsrB-Funktion wichtig ist und zur Regulierung der IsrB-Expression beitragen könnte in seinem ursprünglichen Kontext.

Als nächstes versuchten wir, Strukturinformationen zu nutzen, um den DNA-Targeting-Mechanismus von IsrB zu entschlüsseln. Der gRNA-Ziel-DNA-Heteroduplex ist von S2/S3/S4/SL2/SL4/SL5 der ωRNA sowie der RuvC-Domäne und den BH/RECL/HNHL-Regionen von IsrB umgeben (Abb. 1e und 2b). SL2, SL4 und SL5 kontaktieren das Heteroduplex-Rückgrat direkt über Wasserstoffbrückenbindungen und Van-der-Waals-Wechselwirkungen (Abb. 3a, b). S2, S3 und S4 erkennen das Heteroduplex-Rückgrat indirekt mithilfe eines kurzen Peptidlinkers, RECL, in dem die Reste 113–124 induziert werden, in die Rillen von S2/S3/S4 und dem Heteroduplex zu passen (Abb. 3b)11. Die Mutation von F119 und R124 zu Alanin verringerte die DNA-Nicking-Aktivität von IsrB, was die funktionelle Bedeutung dieser Reste im RECL hervorhebt (Abb. 3c). Zusätzlich zur ωRNA bindet das IsrB-Protein weitgehend an den Heteroduplex (Abb. 1e). Der HNHL erkennt die kleine Furche des Heteroduplex durch Wechselwirkungen mit den Riboseeinheiten des Rückgrats (Abb. 3d). Wir bestätigten die Bedeutung dieser Wechselwirkung, indem wir die Reste V161–F174 im HNHL löschten, wodurch die DNA-Nicking-Aktivität aufgehoben wurde (Abb. 3c und Extended Data Abb. 5b). Mehrere Argininreste im BH kontaktieren das Phosphatrückgrat des ωRNA-Leitsegments auf ähnliche Weise wie im Cas9-Leit-RNA-Komplex, in dem die Leit-RNA-BH-Wechselwirkungen die Leitregion für die DNA-Erkennung und -Abwicklung vorordnen12 (Abb. 3f ). Die Mutation von R104, aber nicht von R100, zu Alanin verringerte die DNA-Nicking-Aktivität von IsrB, was die funktionelle Bedeutung von R104 im BH hervorhebt (Abb. 3c). Stromabwärts der Zielregion (dG1–dC20) wurde der ωRNA-komplementäre DNA-Strang (d. h. der Zielstrang) umgedreht und mit dem Nicht-Ziel-DNA-Strang eine Basenpaarung vorgenommen, um einen TAM-haltigen Duplex (dA[−1]) zu bilden. -dA[−10]–dT1*-dT10*) (Abb. 1c,e). Die Rückgrat-Phosphatgruppe zwischen dC20 und dA(−1) im Zielstrang wird von Asn265 in der Phosphat-Lock-Loop erkannt und erleichtert dadurch die Bildung von Heteroduplexen (Abb. 3e). Die Mutation von N265 zu Alanin verringerte die Nicking-Aktivität, was auf die Bedeutung dieses Rests für die DNA-Abwicklung schließen lässt (Abb. 3c). Die PLMP-Domäne und das β7-Motiv in der TI-Domäne sind die zentralen Einheiten im RuvC-TI-PLMP-Gerüst (Extended Data Abb. 3a). Durch die Verkürzung dieser Domänen/Motive wurde die DNA-Nicking-Aktivität von IsrB aufgehoben, was auf die Bedeutung des starren Gerüsts von RuvC-TI-PLMP hinweist (Abb. 3c und erweiterte Daten Abb. 5b). Diese Ergebnisse zeigen, dass sowohl IsrB als auch das ωRNA-Gerüst wesentlich zur Erkennung des Guide-Target-Heteroduplex für das DNA-Targeting beitragen.

Der Einschub zeigt die Position der vergrößerten Panels. a, Heteroduplex-Erkennung durch den Adapter-Pseudoknoten. b, Heteroduplex-Erkennung durch SL4, S4 und RECL. Die RNA- und DNA-Volumina werden aus Atomkoordinaten unter Verwendung von Chimera n = 3 unabhängige technische Replikate. ΔHNHL, IsrB-Mutante, in der die Reste 161–174 durch einen GSG-Linker ersetzt wurden. Δβ7, IsrB-Mutante, in der die Reste 341–353 gelöscht wurden. ΔPLMP, IsrB-Mutante, bei der die Reste 1–52 gelöscht wurden. Um die Proteinstabilität von Deletionsmutanten zu bestätigen, überprüften wir die Proteinexpression im Bakterienlysat, das die Deletionsmutanten überexprimierte (Extended Data Abb. 5b). d, Heteroduplex-Erkennung durch HNHL. e, Erkennung des +1-Phosphats (Phosphodiesterbindung zwischen den Nukleotiden dG1 und dA(−1) der Zielstrang-DNA) durch die Phosphat-Lock-Loop. f, Anerkennung des Führungssegments durch BH. g, TAM-Erkennung durch die TI-Domäne. h, TAM-Spezifität von DtIsrB. In vitro rekonstituiertes DtIsrB-ωRNA-RNP-Nicking von dsDNA-Substraten (mit TTGA/ATGA/TTGG/ATGG-TAMs) mit WT oder mutiertem DtIsrB. n = 3 unabhängige technische Replikate.

Wir haben zuvor herausgefunden, dass DtIsrB eine NTGA-TAM-Präferenz aufweist4, aber da DtIsrB ein thermophiles Enzym ist, haben wir den TAM-Identifizierungstest bei 60 °C wiederholt. Bei dieser Temperatur beobachteten wir eine TTGA-TAM-Präferenz (Abb. 4b). Anschließend versuchten wir, diese Präferenz strukturell zu charakterisieren. Der TAM-haltige Duplex ist in der Spalte zwischen der WED- und der TI-Domäne gebunden, in der die TAM-Nukleobasen im Nicht-Zielstrang durch die Reste in der TI-Domäne ausgelesen werden (Abb. 1e und 3g). Obwohl die dT1*-Nukleobase das Protein nicht direkt kontaktiert, geht das C5 der dT2*-Nukleobase Van-der-Waals-Wechselwirkungen mit dem von dT1* und dem aliphatischen Teil der Arg323-Seitenkette ein, was mit der Bevorzugung des ersten und zweiten Ts in übereinstimmt der TAM. O6 und N7 von dG3* interagieren mit R323, entsprechend der Präferenz für das dritte G des TAM. Dem R323A-Mutanten fehlte die Spaltungsaktivität, was eine Rolle von R323 bei der TAM-Erkennung unterstützt (Abb. 3c). N6 und N7 von dA4* interagieren mit Gln326, was mit der Bevorzugung des vierten A im TAM übereinstimmt. Um zu testen, ob Q326 das vierte TAM-Nukleotid erkennt, mutierten wir diesen Rest zu Alanin und stellten fest, dass diese Mutation die Zielspaltung aufhob (Abb. 3c). Das Wildtyp-IsrB zeigte Spaltungsaktivität bei Zielen mit TTGA/ATGA-TAMs, jedoch nicht bei TTGG/ATGG-TAMs (Abb. 3h). Allerdings war die Q326R-Mutante mit allen vier dieser TAMs aktiv. Diese Ergebnisse deuten darauf hin, dass Q326 das vierte Nukleotid im TAM erkennt. In SpCas9 kann die PAM-Präferenz durch Veränderung der Wasserstoffbrückenwechselwirkungen zwischen der Aminosäure an Position 1.335 (Arg im Wildtyp-SpCas9 oder Gln in der SpCas9-VQR-Variante) und dem dritten Nukleotid des PAM (G oder A, bzw.)13,14. Analog kann in IsrB die TAM-Präferenz durch Veränderung der Wasserstoffbrückenbindungswechselwirkungen zwischen der Aminosäure an Position 326 und dem vierten Nukleotid des TAM modifiziert werden. Zusammengenommen deuten diese Ergebnisse darauf hin, dass DtIsrB das TTGA-TAM im Nichtzielstrang durch eine Kombination aus Wasserstoffbrückenbindungen und Van-der-Waals-Wechselwirkungen erkennt, und weisen darauf hin, dass eine Änderung dieser Wechselwirkungen die TAM-Präferenz erweitern könnte.

a, Phylogenetischer Baum ausgewählter IsrB-Orthologe. Die Proteingrößen sind angegeben, wobei die Domänen in farbigen Kästchen und die konservierten Sequenzen in Schwarz hervorgehoben sind. Verwandte RNA-Größen und -Gruppen (Abb. 4d) sind angegeben. b, TAM-Sequenzen für sechs IsrB-Orthologe unter Verwendung der In-vitro-Spaltung einer Plasmidbibliothek, die randomisierte TAMs und die Zielsequenz enthält. c: In vitro rekonstituiertes IsrB-ωRNA-RNP-Nicking von dsDNA-Substraten mit fünf IsrB-Orthologen. Für CwIsrB, CsIsrB und K2IsrB enthielt die Ziel-DNA ein TTGA-TAM. Für DsIsrB und BbIsrB enthielt die Ziel-DNA ein ATGG-TAM. n = 3 unabhängige technische Replikate. d, Strukturmodelle der ωRNA-Gerüste für sechs IsrB-Orthologe basierend auf Sekundärstrukturvorhersagen. Die vorhergesagten ωRNA-Gerüste werden in die Gruppen A (Untergruppe A1, CsIsrB und K2IsrB; Untergruppe A2, BbIsrB) und B (Untergruppe B1, DtIsrB; Untergruppe B2, CwIsrB und DsIsrB) eingeteilt. In Gruppe A bilden SL2 und SL4 Pseudoknoten und SL5 und der Zwischenbereich zwischen S2 und SL7 bilden Pseudoknoten. Verbindungsbereiche, die sich von Gruppe B unterscheiden, sind rosa gefärbt. Es wird vorhergesagt, dass es sich bei der Zwischenregion zwischen SL5 und S3 sowie der Endregion nach SL7 („kein Motiv“, grau) um ungepaarte Nukleotide handelt. In Gruppe B bilden SL2 und SL5 Pseudoknoten und SL4 und der Zwischenbereich zwischen S2 und SL7 bilden Pseudoknoten. Verbindungsregionen (rot) sind wie in Gruppe A. Die Zwischenregion zwischen SL5 und S3 sowie die Endregion nach SL7 werden voraussichtlich Stammschleifen sein (SL6 und SL8, grau). In den Untergruppen A1 und B1 wird vorhergesagt, dass es sich bei der Zwischenregion zwischen S2 und S3 um eine Stammschleife (SL3, dunkelgrau) handelt, während in den Untergruppen A2 und B2 diese Region voraussichtlich aus ungepaarten Nukleotiden besteht („kein Motiv“, dunkelgrau). ).

Um den DNA-Nicking-Mechanismus von IsrB zu untersuchen, haben wir die geknickte Stelle in der DNA durch Sanger-Sequenzierung identifiziert. IsrB hat den Nichtzielstrang 8–11 nt vor dem TAM gekerbt (Extended Data Abb. 6a), im Gegensatz zu Cas9s, das den Nichtzielstrang 2–5 nt vor dem PAM15 spaltet. Um das geknickte Produkt nachzuahmen, fügten wir 10 nt zum 5'-Ende des Nichtzielstrangs in der SL1-verkürzten IsrB-Komplexstruktur hinzu (Extended Data Abb. 6b). Wir beobachteten die EM-Dichte des verlängerten Teils des Nichtzielstrangs, der an die RuvC-Domäne angedockt ist (erweiterte Daten, Abb. 6e). In den IsrB-Strukturen werden die TAM- und TAM-proximalen Teile des Nicht-Zielstrangs aus der RuvC-Domäne entfernt (Extended Data Abb. 6e, f), wohingegen in der SpCas9-Struktur der PAM-proximale Teil des Nicht-Zielstrangs entfernt wird Der Strang interagiert mit den RuvC- und HNH-Domänen16 (Extended Data Abb. 6g). Der Konformationsunterschied zwischen den Nicht-Zielsträngen, die auf die RuvC-Domänen geladen wurden, erklärt die unterschiedliche Position des von IsrB vorgenommenen DNA-Schnitts im Vergleich zu dem von SpCas9.

Um die Erhaltung der ωRNA -Ternärstruktur über ISRBs zu bewerten, identifizierten wir fünf Orthologe (CWISRB, ISRB aus Crocosphaera Watsonii; DSISRB, ISRB aus Dolichospermum sp.; aus Contig k249_576930 der viralen Metagenom-Assemblierung) und ihren zugehörigen ωRNAs (Abb. 4a). Ein TAM-Entdeckungstest zeigte, dass CwIsrB/K2IsrB/CsIsrB/DsIsrB ein NTG-TAM erkennt, während BbIsrB ein NTGG-TAM erkennt (Abb. 4b). Wir haben die Funktionalität dieser ωRNAs bestätigt und die TAM-Präferenzen mithilfe eines DNA-Spaltungstests validiert, wobei die Ziel-DNA das einzelne TAM enthielt (Abb. 4c). Wir haben 3D-Strukturmodelle dieser IsrB-Orthologen und die kovarianzgefalteten zweidimensionalen (2D) Strukturmodelle ihrer verwandten ωRNAs erstellt (Extended Data Abb. 7). Das Protein-3D-Modell und das RNA-2D-Modell waren mit den experimentell bestimmten Strukturen von DtIsrB und seiner verwandten ωRNA kompatibel, was die allgemeine Zuverlässigkeit der Strukturvorhersage demonstrierte (Abb. 2a und erweiterte Daten Abb. 7a, b). Bei der Vorhersage der Sekundärstruktur behalten die ωRNAs von DtIsrB und den anderen fünf Orthologen die Zusammensetzung der Kerndomäne bei, die aus vier Stämmen (S1–4) und fünf Stammschleifen (SL1/2/4/5/7) besteht (Abb. 4d und erweitert). Daten Abb. 7a). In der Kryo-EM-Struktur der DtIsrB-ωRNA (DtRNA) befinden sich SL3, SL6 und SL8 an der Peripherie des Gerüsts und tragen nicht zur Bildung des Kerns bei (Abb. 2b). Die Verkürzung von SL8 hatte keinen nennenswerten Einfluss auf die DtIsrB-Spaltungsaktivität, was darauf hindeutet, dass die ωRNAs, denen dieses Motiv fehlt, zumindest die minimale Funktionalität von IsrB unterstützen (Abb. 2d). In den ωRNAs von CwIsrB und DsIsrB wird vorhergesagt, dass SL2 und SL5 sowie SL4 und die an SL7 angrenzende einzelsträngige Region zwei Pseudoknotenstrukturen bilden, die mit der Struktur der DtRNA übereinstimmen (Abb. 4d und erweiterte Daten Abb. 7a). . Im Gegensatz dazu wird vorhergesagt, dass in den ωRNAs von CsIsrB, K2IsrB und BbIsrB zwei Pseudoknotenstrukturen durch SL2 und SL4 sowie SL5 und die an SL7 angrenzende einzelsträngige Region gebildet werden (Abb. 4d und Extended Data Abb. 7a). Über dieses an der Pseudoknotenbildung beteiligte SL4-SL5-Shuffling wurde bereits berichtet 4 und unterstreicht die strukturelle Robustheit von ωRNAs, die trotz struktureller Umlagerungen insgesamt ähnliche Strukturen beibehalten. Zusammengenommen weisen die nachgewiesene Funktionalität von IsrB-Orthologen und die vorhergesagten strukturellen Ähnlichkeiten von IsrBs und ihren ωRNAs auf die Allgemeingültigkeit des ωRNA-gesteuerten DNA-Targeting-Mechanismus hin, der durch die vorliegende Kryo-EM-Struktur vorgeschlagen wird.

Um die Entwicklung der Proteindomäne von IsrB zu Cas9 zu verfolgen, verglichen wir die Struktur von IsrB mit der Struktur eines der größten bekannten IscBs (OgeuIscB)17, einem entfernten Verwandten von IsrB, das die HNH-Nukleasedomäne enthält, und der vorhergesagten Struktur von YnpsCas9- 1 (ein früh verzweigtes Cas9 des Subtyps II-D von Ga0315277_10040887, das zu den Cas9s gehört, die IscB am ähnlichsten sind)4 (Extended Data Abb. 8). Neben der Verstärkung der HNH-Domäne in IscB beobachten wir auch große Unterschiede in anderen Regionen. Beispielsweise ist die RECL in einigen, aber nicht allen Kladen von IscB größer als die entsprechende Linkerregion in IsrB und faltet sich in eine minimale Sekundärstruktur, wohingegen in YnpsCas9-1 eine große globuläre Domäne in der REC-Region erworben wurde. In anderen Cas9, wie etwa SpCas9, ist diese Domäne sogar noch größer und komplexer. Die RuvC-Domäne in OgeuIscB enthält einige größere Schleifen, während sie in YnpsCas9-1 lange Insertionen enthält, die sich in anderen Cas9s, einschließlich SpCas9, offenbar zu hochstrukturierten Domänen weiterentwickelt haben. Diese Vergrößerung der RuvC-Domäne in Cas9 geht mit dem Verlust der PLMP-Domäne einher. In ähnlicher Weise haben die WED- und TI-Domänen in anderen IsrBs und IscBs eine minimale Größe, außer insbesondere in OgeuIscB und anderen großen IscBs, in denen diese Domänen erweitert sind. Die WED- und TI-Domänen expandierten wahrscheinlich weiter zu den großen, kugelförmigen Versionen, die in YnpsCas9-1 und SpCas9 zu finden sind. SpCas9 beherbergt eine größere PAM-interagierende Domäne, die eine zusätzliche globuläre Region enthält, die sich stromabwärts der gemeinsamen PAM-interagierenden Kerndomäne befindet. Die Größenverringerung und Aufteilung der ωRNA in duale RNA-Leiter in Cas9 (z. B. tracrRNA-crRNA) ging wahrscheinlich mit dem Erwerb der REC-Domäne und der Gesamtvergrößerung aller Domänen von Cas9 einher.

Um die Minimierung der ωRNA bei ihrer Entwicklung zu cr/tracrRNAs detaillierter zu charakterisieren, verglichen wir die Struktur von DtIsrB-ωRNA (DtRNA) mit denen von OgeuIscB-ωRNA (OgRNA), CjCas9-Single-Guid-RNA (CjRNA) und SpCas9-sgRNA in ihren Protein-/Ziel-DNA-gebundene Zustände (Extended Data Abb. 9)16,17,18. Auf der Grundlage von Topologie, Lage und Sekundärstruktur haben wir DtRNA-Strukturmerkmale (S1–4 und SL1–8) auf andere RNA-Spezies kartiert und nicht identifizierte Strukturmotive als Motive 1–5 (M1–5) benannt. Die Strukturen der 5′-Stammregion (S1 und SL1 in DtRNA) und der Nexusregion (S2 in DtRNA) sind in allen vier RNA-Arten konserviert. Der aufsteigende Strang der 5′-Stammregion wird beim evolutionären Übergang von OMEGA-IsrB/IscB zu CRISPR-Cas9 durch crRNA ersetzt. Darüber hinaus degenerierten die eingefügten Helices (S3/S4/SL4/SL5/SL6 in DtRNA) innerhalb der Nexus-Region, als sich ωRNAs zu tracrRNAs entwickelten, was zur Verdichtung und Vereinfachung der RNA-Struktur beitrug. Die SL4-Motive von DtRNA und OgRNA bilden Nexus-Pseudoknoten, die in ωRNAs konserviert sind, wohingegen einige Basenpaarungen in CjRNA M3 gut mit diesen Nexus-Pseudoknoten überlagert sind. Eine eingebettete Stammschleife in der DtRNA-5′-Stammregion (SL2) paart sich mit einer der eingebetteten Stammschleifen in der Nexusregion (SL5) und bildet so einen funktionellen Pseudoknoten (Adapterpseudoknoten), der die Ziel-DNA erkennt. Eine Base neben dem Adapterpseudoknoten (C198) bildet mehrere Kontakte zwischen 3 und 5 Å mit den Phosphat- und Desoxyriboseeinheiten der DNA an Position 6 (G6) und 7 (T7) (Abb. 3a) und verleiht so eine einzigartige Anpassung wodurch das ωRNA-Gerüst den RNA-DNA-Duplex erkennen kann. Der Adapter-Pseudoknoten ist in IsrB-ωRNAs konserviert, wird jedoch beim Übergang zu IscB-ωRNAs und Cas9-tracrRNAs degeneriert, eine Änderung, die mit der REC-Regionserweiterung korreliert und wahrscheinlich durch diese kompensiert wird.

Wir wollten auch die mechanistischen Veränderungen besser verstehen, die mit den Domänenakquisitionen in IsrB und Cas9 während ihrer Entwicklung aus dem kompakten RuvC-ähnlichen Vorfahren verbunden sind. Zu diesem Zweck verglichen wir die zielgebundenen Strukturen von Thermus thermophilus RuvC (TtRuvC), IsrB, CjCas9 und SpCas9 (Abb. 5). Als sich RuvC-Domänen enthaltende Proteine ​​entwickelten, um mit ωRNAs zu interagieren, erwarben sie TI/PI-, PLMP- und BH-Domänen. In den Strukturen von IsrB und Cas9 bilden die RuvC-, WED-, TI/PI- und BH-Domänen sowie die Phosphat-Lock-Loop einen funktionellen Kern mit ähnlichen Konfigurationen; Der Guide-Target-Heteroduplex und der TAM/PAM-Duplex sind in ähnlicher Position und Ausrichtung an diesen Kern gebunden. Die TI/PI-Domäne erkennt die TAM/PAM-Nukleobasen und fungiert wahrscheinlich mit Unterstützung der Phosphat-Lock-Loop, BH und ωRNA/gRNA als Primer für die Entwindung der Ziel-DNA und die Bildung von Heteroduplexen. Obwohl IsrB und Cas9 homologe RuvC- und BH-Domänen teilen, enthält IsrB (sowie IscB) eindeutig die PLMP-Domäne, die direkt mit RuvC I interagiert. Die Untersuchung der IsrB-Struktur zeigt außerdem eine Rolle der PLMP-Domäne bei der Stabilisierung der Basis von terminale Haarnadel der ωRNA und Kontakt zur Shine-Dalgarno-Sequenz. Darüber hinaus enthält IsrB nur minimale RECL- und HNHL-Regionen (17 bzw. 19 Aminosäuren in DtIsrB) und sie spielen beim DNA-Targeting wahrscheinlich eine andere Rolle als die größeren REC-Lappen und die HNH-Domäne in Cas9 (z. B. 625). bzw. 135 Aminosäuren in SpCas9). In SpCas9 sondiert der REC-Lappen die Ziel-DNA durch Wechselwirkungen mit dem Heteroduplex, aktiviert die DNA-gebundene RuvC-Nuklease durch die Kommunikation mit der HNH-Domäne und erleichtert die R-Loop-Bildung19,20,21. In IsrB wird diese Kommunikation zwischen Domänen jedoch wahrscheinlich durch die ωRNA sowohl durch Rückgrat-Rückgrat- als auch durch Basis-Rückgrat-Wechselwirkungen unterstützt, da RECL und HNHL vergleichsweise klein sind.

Strukturelle Determinanten der Entwicklung von den angestammten RuvC-Nukleasen zu IsrB und dann zu Cas9. Beispiele moderner Nachkommen (Reste) jeder Familie werden beginnend mit T. thermophilus RuvC (TtRuvC, PDB 6S16), DtIsrB, CjCas9 (PDB 5X2G) und SpCas9 (PDB 7S4X) gezeigt. Kritische Stadien im vorgeschlagenen Evolutionsprozess werden gezeigt, einschließlich der Insertionen der TI-, PLMP- und BH-Domänen, der Interaktion mit ωRNA, der Insertion der HNH-Domäne, des Verlusts der PLMP-Domäne und des Ersatzes verschiedener Teile der ωRNA durch REC-Regionen (Domäne). Ersetzungen werden mit einem Farbschlüssel angezeigt). Der Teil von REC2 in CjCas9 und SpCas9, der SL2 in der DtIsrB-ωRNA ersetzt, ist dunkelgrau gefärbt. Verbundene Basenpaarungen werden nur für den Guide-DNA-Duplex angezeigt. Für den ωRNA-Adapter-Pseudoknoten ist eine getrennte Basenpaarung dargestellt, um seine Position in der Nähe des RNA-DNA-Duplex hervorzuheben.

Die vergleichsweise große ωRNA (ungefähr 300 nt im Vergleich zu 100 nt sgRNA, die von Cas9 verwendet wird) scheint zum Zusammenhang zwischen DNA-Targeting und Nicking-Aktivitäten beizutragen und die kleinen RECL- und HNHL-Regionen zu kompensieren (Extended Data Abb. 10). In der mehrschichtigen ωRNA-Architektur sind die RNA-Helices der oberen Schicht (S2/S3/S4/SL2/SL4/SL5), die ein Interaktionsnetzwerk für die ωRNA-gesteuerte Heteroduplex-Erkennung bilden, mit den RNA-Helices der unteren Schicht (SL7/ SL8) und interagieren umfassend mit dem Nicking-Modul (PLMP/RuvC/TI-Domänen) durch die Nexus-Pseudoknoten-Interaktionen zwischen S2, SL4 und SL7. Angesichts der Tatsache, dass Mutationen im Adapter-Pseudoknoten in der ωRNA die Nicking-Aktivität von IsrB aufhoben (Abb. 2d), könnten die ωRNA-Strukturmotive für die allosterische Regulierung der DNA-Erkennung durch die ωRNA wichtig sein, obwohl der Pseudoknoten von der Ziel-DNA entfernt ist. RECL- und DNA-Nicking durch die RuvC-Nukleasedomäne, was einen Weg für die Integration weiterer Formen der Regulierung bietet. Dieser ωRNA-gesteuerte allosterische Regulationsmechanismus wird durch die insgesamt hohe Oberflächenladung und Fläche unterstützt, über die IsrB mit ωRNA in Kontakt kommt. Andere große (ungefähr 400–900 nt) funktionelle nichtkodierende RNAs, wie Intron der Gruppe I, Intron der Gruppe II und Ribonuklease P, haben komplexe ternäre Strukturen und ihre peripheren Regionen können ihre zentralen katalytischen Kerne durch allosterische Mechanismen steuern22,23,24 ,25. Zukünftige Strukturstudien von IsrB in anderen Konformationen, wie dem katalytisch aktiven IsrB-R-Loop-Komplex, werden diese Hypothese aufgreifen und unser mechanistisches Verständnis von OMEGA-Systemen vertiefen.

Das für DtIsrB in voller Länge kodierende Gen (Reste 1–353) wurde codonoptimiert, synthetisiert (Twist Bioscience) und in einen modifizierten pC013-Vektor (Addgene Plasmid Nr. 90097) kloniert. Die DtIsrB-kodierende Region besteht aus His6-Twinstrep-Tag, SUMO-Tag, DtIsrB und GFP-Tag. Wildtyp-DtIsrB wurde bei 18 °C in Escherichia coli Rosetta(DE3)pLysS-Zellen (Novagen) exprimiert. E. coli wurde bei 37 °C in Luria-Bertani-Medium (enthaltend 100 mg l−1 Ampicillin) kultiviert, bis die OD600 0,5 erreichte, und dann wurde die Proteinexpression durch Zugabe von 0,1 mM Isopropyl-β-d-thiogalactopyranosid und Inkubation induziert bei 18 °C für 20 h. Die E. coli-Zellen wurden in Puffer A (50 mM Tris-HCl, pH 8,0, 20 mM Imidazol und 1 M NaCl) resuspendiert, durch Ultraschallbehandlung lysiert und anschließend zentrifugiert. Der Überstand wurde mit Ni-NTA-Agarose (Qiagen) gemischt. Die proteingebundene Säule wurde mit Puffer A, Puffer B (50 mM Tris-HCl, pH 8,0, 20 mM Imidazol und 0,3 M NaCl) und Puffer C (50 mM Tris-HCl, pH 8,0, 0,3 M Imidazol und 0,3 M) gewaschen NaCl). Das Protein wurde mit Puffer D (50 mM Tris-HCl, pH 8,0, 0,3 M Imidazol und 1 M NaCl) eluiert. Die verwandte ωRNA von DtIsrB wurde in vitro mit T7-RNA-Polymerase unter Verwendung einer PCR-amplifizierten DNA-Matrize und des HiScribe T7 Quick High Yield RNA Synthesis Kit (NEB) transkribiert. Die Vorlage besteht aus dem T7-Promotor (TAATACGACTCACTATAGG), dem Guide (GCCTTATTAAATGACTTCTC) (Reste 1–20) und dem ωRNA-Gerüst (Reste 21–282). Die transkribierte RNA wurde mit einem RNeasy-Kit (Qiagen) gemäß den Anweisungen des Herstellers gereinigt. Die Ziel- und Nicht-Ziel-DNA-Stränge (GATCAGCTCAAGAGAAGTCATTTAATAAGGC bzw. TTGAGCTGAT) wurden von GENEWIZ gekauft. Zur Rekonstitution von Komplex A wurde das gereinigte DtIsrB-Protein mit der ωRNA, dem Ziel-DNA-Strang und dem Nicht-Ziel-DNA-Strang (TTGA TAM) (Molverhältnis 2,3:1:7:7) in Puffer E (10) gemischt mM Tris-HCl, pH 8,0 und 50 mM NaCl, 5 mM MgCl2) gemischt und 15 Minuten bei 37 °C inkubiert. Komplex A wurde durch Gelfiltrationschromatographie auf einer Superose 6 Creating 10/300-Säule (Cytiva) gereinigt, die mit Puffer F (20 mM HEPES-NaOH, pH 7,0 und 50 mM NaCl, 5 mM MgCl2) äquilibriert war. Komplex A (Endkonzentration: 0,1 mg ml−1) wurde mit BS3 (Endkonzentration: 0,5 mM) 2 Stunden lang bei 4 °C inkubiert. Zur Rekonstitution von Komplex B wurde das Lambda-N-Protein (MDAQTRRRERRAEKQAQWKAAN) zwischen DtIsrB und GFP-Tag eingefügt. Die Reste 34–67 des ωRNA-Gerüsts (Reste 21–282) wurden durch einen GAAA-Linker ersetzt. Die GAAA-Linker-fusionierte boxB-RNA (GAAAGCCCUGAAGAAGGGC) (Reste 283–302) wurde an das 3'-Ende des ωRNA-Gerüsts angehängt. Für diese Rekonstitution wurde der gleiche Ziel-DNA-Strang verwendet. Der 5'-verlängerte Nicht-Ziel-DNA-Strang (TACTGAAGAGTTGAGCTGAT) wurde von GENEWIZ gekauft. Das gereinigte DtIsrB-Protein wurde mit der ωRNA, dem Ziel-DNA-Strang und dem Nicht-Ziel-DNA-Strang (TTGA TAM) (Molverhältnis 2,3:1:1,5:1,5) in Puffer G (10 mM Tris-HCl, pH-Wert) gemischt 8,0 und 50 mM NaCl) und 15 Minuten bei 37 °C inkubiert. Komplex B wurde mit der gleichen Größenausschlusssäule gereinigt, die mit Puffer G äquilibriert war. Für die Gittervorbereitung wurden gereinigte Lösungen von Komplex A und B (0,1 mg ml−1, 3 µl) auf frisch glimmentladenes UltrAuFoil 300 Mesh R1.2 aufgetragen /1,3 Gitter (Quantifoil) in einem Vitrobot Mark IV (FEI) bei 4 °C mit einer Wartezeit von 0 und 10 s und einer Blotting-Zeit von 2 und 4 s bei 95 % Luftfeuchtigkeit.

Kryo-EM-Daten für Komplex A wurden am HHMI Janelia Research Campus mit einem Titan Krios G2-Mikroskop (Thermo) gesammelt, das bei 300 kV betrieben und mit einem Gatan Bioquantum Energy Filer (Gatan) und einem Nachfilter-K3-Direktelektronendetektor (Gatan) ausgestattet ist der Elektronenzählmodus. Jedes Video wurde mit einer Nennvergrößerung von 105.000 aufgenommen, was 0,839 Å pro physischem Pixel (0,4195 Å pro hochauflösendem Pixel) bei einer Elektronenbelichtung von 12,075 Elektronen pro Å2 pro Sekunde und einer Gesamtbelichtungszeit von 5,0 s entspricht eine kumulierte Exposition von 60 e−/Å2. Dann wurden 50 Bilder pro Video mit einer Dosis von 1,2 e−/Å2 pro Bild gesammelt, was einer Gesamtdosis von 60 e−/Å2 pro Video entspricht. Der nominale Defokusbereich wurde auf –0,8 bis –2,2 µm eingestellt. Die automatisierte Datenerfassung wurde mithilfe von Skripten in SerialEM durchgeführt. Für jede Bühnenposition wurde die Bildverschiebung verwendet, um Daten von neun Löchern mit zwei Videoaufnahmen pro Loch zu sammeln. Die durch die Bildverschiebung verursachte Strahlneigung wurde kalibriert und während der Datenerfassung wurde eine Strahlneigungskorrektur angewendet. Kryo-EM-Daten für Komplex B wurden am MIT.nano mit einem Talos Arctica G2-Mikroskop (FEI) gesammelt, das bei 200 kV betrieben und mit einem Falcon 3EC-Direktelektronendetektor (Thermo) im linearen Modus ausgestattet war. Jedes Video wurde mit einer Nennvergrößerung von 120.000 × aufgenommen, was einer kalibrierten Pixelgröße von 1,2550 Å bei einer Elektronenbelichtung von 24,54 e−/pix s−1 für 3,99 s entspricht, was zu einer kumulierten Belichtung von 62,53 e−/Å2 führte. Als nächstes wurden 20 Bilder pro Video mit einer Dosis von 3,1265 e−/Å2 pro Bild gesammelt, was einer Gesamtdosis von 62,53 e−/Å2 pro Video entspricht. Der nominale Defokusbereich wurde auf –2,6 bis –1,0 µm eingestellt. Die automatisierte Datenerfassung erfolgte mit der EPU-Software (Thermo). Für jede Bühnenposition wurde die Bildverschiebung verwendet, um Daten von neun Löchern zu sammeln. Um die 3D-Rekonstruktion von Komplex A zu erhalten, wurden die Daten mit RELION-4.0 verarbeitet (Lit. 26). Die Videobilder wurden in 5 × 5-Patches ausgerichtet und in MotionCor2 dosisgewichtet (Lit. 27). Die Defokussierungsparameter wurden mit CTFFIND-4.1 geschätzt (Lit. 28). Aus den 4.142 vorverarbeiteten Mikroaufnahmen wurden 1.626.574 Partikel durch automatisches Picken auf TOPAZ-Basis29 erfasst und in 3,146 Å Pixel−1 ​​extrahiert. Die ausgewählten 107.066 Partikel wurden dann in 1,144 Å Pixel−1 ​​erneut extrahiert und einer Runde der 3D-Verfeinerung und 3D-Klassifizierung ohne Ausrichtung unterzogen. Die ausgewählten 58.188 Partikel wurden einer Defokussierungsschätzung pro Partikel und einem Bayes'schen Polieren unterzogen. Zur Verfeinerung der Strahlneigung wird die Optikgruppe jeder Mikroaufnahme auf der Grundlage ihrer Lochposition vom Objekttisch aus eingestellt. Die polierten Partikel wurden einer 3D-Verfeinerung unterzogen und ergaben eine Karte mit einer globalen Auflösung von 3,10 Å gemäß dem Kriterium der Fourier-Schalenkorrelation 0,143. Um die 3D-Rekonstruktion des Komplexes B zu erhalten, wurden die Daten mit denselben Programmen verarbeitet. Aus den 2.542 bewegungskorrigierten und dosisgewichteten Mikroaufnahmen wurden 1.595.800 Partikel durch automatisches Picking auf TOPAZ-Basis erfasst und in 3,138 Å Pixel−1 ​​extrahiert. Diese Partikel wurden mehreren Runden der 2D- und 3D-Klassifizierung unterzogen. Die ausgewählten 50.661 Partikel wurden dann in 1,255 Å Pixel−1 ​​erneut extrahiert und einer homogenen Verfeinerung mit cryoSPARC30 unterzogen, was eine Karte mit einer globalen Auflösung von 6,85 Å gemäß dem Fourier-Shell-Korrelationskriterium 0,143 ergab.

Das anfängliche Proteinmodell wurde mit AlphaFold2 (Lit. 31) unter dem ColabFold-Framework unter Verwendung von Standardparametern und MMseqs2 generiert, um in der ColabFold-Datenbank nach Homologen zu suchen32, und manuell mit COOT33 und ISOLDE7 gegen die Dichtekarte von Komplex A modifiziert. Die anfängliche Nukleinsäure Das Modell wurde mit auto-DRRAFTER unter Verwendung der Dichtekarte von Komplex A und des kovarianzbasierten Sekundärstrukturmodells von ωRNA8 erstellt. Die Sekundärstrukturen der ωRNA (Abfrage) wurden mithilfe von cmsearch34 mit der Option –max vorhergesagt, um das IscB/IsrB-ωRNA-Kovarianzmodell mit der höchsten Bewertung aus einer früheren Studie zu identifizieren4. Für das beste Modell wurden Abfrageregionen, die am Modell ausgerichtet waren, Sekundärstrukturen aus den Vorhersagen des Modells zugewiesen. Stammschleifen-Sekundärstrukturen, bei denen festgestellt wurde, dass sie fälschlicherweise Basenpaaren zugeordnet waren, bei denen eine der Basenidentitäten einem Lückenzeichen entsprach, wurden neu zugeordnet, sodass sie keine Sekundärstruktur aufwiesen. Sekundärstrukturen für Abfrageregionen ohne Abdeckung (≥8 bp ohne Übereinstimmung mit dem besten Kovarianzmodell), mit Ausnahme der Region mit geringer Konservierung am 3′-Ende jenseits des Nexus, wurden dann mit mfold35 vorhergesagt. Pseudoknoten wurden manuell zugewiesen, indem passende Basenpaare an den Pseudoknotenpositionen identifiziert wurden, die für den gegebenen ωRNA-Typ erwartet wurden. ωRNA-Koordinaten wurden mit auto-DRRAFTER modelliert, ausgehend von einer leicht modifizierten Version des kovarianzbasierten Sekundärstrukturmodells, bei dem alle nichtkanonischen Basenpaare und die meisten Helices, die nur aus einem einzigen Basenpaar bestanden, entfernt wurden. Die Notation in punktierten Klammern für diese Sekundärstruktur ist unten angegeben:

.((((((((((((((((((.((.(((((((...((((((((. ...))))))))...))))))))).((((((({..{))))))........ )).))))..(((.((((((....)))))....(((((((((((..... (((..(((((((...[[[[[.)))))).....)))((((...}..}... .))))..(((.((......)).)))..))))))))))))...)))..]]] ]]......((((....)))).(((.....)))..<<<<<<<<<<)))))) ))))))))))))))>>>>>>>>>>

Alle DNA-Nukleotide wurden als RNA modelliert, da Auto-DRRAFTER keine DNA-Nukleotide modellieren kann. Das Leit-/ωRNA-Gerüst/die Ziel-DNA/die Nicht-Ziel-DNA wurden jeweils den Resten 1–20/21–282/283–313/314–323 zugeordnet. Die vollständige RNA-Sequenz, die für die Modellierung verwendet wurde, ist unten aufgeführt:

ggccuuauuaaaugacuucucgucaaccaccccugacugaagucagaggcuugcuucuggccugaguugggggcccgguuuggcggggccgggggcaacuggcugaccaggcggcccgguucgccgggcagggguccgcggggcuaccaaggacuuccggguguuucgccagcccggacuaucuccggcagaaccgcucaaugccgcggccggccaagaccggccuaagc ccugcggacagcgccgaggcgacaaucacuccgaaaggaggccguguaucggcgaucagcucaagagaagucauuuaauaaggcuugagcugau

Die Auto-DRRAFTER-Modellierung wurde in Abwesenheit von Proteinkoordinaten unter Verwendung der Dichtekarte durchgeführt, wobei Regionen, die der Proteindichte entsprachen, entfernt wurden. Alle ersten Modellierungsrunden wurden in einer vorläufigen Dichtekarte mit einer Auflösung von 4,3 Å durchgeführt. Die Modellierung wurde manuell erstellt, indem Helices entsprechend den Resten W:1–14 W:41–48 W:53–60 W:258–269 W:271–281 X:2–11 X:18–31 Y:1 angepasst wurden -10 in die Dichtekarte ein. In der zweiten Runde der Auto-DRRAFTER-Modellierung durfte sich die Helix, die den Resten W:41–48 und W:53–60 entspricht, von ihrer ursprünglichen Position bewegen. Es wurden fünf Modellierungsrunden durchgeführt, gefolgt von einer letzten Modellierungsrunde. Pro Runde wurden zwischen 2.000 und 6.000 Modelle gebaut. Eines der zehn besten Bewertungsmodelle wurde von ISOLDE und Phenix6 zusammen mit dem Proteinmodell zur weiteren Verfeinerung ausgewählt, um die Geometrie zu optimieren und die Anpassung an die Kryo-EM-Dichte zu verbessern. Nach der Untersuchung des optimierten Modells und der kovarianzbasierten Sekundärstruktur wurden zwei weitere Runden der Auto-DRRAFTER-Modellierung, einschließlich einer letzten Runde, durchgeführt, in denen die Basenpaarung für den Adapter-Pseudoknoten leicht modifiziert wurde, sodass die Reste 81–84 und 194–197 entstanden waren gepaart und nicht die Reste 81–84 und 193–196. Für diese zusätzliche Modellierung wurden nur die Reste W:73–99 und W:186–206 neu aufgebaut; alle anderen Reste blieben fixiert. Eine weitere letzte Modellierungsrunde wurde unter Verwendung der auf 4 Å tiefpassgefilterten Dichtekarte mit einer Auflösung von 3,1 Å durchgeführt. Die endgültige Konvergenz dieser Modelle (paarweise quadratische mittlere Abweichung zwischen den Modellen) beträgt 4,1 Å. Es wurde bereits gezeigt, dass Auto-DRRAFTER-Konvergenzwerte die Modellgenauigkeit vorhersagen. Unter Verwendung einer zuvor ermittelten linearen Beziehung zwischen Konvergenz und Modellgenauigkeit (Genauigkeit von 0,61 × Konvergenz + 2,4 Å) beträgt die geschätzte Genauigkeit dieser anfänglichen rechnerisch generierten Modelle 4,9 Å. Um die Genauigkeit weiter zu verbessern, wurde eines dieser Modelle mit COOT, ISOLDE und Phenix zusammen mit dem Protein verfeinert, um das endgültige IsrB-ωRNA-Ziel-DNA-Komplexmodell zu erstellen. Das endgültige Modell (ohne Proteinreste 1–5/211–224/348–353, RNA-Reste 1–2/37–64/119–122/212–219/263–265 und Ziel-DNA-Reste 1/30–31, die schlecht aufgelöst waren und im endgültigen Modell weggelassen wurden) wurden von MolProbity36 und Q-score37 ausgewertet. Molekulare Grafiken und EM-Dichtezahlen wurden mit CueMol (http://www.cuemol.org), PyMOL (https://pymol.org/2/), UCSF Chimera (https://www.cgl.ucsf.edu) erstellt /chimera/) oder Chimera X (https://www.cgl.ucsf.edu/chimerax/).

Das IsrB-Protein und die ωRNA-Matrizen wurden für ein In-vitro-Transkriptions-/Translations-Expressionssystem vorbereitet. Die IsrB-Proteinvorlage besteht aus den T7-Promotor- und Translationsinitiationssequenzen (GCGAATTAATACGACTCACTATAGGGCTTAAGTATAAGGAGGAAAAAATATG), der IsrB-ORF-Sequenz und der T7-Terminatorsequenz (CTAGCATAACCCCTTGGGGCCTCTAAACGGGTCTTGAGGGGTTTTTTG). Die ωRNA-Matrize besteht aus der T7-Promotorsequenz (GGAAATTAATACGACTCACTATAGG) und der ωRNA-Sequenz. Das IsrB-Protein und die ωRNA-Matrizen wurden in den modifizierten pC013-Vektor (Addgene Plasmid Nr. 90097) und den pCOLADuet-1-Vektor eingebettet. Mutationen im IsrB-Protein und in der ωRNA wurden durch eine PCR-basierte Methode eingeführt und die Sequenzen wurden durch DNA-Sequenzierung bestätigt. Das 320-bp-PCR-Amplikon (30 ng), das die 20-nt-Zielsequenz und das TAM enthält und mit 5'-IRDye 700 (IDT) fluoreszierend markiert war, wurde mit der IsrB-Proteinvorlage (50 ng) und der ωRNA inkubiert Vorlage (125 ng) in 12,5 μl Reaktionspuffer, enthaltend 5 μl Lösung A und 3,75 μl Lösung B des PURExpress In vitro Protein Synthesis Kit (NEB). Die Reaktionsbedingungen wurden wie folgt optimiert. Abb. 2d, 3 h: 2 h bei 37 °C, 1 h bei 60 °C; Abb. 3c, 2,1 h: 2 h bei 37 °C, 5 min bei 60 °C; Abb. 3h, 3 h: 2 h bei 37 °C, 1 h bei 60 °C; Abb. 4c (CwIsrB, DsIsrB und BbIsrB), 6 h bei 37 °C; Abb. 4c (CsIsrB), 6 h: 2 h bei 37 °C, 4 h bei 60 °C; Abb. 4c (K2IsrB) und 2 h bei 37 °C. DtIsrB stammt von einem thermophilen Organismus, D. thermocuniculi, der bei 60–80 °C wächst (Lit. 38). Die Reaktion wurde durch die Zugabe von 3 µg RNase A (Qiagen) und 0,24 Einheiten Proteinase K (NEB) gestoppt. Die Reaktionsprodukte wurden mit einem Wizard SV Gel und PCR Clean-Up System (Promega) gereinigt, auf einem Novex 10 % TBE-Harnstoff-Gel (Invitrogen) aufgelöst und dann mit einem ChemiDoc Imaging System (Bio-Rad) sichtbar gemacht. Um die Proteinstabilität von Deletionsmutanten zu untersuchen, wurden IsrB-Proteine ​​in dem bakteriellen Expressionssystem produziert, das bei der Kryo-EM-Probenvorbereitung verwendet wurde. Die E. coli-Zellen wurden in Puffer A (50 mM Tris-HCl, pH 8,0, 20 mM Imidazol und 1 M NaCl) resuspendiert, durch Ultraschallbehandlung lysiert und anschließend zentrifugiert. Der Überstand wurde mit MagneHis-Perlen (Promega) gemischt. Die proteingebundene Säule wurde mit Puffer A gewaschen. Das Protein wurde mit Puffer B (50 mM Tris-HCl, pH 8,0, 0,3 M Imidazol und 1 M NaCl) eluiert und mittels SDS-PAGE analysiert (Extended Data Abb. 5b). Um die IsrB-DNA-Spaltstellen zu bestimmen, wurde das 816-bp-PCR-Amplikon (400 ng), das die 20-nt-Zielsequenz (GCCTTATTAACCTCAGCCTC) und das TAM enthielt, mit der IsrB-Protein-Matrize (100 ng) und der ωRNA-Matrize (125 ng) inkubiert ) in 25 μl Reaktionspuffer, enthaltend 10 μl Lösung A und 7,5 μl Lösung B des PURExpress In-vitro-Proteinsynthese-Kits. Nach der Reinigung des Reaktionsprodukts wurde das gespaltene Produkt mit Nb.BbvCI (NEB) gespalten. Die gespaltenen Produkte wurden gelextrahiert, gereinigt und durch DNA-Sequenzierung (GENEWIZ) analysiert.

Repräsentative IsrBs mit intakten RuvC-Resten des aktiven katalytischen Zentrums und ohne Anzeichen von Verkürzungen wurden aus den drei Hauptklassen von IsrBs ausgewählt, die in einer früheren Studie identifiziert wurden4, entsprechend IsrBs mit ωRNAs vom Typ G1b, G1c und G1h. Die jedem IsrB entsprechenden ωRNAs wurden den Vorhersagen einer früheren Studie4 entnommen und so modifiziert, dass das Ende der ωRNA am Anfang des IsrB lag. IsrBs wurden dann verworfen, wenn die entsprechende ωRNA-Sekundärstruktur, wie durch mfold bestimmt, nicht die konservierten Stammschleifen und Pseudoknoten (wie manuell identifiziert) enthielt, die in der kovarianzbasierten ωRNA-Sekundärstruktur für den gegebenen ωRNA-Typ gefunden wurden. Die Analyse nominierte die Sequenzen CwIsrB, CsIsrB, DsIsrB, BbIsrB, K2IsrB und die entsprechenden ωRNAs. Kovarianzbasierte Sekundärstruktur- und Pseudoknotenvorhersagen wurden für die entsprechenden ωRNAs ermittelt, wie für die DtRNA beschrieben. Alle ωRNAs wurden dann mit forna39 visualisiert.

Zur Analyse der PLMP-Domäne wurde die DtIsrB-PLMP-Domäne in HHPred nach entfernten Homologen durchsucht und dabei IF-3 als mutmaßliches entferntes Homolog identifiziert. Repräsentative Sequenzen, die IF-3-N-terminale Regionen und PLMP-Domänen aus der IscB/IsrB-Familie enthalten, wurden von UniProt und dem National Center for Biotechnology Information erhalten und mit MAFFT-einsi abgeglichen. Strukturvertreter wurden mithilfe der Pymol-Superfunktion ausgerichtet und überlagert.

Der TAM-Identifizierungstest wurde unter Verwendung einer TAM-Bibliothek durchgeführt, die wie zuvor beschrieben erstellt wurde4. Einzelsträngige DNA-Oligonukleotide (IDT), die acht randomisierte Nukleotide stromabwärts einer 20-nt-Zielsequenz (GCCTTATTAACCTCAGCCTC) enthalten, wurden durch Auffüllen mit PrimeSTAR Max DNA-Polymerase (Takara) in dsDNA umgewandelt und durch Gibson-Klonierung (NEB) in pUC19 kloniert ), um eine TAM-Bibliothek zu generieren. Die Bibliothek (25 ng) wurde unter Verwendung eines In-vitro-Transkriptions-/Translationsexpressionssystems verdaut, das die IsrB-Protein- (50 ng) und ωRNA-Matrizen (125 ng) enthielt, wie im Abschnitt über In-vitro-Spaltungsexperimente beschrieben. Die Reaktionen von CwIsrB, DsIsrB, CsIsrB, BbIsrB und K2IsrB wurden 4 Stunden lang inkubiert: 2 Stunden bei 37 °C, 1 Stunde bei 50 °C und 1 Stunde bei 60 °C. Die Reaktion von DtIsrB wurde 3 Stunden lang inkubiert: 2 Stunden bei 37 °C und 1 Stunde bei 60 °C. Anschließend wurde es durch die Zugabe von 3 µg RNase A (Qiagen) und 0,24 Einheiten Proteinase K (NEB) gestoppt. Die Reaktionsprodukte wurden mit einem Wizard SV Gel und PCR Clean-Up System (Promega) gereinigt und mit Nb.BbvCI (NEB) verdaut. Die gereinigten Reaktionsprodukte wurden einer Endmarkierung und Adapterligation unter Verwendung eines NEBNext Ultra II End Repair/dA-Tailing Module (NEB), eines NEBNext Ultra II DNA Library Prep Kit für Illumina (NEB) und eines NEBNext Adapter for Illumina (NEB) unterzogen. . Die mit dem USER-Enzym (NEB) verdaute und gereinigte DNA wurde mit einer 12-Zyklen-PCR unter Verwendung eines für das TAM-Bibliotheksrückgrat spezifischen Primers und eines für den NEBNext-Adapter spezifischen Primers und mit einer anschließenden 18-Zyklen-PCR zum Hinzufügen des Illumina i5 amplifiziert Adapter. Um die Verteilung der degenerierten 8N-Flankierungssequenzen zu normalisieren, wurde das Bibliotheksplasmid mit einer 12-Zyklen-PCR unter Verwendung von für das Bibliotheksrückgrat spezifischen Primern und mit einer anschließenden 18-Zyklen-PCR amplifiziert, um den Illumina i5-Adapter hinzuzufügen. Die amplifizierten Bibliotheken wurden auf 2 % Agarose-E-Gelen (Invitrogen) isoliert und auf einem MiSeq-Sequenzierer (Illumina) sequenziert. Die resultierenden Sequenzdaten wurden analysiert, indem die sechs Nukleotid-TAM-Regionen extrahiert, die einzelnen TAMs gezählt und die TAM auf die Gesamtablesungen für jede Probe normalisiert wurden. Sequenzmotive wurden unter Verwendung der ausgewählten TAMs in der Fraktion mit der höchsten Punktzahl mit dem benutzerdefinierten Python-Skript generiert, das in unserem vorherigen Bericht verwendet wurde4.

Weitere Informationen zum Forschungsdesign finden Sie in der mit diesem Artikel verlinkten Nature Research Reporting Summary.

Die Atomkoordinaten der ternären IsrB-Struktur wurden bei der Protein Data Bank (PDB) unter http://www.pdb.org (PDB 8DMB) hinterlegt. Die dreidimensionalen Kryo-EM-Rekonstruktionen von Komplex A und Komplex B wurden bei der Electron Microscopy Data Bank hinterlegt (Komplex A EMD27533; Komplex B EMD26723).

Zhang, F. Entwicklung von CRISPR-Cas-Systemen für die Genombearbeitung und darüber hinaus. Q. Rev. Biophys. 52, e6–e6 (2019).

Artikel ADS Google Scholar

Doudna, JA Das Versprechen und die Herausforderung der therapeutischen Genombearbeitung. Natur 578, 229–236 (2020).

Artikel ADS CAS Google Scholar

Nishimasu, H. & Nureki, O. Strukturen und Mechanismen von CRISPR-RNA-gesteuerten Effektornukleasen. Curr. Meinung. Struktur. Biol. 43, 68–78 (2017).

Artikel CAS Google Scholar

Altae-Tran, H. et al. Die weit verbreitete IS200/IS605-Transposonfamilie kodiert verschiedene programmierbare RNA-gesteuerte Endonukleasen. Wissenschaft 374, 57–65 (2021).

Artikel ADS CAS Google Scholar

Kapitonov, VV, Makarova, KS & Koonin, EV ISC, eine neuartige Gruppe bakterieller und archaischer DNA-Transposons, die Cas9-Homologe kodieren. J. Bakteriol. 198, 797–807 (2015).

Artikel Google Scholar

Afonine, PV et al. Realraumverfeinerung in PHENIX für Kryo-EM und Kristallographie. Acta Crystallogr. Sekte. D., Struktur. Biol. 74, 531–544 (2018).

Artikel CAS Google Scholar

Croll, TI ISOLDE: eine physikalisch realistische Umgebung für den Modellaufbau in niedrigaufgelösten Elektronendichtekarten. Acta Crystallogr. Sekte. D., Struktur. Biol. 74, 519–530 (2018).

Artikel CAS Google Scholar

Kappel, K. et al. Beschleunigte kryo-EM-gesteuerte Bestimmung dreidimensionaler reiner RNA-Strukturen. Nat. Methoden 17, 699–707 (2020).

Artikel CAS Google Scholar

Briner, AE et al. Leitende RNA-Funktionsmodule steuern die Aktivität und Orthogonalität von Cas9. Mol. Zelle 56, 333–339 (2014).

Artikel CAS Google Scholar

Er, S. et al. Die IS200/IS605-Familie und der „Peel and Paste“-Einzelstrang-Transpositionsmechanismus. Mikrobiologie-Spektr. https://doi.org/10.1128/microbiolspec.MDNA3-0039-2014 (2015).

Juneau, K., Podell, E., Harrington, DJ & Cech, TR Strukturelle Grundlagen der erhöhten Stabilität einer mutierten Ribozymdomäne und eine detaillierte Ansicht der RNA-Lösungsmittel-Wechselwirkungen. Struktur 9, 221–231 (2001).

Artikel CAS Google Scholar

Jiang, F., Zhou, K., Ma, L., Gressel, S. & Doudna, JA Ein Cas9-Guide-RNA-Komplex, präorganisiert für die Ziel-DNA-Erkennung. Wissenschaft 348, 1477–1481.

Artikel ADS CAS Google Scholar

Hirano, S., Nishimasu, H., Ishitani, R. & Nureki, O. Strukturelle Basis für die veränderten PAM-Spezifitäten von manipuliertem CRISPR-Cas9. Mol. Zelle 61, 886–894 (2016).

Artikel CAS Google Scholar

Kleinstiver, BP et al. Konstruierte CRISPR-Cas9-Nukleasen mit veränderten PAM-Spezifitäten. Natur 523, 481–485 (2015).

Artikel ADS Google Scholar

Ran, FA et al. In-vivo-Genombearbeitung mit Staphylococcus aureus Cas9. Natur 520, 186–191 (2015).

Artikel ADS CAS Google Scholar

Bravo, JPK et al. Strukturelle Grundlage für die Mismatch-Überwachung durch CRISPR-Cas9. Natur 603, 343–347 (2022).

Artikel ADS CAS Google Scholar

Schuler, G., Hu, C. & Ke, A. Strukturelle Basis für die RNA-gesteuerte DNA-Spaltung durch IscB-ωRNA und mechanistischer Vergleich mit Cas9. Science 376, 1476–1481 (2022).

Artikel ADS CAS Google Scholar

Yamada, M. et al. Die Kristallstruktur des minimalen Cas9 aus Campylobacter jejuni zeigt die molekulare Vielfalt in den CRISPR-Cas9-Systemen. Mol. Zelle 65, 1109–1121.e3 (2017).

Artikel CAS Google Scholar

Chen, JS et al. Verbessertes Korrekturlesen regelt die CRISPR-Cas9-Targeting-Genauigkeit. Natur 550, 407–410 (2017).

Artikel ADS CAS Google Scholar

Sternberg, SH, LaFrance, B., Kaplan, M. & Doudna, JA Konformationskontrolle der DNA-Zielspaltung durch CRISPR-Cas9. Natur 527, 110–113 (2015).

Artikel ADS CAS Google Scholar

Pacesa, M. et al. R-Loop-Bildung und Konformationsaktivierungsmechanismen von Cas9. Natur 609, 191–196 (2022).

Haack, DB et al. Kryo-EM-Strukturen eines Gruppe-II-Introns, das sich rückwärts in DNA spleißt. Zelle 178, 612–623.e12 (2019).

Artikel CAS Google Scholar

Reiter, NJ et al. Struktur eines bakteriellen Ribonuklease-P-Holoenzyms im Komplex mit tRNA. Natur 468, 784–789 (2010).

Artikel ADS CAS Google Scholar

Su, Z. et al. Kryo-EM-Strukturen von Tetrahymena-Ribozym voller Länge bei 3,1 Å Auflösung. Natur 596, 603–607 (2021).

Artikel ADS CAS Google Scholar

Weinberg, Z., Perreault, J., Meyer, MM & Breaker, RR Außergewöhnlich strukturierte nichtkodierende RNAs, entdeckt durch bakterielle Metagenomanalyse. Natur 462, 656–659 (2009).

Artikel ADS CAS Google Scholar

Kimanius, D., Dong, L., Sharov, G., Nakane, T. & Scheres, SHW Neue Tools für die automatisierte Kryo-EM-Einzelpartikelanalyse in RELION-4.0. Biochem. J 478, 4169–4185 (2021).

Artikel CAS Google Scholar

Zheng, SQ et al. MotionCor2: Anisotrope Korrektur der strahlinduzierten Bewegung für eine verbesserte Kryo-Elektronenmikroskopie. Nat. Methoden 14, 331–332 (2017).

Artikel CAS Google Scholar

Rohou, A. & Grigorieff, N. CTFFIND4: schnelle und genaue Defokusschätzung aus elektronenmikroskopischen Aufnahmen. J. Struktur. Biol. 192, 216–221 (2015).

Artikel Google Scholar

Bepler, T. et al. Positiv-unmarkierte Faltungs-Neuronale Netze zur Partikelauswahl in Kryo-Elektronenmikroskopaufnahmen. Nat. Methoden 16, 1153–1160 (2019).

Artikel CAS Google Scholar

Punjani, A., Rubinstein, JL, Fleet, DJ & Brubaker, MA cryoSPARC: Algorithmen für die schnelle unbeaufsichtigte Kryo-EM-Strukturbestimmung. Nat. Methoden 14, 290–296 (2017).

Artikel CAS Google Scholar

Jumper, J. et al. Hochpräzise Vorhersage der Proteinstruktur mit AlphaFold. Natur 596, 583–589 (2021).

Artikel ADS CAS Google Scholar

Mirdita, M., et al. ColabFold: Proteinfaltung für alle zugänglich machen. Nat. Methoden 19, 679–682 (2022).

Emsley, P., Lohkamp, ​​B., Scott, WG & Cowtan, K. Merkmale und Entwicklung von Blässhuhn. Acta Crystallogr. D., Biol. Kristalllogr. 66, 486–501 (2010).

Artikel CAS Google Scholar

Nawrocki, EP & Eddy, SR Infernal 1.1: 100-fach schnellere Suche nach RNA-Homologien. Bioinformatik 29, 2933–2935 (2013).

Artikel CAS Google Scholar

Zuker, M. Mfold-Webserver für die Faltung und Hybridisierungsvorhersage von Nukleinsäuren. Nukleinsäuren Res. 31, 3406–3415 (2003).

Artikel CAS Google Scholar

Williams, CJ et al. MolProbity: mehr und bessere Referenzdaten für eine verbesserte Validierung der Gesamtatomstruktur. Proteinwissenschaft. 27, 293–315 (2018).

Artikel CAS Google Scholar

Pintilie, G. et al. Messung der Atomlösbarkeit in Kryo-EM-Karten mit Q-Scores. Nat. Methoden 17, 328–334 (2020).

Artikel CAS Google Scholar

Kaksonen, AH, Spring, S., Schumann, P., Kroppenstedt, RM & Puhakka, JA Desulfovirgula thermocuniculi gen. Nov., sp. nov., ein thermophiles Sulfatreduzierungsmittel, das aus einem geothermischen Untertagebergwerk in Japan isoliert wurde. Int. J. Syst. Entwicklung Mikrobiol. 57, 98–102 (2007).

Artikel CAS Google Scholar

Kerpedjiev, P., Hammer, S. & Hofacker, IL Forna (kraftgesteuerte RNA): einfache und effektive Online-RNA-Sekundärstrukturdiagramme. Bioinformatik 31, 3377–3379 (2015).

Artikel CAS Google Scholar

Referenzen herunterladen

Wir danken E. Brignole, C. Borsa, X. Zhao und S. Yang für ihre Unterstützung bei der Vorbereitung des Kryo-EM-Gitters und der Datenerfassung. Die Proben wurden in der Cryogenic-Electron Microscopy Facility am MIT.nano vorbereitet und abgebildet, die teilweise mit finanzieller Unterstützung der Arnold and Mabel Beckman Foundation eingerichtet wurde. Wir danken allen Mitgliedern des Zhang-Labors für hilfreiche Diskussionen und Unterstützung. SH wird durch ein JSPS Overseas Research Fellowship unterstützt. KK wird von den Schmidt Science Fellows in Zusammenarbeit mit dem Rhodes Trust und dem HHMI Hanna H. Gray Fellows Program unterstützt. FZ wird von den National Institutes of Health unterstützt (Zuschussnummern 1DP1-HL141201 und 2R01HG009761-05); das Howard Hughes Medical Institute; das Poitras Center for Psychiatric Disorders Research am MIT; das Hock E. Tan und K. Lisa Yang Center for Autism Research am MIT; das Yang-Tan Molecular Therapeutics Center in McGovern, die BT Charitable Foundation und von der Familie Phillips sowie J. und P. Poitras.

Die folgenden Autoren haben gleichermaßen beigetragen: Seiichi Hirano, Kalli Kappel

Broad Institute of MIT und Harvard, Cambridge, MA, USA

Seiichi Hirano, Kalli Kappel, Han Altae-Tran, William Faure, Max E. Wilkinson, Soumya Kannan, F. Ezra Demircioglu, Rhiannon K. Macrae und Feng Zhang

McGovern Institute for Brain Research am MIT, Cambridge, MA, USA

Seiichi Hirano, Kalli Kappel, Han Altae-Tran, William Faure, Max E. Wilkinson, Soumya Kannan, F. Ezra Demircioglu, Rhiannon K. Macrae und Feng Zhang

Abteilung für Gehirn- und Kognitionswissenschaft, Massachusetts Institute of Technology, Cambridge, MA, USA

Seiichi Hirano, Kalli Kappel, Han Altae-Tran, William Faure, Max E. Wilkinson, Soumya Kannan, F. Ezra Demircioglu, Rhiannon K. Macrae und Feng Zhang

Abteilung für Biotechnik, Massachusetts Institute of Technology, Cambridge, MA, USA

Seiichi Hirano, Kalli Kappel, Han Altae-Tran, William Faure, Max E. Wilkinson, Soumya Kannan, F. Ezra Demircioglu, Rhiannon K. Macrae und Feng Zhang

Howard Hughes Medical Institute, Cambridge, MA, USA

Seiichi Hirano, Kalli Kappel, Han Altae-Tran, William Faure, Max E. Wilkinson, Soumya Kannan, F. Ezra Demircioglu, Rhiannon K. Macrae und Feng Zhang

Gemeinsame CryoEM-Ressourcen, Howard Hughes Medical Institute, Janelia Research Campus, Ashburn, VA, USA

Rui Yan, Momoko Shiozaki und Zhiheng Yu

National Center for Biotechnology Information, National Library of Medicine, National Institutes of Health, Bethesda, MD, USA

Kira S. Makarova und Eugene V. Koonin

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

Sie können diesen Autor auch in PubMed Google Scholar suchen

SH und FZ haben das Projekt konzipiert. SH, KK, GF, HA-T., MEW, SK, FED und KSM haben Experimente entworfen, durchgeführt und die Ergebnisse analysiert. RY, MS und ZY führten eine Datenerfassung durch. FZ überwachte die Forschung und das experimentelle Design mit Unterstützung von RKMSH, RKM, EVK und verfasste das Manuskript unter Mitwirkung aller Autoren.

Korrespondenz mit Feng Zhang.

FZ ist wissenschaftlicher Berater und Mitbegründer von Editas Medicine, Beam Therapeutics, Pairwise Plants, Arbor Biotechnologies und Proof Diagnostics.

Nature dankt Malcolm White, David Taylor und den anderen, anonymen Gutachtern für ihren Beitrag zum Peer-Review dieser Arbeit. Peer-Reviewer-Berichte sind verfügbar.

Anmerkung des Herausgebers Springer Nature bleibt hinsichtlich der Zuständigkeitsansprüche in veröffentlichten Karten und institutionellen Zugehörigkeiten neutral.

(a) Kryo-EM-Datenverarbeitungsschema für die Einzelpartikelanalyse des Komplexes A. Ungeschärfte (links) und geschärfte (rechts) Karten in der endgültigen 3D-Verfeinerung. Partikelorientierungsverteilung (Mitte). (b) Endgültige verfeinerte Karte, gefärbt nach lokaler Auflösung, berechnet in RELION-4.0 mit einem FSC-Schwellenwert von 0,5. (c) FSC-Kurven berechnet zwischen den Halbkarten von Komplex A aus der letzten Runde der Verfeinerung in RELION-4.0. (d) FSC-Kurven, die zwischen dem Modell und der endgültigen verfeinerten Karte unter Verwendung von phenix.validation_cryoem berechnet wurden. (e) Q-Scores für jeden Rest des IsrB-ωRNA-Zielstrang-DNA-Nicht-Zielstrang-DNA-Modells in einer 3,1 Å-Karte des IsrB-ωRNA-DNA-Komplexes. Die gestrichelten schwarzen und grauen Linien im Diagramm stellen die erwarteten Q-Scores basierend auf der globalen Kartenauflösung (3,1 Å) bzw. der lokalen Kartenauflösung (4,5 Å) dar. Die Q-Scores für die RNA- und DNA-Reste stimmen mit den erwarteten Werten basierend auf der lokalen Kartenauflösung überein.

Kryo-EM-Dichtekarten für in den Hauptabbildungen dargestellte Rückstände.

(a) Nahaufnahme der IsrB-Proteinstruktur. (b) Strukturvergleich zwischen DNA-gebundener IsrB-TI-Domäne und SpCas9-PI-Domäne (PDB: 7S4X). In der Cas9-Struktur ist die zwischen β6 und β7 eingefügte Subdomäne der Übersichtlichkeit halber weggelassen.

(a) Die fünf besten Treffer der HHPred-Suche unter Verwendung der Startsequenz SITRVPVVGVDGRPLMPTTPRKARLLIRDGLAVPRRNKLGLFYIQMLRPVGTRTQ, die der PLMP-Domäne von DtIsrB entspricht. (b) Strukturvergleich der PLMP-Domäne von DtIsrB und der N-terminalen Domäne des Translation Initiation Factor 3 (IF-3) von Geobacillus stearothermophilus (PDB: 1TIF). (c) Ausrichtung repräsentativer IF-3-N-terminaler Domänen und OMEGA-bezogener PLMP-Domänen.

(a) Denaturierte PAGE-Gele zur Auflösung geknickter DNA-Produkte. (b) Ein SDS-PAGE-Gel zur Expressionsprüfung der Deletionsmutanten. Bezogen auf Abb. 3c.

(a) Spaltstellen in der Ziel-DNA als Assay durch Sanger-Sequenzierung. Die Einkerbungsstellen sind durch schwarze Dreiecke gekennzeichnet. Das zusätzliche, nicht templatierte Adenin ist in der Sanger-Sequenzierungsspur mit einem Sternchen gekennzeichnet. (b) Domänenstruktur des λN-IsrB-Fusionsproteins (links) und schematische Darstellung der ωRNA-Mutante und der Ziel-DNA (rechts). In der ωRNA-Mutante wurden die Reste 34–67 durch GAAA ersetzt und boxB-RNA wurde an das 3′-Ende des ωRNA-Gerüsts angehängt. (c) Kryo-EM-Datenverarbeitungsschema für die Einzelpartikelanalyse von Komplex B (links). Endgültige verfeinerte Karte (rechts). (d) FSC-Kurven, berechnet zwischen den Halbkarten von Komplex B aus der letzten Runde der Verfeinerung in cryoSPARC v3.3. (e) Kryo-EM-Dichtekarte von Komplex B. Basierend auf der Überlagerung der Karte von Komplex B und des Modells von Komplex A wurden Regionen von Protein, RNA und DNA zugeordnet. In der Nähe der ωRNA-SL8-Region wurde eine zusätzliche Dichte beobachtet und dem λN-boxB-Komplex zugeordnet, was mit der SL8-boxB-Konnektivität und dem λN-boxB-Volumen übereinstimmt (PDB: 1QFQ). TS, Zielstrang; NTS, Nichtzielstrang. (f und g) Kryo-EM-Dichtekarten von Komplex A (f) und SpCas9 im Komplex mit seiner zugehörigen RNA und Ziel-DNA (EMD: 24838) (g).

(a) Sekundärstruktur und Pseudoknotenvorhersage der ωRNA-Gerüste basierend auf dem Kovarianzmodell. In CwIsrB/DsIsrB/BbIsrB-ωRNAs werden SL3-Motive durch ungepaarte Nukleotide ersetzt. In CsIsrB/K2IsrB/BbIsrB-ωRNAs sind SL6-Motive degeneriert und SL8-Motive durch ungepaarte Nukleotide ersetzt. (b) Überlagerung von AlphaFold (AF)- und Kryo-EM (EM)-Strukturen von DtIsrB. (c) Überlagerung von AlphaFold-Strukturen von sechs IsrB-Orthologen. CwIsrB/DsIsrB weisen β-Haarnadel- und Schleifeninsertionen in der RuvC-Domäne bzw. RECL auf.

Struktureller Vergleich zwischen DtIsrB, OgeuIscB (8CSZ), YnpsCas9-1 (AF2-Modell) und SpCas9 (PDB: 4OO8).

Struktureller Vergleich zwischen verwandten RNAs von DtIsrB, OgeuIscB (8CSZ), CjCas9 (5X2G) und SpCas9 (7S4X) in ihren Protein-/DNA-gebundenen Zuständen. Gesamtstrukturen (links). RNA-Strukturen (Mitte). Schematische RNA-Diagramme (rechts).

Schematische Darstellung der mechanistischen Ähnlichkeiten und Unterschiede zwischen IsrB und Cas9.

Open Access Dieser Artikel ist unter einer Creative Commons Attribution 4.0 International License lizenziert, die die Nutzung, Weitergabe, Anpassung, Verbreitung und Reproduktion in jedem Medium oder Format erlaubt, sofern Sie den/die ursprünglichen Autor(en) und die Quelle angemessen angeben. Geben Sie einen Link zur Creative Commons-Lizenz an und geben Sie an, ob Änderungen vorgenommen wurden. Die Bilder oder anderes Material Dritter in diesem Artikel sind in der Creative Commons-Lizenz des Artikels enthalten, sofern in der Quellenangabe für das Material nichts anderes angegeben ist. Wenn Material nicht in der Creative-Commons-Lizenz des Artikels enthalten ist und Ihre beabsichtigte Nutzung nicht durch gesetzliche Vorschriften zulässig ist oder über die zulässige Nutzung hinausgeht, müssen Sie die Genehmigung direkt vom Urheberrechtsinhaber einholen. Um eine Kopie dieser Lizenz anzuzeigen, besuchen Sie http://creativecommons.org/licenses/by/4.0/.

Nachdrucke und Genehmigungen

Hirano, S., Kappel, K., Altae-Tran, H. et al. Struktur der Omega-Nickase IsrB im Komplex mit ωRNA und Ziel-DNA. Natur 610, 575–581 (2022). https://doi.org/10.1038/s41586-022-05324-6

Zitat herunterladen

Eingegangen: 20. April 2022

Angenommen: 06. September 2022

Veröffentlicht: 12. Oktober 2022

Ausgabedatum: 20. Oktober 2022

DOI: https://doi.org/10.1038/s41586-022-05324-6

Jeder, mit dem Sie den folgenden Link teilen, kann diesen Inhalt lesen:

Leider ist für diesen Artikel derzeit kein Link zum Teilen verfügbar.

Bereitgestellt von der Content-Sharing-Initiative Springer Nature SharedIt

Natur (2023)

Durch das Absenden eines Kommentars erklären Sie sich damit einverstanden, unsere Nutzungsbedingungen und Community-Richtlinien einzuhalten. Wenn Sie etwas als missbräuchlich empfinden oder etwas nicht unseren Bedingungen oder Richtlinien entspricht, kennzeichnen Sie es bitte als unangemessen.