Посещений:
НУКЛЕАЗА Cas9



Формирование R-петли и конформационная активация

R-loop formation and conformational activation mechanisms of Cas9
• Martin Pacesa, • Luuk Loeff, • Irma Querques, et al.
Nature volume 609, pages191–196 (2022)

Cas9 is a CRISPR-associated endonuclease capable of RNA-guided, site-specific DNA cleavage1,2,3. The programmable activity of Cas9 has been widely utilized for genome editing applications4,5,6, yet its precise mechanisms of target DNA binding and off-target discrimination remain incompletely understood. Here we report a series of cryo-electron microscopy structures of Streptococcus pyogenes Cas9 capturing the directional process of target DNA hybridization. In the early phase of R-loop formation, the Cas9 REC2 and REC3 domains form a positively charged cleft that accommodates the distal end of the target DNA duplex. Guide-target hybridization past the seed region induces rearrangements of the REC2 and REC3 domains and relocation of the HNH nuclease domain to assume a catalytically incompetent checkpoint conformation. Completion of the guide-target heteroduplex triggers conformational activation of the HNH nuclease domain, enabled by distortion of the guide-target heteroduplex, and complementary REC2 and REC3 domain rearrangements. Together, these results establish a structural framework for target DNA-dependent activation of Cas9 that sheds light on its conformational checkpoint mechanism and may facilitate the development of novel Cas9 variants and guide RNA designs with enhanced specificity and activity.

Ферменты Cas9 полагаются на двойную структуру направляющей РНК, состоящую из направляющей CRISPR РНК (crRNA) и транс-активирующего коактиватора CRISPR РНК (tracrRNA) для расщепления комплементарных ДНК-мишеней. S. pyogenes Cas9 (SpCas9) нашла широкое применение в качестве программируемого инструмента для ДНК-мишени в редактировании генома и в приложениях по нацеливанию генов4-6. Связывание ДНК мишени SpCas9 зависит от первоначального распознавания NGG protospacer-adjacent motif (PAM) ниже по течению от сайта мишени2,7-9, которое запускает локальное разделение нитей ДНК для ее направленной гибридизации с 20-нтным сегментом в направляющей crRNA для формирования структуры R-петли7,10,11. Связывание Target strand (TS) облегчается структурной предварительной упорядоченностью нуклеотидов 11-20 crRNA (считая с 5'-го конца), называемой seed-последовательностью, в подобной А-форме, конформации8,12. Формирование полной R-петли приводит к активации нуклеазных доменов Cas9 HNH и RuvC для каталитического расщепления TS и нецелевой нити ДНК (NTS), соответственно2,8,13. Несмотря на высокую специфичность, SpCas9 расщепляет и вне-целевые участки с несовершенной комплементарностью к направляющей РНК, что часто приводит к значительному уровню нецелевого редактирования генома14-18. Вне-целевая активность зависит от количества, типа и расположения несоответствий оснований в гетеродуплексе направляющая РНК-мишень ДНК15,19-21. PAM-проксимальные несоответствия в области seed дискриминируются непосредственно увеличенной скоростью диссоциации11,19,21,22, тогда как PAM-дистальные несоответствия совместимы со стабильным связыванием ДНК13,19,21,23,24. Такие нецелевые последовательности вместо этого дискриминируются механизмом конформационного контроля, который следит за целостностью дуплекса направляющая РНК-цель, чтобы вызвать конформационную активацию доменов нуклеазы11,13,19,21-24. Структурные, биофизические и вычислительные исследования SpCas9 пролили свет на механизм связывания направляющей РНК, распознавания PAM и активации нуклеазы, показав, что фермент претерпевает обширные конформационные перестройки на всех этих этапах. В частности, структуры высокого разрешения полностью связанного с целевой ДНК комплекса SpCas925-28 выявили зависящую от ДНК-мишени конформационную перестройку REC-доли Cas9, необходимую для активации расщепления. Однако механизмы, лежащие в основе формирования R-петли и дискриминации вне мишени во время конформационной активации, остаются неустановленными.
Cryo-EM analysis of R-loop formation


Для изучения механизма образования R-петли мы сначала определили минимальную степень комплементарности ДНК мишени, необходимую для стабильного связывания, с помощью флуоресцентно-связанной размерно-эксклюзионной хроматографии, показав, что наличие шести комплементарных нуклеотидов в PAM-проксимальной области гетеродуплекса целевой ДНК мишени достаточно для стабильной ассоциации с комплексом SpCas9-guide RNA. (Расширенные данные, рис. 1). Затем каталитически неактивный SpCas9 (dCas9) был воссоздан с single-molecule guide RNA (sgRNA) и частично подобранными ДНК-мишенями, содержащими 6, 8, 10, 12, 14 и 16 комплементарных нуклеотидов вверх по течению от PAM (рис. 1a и расширенные данные рис. 2). Мы проанализировали полученные комплексы с помощью криоэлектронной микроскопии (крио-ЭМ), получив молекулярные реконструкции с разрешением 3,0-4,1 Å (расширенные данные рис. 3 и расширенные данные табл. 1 и 2). Мы дополнительно определили крио-ЭМ реконструкцию SpCas9 дикого типа, связанной с 18-нтными комплементарными ДНК-мишенями в присутствии 1 mМ и 10 mМ Mg2+, представляющих контрольную точку и каталитически активное состояние, соответственно (расширенные данные рис. 3 и расширенная таблица 2). Для анализа конформационной гетерогенности внутри каждого комплекса был использован анализ трехмерной изменчивости29 (Дополнительные видео 1-8). Большая часть обнаруженной изменчивости внутри каждого комплекса может быть отнесена к PAM-дистальному дуплексу и доменам REC2, REC3 и HNH, что указывает на выборку конформационного равновесия. Полученные структурные модели представляют наиболее распространенное конформационное состояние каждого комплекса (Расширенные данные, рис. 4).



Fig. 1: Target DNA binding induces Cas9 REC lobe restructuring.

a, Top, schematic depicting DNA-bound complexes with increasing extent of complementarity to guide RNA. Bottom, domain composition of SpCas9. 1-A, REC1-A domain; I-III, RuvC domain motifs I-III; BH, bridge helix. b, Structural comparison of the SpCas9 binary (left), 6-nt match (middle) and 8-nt match (right) complexes. c, Zoomed-in view of the seed region of the guide RNA-target DNA heteroduplex in the 6-nt match complex. Tyr450 stacks between the fifth and sixth nucleotide, counting from the PAM-proximal end of the heteroduplex. d, Zoomed-in view of the seed region of the guide RNA-target DNA heteroduplex in the 8-nt match complex. e, Fitted cleavage rate (kobs) of wild-type (WT) and Y450A mutant Cas9 against on-target and off-target substrates.


Структурные суперпозиции частично совпадающих комплексов с бинарным комплексом SpCas9, связанным с направляющей РНК12 , обеспечивают основу для визуализации механизма связывания ДНК, выявляя поэтапные перестройки доменов, связанные с образованием R-петли (расширенные данные рис. 5а). Все комплексы демонстрируют практически идентичные конформации спирали-моста, доменов REC1, RuvC и PAM-взаимодействия, а также PAM-проксимального дуплекса двухцепочечной ДНК (dsDNA) и sgRNA ниже по течению (3' конец) seed области. Конформационные различия наблюдаются в расположении доменов REC2, REC3 и HNH относительно формирующейся R-петли, что согласуется с результатами анализа 3D-вариаций.
R-loop initiation by bipartite seed


Структура 6-нуклеотидного комплементарного комплекса мишени (6-nt match) выявляет в 5-bp гетеродуплекс, образованный seed последовательностью sgRNA и ДНК TS (рис. 1б). Гибридизация за пятым нуклеотидом стартовой последовательности исключена из-за сцепления оснований с боковой цепью Tyr450, что ранее наблюдалось в структуре бинарного комплекса Cas9-sgRNA12 (рис. 1c). Сравнение со структурой бинарного комплекса показывает, что гибридизация TS связана со смещением домена REC2 из центрального канала связывания (рис. 1б). PAM-дистальная дуплексная часть ДНК-субстрата связывается в положительно заряженной щели, образованной доменами REC2 и REC3 (рис. 1б и расширенные данные рис. 5б), стабилизированной взаимодействием остатков REC2 Ser219, Thr249 и Lys263 с основой NTS (расширенные данные рис. 5в), и остатков REC3 Arg586 и Thr657 с основой TS (расширенные данные рис. 5г). Подобная конформация части REC и контакты белка с PAM-дистальным концом ДНК наблюдались в гетеродуплексном комплексе из 3 п.н., описанном в недавнем исследовании30. Следовательно, NTS располагается параллельно гетеродуплексу направляющей РНК-TS ДНК в пределах центрального канала связывания (рис. 1b). 5'-концевая часть sgRNA кажется конформационно гибкой, но остаточная плотность крио-ЭМ позволяет предположить ее размещение в положительно заряженной щели, расположенной между HNH и PAM-взаимодействия доменами (расширенные данные рис. 5e).
Структура 8-нуклеотидного комплементарного целевого комплекса (8-nt match) показывает, что расширение гетеродуплекса R-петли, которое происходит за счет расцепления Tyr450, заставляет домены REC2 и REC3 изменить позицию для расширения тракта (channel ) связывания, поскольку PAM-дистальный дуплекс смещается глубже внутрь тракта (рис. 1d и 2a-c и расширенные данные рис. 5f). Распространение R-петли и смещение PAM-дистального дуплекса приводит к образованию новых межмолекулярных контактов, при этом Cas9 связывается с PAM-дистальной дуплексной основой через остатки Ser217, Lys234 и Lys253 домена REC2 и остатки Arg557 и Arg654 домена REC3 (расширенные данные рис. 5g,h).



Fig. 2: R-loop propagation drives DNA repositioning within Cas9.

a, Zoomed-in views of the conformational transitions in the PAM-distal DNA duplex and Cas9 REC2 and REC3 domains in the 6-, 8- and 10-nt match complex. b, Zoomed-in view of the R-loop in the 6-nt match complex. c, Zoomed-in view of the R-loop in the 8-nt match complex. d, Zoomed-in view of the R-loop in the 10-nt match complex. e, Zoomed-in view of the interaction between the REC2 domain DDD helix and the REC3 RRR helix.


В совокупности эти наблюдения позволяют предположить, что стартовая последовательность направляющей РНК Cas9 является двунитевой и что ее гибридизация с целевой ДНК происходит в два этапа, что согласуется с существованием короткоживущего промежуточного состояния, наблюдаемого в исследованиях FRET11,31. Чтобы подтвердить наблюдаемые взаимодействия, мы проверили активность расщепления мутантных белков Cas9 in vitro (расширенные данные, рис. 6a). Замена аланина на Tyr450 привела к существенному снижению скорости расщепления субстрата вне мишени, в то время как расщепление в мишени осталось практически без изменений (рис. 1e и расширенные данные рис. 6b). Как было отмечено ранее32 , этот эффект был более заметен для субстратов вне мишени, содержащих несоответствия с затравочной областью направляющей РНК, по сравнению с субстратами вне мишени, содержащими только PAM-дистальные несоответствия. В совокупности эти результаты позволяют предположить, что нарушение взаимодействия seed последовательности в бинарном комплексе Cas9-sgRNA и ранних промежуточных продуктов связывания может усугублять дестабилизацию R-петли, вызванную несовпадением с мишенью, что приводит к увеличению скорости диссоциации субстрата вне мишени и, таким образом, к повышению специфичности. Напротив, подмножество мутаций ДНК-взаимодействующих остатков REC2 или REC3 приводило к увеличению внецелевого расщепления, как и удаление домена REC2 (расширенные данные рис. 6b-e), что согласуется с результатами одномолекулярных исследований, указывающих на участие домена REC2 в обеспечении специфичности Cas931. В совокупности эти результаты подчеркивают важность специфических контактов Cas9 с ДНК на ранних этапах формирования R-петли для специфичности Cas9.
R-loop propagation and remodelling


Дальнейшая гибридизация направляющей РНК и TS с образованием гетеродуплекса длиной 10 п.н. вызывает перестройку доменов REC2 и REC3 и перемещение PAM-дистального дуплекса ДНК в положительно заряженный центральный связывающий тракт, образованный доменами REC3, RuvC и HNH (рис. 2a). Здесь PAM-дистальный дуплекс dsDNA образует непрерывный базовый стек с гетеродуплексом sgRNA-TS (рис. 2d). Смещенный NTS располагается под доменом HNH и продолжает идти параллельно удлиняющемуся гетеродуплексу направляющей РНК-TS ДНК (расширенные данные рис. 7a). Рентгеновский кристаллографический анализ 10-нтного комплекса с разрешением 2,8 Å (Таблица 3 расширенных данных) подтвердил, что TS и NTS остаются гибридизированными на PAM-дистальном конце ДНК-субстрата (рис. 7b расширенных данных). PAM-дистальный дуплекс зажат между доменами REC3 и RuvC и линкером L1 HNH (рис. 2d и расширенные данные рис. 7a,b). Перемещение PAM-дистального дуплекса приводит к тому, что домен REC2 смещается ближе к тракту связывания и закрывает сайт расщепления в TS ДНК (рис. 2d). Этот сдвиг также устанавливает новые электростатические взаимодействия между отрицательно заряженной спиралью в REC2 (Glu260, Asp261, Asp269, Asp272, Asp273, Asp274 и Asp276) и положительно заряженной спиралью в REC3 (Lys599, Arg629, Lys646, Lys649, Lys652, Arg653, Arg654 и Arg655), далее называемые DDD и RRR спиралями, соответственно (рис. 2e). 2e), которые высоко консервативны у всех ортологов Cas9, содержащих домен REC2 (расширенные данные, рис. 7c). Расщепление внецелевых субстратов in vitro уменьшалось при замене аланина взаимодействующих остатков в спирали DDD домена REC2, тогда как мутации в спирали REC3 RRR уменьшали расщепление только вне-целевого субстрата, содержащего несоответствие в области seed (расширенные данные рис. 6d,e). Эти результаты позволяют предположить, что взаимодействие REC2-REC3 способствует перестройке Cas9 во время удлинения R-петли, однако спирали DDD и RRR могут иметь дополнительные структурные роли на этапах выше и ниже по течению в механизме связывания ДНК, в частности, поскольку спираль REC3 RRR контактирует с основой PAM-дистального ДНК-дуплекса на ранних стадиях связывания мишени (расширенные данные рис. 5d,h).
Домен нуклеазы HNH остается прикрепленным к доменам RuvC и PI в 6-, 8- и 10-нт комплексах, при этом активный сайт находится на междоменном интерфейсе (рис. 3a). Удлинение R-петли за пределы затравочной области для формирования 12-п.н. гетеродуплекса не приводит к значительным перестройкам домена REC2/3, при этом PAM-дистальный дуплекс остается коаксиально уложенным на гетеродуплекс из направляющей РНК и ТС ДНК в 12-, 14-, 16- и 18-нт комплексах (рис. 3б). В отличие от этого, домен HNH становится неупорядоченным вместе с окружающими петлями RuvC 1011-1040 и PI 1245-1251 в 12-нтном комплексе (рис. 3c). При удлинении гетеродуплекса R-петли до 14 п.н. петли RuvC и PI, ответственные за стыковку HNH, остаются структурно неупорядоченными (рис. 3c и расширенные данные рис. 8a), а для домена HNH наблюдается остаточная плотность, поскольку его линкер L2 контактирует с гетеродуплексом направляющей РНК-TS (расширенные данные рис. 8a). Дальнейшее удлинение гетеродуплекса R-петли с 14 до 16 п.н. приводит к транслокации домена HNH в направлении гетеродуплекса направляющей РНК-TS ДНК в пределах центрального тракта связывания (рис. 3в). Облегченная формированием PAM-дистальной части R-петли, петля в домене RuvC (остатки 1030-1040) перестраивается в спиральную конформацию, устанавливая взаимодействие с линкером L2 (расширенные данные рис. 8b). Это приводит к перемещению линкера L2 и смещению домена HNH на вершину гетеродуплекса, закрывая центральный участок связывания (рис. 3c и расширенные данные рис. 8c). Домен HNH остается в каталитически некомпетентной ориентации, при этом его активный сайт расположен на расстоянии около 31 Å от расщепляющейся (scissile) фосфатной группы в TS.



Fig. 3: Target pairing past the seed region undocks the HNH nuclease domain.

a, Position of the HNH catalytic site in the binary, 6-, 8- and 10-nt match complexes. b, Structural overlay of the REC2 and REC3 domains in the 10-, 12-, 14-, 16- and 18-nt match (checkpoint) complexes. c, Overview of the 12-nt match (left), 14-nt match (middle) and 16-nt match (right) complexes, shown in the same orientations. For each complex, the unsharpened cryo-EM map is overlaid with the respective atomic model. The 12-nt match complex map shows residual density for the displaced NTS (white). The 14-nt match map reveals residual density corresponding to the HNH domain. No density is visible for NTS. Cryo-EM maps are coloured according the schematic in Fig. 1a.


Conformational checkpoint and activation


Предыдущие исследования показали, что субстраты, содержащие в 4-bp несоответствия на PAM-дистальном конце целевой последовательности (положения 16-20), как правило, не поддаются расщеплению Cas9, в то время как субстраты, содержащие несоответствия в положениях 19 и 20, эффективно расщепляются13,23,24,33. Крио-ЭМ реконструкция 18-нтного комплекса в присутствии 1 µМ Mg2+ показывает, что наиболее населенный 3D класс в образце представляет собой состояние до расщепления с интактным TS и неупорядоченным NTS (рис. 4a). После удлинения R-петли до 18 п.н. домен HNH продолжает принимать каталитически некомпетентную ориентацию, наблюдаемую в 16-нтном комплексе, тогда как конформация доменов REC2 и REC3 остается такой же, как в 12-, 14- и 16-нтных комплексах (рис. 3б и 4а). Таким образом, наблюдаемая конформация согласуется с каталитически неактивным состоянием контрольной точки, полученным в результате предыдущих биофизических и структурных исследований23,24,33.



Fig. 4: HNH domain rotation and DNA bending enable catalytic activation.

a, The structure of the 18-nt match complex in the pre-cleavage, checkpoint state. b, The structure of the 18-nt match complex in the catalytically active state. c, Conformations of the guide-target heteroduplexes and REC2 and REC3 domains in the 18-nt match checkpoint (left) and catalytic (right) complexes. The structures are shown in the same orientations as in a,b. The HNH domain has been omitted from the images for clarity. d, Zoomed-in view of the HNH nuclease active site in the 18-match catalytic complex containing bound cleaved TS. e, Zoomed-in view of the L1 linker contacting the minor groove of the guide RNA-target DNA heteroduplex. f, Zoomed-in view of the RuvC nuclease active site containing the 3'-terminal product of cleaved NTS.


Крио-ЭМ реконструкция, полученная из образца, восстановленного в присутствии 10 µМ Mg2+, показывает каталитически активную конформацию, в которой TS и NTS разделены в ожидаемых положениях (рис. 4b-f). В отличие от ранее описанных структур каталитически активных ферментов Cas928,34,35, PAM-проксимальная часть отщепленного NTS остается связанной в активном сайте RuvC (рис. 4b,f). В этом состоянии домен REC2 смещен в сторону от места расщепления TS, что позволяет домену HNH совершить поворот примерно на 140°, чтобы зацепить цисцилфосфат TS своим активным сайтом и катализировать его гидролиз по механизму одного иона металла (рис. 4d), что согласуется с предыдущими структурными данными28,34,35. Этой перестройке способствует выраженный изгиб PAM-дистальной области гетеродуплекса направляющей РНК-TS ДНК и сопутствующая переориентация домена REC3, который сохраняет взаимодействие с гетеродуплексом (рис. 4c). Поворот домена HNH происходит за счет реструктуризации линкеров L1 и L2, что приводит к расширению щели связывания NTS и обнажению активного сайта RuvC (рис. 4b,e,f). Линкер L1, который структурно неупорядочен в 18-nt комплексе matchpoint, образует α-спираль и взаимодействует с минорным желобком гетеродуплекса направляz РНК-TS ДНК посредством многочисленных водородно-связывающих взаимодействий (рис. 4e). Линкерная спираль L2 становится вытянутой, позволяя Phe916 интеркалировать между нуклеиновми основаниями NTS путем π-π укладки, тем самым стабилизируя NTS в активном сайте RuvC (рис. 4f). Расщепляющийся фосфат NTS координируется двумя ионами Mg2+, его положение согласуется с His983-зависимым каталитическим механизмом, предложенным моделированием молекулярной динамики36. В недавнем дополнительном исследовании была получена структура каталитического комплекса с 17-nt совпадением, который демонстрирует почти такое же расположение домена HNH и изогнутую конформацию гетеродуплекса направляющей РНК-TS ДНК, как и каталитический комплекс с 18-nt совпадением37, это указывает на то, что каталитическая активация может происходить после образования 17-bp гетеродуплекса. Вместе эти структурные наблюдения дают обоснование аллостерической связи образования R-петли с перестройкой домена HNH и доступностью активного сайта RuvC, что согласуется с исследованиями, показывающими, что позиционирование PAM-дистального конца модулирует конформацию домена HNH33.
Conclusions


В целом, наш структурный анализ SpCas9 на пути связывания с ДНК указывает на механизм, при котором формирование R-петли аллостерически и энергетически связано с перестройками доменов, необходимых для активации нуклеазного домена (расширенные данные рис. 9). Начальная фаза формирования R-петли облегчается гибридизацией TS с состоящей из двух частей seed (затравочной) последовательностью направляющей РНК и взаимодействием PAM-дистальной части ДНК с доменами Cas9 REC2 и REC3. Наблюдение за состоящей из двух частей seed последовательностью в направляющей РНК Cas9 и двухступенчатым механизмом гибридизации seed, включающего конформационную перестройку, позволяет провести параллели с другими системами РНК-направляющих нуклеиновых кислот, включая комплекс Cascade и белки Argonaute, которые имеют прерывистые seed последовательности в своих направляющих РНК38-41. Мы выявили мутации, которые дестабилизируют промежуточные состояния связывания и, таким образом, увеличивают дискриминацию вне мишени, что представляет возможность для разработки новых вариантов SpCas9 с высокой точностью. Поскольку большинство последовательностей вне мишени только связываются, но не расщепляются19-21,42, эти варианты могут оказаться полезными для приложений, которые зависят от надежности связывания Cas9 с мишенью, таких как регуляция транскрипции или редактирование оснований43. Направленная гибридизация целевой ДНК мишени связана с динамической перестановкой доменов REC2, REC3 и HNH, которые первоначально принимают каталитически неактивную, контрольную конформацию после завершения формирования R-петли. Поскольку конформационная активация доменов нуклеазы аллостерически контролируется структурным искажением PAM-дистального конца гетеродуплекса "направляющая-мишень" и считыванием его целостности Cas9, она исключается при неполном сопряжении PAM-дистального гетеродуплекса (менее 17 bp). Доброкачественные вне-целевые субстраты способны пройти конформационную контрольную точку, поскольку они сохраняют целостность гетеродуплекса, несмотря на наличие PAM-distal несоответствий, что согласуется с нашими недавними структурными данными44. Более того, модификации направляющей РНК, приводящие к изменению конформации гетеродуплекса, оказывают глубокое влияние на активность и специфичность нуклеазы Cas945. Таким образом, наши структурные исследования подчеркивают важность поддержания комплементарности направляющей РНК и мишени и правильной геометрии гетеродуплекса, что согласуется с биофизическими и вычислительными исследованиями, показывающими, что конформация гетеродуплекса R-петли сильно влияет на связывание вне мишени11,46. Таким образом, эти результаты имеют важное значение для текущих экспериментальных и вычислительных исследований активности CRISPR-Cas9 вне мишени и послужат основой для его дальнейшего технологического развития.