Способность к точным манипуляциям с геномом является критической для изучения функции специфических геномных последовательностей, включая гены и регуляторные элементы. Технология CRISPR/Cas9 делает возможным целенаправленное воздействие на геномные локусы, при этом их репертуар быстро расширяется1. Среди них точные и неограниченные делеции специфических геномных последовательностей особенно важны как в случаях функциональной геномики, так и в случае генотерапии.
Сегодня ведущим методом программирования геномных делеций является использование пары CRISPR guide RNAs (gRNAs) , каждая из которых целенаправленно воздействует на последовательность protospacer-adjacent motif (PAM), генерируя пару соседних DNA double-strand breaks (DSBs). После одновременного разрезания в двух местах, клеточные факторы репарации повреждений ДНК часто соединяют два конца генома часто без внесения промежуточных последовательностей
2 посредством non-homologous end joining (NHEJ) (Figure 1a). Будучи мощным, этот подход всё же имеет ограничения: 1) Попытки индуцировать делеции, особенно длинные делеции, часто приводят к коротким вставкам или делециям (indels; обычно менее 10-bp) вблизи одного или обоих разрывов DSBs, с присутствием или отсутствием ожидаемой делеции
3–5; 2) Др. непреднамеренные мутации включают часто возникающие длинные делеции и более сложные перестройки, которые могут не обнаруживаться по техническим причинам
5–8; 3) Разрывы двунитчатой ДНК вызывают цитотоксические эффекты
9; и 4) Стыковка геномных делеций, запрограммированная этим методом, ограничивается распределением естественно возникших сайтов PAM. Несмотря на эти ограничения, разные исследования разработали стратегию получения более значительного эффекта, напр., чтобы исследовать функцию генов и регуляторных элементов
5,10,11, а также использовать для генотерапии
12,13.
Figure 1.
Precise episomal deletions using PRIME-Del.
a. Schematic of Cas9/paired-gRNA deletion strategy. b. Schematic of PE3 strategy, wherein the PE2/gRNA complex induces a nick (denoted as a gap in the bottom DNA strand), even after the correct editing event. c. Schematic of PRIME-Del using pairs of pegRNAs that target opposite DNA strands. Each pegRNA encodes the sites to be nicked at each end of the intended deletion, as well as a 3’ flap that is complementary to the region targeted by the other pegRNA. d. Cartoon representation of deletions programmed within the episomally-encoded eGFP gene (not drawn to a scale). e. PRIME-Del-mediated deletion efficiency was measured for 24-bp, 91-bp, and 546-bp deletion experiments. Error bars represent standard deviation for five replicates. f. PRIME-Del-mediated deletion efficiency was measured for the 546-bp deletion experiment using three methods. Error bars represent standard deviation for three replicates. g. Insertion, deletion and substitution error frequencies across sequencing reads from 546-bp deletion experiment. Reads were aligned to reference sequence either without (top) or with (bottom) deletion. Plots are from single-end reads with collapsing of UMIs to reduce sequencing errors; also shown with additional replicates and error-class-specific scales in Supplementary Fig. 1e. Note that only one of the two 3’-DNA-flaps is covered by the sequencing read in amplicons lacking the deletion (labeled as ‘wild-type’). h. Insertion, deletion and substitution error frequencies across the amplicons from 546-bp deletion experiment after merging paired-end sequencing reads.
Недавно Liu с колл. описали ‘prime editing’, который расширяет возможности CRISPR/Cas9 геномного редактирования критическим способом14. Prime-editing использует фермент PE2, который является Cas9 никазой (Cas9 H840A), слитой с обратной траскриптазой и 3’-увеличенной gRNA (prime-editing gRNA or pegRNA). Комплекс PE2/pegRNA может вызывать выемку (nick) в одной нити в геноме и присоединять 3’ однонитчатую ДНК створку (flap) к разрезанному (nicked) сайту благодаря последовательности матричной РНК в молекуле pegRNA. Путем включения гомологичной последовательности в соседний регион, факторы репарации повреждений ДНК может внедряться в эту 3’-flap последовательность генома. Скорость инкорпорации может быть еще больше усилена добавлением gRNA, которая делает nick на противоположной нити, усиливая репарацию ДНК в 3’-flap последовательности, но часто со снижением точности (стратегия, обозначаемая как PE3/PE3b)14 (Figure 1b). Принципиальное преимущество prime редактирования заключается в том, что оно кодирует оба сайта для целенаправленного воздействия и в природе репарации внутри одиночной молекулы, pegRNA. Среди прочего, Anzalone et al. использовали стратегию PE3, чтобы показать, что одиночная пара pegRNA/gRNA может быть использована, чтобы программировать делеции в пределах от 5 до 80 bp с высокой эффективностью (52-78%) с умеренной точностью (в среднем 11% нежелательных indels)14.
Мы полагаем, что пара pegRNAs может быть использована для спецификации не только сайтов, которые д. быть nicked, но и также для спецификации результатов репарации, в принципе способных программировать более длинные делеции (Figure 1c). Мы продемонстрировали , что такая стратегия, которую мы наз. PRIME-Del, эффективно индуцирует делеции последовательностей вплоть до ~700 bp в длину со значительно большей точностью, чем при стратегиях Cas9/paired-gRNA или PE3 (PE2/pegRNA/gRNA). Более того, мы показали, что PRIME-Del может одновременно программировать короткие инсерции в месте делеции. Сопутствующие deletion/insertion могут быть использованы для внесения делеций in-frame, чтобы вносить эпитопные метки одновременно с делециями и облегчать программирование делеций неограниченно с помощью эндогенного распределения PAM сайтов. Путем заполнения подобных пробелов, PRIME-Del расширяет наш инструментарий для изучения биологических функций геномных последовательностей с разрешением в один нуклеотид.
Figure 2.
Concurrent programming of deletion and insertion using PRIME-Del.
a. Schematic of strategy, with reverse complementary sequences corresponding to the intended insertion in purple. b. Conventional strategy for deletion with Cas9 and pairs of gRNAs. Potential deletion junctions are restricted by the natural distribution of PAM sites. c. Pairs of pegRNAs were designed to encode five insertions, ranging in size from 3 to 30 bp, together with a 546 bp deletion in eGFP. d. Estimated deletion efficiencies in using these pegRNA pairs. Error bars represent standard deviation for at least three replicates. e. Representative insertion, deletion and substitution error frequencies plotted across sequencing reads from concurrent 546-bp deletion and 30-bp insertion condition. Plots are from single-end reads without UMI correction. Note that only one of the two 3’-DNA-flaps is covered by the sequencing read in amplicons lacking the deletion (labeled as ‘wild-type’). f. The percentage of reads containing the programmed deletion that also contain the programmed insertion. Error bars represent standard deviation for at least three replicates.
Figure 3.
Precise genomic deletions using PRIME-Del.
a. Schematic of generation of the eGFP-integrated cell line. b. Estimated deletion efficiencies in using PRIME-Del for concurrent deletion and insertion on genomically integrated eGFP. Error bars represent standard deviation for at least three replicates. c. Representative insertion, deletion and substitution error frequencies plotted across sequencing reads from concurrent 546-bp deletion and 30-bp insertion condition on genomically integrated eGFP. Plots are from single-end reads without UMI correction. d. Cartoon representation of deletions programmed within the HPRT1 gene. e. Deletion efficiencies measured for the 118-bp and 252-bp deletion using either PRIME-Del (orange) or Cas9/paired-gRNA (green) strategies. Error bars represent standard deviation for at least three replicates. f. Fraction of total reads without indel modifications (“No editing”), indel errors without intended deletion, indel errors with intended deletion, and correct deletion without error. g. Representative insertion, deletion and substitution error frequencies plotted across sequencing reads from 118-bp deletion (left) and 252-bp deletion (right) at HPRT exon 1, using the Cas9/paired-gRNA strategy. Different error classes are colored the same as in (c). h. Same as (g), but for PRIME-Del strategy. i. Cartoon representation of deletions programmed within the FMR1 5’-UTR and an NMU enhancer (“e-NMU”). j. Deletion efficiencies measured for the FMR1 5’-UTR (185 bp) and e-NMU (710 bp) deletions using PRIME-Del. Error bars represent standard deviation for at least three replicates. k-l. Representative insertion, deletion and substitution error frequencies plotted across sequencing reads from PRIME-Del programmed deletions at FMR1 (k) and e-NMU (l).
Figure 4.
Extending the editing time window enhances prime editing and PRIME-Del efficiency.
a. Schematic for stably expressing both PE2 and pegRNAs via two-step genome integration. b-c. Editing efficiencies measured for the 118-bp and 252-bp deletions at genomic HPRT1 exon 1 using PRIME-Del (paired-pegRNA construct) or CTT-insertion using prime editing (single-pegRNA construct) in K562 cells (b) or HEK293T cells (c), as a function of time after initial transduction of pegRNA(s). Error bars represent standard deviation for three replicates.
Discussion
Здесь мы описали стратегию PRIME-Del, a paired pegRNA для prime editing и продемонстрировали, что она обеспечивает высокую точность программирования делеций, вместе с или без короткой инсерции. Мы обнаруживали делеции в пределах от 20 до 700-bp в длину в эписомных, синтетических геномных и нативных геномных локусах. Эффективность редактирования нативных генов в пределах 5-50% с одиночным раундом временной трансфекции в клетки HEK293T, хотя мы также наблюдали, что пролонгирование высокой экспрессии prime editing или PRIME-Del компонентов усиливает эффективность редактирования без нарушения точности. В 4-х геномных локусах, на которые целенаправленно воздействовали системой PRIME-Del, мы наблюдали высокую точность редактирования за исключением HPRT1 экзона 1, где иногда обнаруживались длинные инсерции в месте соединения концов делеции (~13% от событий редактирования). Даже в случае таких инсерционных ошибок, PRIME-Del действовала лучше, чем обычная Cas9/paired-gRNA стратегия, обеспечивая более высокую эффективность с немногими ошибками. Более того, богатые GC концы 3’-DNA flap последовательности пар pegRNA, использованных в HPRT1 exon 1, по-видимому, лежали в основе более длинных инсерций. Оптимизация структуры pegRNA может оказаться способной к устранению такого ошибочного способа, т.к. инсерции не наблюдались при целенаправленном воздействии на eGFP, 5’-UTR of FMR1 или e-NMU, эксперименты, в которыъх pegRNA пары были лишены GC-rich концов на их 3’-DNA flaps. Мы разработали сопутствующий Python-based web инструмент для получения PRIME-Del paired-pegRNA последовательностей, которые извещают пользователя, присутствуют ли такие последовательности в разрабатываемых pegRNA парах.
Потенциальным ограничением PRIME-Del по отношению к Cas9/paired-gRNA стратегии, является необходимость подбора пар геномных protospacers, т.к. они д. находиться на противоположных нитях с PAM последовательностями, ориентированными в направлении одна к др. (Figure 1c). Однако, разработка и оптимизация near-PAMless18 prime editing энзимов позволит смягчить это ограничение. Дальнейшим ограничением является то, что из-за их большей длины клонирование пар pegRNAs в тандеме является довольно затруднительным, чем клонирование gRNA пар. Каждая pegRNA , использованная здесь, была длиной 135 - 170 bp, так что синтез их уникальных компонентов в тандеме в качестве одиночных длинных олигонуклеотидов ограничен по сравнению с обычной технологией синтеза ДНК, особенно с целью осуществления array-based синтеза парных pegRNA библиотек.
Несмотря на эти ограничения, PRIME-Del обеспечивает значительными преимуществами в нескольких потенциальных областях применения (Figure 5). Так, PRIME-Del может быть использована для точного программирования длинных делеций. Помимо значительно более низкого уровня indel ошибок, обнаруживаемых в местах соединения делеций, по сравнению со стратегией Cas9/paired-gRNA, индукция парных nicks вряд ли будет приводить к крупным, нежелательным локальным делециям, перестройкам генома (chromothripsis) или к off-target редактированию
7,14,19–21. Эти характеристики благоприятны для разработки терапевтических подходов, при которых PRIME-Del устраняет патогенные регионы, такие как увеличенные повторы CGG на 5’-UTR в FMR1, в отсутствие нежелательных пертурбаций в ближайших или удаленных последовательностях
12,13.
Figure 5.
Potential advantages of using PRIME-Del in various genome editing applications.
The PRIME-Del strategy can be used to program precise genomic deletions without generation of short indel errors at Cas9 target sequences. Precision deletion, combined with ability to insert a short arbitrary sequence at the deletion junction, may allow robust gene knockout of active protein domains without generating a premature in-frame stop codon, which can trigger the nonsense-mediated decay (NMD) pathway. PRIME-Del also allows replacement of long (<700 bp) genomic regions with arbitrary sequences such as epitope tags or RNA transcription start sites. Single-stranded breaks generated during PRIME-Del are likely to be less toxic to the cell, especially when multiple regions are edited in parallel, potentially facilitating its multiplexing.
PRIME-Del также делает возможными одновременные инсерции коротких последовательностей в запрограммированные места делеционных соединений без существенного нарушения эффективности или точности. Инсерция коротких последовательностей позволительна для точный делеций белковых доменов, т.к. сохраняет нативную рамку считывания, избегая тем самым преждевременного стоп-кодона, что может вызывать сложные nonsense-mediated decay (NMD) реакции22,23. Более того, инсерция биологически активной последовательности в делецию, скорее всего, может оказаться благоприятной для PRIME-Del технологии, благодаря возможной инсерции эпитопных меток или T7 промоторной последовательности, которая может быть использована в качестве молекулярного рычага (handles) внутри редактируемых геномных локусов.
Мы также ожидаем меньшую токсичность повреждений ДНК при prime editing-based PRIME-Del, чем при обычной Cas9/paired-gRNA стратегии, это может облегчать multiplexing запрограммированных геномных делеций для конструкций, таких как scanDel и crisprQTL5,6. Для изучения некодирующих элементов при транскрипции, эффективные и точные делеции до 700 bp будут взаимодополнять используемый сегодня де-активированный Cas9-tethered KRAB домен для CRISPR-interference (CRISPRi), который не может контролировать пределы эпигенетических модификаций вокруг области мишени. В этом случае мы ожидаем, что PRIME-Del может быть широко использоваться в массивных параллельных функциональных исследованиях, чтобы охарактеризовать нативные генетические элементы с разрешением в пары оснований.
Технологии, которые с точностью делетируют геномные последовательности запрограммированным способом, могут быть использованы для изучения функции, а также в принципе для генотерапии. Ведущим современным методом для программирования делеций является CRISPR/Cas9 и пара guide RNAs (gRNAs), чтобы генерировать два близких разрыва двойной нити ДНК, которые часто сопровождаются делециями в интронной (intervening) последовательности во время репарации ДНК. Однако, этот подход может оказываться неэффективным и неточным, с ошибками, включающими небольшие indels в двух сайтах мишенях, а также нежелательные крупные делеции и более сложные перестройки. Мы описали метод, базирующийся на prime editing, названный PRIME-Del, который индуцировал делеции, используя пару prime editing gRNAs (pegRNAs), которые целенаправленно воздействовали на противоположные нити ДНК, эффективно программируя не только места, которые д. быть nicked, но и исход репарации. Мы продемонстрировали, что PRIME-Del обеспечивает заметно более высокую точность в программирования делеций, чем CRISPR/Cas9 и gRNA пары. Было также показано, что PRIME-Del может быть использована для соединения геномных делеций с короткими инсерциями, чьи соединения на попадают на protospacer-adjacent motif (PAM) . Наконец, мы продемонстрировали, что увеличение временного промежутка экспрессии компонентов prime editing может существенно повысить эффективность без нарушения точности. Мы полагаем, что PRIME-Del окажется пригодной для получения точных, гибко программируемых геномных делеций, включая in-frame делеции, а также мечение эпитопов и потенциально программируемые перестройки.