WMZ: Z191701361450 WMR: R209318204033 |
Efficient CRISPR editing with a hypercompact Cas12f1 and engineered guide RNAs delivered by adeno-associated virus | |
---|---|
Gene therapy would benefit from a miniature CRISPR system that fits into the small adeno-associated virus (AAV) genome and has high cleavage activity and specificity in eukaryotic cells. One of the most compact CRISPR-associated nucleases yet discovered is the archaeal Un1Cas12f1. However, Un1Cas12f1 and its variants have very low activity in eukaryotic cells. In the present study, we redesigned the natural guide RNA of Un1Cas12f1 at five sites: the 5? terminus of the trans-activating CRISPR RNA (tracrRNA), the tracrRNA-crRNA complementary region, a penta(uridinylate) sequence, the 3? terminus of the crRNA and a disordered stem 2 region in the tracrRNA. These optimizations synergistically increased the average indel frequency by 867-fold. The optimized Un1Cas12f1 system enabled efficient, specific genome editing in human cells when delivered by plasmid vectors, PCR amplicons and AAV. As Un1Cas12f1 cleaves outside the protospacer, it can be used to create large deletions efficiently. The engineered Un1Cas12f1 system showed efficiency comparable to that of SpCas9 and specificity similar to that of AsCas12a. |
Система кластеризованных регулярно перемежающихся коротких палиндромных повторов (CRISPR), которая функционирует как адаптивная иммунная система бактерий, архей и огромных бактериофагов, была разработана в качестве универсального инструмента редактирования генома1-4. Обычные инструменты редактирования генома вызывают разрывы двух-цепочечной ДНК (DSBs), которые часто приводят к мутациям indels (вставки-делеции) благодаря процессу восстановления, опосредованному негомологичным соединением концов (NHEJ)5,6. Точные генетические изменения также были достигнуты с помощью гомологической репарации7, систем редактирования оснований8,9 и технологии прайм-редактирования10. Эти разнообразные инструменты редактирования генома облегчили клеточную инженерию, создание модельных животных, выведение новых сортов растений11 и генетический скрининг12. В частности, эти методы перспективны для генотерапии при лечении рака13, генетических нарушений14 и инфекционных заболеваний15,16.
Генотерапия может проводиться in vivo или ex vivo, в зависимости от доступности клеток-мишеней. Терапия ex vivo проводится на отдельных типах клеток, полученных от пациента, которые включают иммунные клетки17, взрослые стволовые клетки18 или, в принципе, половые клетки19. Однако большинство моногенных заболеваний требуют системной доставки генетических материалов посредством стратегии in vivo, что требует эффективного средства для их доставки. AAV является средством, одобренным Управлением по контролю за продуктами и лекарствами США, благодаря своей безопасности, стойкости и возможности с массовым производством20. В связи с этим, инструмент CRISPR, загружаемый в AAV, может стать перспективным для лечения генетических заболеваний in vivo21. Однако AAV имеет ограниченный размер полезной нагрузки - менее 4,7 кб, что препятствует клиническому применению большинства инструментов CRISPR22. Более мелкие Cas белки, включая SaCas9 (ссылка 23) и CjCas9 (ссылка 24), были идентифицированы и проверены в отношении их использования в качестве инструментов редактирования генома, доставляемых с помощью AAV. Они могут быть доставлены с помощью AAV, но для доставки с помощью AAV редакторов оснований8,9, прайм-редакторов10 или регуляторов эпигенетических функций5 необходимы еще более миниатюрные системы CRISPR. Более того, миниатюрная система CRISPR позволит использовать несколько направляющих гид (g)РНК и/или дополнительных регуляторных генов в одной частице AAV.
Классифицируемые как нуклеазы CRISPR типа V, миниатюрные белки Cas, включая Cas12f (также известный как Cas14) и Cas12j (CasΦ), были идентифицированы из архей25 и огромных бактериофагов2. Миниатюрные эффекторы CRISPR-Cas состоят из ~400-700 аминокислотных остатков и включают единственный нуклеазный домен RuvC25. До сих пор не было продемонстрировано, что миниатюрные Cas-белки могут быть использованы в качестве надежных инструментов редактирования генома в эукариотических клетках. Первоначально сообщалось, что Cas12f1 проявляет активность расщепляя только одноцепочечную ДНК (ssDNA)25. Последующее исследование показало активность по образованию indels у Cas12f в эукариотических клетках, но эффективность была незначительной, и были протестированы только две мишени26. Белок Cas12j был функционально оценен в клетках растений, но эффективность indels также составила менее 1%2. Кроме того, ни в одном из случаев не была продемонстрирована возможность доставки с помощью AAV.
В настоящем исследовании мы интенсивно модифицировали gRNA для Un1Cas12f1 (далее Cas12f) путем пяти раундов инженерных преобразований gRNA. Отдельные изменения в структуре gRNA были синергическими, что позволило превратить систему CRISPR-Cas12f в высокоэффективный и специфичный инструмент редактирования генома. Более того, ремоделирование gRNA существенно уменьшило размер gRNA. При доставке с помощью вектора AAV эта компактная система CRISPR обеспечила мультиплексное и эффективное редактирование генома. В настоящем исследовании мы предполагаем, что разработанная нами система Cas12f1 полезна для редактирования генов с доставкой AAV и что Un1Cas12f1 может стать основой для разработки доставляемых AVV редакторов оснований и редакторов праймеров, эпигенетических регуляторов и конструкций для сайт-специфической регуляции генов.
Fig. 1: Engineering Cas12f gRNA. a, Structure of the canonical Cas12f1 gRNA consisting of tracrRNA and crRNA. Five MSs for gRNA engineering are indicated. The gRNA engineering steps were performed sequentially, from MS1 to MS2 and MS3, and finally MS4; MS5 modifications are discussed elsewhere. b, Increased Cas12f-mediated indel frequencies caused by substitutions of uridine in the tracrRNA penta(uridinylate) site (MS1). c, Combined effects of sequence modifications in both the tracrRNA and the crRNA at the penta(uridinylate) site on indel frequencies (n?=?3). d, Synergistic modulation of indel frequencies by modifications in MS1 and MS2 (addition of poly(uridinylate) 3? overhang on the crRNA) (n?=?3). e, Optimal length of truncation of the 5? terminus of the tracrRNA (MS3). Values were obtained from independent triplicate experiments. f, Changes in indel frequencies induced by the truncation of the crRNA-tracrRNA complementary region (MS4). At each position, the crRNA and tracrRNA were truncated and connected with a GAAA tetraloop (n = 3). g, Increased indel frequencies induced by various combinations of gRNA modifications (n = 3). h, Changes in the length of the crRNA and tracrRNA caused by each step of gRNA engineering and comparison of the lengths of sequences encoding the components of several representative CRISPR-Cas systems. NS, not significant. c,d,f, Two-group and multiple comparisons were performed by the two-sided Student's t-test and one-way ANOVA test, respectively. All error bars represent s.d. Fig. 2: Large-scale validation of the engineered CRISPR-Cas12f system. a, Common sequences targetable by the SpCas9, AsCas12a and Cas12f systems and the gRNA formulations for each system. TTTR indicates TTTA or TTTG. b, A heatmap for indel frequencies per target obtained by SpCas9, AsCas12a or Cas12f. Measurement of indel frequencies in HEK293T cells transfected with SpCas9, AsCas12a, canonical Cas12f or engineered Cas12f vector constructs. Cells (1.75???105) were transfected with 2??g of plasmid vector using a Fugene lipofection kit and grown for 96?h. c, A box-and-whisker plot for SpCas9-, AsCas12a- and Cas12f-induced indel frequencies merged with a dot plot. Whole data points (n?=?88) were plotted with mean values as indicated by the horizontal cyan-colored line. Box plots represent the median with interquartile ranges (25-75%); whiskers extend to 1.5? the interquartile distance from the box. P values were derived by a Mann-Whitney U-test. NS, not significant. Error bars represent the s.d. d, Distribution of the number of targets per indel frequency subdivision. Values indicate the number of targets with indel efficiency belonging to the indicated ranges. The indel efficiencies and target information were provided in a source file and Supplementary Table 2. e, Distribution of the targets that show the highest efficiencies by the _ge3.0, _ge4.0 or _ge4.1 version. f, Schematic representation of the paired gRNA strategy for increasing Cas12f-mediated indel frequencies. DNA cleavages are centered in the spacing region, which is 10-30?bp in length. The size of the triangle indicates the frequency of a DNA-strand cleavage. g, Indel frequencies induced by Cas12f with engineered gRNA at ten targets when using either or both gRNAs. The upper and lower panels indicate indel frequencies for gRNAs with MS1/2 and MS1/2/3 engineering, respectively. h, Comparison of fold-changes in indel frequencies caused by MS1/2- and MS1/2/3-engineered gRNAs. The fold-changes were calculated from the indel frequencies induced by paired gRNAs compared with that of a gRNA that induces a higher indel frequency at a target located between the two paired gRNAs. i, Fold-changes in indel efficiencies by paired gRNAs according to the length of spacing. Fig. 3: Highly efficient correction of pathogenic mutations through AAV-delivered Cas12f. a, A schematic illustration showing multiple chances for dsDNA cleavage and NHEJ cycles for the Cas12f system. Cleavage sites are marked with triangles and different colors indicate changes in the DNA sequences. The protospacer regions are colored sky-blue and green. b, Increased frequency of long deletion mutations over time in HEK293T cells transfected with CRISPR-Cas12f_ge4.1. c, Time-course of Cas12f-, SpCas9- and LbCas12a-induced indel frequencies in HEK293T cells transfected with plasmid vectors (n?=?3). d. Comparison of Cas12f- and LbCas12a-mediated rates of exon 51 deletion from the human dystrophin gene in AC16 cells. The lower bands indicate the PCR amplicons of the exon 51-deleted locus. The intensity of the lower bands is indicative of the deletion efficiency. Deletion strategy 1 (DS1) and DS2 target identical loci for Cas12f and Cas12a. The data represent three experiments. e, Screening of targets for the deletion of the c.2991+1655A>G mutation from the CEP290 gene. f, Comparison of Cas12f- and SaCas9 (EDIT101)-mediated frequencies of deletion of the c.2991+1655A>G mutation. HEK293T cells (2 x 105) were seeded into 12-well plates, transduced with AAV2 harboring the Cas12f or SaCas9 system at 5.0 x 109 vector genomes (vg) ml-1, and harvested 3 and 9 d post-transduction. NT, nontransduction. The data represent three experiments. g, Quantitative analysis of deletion frequencies using RT-qPCR. Percentage deletion indicates the percentage ratio of PCR amplicons containing the deletion versus intact amplicons (n = 3). P values were derived using a two-sided Welch's t-test. h, Possible applications of Cas12f using an AAV delivery system. For AAV delivery of vector constructs harboring the Cas12f sequence with two nuclear localization signals, a BGH poly(A) signal, and an XTEN linker sequence under the control of an EF-1α core promoter and a ge4.1 sequence under the control of a U6 promoter, a protein encoded by a gene ≤2.1 kb in size could be fused to Cas12f. i, Application of dCas12f-VP64 to CRISPRa. The fusion protein guided by gRNAs (ge4.1) targeting promoter regions of OCT4 led to transcriptional activations in HEK293T cells (n = 3). P values were derived using a two-sided Student's t-test. All error bars represent the s.d. Fig. 4: Unbiased and targeted analysis of Cas12f specificity as assessed by Digenome-seq analysis. a, Tolerance of Cas12f_4.1 to mismatched gRNA. The engineered gRNAs with a singly mismatched base and pairs of mismatched bases were used for the investigation of indel frequencies in HEK293T cells (n = 3). b, Indel frequencies at off-targets identified by OFFinder for AsCas12a, Cas12_ge4.0 and Cas12_ge4.1. An intergene corresponds to target 3 targeted throughout the main text. c, Indel frequencies at previously validated off-targets for AsCas12a, Cas12_ge4.0 and Cas12_ge4.1. The ratio of indel frequency at off-target to that at on-target was considered as an index for specificity (n = 3). Statistical analysis was performed by a two-sided Student's t-test. NS, not significant. d, IGV files at on-target and off-target loci after in vitro digestion of genomic DNA. The gap indicates a region where sequences were missing in both forward and reverse reads. e, The number of potential off-target loci identified by Digenome-seq analysis for AsCas12a and Cas12f. f, Validation of off-target sites identified by Digenome-seq analysis using Cas12f and AsCas12a as endonucleases. Indel frequencies were measured at both on-target and potential off-target loci after transfection with either Cas12f- or AsCas12a-encoding vector. Control refers to Cas12f-untreated cells (n?=?3). All error bars represent the s.d. Discussion Cas12f1 имеет сверхдлинную gRNA для своего компактного размера белка, что может быть связано с активностью Cas12f1 по расщеплению ssDNA. Наша разработанная sgRNA_ge4.1, хотя и была немного длиннее, структурно была похожа на crRNA, используемую Cas12a или Cas12j. Такая архитектура была получена в основном путем обрезки 5'-tracrRNA, области гибридизации crRNA-tracrRNA, и области stem 2. Фактически, эти модификации gRNA привели к существенному улучшению активности расщепления dsDNA. Модификации MS3, MS4 и MS5, как полагают, улучшают совместимость между gRNA и Cas12f, в то время как модификация MS1 решает проблему, возникающую из-за различий между прокариотической и эукариотической системами экспрессии. Мы также представили доказательства того, что модификации MS2 вносят вклад в оба аспекта. Интересно, что наш эмпирический подход к получению оптимизированной gRNA соответствовал недавним структурным исследованиям: обрезанные области структурно неупорядочены33,34. Одна из интерпретаций заключается в том, что неупорядоченная область может препятствовать гомодимеризации Cas12f1. С помощью обширной перестройки gRNA мы превратили Cas12f1 в эффективный инструмент редактирования генома. Крупномасштабные эксперименты по проверке показали, что вместе с Cas9 и Cas12a Cas12f1 обеспечивает универсальную платформу для редактирования генома. В частности, разработанная платформа Cas12f может стать универсальным средством генотерапии, доставляемым с помощью AAV в клинических условиях.
Полезность технологии CRISPR была значительно расширена за счет создания каталитических вариантов белков Cas46-48 и слияния с другими функциональными белками. Каталитически неактивные белки Cas были соединены с регуляторами транскрипции, что позволило добиться регулируемой экспрессии генов5. Модификаторы оснований, слитые с каталитически неактивным Cas или Cas nickase17 , позволяют осуществлять точное редактирование генома с однонуклеотидным разрешением, минимизируя разрывы dsDNA49. В частности, системы редактирования праймера полагаются на слияние nCas9 и обратной транскриптазы M-MLV для модификации ДНК10,50. Несмотря на их функциональные возможности, клиническое применение редакторов оснований и прайм-редакторов ограничено тем, что их вес выходит за пределы генетической ёмкости в AAV. Компактные Cas белки, такие как Cas12f, должны позволить создать точные инструменты редактирования генома, которые легче доставлять с помощью AAVs.
Cas12f особенно эффективен при делеции патогенного экзона или интрона с использованием парных gRNA с экспрессией, индивидуально управляемой промоторами U6 или H1. Синдром Usher's 39, мышечная дистрофия Дюшенна37 и определенный тип LCA38 потенциально могут быть вылечены с помощью такой стратегии на основе Cas12f. Чтобы расширить спектр заболеваний, поддающихся лечению, важно разработать каталитические варианты Cas12f1, которые получат преимущества от недавнего структурного раскрытия Cas12f1 (ссылки 33,34), как это было показано для SpCas9 (ссылка 51) и Cas12a52.
|