Для редактирования генома в эукариотических клетках и организмах был создан растущий список инструментов, которые в настоящее время включают, но не ограничиваются этим, нуклеазы с цинковыми пальчиками (ZFNs)1, нуклеазы, подобные эффектору активатора транскрипции (TALE) (TALENs)2, TALE-связанные расщепленные межбактериальные деаминазы токсина DddA, производные редакторы оснований цитозина (a. k. a. DdCBEs)3, CRISPR-Cas94,5,6, и каталитически неполноценные Cas9-связанные деаминазы (a. k. a. base editors). k.a. DdCBEs)3, CRISPR-Cas94-6, и каталитически неполноценные Cas9-связанные деаминазы (a.k.a. редакторы оснований)7-9. Эти инструменты, в принципе, состоят из двух функциональных единиц: ДНК-связывающей молекулы и каталитической молекулы. Так, массив цинковых пальчиков или массив TALE функционирует как ДНК-связывающая часть, а нуклеаза (FokI в ZFNs и TALENs) или фермент деаминаза (split-DddAtox в DdCBEs и APOBEC1 в CBEs) функционирует как каталитическая единица. CRISPR-Cas9 является одновременно нуклеазным ферментом и РНК-направляемым ДНК-связывающим белком. Программируемые нуклеазы, такие как ZFNs, TALENs и Cas9, расщепляют ДНК, образуя двунитевые разрывы (DSBs), восстановление которых приводит к целенаправленному нокауту и нокауту-включению генов. Однако программируемые нуклеазы, вызывающие DSBs, могут вызывать нежелательные крупные делеции10-13 в сайтах-мишенях, активацию p5314,15,16 и хромосомные перестройки17,18 в результате одновременной репарации двух DSBs в сайтах-мишенях и вне их. В отличие от них, программируемые деаминазы, включая редакторы цитозиновых и адениновых оснований (CBEs7,9 и ABEs8), не производят DSBs, избегая этих нежелательных событий в клетках, и эффективно катализируют однонуклеотидные преобразования без ремонтного шаблона или донорской ДНК. Следует отметить, однако, что CBEs и ABEs, содержащие вариант никазы Cas9, разрезают целевую нить ДНК и производят выщепление или однонитевые разрывы, которые все еще могут вызывать нежелательные indels в сайтах мишенях.
Недавно Mok и др.3 продемонстрировали, что бактериальный деаминазный токсин DddAtox, полученный из Burkholderia cenocepacia, может быть разделен и соединен с TALE-массивом и ингибитором урациловой гликозилазы (UGI) для создания DdCBEs, которые катализируют преобразование оснований C-в-T в ядерной ДНК и митохондриальной ДНК (мтДНК) в клетках млекопитающих. Мы и другие исследователи также продемонстрировали редактирование мтДНК у мышей19 и хлоропластной ДНК у растений20,21 с помощью специально разработанных DdCBEs. В данном исследовании мы стремились создать деаминазы с цинковыми пальчиками (ZFD) для точного редактирования оснований без indels в клетках человека и у других эукариотических организмов путем соединения split-DddAtox с белками с цинковыми пальчиками (ZFP). Поскольку массивы цинковых пальцев (закодированные в ДНК размером 2 х 0.3~0.6 k base pair (kbp)) имеют небольшой размер, по сравнению с массивами TALE (2 х 1.7~2 kbp) или S. pyogenes Cas9 (4.1 kbp)22, гены, кодирующие ZFD, могут быть легко упакованы в вирусный вектор с ограниченным грузовой ёмкостью, такой как AAV, для исследований in vivo и применения в генной терапии. В отличие от массивов TALE, массивы цинковых пальчиков не имеют громоздких доменов как на С-конце, так и на N-конце, что делает их удобными для преобразований: половинки split-DddAtox могут быть соединены с любым концом ZFP. Кроме того, ZFP с присущей им проникающей в клетки активностью23,24,25,26 могут позволить редактировать гены в клетках человека без использования нуклеиновых кислот. Эти свойства могут сделать ZFP идеальной платформой в качестве ДНК-связывающего модуля для редактирования оснований в ядерной ДНК и ДНК органелл.
Optimization of ZFD architecture...
Fig. 1: Development of ZFDs.
a ZFD (zinc finger deaminase) architecture. Split-DddAtox halves are fused to the C terminus of ZFPs (zinc finger proteins) (C type). b Optimization of the ZFD platform using pTarget libraries. pTarget plasmids contain a spacer region that ranges in size from 1-24 bp (shown in red) and ZFP DNA binding sites (shown in green). ZFD constructs contain AA (amino acid) linkers of different lengths (shown in yellow and orange) and different DddAtox split sites and orientations (shown in blue). c, d ZFD activities were measured at on-target sites in the pTarget library to examine the effect of the variables described in (b). ZFD pairs with linkers of the same (c) or different (d) lengths in the left and right ZFD were tested. Base editing frequencies were measured by targeted deep sequencing of the relevant region of pTarget plasmids. Data are shown as means from n = 2 biologically independent samples. Source data are provided as a Source Data file.
Base editing at endogenous target sites...
Fig. 2: Cytosine base editing by ZFDs at endogenous target sites.
a Architecture of nuclear DNA-targeting ZFDs. Split-DddAtox halves are fused to the C terminus (C type) or N terminus (N-type) of ZFPs. ZFD pairs were designed in CC or NC configurations, which are composed of a C-type left ZFD and a C-type right ZFD or an N-type left ZFD and a C-type right ZFD, respectively. b Base editing frequencies induced by ZFDs at endogenous target sites in HEK 293?T cells. All statistical analysis for comparing with untreated samples was conducted using unpaired Student's t-test (two-tailed) in GraphPad Prism 8. Statistical significance as compared with untreated samples was denoted with *P≤0.05, **P [ 0.01, ***P≤0.001, ****P≤0.0001, n.s. (not significant) P > 0.05. Data are shown as means?with standard error of the mean (s.e.m.) from n?=?3 biologically independent samples. c-f ZFD-induced base editing efficiencies at each base position within the spacer at the NUMBL (c), INPP5D-2 (d), TRAC-CC (e), and TRAC-NC (f) target sites in HEK 293?T cells. Data are shown as means?±?s.e.m. from n = 3 biologically independent samples. g ZFD-induced base editing frequencies in K562 cells following electroporation or direct delivery of ZFDs or ZFD-encoding plasmids. ZFD proteins with one or four NLSs were tested, and equimolar amounts of left and right ZFDs were used. Electroporation was performed using an Amaxa 4D-Nucleofector. For direct ZFD delivery, K562 cells were incubated with a cell medium containing left and right ZFD proteins. Cells were treated either once (1x) or twice (2x) in the same way. Data are shown as means from n = 2 biologically independent samples. Source data are provided as a Source Data file.
В клетках HEK 293 эффективность редактирования оснований C-в-T этими ZFD, включая те, которые имели конфигурацию NC, варьировала от 1,0% до 60%, в то время как indels индуцировались редко, с частотой менее 0,4% (рис. 2b и Дополнительный рис. 5)...
Mitochondrial DNA editing with ZFDs ...
Fig. 3: mtDNA editing with mitoZFDs.
a Base editing frequencies in mtDNA induced by mitoZFDs and a TALE-DdCBE in HEK 293?T cells. All statistical analysis for comparing with untreated samples was conducted using unpaired Student's t-test (two-tailed) in GraphPad Prism 8. Statistical significance as compared with untreated samples was denoted with *PP≤0.05, **P≤0.01, ***P≤0.001, ****P≤0.0001, n.s. (not significant) P > 0.05. Data are shown as means?from n = 2 biologically independent samples. b-g mitoZFD-induced base editing efficiencies at each base position within the spacer at the ND2 (b), ND4L (c), COX2 (d), ND5-2 (e), and ND1 (f) target sites, and TALE-DdCBE-induced base editing efficiencies at the ND1 (g) target site, in HEK 293?T cells. Data are shown as means from n = 2 biologically independent samples. h Comparison of DNA changes and amino acid changes in the ND1 gene introduced by mitoZFD and TALE-DdCBE. The reference sequence (Ref.) is at the top. In the alleles, the red letters indicate changes in the amino acid sequence. (* indicates a stop codon.) The frequency of sequencing reads (%) for each mutant allele was measured by targeted deep sequencing. The spacer regions for the ZFD pair and the TALE-DdCBE pair are indicated with blue dashed lines. Source data are provided as a Source Data file.
Fig. 4: Activity of mitoZFDs, TALE-based DdCBEs, and ZFD/DdCBE hybrid pairs.
a DNA sequences of the binding regions of the mitoZFD and TALE-DdCBE pairs. Sites recognized by the TALE-DdCBEs are highlighted in green and for the mitoZFDs in blue. The upper sequence represents the mtDNA heavy strand and the lower sequence represents the mtDNA light strand. b Frequencies of cytosines edited by ZFDs, TALE-DdCBEs, and ZFD/DdCBE hybrid pairs. All statistical analysis for comparing with untreated samples was conducted using unpaired Student's t-test (two-tailed) in GraphPad Prism 8. Statistical significance as compared with untreated samples was denoted with *P≤0.05, **P≤0.01, ***P≤0.001, ****P≤0.0001, n.s. (not significant) P?>?0.05. Data are shown as means?from n?=?2 biologically independent samples. c Heat maps of base editing activities at each base position. The red box indicates the spacer region for each construct. The blue arrows indicate the position in the mtDNA. Source data are provided as a Source Data file.
Fig. 5: Improving the mitochondrial genome-wide target specificity of mitoZFDs.
a QQ mitoZFD variants contain R(-5)Q mutations in each zinc finger in the ZFD to remove non-specific DNA contacts. F1-F4; Finger 1-4. (If no R was present at position-5 of the zinc finger framework, a nearby K or R was converted to Q.) b Whole-mtDNA sequencing of mitoZFD-treated cells. Editing frequencies at on-target and off-target sites are indicated by red and black dots, respectively. Error bars are shown as standard error of the mean (s.e.m.) for n?=?2 biologically independent samples. All C/G-to-T/A base changes present at frequencies >1% are presented. c-e Editing efficiencies and specificities depend on the dose of ZFD-encoding mRNA delivered. Data are shown as means?from n = 2 biologically independent samples. c The average C/G-to-T/A editing frequency for all C/Gs in the mitochondrial genome. d The number of edited C/G sites with base editing frequencies >1%. e The specificity ratio was calculated by dividing (average editing frequency at on-target Cs) by (average editing frequency at off-target Cs). Source data are provided as a Source Data file.
Discussion
Редактирование оснований - это относительно новый метод создания целевых нуклеотидных замен без разрезания двунитевой ДНК или ремонта матрицы ДНК. Редактирование оснований позволяет осуществлять преобразования C-в-T или A-в-G в клеточных линиях3,7,8, у животных19,32,33 и растений20,21,34, это позволяет исследователям изучать функциональные эффекты однонуклеотидных полиморфизмов (SNPs) и исправлять вызывающие заболевания точечные мутации для терапевтического применения. Были разработаны два типа редакторов оснований: ABE и CBE, созданные на основе CRISPR, и CBE, созданные на основе DddA. CRISPR-редакторы оснований состоят из каталитически неполноценных вариантов Cas9 или Cas12a в качестве ДНК-связывающих единиц и однонитевых ДНК-специфических деаминаз, происходящих из крыс, морской миноги или кишечной палочки7,8,9,35, тогда как DdCBE состоят из ДНК-связывающих массивов TALE и двухнитевых ДНК-специфических DddAtox3. В данном исследовании мы представили альтернативный тип базовых редакторов - ZFDs, состоящих из ДНК-связывающих массивов с цинковыми пальцами и DddAtox.
По сравнению с DdCBEs, ZFDs имеют меньший размер, поскольку ZFPs в ZFDs компактны, тогда как массивы TALE в DdCBEs громоздки. В результате ген, кодирующий пару ZFD, но не ген, кодирующий пару DdCBE, может быть легко упакован в вектор AAV с небольшой грузовой ёмкостью. Кроме того, компактные ZFP удобны для инженерии, что позволяет сплавлять разрезанные половинки DddAtox с С- или N-концом ZFP, создавая ZFD, которые работают либо выше, либо ниже по течению от ZFP-связывающего сайта. Кроме того, рекомбинантные белки ZFD могут проникать в клетки человека спонтанно, без электропорации или липофекции, что потенциально позволяет проводить генную терапию без использования генов. И последнее, но не менее важное: пары ZFD или гибридные пары ZFD/DdCBE могут производить уникальные мутации, которые невозможно получить, используя только DdCBE. Эти свойства делают ZFD мощной платформой для моделирования и лечения митохондриальных заболеваний.
Мы ожидаем, что ZFD могут быть усовершенствованы для повышения эффективности и специфичности. Здесь мы показали, что использование вариантов ZFP и мРНК ZFD может уменьшить активность вне мишени. DddAtox также может быть сконструирован таким образом, чтобы избежать мутаций ZFD вне мишени. ZFD с повышенной эффективностью и точностью могут проложить путь к исправлению патогенных мутаций митохондриальной ДНК у человеческих эмбрионов, плодов и пациентов.
Целевое глубокое секвенирование
Для получения библиотек для секвенирования следующего поколения (NGS) использовалась вложенная ПЦР. Интересующий регион сначала амплифицировали методом ПЦР с использованием полимеразы KAPA HiFi HotStart PCR (Roche). Для создания библиотек NGS ампликоны амплифицировали повторно с использованием индекс-содержащих праймеров TruSeq DNA-RNA CD для маркировки каждого фрагмента адаптером и индексными последовательностями. Конечные продукты ПЦР очищали с помощью набора для очистки ПЦР (MGmed) и секвенировали с помощью секвенатора MiniSeq (Illumina) с рабочим процессом GenerateFASTQ. Последовательности праймеров для направленного глубокого секвенирования перечислены в Дополнительной таблице 10. Частоты замен и indels из данных направленного глубокого секвенирования были рассчитаны с помощью исходного кода (https://github.com/ibs-cge/maund, написанного BotBot Inc.).
Секвенирование цельного митохондриального генома
Для секвенирования всего митохондриального генома потребовалось три этапа: выделение мтДНК из изолированных митохондрий, генерация NGS и библиотеки NGS. Во-первых, 3 ч 105 клеток HEK 293?T были трипсинизированы и собраны центрифугированием (500 g, 4 мин, 4°C) через 96 ч после трансфекции парами ND1- или ND2-мишеней mitoZFD. Затем клетки промывали ледяным фосфатно-буферным солевым раствором (Welgene) и снова собирали центрифугированием. Супернатант удаляли, а митохондрии выделяли из культивируемых клеток с помощью реагентного метода с использованием набора Mitochondria Isolation Kit for Cultured Cells (Thermo Fisher) в соответствии с протоколом производителя. МтДНК выделяли из выделенных митохондрий с помощью набора DNeasy Blood & Tissue Kit (Qiagen). Для создания библиотеки NGS из выделенной мтДНК мы использовали набор Illumina DNA Prep kit с индексами Nextera™ DNA CD Indexes (Illumina). Наконец, библиотеки были объединены и загружены в секвенатор MiniSeq (Illumina). Средняя глубина секвенирования составила более 50.
Анализ редактирования ДНК митохондриальных геномов
Для анализа данных NGS, полученных при секвенировании всего митохондриального генома, мы использовали метод, который ранее применялся для анализа ДНК, смещенной от мишени TALE-DdCBE3. Сначала мы выровняли файлы Fastq по эталонному геному GRCh38.p13 (релиз v102) с помощью BWA (v.0.7.17) и создали файлы BAM с помощью SAMtools (v.1.9), зафиксировав информацию о сопряжении чтений и флаги. Затем мы использовали скрипт REDItoolDenovo.py из REDItools (v.1.2.1)38 для выявления среди всех цитозинов и гуанинов в митохондриальном геноме позиций со степенью конверсии ~1%. Мы исключили позиции с коэффициентом конверсии ~50% во всех образцах, считая их однонуклеотидными вариациями в клеточных линиях. Мы также исключили сайты-мишени для каждой обработки ZFD. Оставшиеся позиции мы рассматривали как сайты вне мишени и подсчитывали количество отредактированных нуклеотидов C/G с частотой редактирования ~1%. Мы усреднили показатели конверсии в каждой позиции основания в сайтах, не являющихся мишенями, чтобы рассчитать среднюю частоту редактирования C/G в T/A для всех C/G в митохондриальном геноме. Коэффициент специфичности рассчитывали путем деления средней частоты редактирования в мишени на среднюю частоту редактирования вне мишени. Графики митохондриального генома были созданы путем построения графиков коэффициентов конверсии в сайтах "в мишени" и "вне мишени".