Посещений:
внедренные в ядро митохондриальные ДНК последовательности



Процесс внедрения у человека

Nuclear-embedded mitochondrial DNA sequences in 66,083 human genomes
• Wei Wei, • Katherine R. Schon, • Greg Elgar, et al.
Nature volume 611, pages105-114 (2022)

DNA transfer from cytoplasmic organelles to the cell nucleus is a legacy of the endosymbiotic event-the majority of nuclear-mitochondrial segments (NUMTs) are thought to be ancient, preceding human speciation1,2,3. Here we analyse whole-genome sequences from 66,083 people-including 12,509 people with cancer-and demonstrate the ongoing transfer of mitochondrial DNA into the nucleus, contributing to a complex NUMT landscape. More than 99% of individuals had at least one of 1,637 different NUMTs, with 1 in 8 individuals having an ultra-rare NUMT that is present in less than 0.1% of the population. More than 90% of the extant NUMTs that we evaluated inserted into the nuclear genome after humans diverged from apes. Once embedded, the sequences were no longer under the evolutionary constraint seen within the mitochondrion, and NUMT-specific mutations had a different mutational signature to mitochondrial DNA. De novo NUMTs were observed in the germline once in every 104 births and once in every 103 cancers. NUMTs preferentially involved non-coding mitochondrial DNA, linking transcription and replication to their origin, with nuclear insertion involving multiple mechanisms including double-strand break repair associated with PR domain zinc-finger protein 9 (PRDM9) binding. The frequency of tumour-specific NUMTs differed between cancers, including a probably causal insertion in a myxoid liposarcoma. We found evidence of selection against NUMTs on the basis of size and genomic location, shaping a highly heterogenous and dynamic human NUMT landscape.

Перенос генов из цитоплазматических органелл в ядро клетки лежит в основе эндосимбиотической теории происхождения митохондрий3. У организмов более высокого порядка митохондриальные геномы постепенно уменьшаются, что отражает транслокацию митохондриальных генов в ядерный геном в течение эволюционного времени, облегчая координированный синтез белков органелл цитозольным трансляционным механизмом2. Этот процесс оставил фрагменты не-экспрессируемой митохондриальной ДНК (мтДНК) в не-кодирующем пространстве, причем многие NUMT являются общими для разных видов, что отражает их древнее происхождение4. Недавно секвенирование всего генома (WGS) выявило сверхредкие NUMTs у человека5, это свидетельствует о том, что перенос мтДНК в ядро является непрерывным процессом, однако скорость образования NUMT в зародышевой линии остается неизвестной. Новые вторжения мтДНК в ядро имеют важные последствия, поскольку они могут потенциально нарушать работу генов, кодирующих белки, вызывая заболевания6-9, и создавать артефакты, напоминающие смешанные популяции мтДНК10,11 (псевдо-гетероплазмия). Ошибочная интерпретация последовательности NUMT как варианта мтДНК может запутать диагностику митохондриальных заболеваний12 и вызвать вопросы о возможном наследовании мтДНК по отцовской линии13.
Крупномасштабные проекты WGS дают возможность охарактеризовать NUMT человека более глубоко, чем у других видов. Здесь мы описываем ландшафт NUMTs человека у 66 083 человек, включая 8 201 трио мать-отец-ребенок и 12 509 пар опухоль-нормальная ткань в рамках проекта 100 000 геномов в Англии. Это обеспечивает ресурс для интерпретации вариантов мтДНК в различных популяциях и для нашего понимания эволюции ядерного генома. Результаты доступны в онлайновой базе данных с возможностью поиска по адресу https://wwei.shinyapps.io/numts/.
Atlas of human germline NUMTs


Первоначально мы изучили 68 348 геномов от 67 875 участников проекта Genomics England Rare Disease Project14. После всех этапов контроля качества (QC) (Методы) мы изучили 25 436 мужчин и 28 138 женщин в возрасте от 0 до 99 лет (расширенные данные рис. 1a,b), включая 8 201 трио, чье родство соответствовало геномным прогнозам (Методы). Используя проверенную систему обнаружения NUMT на основе коротких прочтений5,15 (рис. 1a), мы выявили 335 891 NUMT, отсутствующих в референсной последовательности, на основе как минимум двух пар дискордантных прочтений, обнаруженных у 53 535 человек (более 99,9%), включая 3 829 различных NUMT (расширенные данные рис. 1d,e). Увеличение строгости для обнаружения NUMT по крайней мере до 5 дискордантных пар считываний позволило увеличить выход до 254 195 NUMT (1 637 различных NUMT у 53 507 (99,87%) особей), которые не присутствуют в референсной последовательности (рис. 1b,c и дополнительная таблица 1). Этот набор данных с более высокой степенью строгости лег в основу представленных здесь результатов, в которых мы относим NUMT к распространенным (частота (F) ≥ 1%), редким (0,1% ≤ F < 1%), ультраредким (F < 0,1%) или частным (обнаруженным только в одной семье). Секвенирование с длинным прочтением подтвердило нашу схему определения NUMT в 99% случаев (182 из 184 NUMT от 39 человек; рис. 1a) (Методы).



Fig. 1: NUMT detection in 53,574 individuals.

a, Bioinformatics pipeline for detecting NUMTs that are not present in the reference sequence, iцитоскелет ncluding concatenated NUMTs (boxed). Short reads: mtDNA is shown in orange, nuclear DNA (nuDNA) is shown in blue. Long reads are shown in green. MT, mitochondrial genome; NU genome, nuclear genome. b, 1,637 distinct NUMTs were detected in 53,574 individuals. From the outside: (1) nuclear chromosomes (right) and mtDNA genes (left); (2) frequencies of ultra-rare and rare NUMTs; (3) frequencies of common NUMTs; (4) links connect the mtDNA and nuclear breakpoints. c, mtDNA fragments of the 1,637 distinct NUMTs from 53,574 individuals. Left, size and location of NUMTs on mtDNA. Links connect mtDNA fragments and nuclear insertion site. d, The average number of NUMTs per individual that is not present in the reference sequence and was detected by at least five discordant reads. e, Left, the proportion of NUMTs by population frequency (common, F≥1%; rare, 0.1%≤ F < 1%; and ultra-rare, F < 0.1%). Middle, donut plots show the proportion of known (darker colour) and newly (lighter colour) identified NUMTs. Right, bar charts show the frequency of individuals carrying common, rare, ultra-rare and private NUMTs. 99.87% of individuals carry at least one common NUMT (F > 1%), 26.2% of individuals carry at least one NUMT with F < 1%, 14.2% of individuals carry at least one NUMT with F < 0.1% and 3.6% of individuals carry at least one private NUMT. f, Size distribution of germline NUMTs. NUMTs smaller than 500 bp are shown in the inset. g, Correlation between NUMT frequency and size.


Discussion


NUMT считались древними остатками предыдущих событий транслокации мтДНК, которые часто были общими между родственными видами42. Здесь мы показываем, что формирование NUMT является непрерывным процессом, при этом зародышевые события de novo происходят примерно один раз на каждые 104 родов, а соматические инсерции - один раз на каждые 103 раковых заболеваний. Это приводит к высокому разнообразию NUMT в человеческой популяции, причем 14,2% людей являются носителями сверхредких NUMT, встречающихся менее чем у 1 из 1000 человек. Массовый перенос фрагментов мтДНК в геном ядра неизбежно увеличил бы размер генома человека3. Однако обратная корреляция между размером NUMT и частотой их появления в популяции указывает на селективный процесс, уравновешивающий вставку NUMT, поддерживающий размер генома и удаляющий NUMT, влияющие на экспрессию генов. Совместное расположение NUMTs с PRDM9-связывающими сайтами могло бы облегчить их удаление в зародышевой линии, поскольку PRDM9 определяет сайты горячих точек рекомбинации во время мейоза37. Таким образом, NUMTs могут действовать как "временные исправления", напоминающие липкий пластырь, восстанавливая DSBs до их удаления во время мейоза. Более высокое бремя и распределение NUMTs в раковых опухолях, вероятно, отражает повышенное состояние нестабильности генома в отсутствие отбора в течение коротких периодов времени.
Хотя NUMTs могут охватывать всю молекулу мтДНК, точки разрыва NUMT были более распространены в некодирующей D-петле, включая начала репликации тяжелой и легкой нитей. Это дает возможность предположить, что делеции мтДНК участвуют в образовании NUMT. Однако более убедительное объяснение связано с транскрипцией мтДНК и связанной с ней репликацией, которая берет начало в D-петле43. Недавнее описание митохондриальных грыж и макропор BSX-BAK обеспечивает один из путей44, потенциально связанный с утечкой промежуточных продуктов РНК в цитоплазму после DSBs мтДНК45. Это также может происходить в отдельных клетках, способствуя соматическому мозаицизму.
Транслокация генов органеллы в ядро сыграла ключевую роль в установлении симбиотических отношений между митохондриями и эукариотическими клетками. Здесь мы показываем, что механизмы переноса ДНК остаются активными и изменяют зародышевую линию примерно один раз из каждых 4 000 рождений. Поэтому можно предположить, что эндосимбиоз, начавшийся около 1,45 миллиарда лет назад, еще не завершен.