Пользователи:
ЗИГОТИЧЕСКОГО ЭМБРИОНА АКТИВАЦИЯ



Роль пионерских транскрипционных факторов

Pioneer Transcription Factors: The First Domino in Zygotic Genome Activation
Bo Fu ,Hong Ma and Di Liu
Biomolecules 2024, 14(6), 720; https://doi.org/10.3390/biom14060720

Zygotic genome activation (ZGA) is a pivotal event in mammalian embryogenesis, marking the transition from maternal to zygotic control of development. During the ZGA process that is characterized by the intricate cascade of gene expression, who tipped the first domino in a meticulously arranged sequence is a subject of paramount interest. Recently, Dux, Obox and Nr5a2 were identified as pioneer transcription factors that reside at the top of transcriptional hierarchy. Through co-option of retrotransposon elements as hubs for transcriptional activation, these pioneer transcription factors rewire the gene regulatory network, thus initiating ZGA. In this review, we provide a snapshot of the mechanisms underlying the functions of these pioneer transcription factors. We propose that ZGA is the starting point where the embryo’s own genome begins to influence development trajectory, therefore in-depth dissecting the functions of pioneer transcription factors during ZGA will form a cornerstone of our understanding for early embryonic development, which will pave the way for advancing our grasp of mammalian developmental biology and optimizing in vitro production (IVP) techniques.
После оплодотворения геном тотипотентного эмбриона остается транскрипционно молчаливым, а затем инициирует всплески транскрипции, известные как активация зиготического генома (ZGA). ZGA означает переход развития с материнского генетического материала к зиготическому контролю. Этот переход включает в себя не только деградацию материнских компонентов, но и активацию зиготического генома в двух или более различных транскрипционных фазах. Если взять в качестве примера ранний эмбрион мыши, то ZGA начинается с малой фазы ZGA, которая происходит на одноклеточной стадии эмбриона, а затем следует большая фаза ZGA, которая более выражена и происходит на двухклеточной стадии. Фактически, время и ход ZGA варьируют у разных видов, что отражает разнообразие стратегий эмбрионального развития, используемых различными млекопитающими [1,2]. Процесс ZGA инициирует ряд жестко регулируемых молекулярных событий, которые необходимы для продолжения эмбриогенеза. В частности, во время ZGA происходит ремоделирование хроматина, которое облегчает доступ эмбрионального генома к транскрипционному механизму [3,4]. В этом сложном механизме транскрипции ключевую роль играют факторы транскрипции, особенно отдельная подгруппа, известная как пионерские транскрипционные факторы.
В архитектурной конфигурации нуклеосомы геномная ДНК обернута вокруг октамерного ансамбля гистонов, что представляет собой серьезное препятствие для связывания факторов транскрипции. Хотя архитектурная конфигурация нуклеосомы имеет решающее значение для организации и целостности генома, эта структурная конформация представляет собой серьезную проблему для процессов активации транскрипции, в том числе связанных с ZGA [5]. Пионерские транскрипционные факторы, в отличие от других транскрипционных факторов, требующих доступного хроматина, могут связываться непосредственно с нуклеосомной ДНК внутри уплотненного хроматина, тем самым инициируя ремоделирование хроматина и обеспечивая экспрессию генов. Термин "пионер" относится к транскрипционным факторам, которые отвечают определенным критериям: они связываются со своими (частичными) мотивами в закрытом хроматине, необходимы для локального раскрытия хроматина in vivo и могут связываться с нуклеосомами in vitro [6].
Пионерские транскрипционные факторы, рассматриваемые в этом обзоре, включая Dux, Obox и Nr5a2, наделены уникальной способностью распознавать и связываться со специфическими последовательностями в рамках своих целевых мотивов среди компактной архитектуры закрытого хроматина. Это явление первоначальной стыковки имеет решающее значение, поскольку оно запускает последовательность действий по ремоделированию хроматина, которые завершаются деконденсацией хроматина. Эти пионерские транскрипционные факторы демонстрируют удивительную способность проникать на территории хроматина, обычно характеризующиеся репрессивным состоянием в живом организме, катализируя переход хроматина из недоступного в открытое состояние в физиологической среде in vivo. Такое преобразующее действие на хроматиновый ландшафт опосредовано различными механизмами, каждый из которых вносит свой вклад в создание более транскрипционно благоприятной среды [7-11]. Соответственно, считается, что присущее этим пионерским транскрипционным факторам свойство действовать в качестве триггера доступности хроматина особенно важно для инициации транскрипционного пробуждения зиготы.
В настоящее время выяснение механизмов ZGA у млекопитающих остается сравнительно слабым, особенно по сравнению с обширными знаниями, накопленными у таких модельных организмов, как плодовые мушки и рыбки данио, пионерные транскрипционные факторы которых уже подвергались детальному изучению [12-16]; а пионерские транскрипционные факторы, запускающие ZGA у млекопитающих, до сих пор остаются неуловимыми. Удивительно, но недавние исследования пролили свет на сложность транскрипционной регуляции в эмбриональном развитии млекопитающих, показав, что не один, а несколько пионерских транскрипционных факторов (включая Dux, Obox и Nr5a2) связываются с геномом для открытия хроматина, тем самым запуская инициацию ZGA [17-21]. Удивительно, но все эти три пионерских транскрипционных фактора используют ретротранспозоны в качестве хабов для контроля экспрессии генов ZGA, тем самым инициируя процесс ZGA. В этом обзоре мы кратко описали, как Dux, Obox и Nr5a2 функционируют в качестве активаторов ZGA у млекопитающих, и описали взаимодействие между этими пионерскими транскрипционными факторами и ретротранспозонами.
2. Роль Dux в ZGA


Dux у мышей или DUX4 у людей, члены семейства генов двойного гомеобокса (DUX), которые сохранились у млекопитающих, были идентифицированы как пионерский транскрипционный фактор, инициирующий ZGA. Используя нанопоровое секвенирование со сверхдлинным считыванием, Mitsuhashi и др. обнаружили, что локусы генов DUX4 расположены в пределах 3,3-килобитных повторов массива D4Z4 в субтеломерной области хромосомы 4q35 у человека [22]. Результаты, полученные с помощью флуоресцентной гибридизации ДНК in situ (FISH), также подтвердили наличие гибридизационного сигнала повторов Dux на хромосоме 10 у мышей [23]. Гены двойного гомеобокса, такие как тандемные повторы DUX4, расположенные в перицентромерных областях, обычно несут характерный гетерохроматин, который служит для репрессии экспрессии в подавляющем большинстве типов соматических клеток. Когда происходит патологическая аномальная экспрессия DUX4 из этих тандемных повторов, аберрантная экспрессия обычно приводит к транскрипционной активации ранней эмбриональной программы, а затем вызывает фациоскапуло-гуморальную мышечную дистрофию (FSHD) [24,25]. Однако в контексте развития мышиный DUX и его человеческий аналог, DUX4, экспрессируются до ZGA у соответствующих видов [19,26]. Экспрессия Dux быстро возрастает после оплодотворения и достигает пика на стадии двух клеток. Этот временной паттерн экспрессии указывает на то, что переходная экспрессия Dux может подчеркивать ключевую роль в оркестровке ZGA [27]. Например, что касается эмбрионов с переносом ядер соматических клеток (SCNT), когда ядро соматической клетки переносится в энуклеированный ооцист для получения эмбриона, генетически идентичного клетке-донору, Dux способен исправлять аберрантное ацетилирование H3K9ac и вызывать локальное расслабление хроматина у SCNT-эмбрионов, обеспечивая тем самым соответствующую двухклеточную активацию генома. Как правило, аномальные паттерны H3K9ac приводят к снижению активации генома на двухклеточном этапе развития SCNT-эмбрионов. Тем не менее, избыточная экспрессия Dux корректирует аберрантный сигнал H3K9ac в своих сайтах-мишенях, тем самым способствуя правильной активации генома на двухклеточной стадии и повышая эффективность SCNT. Кроме того, Yang и др. подтвердили, что развитие, которому способствует TSA, заметно тормозится в отсутствие Dux во время развития эмбрионов SCNT, что также указывает на то, что эффективность спасения с помощью TSA во многом зависит от активации Dux [28].
Исследование функциональных доменов Dux демонстрирует его структурную сложность и выявляет критические домены, ответственные за его различные регуляторные действия, что еще раз подтверждает разностороннюю роль Dux в эмбриональной транскрипционной регуляции во время ZGA. Белок Dux мыши, подобно человеческому белку DUX4, состоит из трех функциональных доменов. Два смежных гомеодомена расположены на N-конце (аминокислоты 29-72 и 113-166), а единственный домен - на С-конце (аминокислоты 626-674), оставляя аминокислоты 167-625 Dux в промежуточной области. Huang et al. подтвердили, что Dux и DUX4 содержат консервативные N-концевые двойные гомеодомены, которые необходимы для их ядерной локализации, и любого одиночного гомеодомена также достаточно, чтобы показать ядерную локализацию со всем С-концом. Кроме того, Huang et al. обнаружили, что промежуточная область (AA167-625) белка Dux отвечает за активацию транскрипции Zscan4 и MERVL [29]. Терминальные 49 аминокислот на С-конце белка Dux мыши демонстрируют значительное сходство с соответствующим С-концевым доменом человеческого белка DUX4. Такая структурная консервация подчеркивает потенциальную эволюционную параллель в их функциональных ролях, указывая на то, что эти С-концевые последовательности могут обладать критическими возможностями транскрипционной регуляции [23]. Недавно Christina и др. идентифицировали 5 примерно 100-аминокислотных повторов, за которыми следует один 14-аминокислотный высококислотный хвост в С-конце Dux. Механистически, существует кооперативность между активными повторами и кислым хвостом, что может способствовать привлечению кофакторов, открытию мишеней и транскрипции, опосредованной Dux [30]. Что касается роли DUX4 в обеспечении доступности хроматина для транскрипции, то DUX4 также регулирует динамику хроматина через свой С-концевой домен, тем самым влияя на экспрессию генов. Более подробно, DUX4 рекрутирует гистоновые ацетилтрансферазы p300/CBP к своим целевым генам. Эта вербовка приводит к увеличению ацетилирования H3K27 в этих сайтах, как показывают эксперименты по иммунопреципитации хроматина. В частности, было замечено, что связывание DUX4 приводит к значительным изменениям ацетилирования в локусе ZSCAN4, с заметным увеличением H3K27ac, фланкирующего сайт связывания DUX4. Это предполагает реорганизацию расположения нуклеосом вокруг этих локусов. Кроме того, DUX4 способен связываться с занятой нуклеосомами ДНК и способствовать ремоделированию хроматина. Об этом свидетельствует перемещение нуклеосом, особенно в ранее недоступных местах, после связывания DUX4. Данные ChIP-seq также показывают, что связывание DUX4 коррелирует с истощением гистона H3 и увеличением ацетилирования H3K27 в целевых локусах, что предполагает роль в репозиции нуклеосом [31]. Хотя белок DUX4 рекрутирует гистоновую ацетилтрансферазу P300 через свой С-концевой участок и вызывает локальное раскрытие хроматина, это указывает на то, что DUX4 может действовать как пионерский фактор, прямое связывание DUX4 с нуклеосомами in vitro остается неподтвержденным. Несмотря на первостепенное положение Dux в иерархии транскрипционных регуляторов, мы также должны учитывать, что ZGA может дублироваться другими пионерными транскрипционными факторами. В моделях эмбрионов мышей с дефицитом Dux было затронуто меньшинство генов-мишеней Dux, и нокаутные эмбрионы не замирали на двухклеточной стадии, а доживали до взрослого состояния, хотя и с ограниченными способностями к развитию [32-34]. Хорошо известно, что гены, обладающие гомологией последовательностей, могут проявлять генетическую избыточность [35], а многочисленные функционально перекрывающиеся факторы обычно направлены на достижение телеологической цели, чтобы противостоять спорадическим мутациям или дефектам [36,37]. Таким образом, есть основания полагать, что такая избыточность может представлять собой эволюционную адаптацию или отказоустойчивый механизм, гарантирующий инициацию ZGA.
3. Роль Obox в ZGA


Учитывая, что Dux является гомеобоксным геном, исследователи старательно изучают другие гомеобоксные гены, способные запускать ZGA. Недавно Obox, член семейства гомеобоксных генов, также был идентифицирован как пионерный транскрипционный фактор, функционально избыточный по отношению к DUX во время ZGA [20,38]. Гены Obox, в том числе Obox4, картируются на проксимальной части хромосоме 7 у мыши [39]. Изначально уровни транскрипции и трансляции Obox4 в ооцитах низкие. Во время ZGA Obox4 и набор его псевдогенов (Obox4-ps) демонстрируют заметную динамику в экспрессии: экспрессия резко возрастает в ранних двухклеточных эмбрионах, а затем быстро снижается в поздних двухклеточных эмбрионах [20]. Белок Obox4 состоит из трех отдельных областей: N-концевой области, центральной гомеодоменовой области (HD) и С-концевой области. Используя систему экспрессии зеленого флуоресцентного белка (GFP), Park et al. показали, что интактная HD-область Obox4, которая содержит предположительный ДНК-связывающий мотив, необходимый для его транскрипционной активности, может быть ответственна за ядерную локализацию Obox4 [40].
Общепризнано, что ZGA у мышей характеризуется выраженным повышением уровня экспрессии генов, которые уникальным образом экспрессируются на стадии двух клеток (2С), причем значительное число из них кооптировали длинные терминальные повторы (LTR) MERVL в качестве промоторов [41]. Таким образом, вполне естественно возникает вопрос, может ли Obox4 вызывать ZGA путем активации MERVL, подобно эффектам, вызываемым Dux. Создав репортерную линию mESC 2C::tdTomato с трансгенным красным флуоресцентным белком tdTomato, управляемым 5'-LTR MERVL, Guo и др. продемонстрировали, что эктопическая экспрессия Obox4 приводит к значительному увеличению экспрессии tdTomato, зеркально отражая эффект, наблюдаемый в случае Dux, что подчеркивает инструментальную функцию Obox4 в оркестровке ZGA [37]. Неожиданно, когда генетически нокаутные mESC с Obox4 использовались в качестве ядерных донорских клеток для SCNT, 54,4 % реконструированных эмбрионов все еще развивались до стадии бластоциста. Кроме того, одиночный нокдаун Obox4 приводил к умеренной задержке развития зигот, при этом почти 50 % эмбрионов достигали стадии бластоцисты. Однако совместный нокдаун Obox4 и Dux значительно замедлял формирование бластоцист, в результате чего более 80 % эмбрионов дегенерировали или прекращали развитие, не достигнув стадии четырех клеток, и менее 20 % демонстрировали морулоподобную структуру. Присутствие Obox4 может преодолеть арест развития эмбрионов с двойным нокдауном Obox4/Dux. Хотя секвенирование РНК эмбрионов двухклеточной стадии показало более серьезную дисрегуляцию двухклеточных генов и транспозируемых элементов в результате двойного нокдауна Obox4 и Dux по сравнению с одиночным нокдауном, повторное введение Obox4 может исправить дисрегуляцию транскриптома, вызванную двойным нокдауном. Следует отметить, что нокаут всего кластера Obox (включая Obox1, Obox2, Obox3/4, Obox5 и Obox7) приводил к аресту эмбрионов на ст. 2-4 клетки. Это явление указывает на то, что хотя Obox4 в определенной степени играет дублирующую роль в отсутствие Dux, функции белков Obox не могут быть полностью компенсированы Dux, так как полный нокаут кластера Obox приводил к серьезному аресту развития, несмотря на присутствие Dux [20,38].
В дополнение к Obox4, Obox3 также играет критическую роль в активации ZGA. Obox3 взаимодействует со специфическими повторяющимися элементами, такими как длинные терминальные повторы MERVL. Используя ChIP-seq для обнаружения сайтов связывания Obox3 по всему геному, Sakamoto и др. обнаружили, что Obox3 преимущественно связывается с промоторами генов ZGA, способствуя предварительной конфигурации РНК-полимеразы II в этих местах. Кроме того, Obox3 значительно усиливает приобретение тотипотентности у эмбрионов, подвергшихся ядерному переносу соматических клеток (SCNT). Sakamoto и др. продемонстрировали, что введение мРНК Obox3 в SCNT-эмбрионы значительно повышает процент успешного достижения SCNT-эмбрионами стадии бластоцисты. Этот процесс сопровождается восстановительной активацией генов ZGA и специфических повторяющихся элементов, таких как MERVL, что указывает на то, что Obox3 играет важнейшую роль в исправлении аномальных транскрипционных программ в SCNT-эмбрионах [42].
С точки зрения механики, Obox управляет своевременной предварительной конфигурацией Pol II и доступностью хроматина в регуляторных элементах, что инициирует активацию мишеней Pol II и запускает ZGA. Во время ZGA мыши Pol II проходит фазы "загрузки, предварительной конфигурации и синтеза" [43], а связывание Pol II коррелирует с плотностью CG. Более подробно, хотя промоторы, богатые CG, изначально доступны для загрузки Pol II [44], пики Pol II, характерные для поздних двухклеточных эмбрионов, характеризующиеся низким содержанием CG, требуют участия дополнительных транскрипционных факторов [20]. В поздних двухклеточных мишенях Pol II наиболее обогащен мотив Obox, а белок Obox демонстрирует самую высокую экспрессию среди предполагаемых транскрипционных факторов; кроме того, Ji et al. с помощью Stacc-seq подтвердили, что белки Obox отвечают за рекрутирование РНК-полимеразы II в бедных CG промоторах генов ZGA у эмбрионов двухклеточной стадии [20]. Учитывая, что неспособность открывать промоторы и энхансеры коррелирует с пониженной регуляцией близлежащих генов ZGA, этот феномен позволяет предположить, что белки Obox способствуют открытию хроматина в регуляторных элементах и направляют предварительную конфигурацию Pol II в этих местах. Следовательно, отсутствие Obox приводит к дефектному ZGA [20]. Интересно, что по результатам ATAC-seq было показано, что активные энхансеры, определяемые по дистальному H3K27ac, демонстрировали значительное снижение доступности хроматина в поздних двухклеточных эмбрионах с материнско-зиготическим нокаутом Obox, что указывает на то, что истощение Obox снижает доступность хроматина в специфических для поздних двухклеточных эмбрионов сайтах связывания Pol II [20]. Хотя Obox может быть вовлечен в раскрытие хроматина, вопрос о том, обладают ли белки Obox всеми характеристиками пионерских факторов, остается открытым. В совокупности белки Obox играют важную роль в повышении доступности хроматина в промоторах и энхансерах, бедных CG, и оркестровке временной преконфигурации РНК-полимеразы II, тем самым способствуя началу транскрипционной активации генов, зависящих от РНК-полимеразы II, что открывает путь к началу ZGA.
4. The Role of Nr5a2 in ZGA


Ядерный рецептор подсемейства 5 группы А, член 2 (Nr5a2), также известный как гомолог рецептора печени-1 (LRH-1), - это цинковыми пальчиками фактор транскрипции, принадлежащий к суперсемейству сиротских (orphan) ядерных рецепторов. Мышиный Nr5a2, ортолог NR5A2 у человека, картируется на хромосоме 7 у мыши. Предыдущие исследования показали, что Nr5a2 экспрессируется в печени, экзокринной поджелудочной железе, кишечных криптах и яичниках взрослых млекопитающих [45-48]. Недавно экспериментальные данные, полученные с помощью иммунофлуоресценции, показали, что хотя экспрессия Nr5a2 в ооцитах GV (germinal vesicle) очень низкая, она значительно повышается в эмбрионах, находящихся на двухклеточной стадии [21]. Таким образом, хотя известно, что Nr5a2 регулирует гомеостаз холестерина и желчных кислот, а также доставку холестерина и производство стероидов [49-52], мы ставим вопрос о том, действует ли он также как кандидат в регуляторы ZGA.
Чтобы выяснить потенциальную роль Nr5a2 в раннем эмбриональном развитии, особенно в контексте ZGA, был проведен мониторинг потенциала развития оплодотворенных эмбрионов. SR1848, химический ингибитор, заставляет Nr5a2 перемещаться из ядра в цитоплазму, тем самым не позволяя ему активировать транскрипцию своих генов-мишеней. Чтобы конкретно изучить функцию Nr5a2, использовали SR1848 [53,54]. Когда эмбрионы подвергались воздействию SR1848, начиная с 6 ч после оплодотворения (hpf), они не развивались в бластоцисты и демонстрировали обширную фрагментацию. Эти эмбрионы разительно отличаются от контрольных, что соответствует роли Nr5a2 в поддержании плюрипотентности "нативных" ES-клеток мыши [55]. Интересно, что преходящее ингибирование Nr5a2 с 6 до 36 hpf приводило к остановке развития на двухклеточной стадии, в то время как эмбрионы, обработанные SR1848, начиная с 36 hpf (двухклеточная стадия), проявляли менее выраженный фенотип, чем те, которые обрабатывали с 6 hpf. Эти явления указывали на то, что активность Nr5a2 имеет решающее значение в период между оплодотворением и двухклеточной стадией, совпадающей с прохождением ZGA [21]. Впоследствии, чтобы выяснить, инициирует ли Nr5a2 начало ZGA, Gassler и др. использовали алгоритмы одномолекулярного FISH-анализа для количественной оценки экспрессии de novo генов ZGA. Они обработали зиготы препаратом SR1848, после чего наблюдали дозозависимое снижение количества зарождающихся транскриптов ZGA [21]. Кроме того, используя метод CUT&Tag, оптимизированный для сверхмалых входных образцов, Gassler и др. проверили, активно ли связывается Nr5a2 вблизи участков генов ZGA у двухклеточных эмбрионов. Более подробно, используя специфические антитела против Nr5a2, результаты CUT&Tag показали значительное обогащение Nr5a2 в этих регионах; а мотивы, возникающие из пиков CUT&Tag, характеризовались последовательностью (A/G) (A/G) T, расположенной выше консенсусных последовательностей, которая также была обнаружена в мотиве, встроенном в SINE B1/Alu 5YR выше по течению от генов ZGA. Это позволяет предположить, что ретротранспозоны SINE B1 могут служить критическими регуляторными мишенями для Nr5a2 в период начала ZGA [21]. Учитывая опубликованные данные ATAC-seq и ChIP-seq (включая модификации гистонов H3K4me3 и H3K27ac) [56,57], было также обнаружено, что Nr5a2 связывается с открытым хроматином, предпочтительно нацеливаясь на энхансеры у двухклеточных эмбрионах [21].
С точки зрения механики, логично поставить вопрос о том, выполняет ли Nr5a2 свои биологические функции, способствуя доступности хроматина. На основе технологии ChARM (Chromatin Accessibility Revealed by Microscopy), как исследования нокдауна, так и эксперименты по химическому ингибированию подтвердили, что Nr5a2 положительно коррелирует с доступностью хроматина в раннем эмбриональном развитии; в частности, обработка SR1848 приводила к значительному снижению доступности хроматина по большинству мотивов Nr5a2. В то же время Nr5a2 демонстрирует мотив-зависимое связывание с нуклеосомной ДНК, преимущественно в местах входа-выхода, подобно известным пионерным факторам. Взаимодействие Nr5a2 с нуклеосомной ДНК является специфичным и конкурентным, что также соответствует характеристикам пионерских транскрипционных факторов. В совокупности сочетание геномных профилей связывания, анализов доступности хроматина и связывания нуклеосом in vitro доказало, что Nr5a2 проявляет свойства, соответствующие пионерским транскрипционным факторам [21]. Недавно Kobayashi и др. продемонстрировали механизм, лежащий в основе того, как Nr5a2 взаимодействует с нуклеосомами, проявляя свою пионерскую активность [58]. Кристаллографический анализ комплекса NR5A2-ДНК человека показал, что α-спираль домена цинковых пальчиков связывается с основной бороздкой, а CTE (карбокси-концевое расширение) - с минорной бороздкой [59]. Nr5a2, действуя как мономер, специфически связывается с мотивом ДНК как на голой ДНК, так и на нуклеосомах [21,60]. Представив крио-электронно-микроскопическую структуру NR5A2 человека, связанного с нуклеосомой, Kobayashi и др. заметили, что петля CTE ДНК-связывающего домена NR5A2 конкурентно взаимодействует с якорем минорной бороздки ДНК нуклеосомы, способствуя высвобождению ДНК сайта входа-выхода, что соответствует модели, в которой взаимодействия гистон-ДНК компенсируются пионерными взаимодействиями транскрипционного фактора-ДНК [58,61]. Кроме того, хотя остаток D159 в CTE не является необходимым для связывания ДНК, он имеет решающее значение для поддержания стабильной ассоциации с нуклеосомой и непрерывного "разворачивания" ДНК [61]. Важно отметить, что мотив RGGR в петле CTE является общей характеристикой для членов семейств сиротских ядерных рецепторов NR5A и NR3B, это указывает на то, что конкуренция в минорной бороздке, опосредованная петлей CTE, может быть консервативным механизмом в этих транскрипционных факторах [59].
Несмотря на выводы из исследования Gassler et al. о том, что Nr5a2 играет определенную роль в процессе ZGA, мы также должны учитывать, что роль Nr5a2 в ZGA остается предметом продолжающихся споров. Недавние исследования с использованием более строгих генетических подходов поставили под сомнение эти выводы. Например, Lai и др. показали, что Nr5a2 в значительной степени не нужен для глобальной ZGA, но необходим для программы генов на стадии 4-8 клеток.
Удивительно, но, используя комплексные методы ATAC-seq и CUT&RUN для профилирования связывания Nr5a2, Lai et al. получили высококачественные наборы данных, которые подчеркнули связывание Nr5a2 с цис-регуляторными элементами, особенно в 2-клеточных и 8-клеточных эмбрионах, и продемонстрировали существенную роль Nr5a2 в активации генов во время перехода на стадию 4-8 клеток. Их данные показали, что хотя нокдаун или нокаут Nr5a2 не оказывал существенного влияния на ZGA, он приводил к нарушению активации генов на стадии 4-8 клеток и вызывал эмбриональный арест на стадии морулы. Аналогичным образом, Festuccia и др. сообщили, что нокаутные эмбрионы с Nr5a2 выходят за пределы двухклеточной стадии, но демонстрируют значительные задержки в развитии и морфологические аномалии на стадии морулы, что подчеркивает его важнейшую роль в развитии морулы и в спецификации первой линии [62,63]. Мы предполагаем, что дальнейшие исследования с использованием более специфичных ингибиторов, нацеленных на Nr5a2, или мышей того же генетического фона могут помочь разрешить споры о роли Nr5a2.5. Факторы транскрипции Pioneer используют элементы ретротранспозонов в качестве хабов для регуляции ZGA
Ретротранспозоны, произошедшие от древних ретровирусов, колонизировали геномы и сейчас составляют почти 40 % геномов млекопитающих [64]. Ретротранспозоны делятся на ретротранспозоны с длинным терминальным повтором (LTR), также называемые ERV (эндогенные ретровирусы), и ретротранспозоны без LTR; ретротранспозоны без LTR также делятся на LINEs (длинные интерсерсированные элементы) и SINEs (короткие интерсерсированные элементы) [65,66,67,68]. Учитывая, что транспозиционная активность ретротранспозонов может нарушать целостность генома и потенциально приводить к раку и аутоиммунным заболеваниям [68,69], ретротранспозоны обычно замалчиваются в большинстве соматических клеток посредством различных эпигенетических модификаций, включая метилирование ДНК и репрессивные модификации гистонов, чтобы снизить риск ретротранспозиции [70,71]. Как ни странно, всплески транскрипции ретротранспозонов обычно происходят во время ZGA у преимплантационных эмбрионов [72,73]. С эволюционной точки зрения мы полагаем, что существует тонкий баланс между активацией транскрипции ретротранспозонов и целостностью генома в развивающемся эмбрионе млекопитающих. Сталкиваясь с давлением естественного отбора, ретровирусы и хозяева идут на компромисс друг с другом. Если взять в качестве примера эндогенные ретровирусы, то, с одной стороны, на протяжении всей эволюционной истории рекомбинация между LTR приводила к потере внутренних генов ERV, что приводило к образованию одиночных LTR и предотвращению вредной экспрессии вирусных белков в геноме хозяина [74]; с другой стороны, во время окна репрограммирования ранние эмбрионы выдерживают мощный натиск экспрессии ERV, используя цис-регуляторные элементы, расположенные в LTR, для перестройки сети регуляции генов [75]. Хорошо известно, что, несмотря на колонизацию эгоистичными ретровирусами, геномы хозяев успешно одомашнили ретротранспозонные последовательности на благо вида-хозяина. Этот процесс также известен как кооптация [76,77]. Другими словами, в контексте раннего развития хозяина ретротранспозоны эволюционировали цис-регуляторные последовательности, которые рекрутируют кодируемые хозяином факторы, такие как транскрипционные факторы, для обеспечения экспрессии важных генов развития во время ZGA, что в конечном итоге приводит к кооптации хозяина.
Во время ZGA пионерские транскрипционные факторы, находящиеся на вершине транскрипционной иерархии, инициируют каскадное воздействие на экспрессию генов, используя ретротранспозонные элементы в качестве концентраторов. Три пионерских транскрипционных фактора (такие как Dux, Obox и Nr5a2), о которых пойдет речь в этом обзоре, выполняют свои функции, нацеливаясь на мотивы, встроенные в ретротранспозоны, как показано на рисунке 1. Распространение ретротранспозонов и связанных с ними цис-регуляторных элементов способствует расширению сайтов связывания транскрипционных факторов (TFBS) по всему геному, тем самым стимулируя эволюционные инновации в регуляторных механизмах.



Figure 1. Scheme of pioneer transcription factors activating ZGA genes via retrotransposon elements. (A) ZGA gene activation by Dux. During ZGA, endogenous Dux is transiently expressed. Through the more divergent homeodomain (the first homeodomain) in DUX-C family proteins, Dux binds to the MERVL-LTR, which is co-opted by the host as an alternative promoter, thereby activating downstream ZGA genes. (B) ZGA gene activation by Obox. During ZGA, RNA pol II alone cannot locate CG-poor promoters of ZGA genes; therefore, Obox proteins are essential for recruiting RNA pol II to these promoters, which in turn activate downstream ZGA genes. (C) ZGA gene activation by Nr5a2. Nr5a2 specifically binds to its motif within a subtype of SINE B1/Alu transposable elements, which are prevalent in the enhancers of ZGA genes, ultimately activating downstream ZGA genes.

Dux был определен как центральный индуктор ZGA, в основном за счет связывания с MERVL LTR [17-19]. Значительная часть транскриптома на стадии двух клеток инициирует транскрипцию в пределах MERVL LTR. По-видимому, MERVL LTR кооптирован геномом хозяина в качестве альтернативного промотора, стимулирующего экспрессию генов, связанных с двухклеточной стадией во время ZGA [73]. Используя CRISPRi (CRISPR-интерференцию), Yang и др. нарушили 2 485 (93 %) инсерций MERVL-LTRs (MT2-Mm) в двухклеточных эмбрионах, а затем наблюдали подавление активности сотен генов ZGA [78]. Важно отметить, что анализ с использованием консервативного подхода уникальных считываний показал, что Dux напрямую взаимодействовал по меньшей мере с 53 % всех MERVL-LTRs (MT2-Mm) и по меньшей мере с 37 % областей, которые показали повышенную чувствительность к ATAC в 2C-подобных клетках в mESCs. Кроме того, был идентифицирован консенсусный DUX-связывающий мотив (WGATTYAATCW), который значительно обогатился в регионах, демонстрирующих повышенную чувствительность к ATAC после сверхэкспрессии Dux. Интересно, что MERVL-LTRs (MT2_Mm) не показали значительного обогащения DUX4-мотивом, а HERVL-LTRs (MLT2A1/2) продемонстрировали лишь минимальное обогащение DUX-мотивом [18]. Этот феномен позволяет предположить, что, хотя Dux у мышей и DUX4 у человека не содержат интронов и расположены тандемными рядами на нескольких хромосомах, что указывает на функциональную консервацию [23], они эволюционировали как видоспецифичные, возможно, в ответ на ERV.
Obox преимущественно связывается с генами ZGA и регулирует их работу через мотив Obox в эмбрионах мыши. Ji et al. исследовали сайты связывания белков Obox с ДНК в ранних эмбрионах мыши путем сверхэкспрессии генов Obox (Obox1, Obox5 и Obox3), помеченных меткой Flag. С помощью секвенирования следующего поколения и биоинформатики они подтвердили, что Obox обогащен повторяющимися элементами MERVL и B1/B2/B4. Более подробно, они идентифицировали два основных мотива de novo, которые близко соответствовали известному мотиву связывания Obox (TAATCCC) [20,79]. Кроме того, эти мотивы de novo часто располагаются близко друг к другу в местах связывания, образуя расширенный мотив связывания (ACNCCTTTAATCCCAG), причем Obox1 демонстрирует самую длинную последовательную версию этого мотива (CCTTTAATCCCAG). Примечательно, что около 95,9% расширенного мотива Obox расположено в элементе B1, что приводит к более сильной активации генов, чем 7-bp мотив в репортерных анализах у эмбрионов. Кроме того, Guo и др. обнаружили, что Obox4 напрямую связывается с локусами MERVL и MERVK и активирует специфические элементы MERVL и MERVK независимым от Dux образом, позиционируя Obox4 как избыточный ген по отношению к Dux в контексте ZGA [38]. Примечательно, что в контексте ZGA гены, специфичные для двухклеточной стадии, демонстрируют выраженное обогащение мотивов связывания транскрипционного фактора Obox в промоторных областях, причем наблюдается увеличение количества мотивов по сравнению с генами, активируемыми на последующих стадиях развития, что указывает на отдельный регуляторный ландшафт по сравнению с генами, активируемыми на последующих стадиях развития [20].
Nr5a2 был идентифицирован как важнейший активатор ZGA в эмбрионах мыши, в первую очередь благодаря его связыванию со специфическими мотивами в подтипе транспозируемых элементов SINE B1/Alu, расположенных в цис-регуляторных областях генов ZGA. Исследуя обогащение мотивов транскрипционных факторов в цис-регуляторных областях генов ZGA, было обнаружено, что в значительном большинстве генов ZGA преобладает специфическая последовательность мотивов, содержащая вариабельные участки пиримидин/пурин (YR). В частности, СА-вариант пятого участка YR, YR5, ассоциирован с повышенной доступностью хроматина и повышенным ацетилированием гистонов, что указывает на его важную функцию во время ZGA. Более подробно, CA-вариант мотива включает консенсусную последовательность TCAAGGCCA, которая была идентифицирована как мотив Nr5a2. При сравнении сайтов связывания Nr5a2 с перекрытием с транспозиционными элементами SINE B1 было обнаружено, что 70% пиков Nr5a2 перекрываются с SINE B1, что позволяет предположить, что транспозоны SINE B1 являются основными мишенями для Nr5a2. Мотив Nr5a2, выявленный в пиках, включает последовательность (A/G)(A/G)T перед консенсусными последовательностями, что аналогично мотиву 1 в SINE B1/Alu 5YR перед генами ZGA [21].
5. Conclusions


Пионерские транскрипционные факторы, такие как Dux, Obox и Nr5a2, управляют сложным регуляторным ландшафтом во время ZGA, что подчеркивает их центральную роль в биологии развития и потенциальную полезность для повышения эффективности перепрограммирования. Геномы хозяев успешно одомашнили ретротранспозонные элементы, которые служили как вызовом, так и подспорьем, развивая цис-регуляторные последовательности, что обеспечивает экспрессию важнейших генов развития во время ZGA и достигает симбиотического использования этих ретротранспозонных элементов. В частности, пионерские транскрипционные факторы нацелены на эти ретротранспозонные элементы и используют их в качестве регуляторных хабов для ZGA, тогда эти пионерские транскрипционные факторы находятся на вершине транскрипционной иерархии. Изучение функций пионерских транскрипционных факторов не только позволяет понять фундаментальные процессы жизни, но и открывает возможности для применения этих знаний в репродуктивной медицине, генетических исследованиях, животноводстве и регенеративной медицине. В будущем сочетание Hi-C с методами визуализации со сверхразрешением, которые могут дать представление о динамической организации хроматина в ядре, может выявить дальнейшие последствия для функции пионерских транскрипционных факторов в регуляции генов [80].