Посещений:
ЦИС-РЕГУЛЯТОРНЫЕ ЭЛЕМЕНТЫ И РЕГИОНЫ

Механизмы Действия

Multiple layers of complexity in cis-regulatory regions of developmental genes
Nicolas Frankel
Developmental Dynamics Volume 241, Issue 12, pages 1857–1866, December 2012

Genomes contain the necessary information to ensure that genes are expressed in the right place, at the right time, and with the proper rate. Metazoan developmental genes often possess long stretches of DNA flanking their coding sequences and/or large introns which contain elements that influence gene expression. Most of these regulatory elements are relatively small and can be studied in isolation. For example, transcriptional enhancers, the elements that generate the expression pattern of a gene, have been traditionally studied with reporter constructs in transgenic animals. These studies have provided and will provide invaluable insights into enhancer evolution and function. However, this experimental approach has its limits; often, enhancer elements do not faithfully recapitulate native expression patterns. This fact suggests that additional information in cis-regulatory regions modulates the activity of enhancers and other regulatory elements. Indeed, recent studies have revealed novel functional aspects at the level of whole cis-regulatory regions. First, the discovery of “shadow enhancers.” Second, the ubiquitous interactions between cis-regulatory elements. Third, the notion that some cis-regulatory regions may not function in a modular manner. Last, the effect of chromatin conformation on cis-regulatory activity. In this article, I describe these recent findings and discuss open questions in the field. Developmental Dynamics, 2012. © 2012 Wiley Periodicals, Inc.


Рисунки к статье


Точный контроль генной транскрипции является критическим для развития организма. Присутствие уровней аномальных мРНК во время развития может модифицировать взрослый фенотип и оказывать вредные эффекты на приспособленность. Геном содержит необходимую информацию, которая гарантирует, что гены экспрессируются в соотв. время в соотв. месте и на соотв. уровне. Онтогенетические гены часто обладают длинными участками ДНК, фланкирующими кодирующую последовательность и/или крупными интронами, которые содержат элементы, которые влияют на экспрессию генов. Большинство из этих регуляторных элементов относительно невелики и могут быть изучены в отдельности (отделенными от их соотв. кодирующей последовательности). Определенно, модулярная природа большинства регуляторных элементов (т.e., их способность функционировать в изоляции) открывает путь для их открытия и изучения. Кстати, описаны 4 типа элементов: транскрипционные энхансеры (Banerji et al., 1981), транскрипционные сайленсеры (Laimins et al., 1986), энхансер-блокирующие инсуляторы (Udvardy et al., 1985) и промтор-связывающие элементы (Calhoun et al., 2002). Транскрипционные энхансеры наиболее изучены среди 4-х типов элементов (Levine, 2010). Будучи помещены выше минимального промотора и репортерного гена в трансгене, энхансеры воспроизводят частично нативный паттерн экспрессии гена. Активность энхансера генерируется с помощью связывания транскрипционных факторов с короткими ДНК мотивами (6-20 пар оснований) присутствующих в его последовательности. In vivo, хроматиновые петли обеспечивают взаимодействие между энхансерами и их мишенью стержнем промоторов (Akbari et al., 2006). Сайленсеры репрессируют экспрессию генов благодаря взаимодействиям со стержнем промотора и/или энхансерными элементами (Ogbourne and Antalis, 1998). Инсуляторы изолируют энхансеры от соседних генов, ограничивая их влияние мишенью в стержне промоторов (Bell et al., 2001). Наконец, промотор-закрепляющие элементы облегчают взаимодействие между энхансерами и мишенями в стержне промоторов (Akbari et al., 2008).
Коллекция некодирующих регуляторных элементов генов составляет его цис-регуляторную информацию. В отличие от кодирующих последовательностей отсутствует простой способ демаркации физических границ цис-регуляторных регионов в геномах метазоа; даже если фланкирующие и интронные ДНК известны в деталях, трудно исключить присутствие дополнительных удаленных элементов. Напр., ген sonic hedgehog (shh), Который участвует в развитии конечностей позвоночных, активируется энхансером, расположенным приблизительно на расстоянии в 1 megabase выше его кодирующей последовательности (Lettice et al., 2003). Несмотря на эти затруднения, исследования экспрессии репортеров с крупных фрагментов ДНК позволили нам установить дискретные функциональные единицы, которые, по-видимому, полностью воспроизводят паттерн экспрессии гена. Т.о., для некоторых онтогенетических генов были установлены видимые границы их цис-регуляторных ДНК (Fujioka et al., 2002; Kim and Lauderdale, 2006; Venken et al., 2009).
Было показано, что гены, участвующие в эмбриональном развитии, клеточной дифференцировке и спецификации паттерна у D. melanogaster и C. elegans имеют существенно больше фланкирующих ДНК, чем гены домашнего хозяйства (Nelson et al., 2004). Однако имеется высокая вариабельность содержимого фланкирующих ДНК среди онтогенетических генов (Nelson et al., 2004). Это, по-видимому, способ, с помощью которого регуляторная информация онтогенетических генов может иметь разную степень компактности. В самом деле, это наблюдается внутри и между геномами. Напр., регуляторная информация, необходимая для эмбриональной экспрессии у S. purpuratus endo16 , по-видимому, обеспечивается 2300 парами оснований (Yuh et al., 2001). Напротив, некоторые онтогенетические гены в геномах метазоа имеют цис-регуляторные элементы, разбросанные на десятки или сотни т.п.н. (Maeda and Karch, 2009; Frankel et al., 2011; Montavon et al., 2011; Visser et al., 2012).
Традиционно исследования цис-регуляции ограничивались функциональным анализом цис-регуляторных элементов (в основном энхансеров). В течение многих лет эти анализы пролили свет на логику цис-регуляции (Istrail and Davidson, 2005). Более того, они предоставили неоценимую информацию о структурных правилах (Erives and Levine, 2004; Panne et al., 2007; Swanson et al., 2010) и эволюционной истории (Ludwig and Kreitman, 1995; Crocker et al., 2008) энхансеров. Тем не менее широко распространено мнение, что часто малые энхансерные элементы не в точности воспроизводят нативные паттерны экспрессии (Barolo, 2012). Часто репортерные конструкции управляют экспрессией в несоответствующих клетках, факт известный как "эктопическая экспрессия" (Summerbell et al., 2000; Chao et al., 2010; Prazak et al., 2010; Frankel et al., 2011; Perry et al., 2011). Также часто встречается наблюдение, что экспрессия репортера не совпадает по времени с таковой нативного гена, феномен часто обозначаемый как "гетерохронная экспрессия" (Adachi et al., 2003; Lin et al., 2010; Prazak et al., 2010; Frankel et al., 2011; Ludwig et al., 2011). Это, по-видимому, обозначает, что дополнительная информация необходима, чтобы генерировать нативный паттерн экспрессии гена. Также известно, что трансгены обычно оказываются предметом позиционных эффектов; их экспрессия меняется в зависимости от геномного контекста, в котором они расположены. Это указывает на то, что конформация хроматина внутри и вокруг регуляторных элементов является жизненно важной собственно для их функции. Важно прояснить, что ни один из этих известных вопросов не сказывается на работе с изолированными цис-регуляторными элементами (эти исследования и дальше будут успешными). Вместо этого они заставляют нас думать, что дополнительные уровни анализа необходимы для полного постижения сложности цис-регуляторных регионов. В последние годы многочисленные исследования открыли новые аспекты функциональной сложности на уровне целых цис0оегуляторных регионов. Во-первых, открытие, что один ген может иметь множественные энхансеры, управляющие сходными паттернами экспрессии. Во-вторых, повсеместные взаимодействия между цис-регуляторными элементами. В-третьих, мнение, что некоторые цис-регуляторные регионы могут не функционировать модулярным способом. Наконец, эффект эпигенетических маркеров и конформации хроматина на активность регуляторных элементов и, следовательно, экспрессию генов.

Genes Have Multiple Enhancers With Overlapping or Very Similar Expression Patterns


В 2007, изучение цис-регуляции у эмбрионов D. melanogaster привело к неожиданному факту. ChIP-chip анализ по всему геному трех транскрипционных факторов, участвующих в формировании дорсо-вентрального паттерна , показал, что ген мишень vnd регулируется с помощью двух энхансеров, разделенных многими т.п.н., которые управляют удивительно сходными паттернами экспрессии в презумптивной нейрогенной эктодерме (Zeitlinger et al., 2007). Этот удивительный факт позднее наблюдался и для др. генов, участвующих в формировании дорсо-вентрального паттерна. Гены Drosophila sog и brinker также обладают двумя энхансерами, разделенными многими т.п.н., со сходной эмбриональной активностью (Hong et al., 2008). Было предположено, что, по крайней мере, треть от всех Dorsal генов мишеней могут иметь подобный тип регуляции (Hong et al., 2008). В последнем исследовании авт. использовали термин "теневые энхансеры" ("shadow enhancers)." По моему мнению этот термин наиболее привлекателен, чем описательный. Однако трудно предположить альтернативный термин, который был бы коротким и описательным в то же время. Поэтому "теневые энхансеры" проникли в литературу и научное сообщество.
Приняв во внимание этот интересный феномен, сам собой напрашивается вопрос: почему некоторые гены имеют энхансеры с очевидной перекрывающейся активностью? Достаточен ли один энхансер для аккуратной функции гена? Шроко распространенное появление "теневых энхансеров" указывает на то, что д. быть функциональное объяснение для их присутствия в геноме. Правдоподобные ответы на поставленные вопросы получены с помощью экспериментальных манипуляций с цис-регуляторными регионами. Ген shavenbaby (svb) кодирует основной транскрипционный фактор, который регулирует образование трихом (волоско-подобных структур) на кутикуле насекомых (Payre et al., 1999). Этот ген также содержит множественные энхансеры, которые управляют экспрессией в одной и той же группе клеток (Fig. 1A). Паттерны экспрессии двух отдаленных svb энхансеров, наз. Z и DG2 перекрывается с паттернами энхансеров A and E (Fig. 1A). Все эти 4 энхансера активны в одно и то же время в дорсолатеральных клетках эмбрионального эпидермиса (Frankel et al., 2010). Что же произойдет, если отдаленные энхансеры удалить от нативного локуса с помощью делеции? Если делетировали энхансеры Z и DG2, то эмбрионы развивали при оптимальной температуре роста личиночную кутикулу, имеющей обычный вид (Fig. 1B). Однако , если эмбрионы развивались при экстремальной температуре, то отсутствие энхансеров Z и DG2 вызывало существенную потерю кутикулярных трихом (Fig. 1B; Frankel et al., 2010). Сходный эффект наблюдается при полном стрессов генетическом фоне ("stressful genetic background)." Wingless является известным регулятором svb; если два аллеля этого гена дикого типа, то отсутствие Z и DG2 продуцирует значительную потерю трихом (Frankel et al., 2010). Хотя активность отдаленных энхансеров безразлична при оптимальных условиях, но жизненно важна в условиях стрессов. Т.о., мы можем предположить, что энхансеры Z и DG2 наделяют устойчивостью фенотип (т.e., канализуют фенотип; Swami, 2010).

Figure 1. The function of shavenbaby "shadow enhancers." A: (above) Drawing from the lateral perspective of a D. melanogaster first instar larva. The pattern of trichomes (hair-like structures) is depicted in black. The domain producing quaternary trichomes on the fifth abdominal segment is enclosed in a black outline. (below) Diagram of the region upstream of shavenbaby (svb) transcription start site, showing the positions of the enhancers (black rectangles) for this locus. The overlapping expression driven by enhancers DG2, Z, A, and E6 is shown in red in the diagrams of the quaternary domain (below each enhancer). B: Larvae carrying a deletion of enhancers Z and DG2 in the svb gene show a wild type number of quaternary trichomes if embryos develop at 25°C, the optimal growth temperature. In contrast, larvae with the deletion display a diminished number of quaternary trichomes in the areas where DG2 and Z drive expression (indicated by black arrows) when embryos are reared at extreme temperatures (17°C or 32°C). Larvae with a wild-type shavenbaby develop very similar numbers of quaternary trichomes when grown at different temperatures. Thus, the activity of DG2 and Z confers robustness to the phenotype.

Сходный набор экспериментов также был проделан в отношении гена snail у D. melanogaster (Perry et al., 2010). Однако в этом случае экспериментальные манипуляции были проделаны не в отношении нативного локуса, а в BAC (bacterial artificial chromosome), содержащей цис-регуляторный регион гена. Snail активируется двумя энхансерами (один проксимальный и один дистальный по отношению к месту старта транскрипции) со сходными активностями у ранних эмбрионов. При нормальных условиях роста удаление проксимального или дистального энхансера не влияет на функцию snail. С др. стороны, если эмбрион развивается при высокой температуре или только с одной копией Dorsal (гена, активирующего snail), то отсутствие одного энхансера вызывает дефекты гаструляции (Perry et al., 2010). Интересно недавнее сообщение с очень сходным экспериментальным подходом постулировало, что дистальный энхансер snail важен для гаструляции при нормальных условиях роста (Dunipace et al., 2011), подтверждая предыдущее утверждение о несущественности этого энхансера (Perry et al., 2010).
В последние годы многочисленные цис-регуляторные регионы генов животных, как было установлено, содержат множественные энхансеры с перекрывающимися или очень сходными паттернами экспрессии (Jeong et al., 2006; Werner et al., 2007; Hong et al., 2008; McGaughey et al., 2008; Corbo et al., 2010; Frankel et al., 2010; Kalay and Wittkopp, 2010; L'Honore et al., 2010; Naranjo et al., 2010; Perry et al., 2010, 2011; Franchini et al., 2011; Galindo et al., 2011; Ghiasvand et al., 2011; Lee et al., 2011; McBride et al., 2011; Watts et al., 2011; Pauls et al., 2012). Первые наблюдения перекрывающейся экспрессии с разных энхансеров возвращают нас к 1990s (Hoch et al., 1990; Kassis, 1990; Tolias and Kafatos, 1990).Помимо этих экспериментально оцененных случаев, компьютерный анализ предсказывает появление "теневых энхансеров" во многих генах D. melanogaster, которые действуют в сегментационном каскаде (Kazemian et al., 2010). Присутствие двух энхансеров со сходными активностями не означает автоматически, что один энхансер необходим, чтобы канализовать фенотип, напр., естественная делеция дистального энхансера ATOH7 (гена, обладающего, по-видимому, перекрывающимся проксимальным энхансером) вызывает врожденную болезнь глаз у людей в отсутствии средовых или генетических пертурбаций (Ghiasvand et al., 2011). Т.о., экспериментальные манипуляции или анализ естественной изменчивости определенно необходимы для определения необязательности (dispensability) энхансера.
Существование множественных энхансеров в цис-регуляторных регионах онтогенетических генов может быть широко распространенным механизмом буфферизации против внешнесредовых и генетических вариаций. Такого типа цис-регуляторная архитектура может действовать сочетано с др. механизмами буфферизации, такими как путь microRNA (Hornstein and Shomron, 2006; Li et al., 2009).

Interactions Between Regulatory Elements


В целом малые фрагменты ДНК, выделенные из их фланкирующих ДНК, были протестированы в отношении цис-регуляторной активности с использование репортерных конструкций. Эти репортерные конструкции были или инъецированы в эмбрионы, чтобы вызвать стабильные трансформации (Venken and Bellen, 2007; Tasic et al., 2011; Frokjaer-Jensen et al., 2012), или электропортированы (Funahashi and Nakamura, 2008; Vierra and Irvine, 2012), чтобы наблюдать временный эффект конструкции. В большинстве случаев эти малые фрагменты ДНК были достаточны, чтобы осуществить скоординированное функционирование in vivo. Безусловно, модульность присутствует до некоторой степени в некодирующей ДНК и эта характеристика может быть использована для дальнейшего выяснения функции регуляторных элементов. Тем не менее, несмотря на тот факт, что цис-регуляторные элементы осуществляют разные функции, которые могут быть протестированы на изолированных фрагментах ДНК, это не означает, что эти элементы действуют по одиночке в своих нативных локусах. Фактически, несколько недавних сообщений показали, что взаимодействия между цис-регуляторными элементами обычны и могут играть важную роль для функции цис-регуляторных регионов.
Кластер HoxD у позвоночных активен во время развития конечностей. Точная пространственная и временная экспрессия HoxD генов в зачатках конечностей является жизненно важной для формирования придатков. Этот кластер, как известно, активируется двумя регионами проксимального энхансера, наз. Prox и GCR (Gonzalez et al., 2007). Расположенный в сторону центромеры, загадочный ген desert в 600 т.п.н. фланкирует кластер HoxD. Недавняя работа, в которой исследовались физические контакты между предполагаемыми регуляторными элементами в гене desert и HoxD генами, открыла неожиданно высокое количество новых регуляторных элементов и молекулярных взаимодействий (Montavon et al., 2011). По крайней мере, 5 регуляторных элементов рассредоточены в гене desert, взаимодействующие с геном HoxD13 во время развития пальцев. Более того, эти регуляторные элементы взаимодействуют строго между собой, во время того же самого периода развития. 4 из этих некодирующих элементов проанализированы с помощью lacZ репортерных конструкций у трансгенных мышей, и продемонстрирована активность энхансеров в развивающихся дистальных частях конечностей. Следовательно, в развитии конечностей взаимодействия между многими регуляторными элементами, по-видимому, существенны для собственно формирования паттерна пальцев. Физические взаимодействия между регуляторными элементами не являются специфическим признаком HoxD кластера. В T клетках ген TNF активируется двумя энхансерами, разделенными 12 т.п.н. Эти два энхансера физически взаимодействуют, когда Т клетки активируются, генерируя хроматиновую петлю, которая способствует активации транскрипции (Tsytsykova et al., 2007). В гене β-globin человека locus control region (LCR) модулирует экспрессию гена. Внутри этого контрольного региона присутствуют несколько элементов, наз. MAREs, которые содержат сайты связывания для транскрипционных факторов Maf и Bach1. Используя atomic force микроскопию, исследователи показали, что отдаленные MAREs физически взаимодействуют in vitro, когда присутствуют Maf и Bach1 (Yoshida et al., 1999). Эти взаимодействия между MAREs могут быть критическими для структуры хроматина и экспрессии генов (Yoshida et al., 1999). Хотя и не непосредственно связанный с контролем генной экспрессии, случай локуса Igh представляет др. интересный пример взаимодействий между некодирующими элементами (Guo et al., 2011). Этот геномный регион содержит множественные CTCF инсуляторные элементы, чьи взаимодействия необходимы для продукции правильных V(D)J перестроек (Guo et al., 2011).
В некоторых цис-регуляторных регионах, активных в широком разнообразии развивающихся органов, обнаружены синергичные взаимодействия между цис-регуляторными элементами. Комбинированный эффект двух или более регуляторных элементов может вызывать экспрессию в новых группах клеток, усиливая или подавляя экспрессию гена мишени, или изменяя временные паттерны транскрипции. Прекрасный пример этого феномена предоставляет развитие конечностей D. melanogaster. В этом органе, часть экспрессии гена Distalless (Dll) контролируется двумя отдаленными энхансерами, наз. LT м M. Эти два энхансера управляют очень разными паттернами экспрессии и ни один из них в отдельности не воспроизводит нативный паттерн экспрессии Dll в ножном диске (Estella et al., 2008). Однако если эти два элемента скомбинированы в lacZ репортерной конструкции, то дуэт энхансеров управляет экспрессией во всех Dll-экспрессирующих клетках (Estella et al., 2008). Сходное наблюдение отмечено в гене sloppy-paired-1 во время эмбрионального развития Drosophila (Prazak et al., 2010). Этот ген имеет два энхансера, наз. DESE и PESE, которые управляют неполным или эктопическим паттернами, если анализируются в отдельности в репортерных конструкциях. И снова составной репортер, содержащий оба элемента, в точности воспроизводит нативную экспрессию sloppy-paired-1 (Prazak et al., 2010). Наконец, подобный случае представлен геном snail, чья структура упоминалась ранее, чтобы проиллюстрировать функцию "теневых энхансеров." Как описывалось выше, этот ген содержит проксимальный и дистальный энхансер со сходными активностями у ранних эмбрионов Drosophila. Интересно, что эти два энхансера работают не аддитивным способом; проксимальный энхансер снижает активность дистального энхансера до тонко-настраиваемых уровней экспрессии (Dunipace et al., 2011).

The Unknown Spatial Distribution of cis-Regulatory Information


Физические границы цис-регуляторных регионов трудно демаркировать. Сегодня возможно определить регионы, которые содержат регуляторные элементы, которые влияют на экспрессию определенных генов или групп генов. Однако для онтогенетического гена со сложным паттерном экспрессии было бы неверно утверждать, что этот "the cis-regulatory region of gene X starts in nucleotide A and ends in nucleotide B." Онтогенетические гены несут важную регуляторную информацию и поэтому мы игнорируем, следует ли пространственное распределение регуляторных элементов определенному набору плавил. В этой связи, недавние сообщения показали, что некоторые транскрипционные энхансеры сохраняют свои позиции в цис-регуляторных регионах у удаленных видов (Hare et al., 2008; Cande et al., 2009; Frankel, Wang, and Stern, unpublished). Эти данные подтверждают существование ограничений в архитектуре цис-регуляторных регионов, хотя известно немного об организации цис-регуляторных регионов. Если мы углубимся в небольшие регионы, то мы сможем установить, что физические границы индивидуальных цис-регуляторных элементов трудно определить также. В частности, энхансеры транскрипции могут иметь разную архитектуру. Эти элементы могут иметь компактную конфигурацию, при которой сайты связывания транскрипционного фактора расположены близко др. к др. Напротив, сайты связывания транскрипционного фактора могут быть распределены по более крупным регионам, образуя отдельные функциональные единицы. Эти две модели были названы "enhanceosome" и "billboard," соотв. (Arnosti and Kulkarni, 2005). Определенно эти модели представляют разные локусы среди непрерывных конфигураций энхансеров. Однако не все энхансеры могут иметь так или иначе модулярную архитектуру. Теоретически разные функциональные единицы, все необходимые для управления последовательной экспрессией, д. быть разделены многими т.п.н. Это д. обладать потенциальной архитектурой "femur enhancer", действующей на D. melanogaster ген Ultrabithorax (Davis et al., 2007). В последнем всеобъемлющем исследовании крупного геномного региона не удалось изолировать энхансер Ultrabithorax, это указывает на то, что этот энхансер может быть структурно комплексным (Davis et al., 2007). IВ случае "stripes enhancer" Drosophila гена runt, необходим крупный элемент, чтобы управлять паттерном когерентной экспрессии (Klingler et al., 1996). В частности, часть эмбриональной экспрессии runt регулируется с помощью ~5 Kb энхансера, который не может быть подразделен на боле мелкие функциональные суб-элементы (Klingler et al., 1996). Вполне возможно, что много таких комплексов энхансеров существует в геномах животных. Следовательно, в некоторых случаях неспособность выделить энхансеры может быть обусловлена комплексной их природой. К сожалению, "отрицательные результаты" в исследовании энхансеров трудно интерпретировать и они, скорее всего, останутся неопубликованными.
Детальное изучение цис-регуляторного региона гена Distalless (Dll) прекрасный пример завершения дискуссии в параграфе выше (Fig. 2). Ген содержит цис0регуляторные элементы, способные работать в изоляции, которые активны в ножных дисках D. melanogaster. Эти регуляторные элементы разделены 12 т.п.н. ДНК, не обладающими энхансерной активностью в ножных дисках (Estella et al., 2008). Недавнее исследование установило, что , по крайней мере, 4 различных региона внутри этих 12 Kb обладают функциональными сайтами связывания для транскрипционного фактора GAF (Fig. 2A; Agelopoulos et al., 2012). GAF (GAGA фактор, кодируемый геном trl) является белком, участвующим в модификации структуры хроматина, помимо др. находок (Adkins et al., 2006). Было также показано, что весь Dll цис-регуляторный регион, по-видимому, находится в компактном состоянии в зачатках торакальных ног, тогда как тот же самый регион находится в рыхлом состоянии хроматина в клетках абдомена, где Dll репрессирован с помощью Hox белков (Fig. 2B; Agelopoulos et al., 2012). Компактная конформация цис-регуляторного региона Dll в зачатках торакальных ног указывает, что большая область действует как единая функциональная единица (Agelopoulos et al., 2012). Определенно, цис-регуляторный регион Dll является более сложным, чем до этого представлялось. Первоначально его функция объяснялась активностью купированных отдаленных регуляторных элементов. Однако более глубокое изучение локуса, проведенное с помощью методологии, которая использует специфичную для типа клеток иммунопреципитацию хроматина (cgChIP; Agelopoulos et al., 2012), показало, что это крупная функциональная единица с цис-регуляторной информацией, распределенной по 14 Kb. Информация по регуляции Dll также подчеркивает роль конформации хроматина в контроле экспрессии гена.

Figure 2. The architecture of the Distalless (Dll) locus in D. melanogaster. A: Linear view of the Distalless locus. Black boxes demarcate enhancer regions (LT/304 and M). Yellow boxes indicate regulatory elements without enhancer activity (I1, I2, I3, and I4). The GAF protein, represented here by a red circle, can bind to all six of these regulatory regions. B: (Above) In the thoracic cells that will give rise to legs, the chromatin of the Dll locus is in a compact state, likely due to GAF activity. In this conformation the gene is active. (Below) In contrast, Dll is inactive in the homologous abdominal cells, which do not form legs. In these cells, the chromatin is in an extended conformation. The stoichiometry of GAFs in relation to DNA elements is purely hypothetical. Redrawn with permission from Agelopoulos et al. (2012).

Epigenetic Marks, Chromatin Conformation, and cis-Regulatory Activity


Вплоть до недавних лет большинство исследований цис-регуляции было "epigenetics free." Изолированные фрагменты ДНК были проанализированы с помощью репортерных конструкций, присутствующих в эписомах или интегрированных случайно в местах генома. В результате структура хроматина нативного локуса не рассматривалась как вариабельная, влияющая на активность определенного регуляторного элемента. Такая склонность, по-видимому, обусловлена историческими и техническими причинами; 10 лет назад эпигенетика не была вездесущей и легко исследуемой экспериментально, как сегодня. Сегодня ясно, что состояние хроматина как регуляторных элементов, так и ДНК, фланкирующей регуляторные элементы, важно для регуляции экспрессии гена. Следовательно, активность регуляторного элемента должна в идеале быть проанализирована в соотв. геномном контексте. В пользу этого говорит то, что изолированные регуляторные элементы подвержены определенной степени эпигенетической регуляции. Однако эта потенциальная регуляция может быть очень отличной от той, что происходит в нативном локусе и, как упоминалось выше, не д. оказывать влияния на фланкирующий хроматин.
Исследования эпигенетики испытывают экспоненциальный рост в последние годы, делая эту область быстро меняющейся в основе. Существующее выдающееся положение этой области было мотивировано включением эпигенетических аспектов в некоторые эксперименты по регуляции генов. Более того, недавние технические успехи расширили разрешающую способность анализа, позволив исследователям получить более полную информацию по эпигенетической регуляции.
Посттрансляционные модификации нуклеосомных белков составляют жизненно важную часть регуляции генов. Гистоны явились предметом большого числа посттрансляционных модификаций, при этом метилирование и ацетилирование наиболее распространенные эпигенетические метки. Действие histone acetylases (HATs), deacetylases (HDACs), methyl-transferases (HMTs), and demethylases (HDMs) генерирует часть сложного генетического ландшафта, также известного как гистоновый код. Гистоновые метки и комплексы ремоделирования хроматина модифицируют конформацию хроматина, регулируя доступность транскрипционных факторов к цис-регуляторным регионам. Некоторые эпигенетические метки были ассоциированы со специфическими группами регуляторных элементов; у человека (Heintzman et al., 2009), рыбок данио (Aday et al., 2011) и мух (Negre et al., 2011), моно-метилированный гистон H3 по лизину 4 (H3K4me1) обычно обнаруживается в активных энхансерных регионах, вблизи области открытого хроматина. Недавнее исследование показало, что активность белка LSD1 (a demethylase of H3K4 и H3K9) важна для дифференцировки эмбриональных стволовых клеток мыши (Whyte et al., 2012). По ходу эмбриогенеза активные энхансеры в эмбриональных стволовых клетках испытывают снижение ацетилирования гистонов. В свою очередь этот низкий уровень ацетилированных гистонов запускает LSD1-обусловленное деметилирование H3K4. Эта модификация замалчивает энхансеры генов, которые д. быть выключены для клеточной дифференцировки (Whyte et al., 2012). Помимо действия гистоновых меток, локальная конформация хроматина может испытывать влияние со стороны состава нуклеосом (Rangasamy et al., 2003; Raisner et al., 2005). Сообщалось. что гистоновые варианты H2A.Z и H3.3 ассоциированы с активными энхансерами и инсуляторами в геноме человека (Jin et al., 2009).
Активность регуляторных элементов может быть модулирована с помощью локальных модификаций хроматина (за счет соседних нуклеосом) или глобальных изменений хроматина, которые затрагивают структуру крупных регионов. У метазоа GATA и Polycomb белки взаимодействуют со специфическими мотивами ДНК в цис-регуляторных регионах и модифицируют конформацию хроматина. Белки группы Polycomb регулируют и взаимодействуют с эпигенетическими метками, контролируя программы экспрессии генов благодаря клеточным делениям (Schwartz and Pirrotta, 2008). Было установлено, что Polycomb-репрессивные комплексы обеспечивают компакцию хроматина у мух и мышей (Grau et al., 2011). Эти крупномасштабные изменения хроматина репрессируют экспрессию многих онтогенетических генов (Isono et al., 2005; Boyer et al., 2006; Lee et al., 2006; Lanzuolo et al., 2007; Sing et al., 2009). Др. группа белков, факторы GATA, регулируют конформацию хроматина, влияя на экспрессию генов (Vakoc et al., 2005). Напр., в локусе Kit обмен GATA белками вызывает образование разных петель хроматина, которые влияют на активность транскрипции (Jing et al., 2008). В незрелых эритроидных клетках длинная петля хроматина, поддерживаемая с помощью GATA-2 способствует взаимодействию энхансера с базовым промотором. После созревания, GATA-1 замещает GATA-2, способствуя образованию репрессивной петли, которая подавляет экспрессию гена (Jing et al., 2008).
Метилирование ДНК также оказывает значительное воздействие на экспрессию генов. Феномен импринтинга, когда организм экспрессирует только материнский или отцовский аллель, вызывается дифференциальным метилированием ДНК (Feng et al., 2010). Кластеры импринтированных генов у млекопитающих содержат цис-регуляторные элементы, наз. imprinting control regions (ICRs), которые обеспечивают специфичное родительское метилирование ДНК (Barlow, 2011). Помимо своей роли в импринтинге метилирование ДНК регулирует экспрессию генов в клонах соматических клеток во время эмбриогенеза (Oda et al., 2006; Illingworth et al., 2008). Метилирование цитозинов в CpG динуклеотидах это распространенная эпигенетическая метка цис-регуляторных регионов у позвоночных (Deaton and Bird, 2011). Сегодня известно, что метилирование CpG изменяет архитектуру хроматина, затрагивая транскрипционный потенциал гена (Blackledge and Klose, 2011).
Механизмы, описанные выше представляют лишь часть эпигенетической регуляции (подробнее см. Gibney and Nolan, 2010). Бесспорно эпигенетические процессы сложные и динамические. Более того, существует, по-видимому, значительное взаимодействие между разными эпигенетическими маркерами и эпигенетическими регуляторами; метилированные CpGs, гистоновые модификации, и комплексы Polycomb взаимодействуют при цис-регуляции (Brinkman et al., 2012; Cedar and Bergman, 2012; Ong and Corces, 2012). Соотв. становится ясно, что онтогенетические гены подвергаются воздействию быстрых изменений хроматина, контролируемых несколькими взаимодействующими игроками (Hunkapiller et al., 2012).

Perspectives


Надеюсь, что убедил читателей, что цис-регуляторные регионы являются более чем собранием модулярных цис-регуляторных элементов в нити ДНК. Сегодня становится очевидным, что генетическая архитектура и эпигенетический ландшафт цис-регионов имеют множественные взаимосвязанные кусочки. Часть функции этого комплекса представлена в предыдущих разделах, но существует значительно больше вещей, которые необходимо знать. В самом деле, мы не имеем "big picture" цис-регуляции; существует множество отдельных кусочков. которые необходимо составить. Некоторые важные вопросы всё ещё нуждаются в ответах: (i) является ли активность теневых энхансеров аддитивной или диалоговой (interactive)? Всегда ли регулируются теневые энхансеры с помощью одних и тех же транскрипционных факторов, как в случае генов мишеней для Dorsal? (ii) Существуют ли цис-регуляторные элементы с новыми функциями, ещё не открытыми? Существуют ли генетические элементы и/или эпигенетические маркеры, которые определяют границы цис-регуляторных единиц? (iii) Существуют ли архитектурные правила в цис-регуляторных регионах? Каковы ограничения, которые форматируют цис-регуляторную эволюцию? (iv) Каковы молекулярные механизмы, лежащие в основе взаимодействий между регуляторными элементами? (v) Можно ли измерить изменения в активности цис-регуляторных элементов во время развития? Можно ли отследить динамику конформации хроматина в цис-регуляторных регионах? Можно ли интегрировать эти данные в динамическую модель цис-регуляции?
К счастью, новые технологии могут помочь с ответом на некоторые вопросы. Карта взаимодействий между отдаленными элементами может быть получена при использовании 3C (chromatin conformation capture; Miele and Dekker, 2009) и Hi-C (Lieberman-Aiden et al., 2009). Более того, эта техника может быть нацелена на открытие новых регуляторных элементов и сможет предоставить лучшую картину физических границ цис-регуляторных регионов.
Чтобы избежать биологических шумов при анализе состояний или взаимодействий хроматина, очень важно исследовать гомогенные группы клеток (only those cells in the embryo where the gene in question is active). Интересным подходом по преодолению затруднений является FACS-сортировка эмбриональных клеток, экспрессирующих соотв. маркеры (Spencer et al., 2011; Bonn et al., 2012; Zhou and Pu, 2012). Таким способом возможно получить аккуратные временные карты изменений хроматина.
Др. методологическим подходом является использование BACs (bacterial artificial chromosomes), содержащих предполагаемые цис-регуляторные регионы. BACs содержат крупные регионы ДНК, которые могут быть модифицированы многими способами путем рекомбинирования BAC (Warming et al., 2005). Среди др. модификаций, легко добавить репортерный ген к BAC. Этот путь позволяет отслеживать экспрессию, управляемую крупными chunks ДНК, и сравнивать эту экспрессию с таковой нативного гена. Более того, вполне осуществимо мутировать известные регуляторные элементы или регионы с известной функцией в контексте крупного региона ДНК.
The techniques mentioned above (combined with traditional methods such as the functional dissection of regulatory regions with reporter assays) are fundamental to get a comprehensive view of cis-regulatory activity. Surely, these methodologies coupled to wise experimental designs will generate major discoveries in the field. However, current techniques are not sufficient to obtain a dynamic view of cis-regulatory activity in live embryos. Thus, a major breakthrough would be the development of a robust assay to monitor cis-regulatory interactions in real-time.