ENCODE (Encyclopedia of DNA Elements)
nature.com/encode
Центральная цель биологии - понять, как ограниченная когорта транскрипционных факторов способна организовать огромное разнообразие паттернов генной экспрессии в разных типах клеток и условиях. В последнюю декаду системный анализ паттернов связывания транскрипционных факторов был осуществлен на одноклеточных модельных организмах, таких как Escherichia coli и дрожжи и выявил огромное количество информации об организации регуляторных данных1-8. Эти исследования предоставили информацию о таких свойствах как сетевые ступицы (hubs)1, корреляции коммуникаций9, иерархическая организация10, 11 и сетевые мотивы12, 13. Более того, более сложные сети, которые интегрируют несопоставимые формы геномных и протеомных данных, таких как межбелковые взаимодействия и фосфорилирование, имеют сходную генетическую регуляцию с др. биологическими процессами14-16. Однако для человека анализ системного уровня сталкивается с затруднениями из-за размера репертуара транскрипционных факторов и генома и только специфические регуляторные подсети с горсткой факторов были описаны более подробно17-19. Крупномасштабные данные из проекта ENCODE project теперь начинают делать возможным такой анализ20. Более того, при огромном количестве данных по полиморфизму у человека и геномному секвенированию многих млекопитающих21, 22, стало возможным получение беспрецедентного представления о том, как селекция связана с сетями.
Здесь представлен анализ профилей геномного связывания 119 связанных с транскрипцией факторов, включая сиквенс-специфические, общие и действующие на хроматин факторы. (Для простоты мы обозначим всё это как транскрипционные факторы и будем использовать термин TFSS для обозначения канонических sequence-specific факторов.) Мы впервые использовали данные по связыванию транскрипционных факторов, чтобы проанализировать паттерны совместной ассоциации между разными факторами, а также их дифференциальные паттерны в проксимальных к промотору и в дистальных регуляторных регионах. Затем мы организовали паттерны связывания в стратифицированную иерархию, представляющую общую регуляторную сеть на системном уровне. К этому мы добавили др. формы сетевой информации, включая регуляцию с помощью некодирующих РНК (ncRNA) (в частности микроРНК (miRNAs))23, 24, межбелковые взаимодействия25, 26 и фосфорилирование белков27. Мы анализировали эту 'meta-network' в отношении свойств, которые отличны в отношении иерархического уровня и коммуникабельности (напр., ступицы в противовес non-hubs), а также исследовали в отношении обогащения сетевыми мотивами. Наконец, рассмотрели паттерн вариации последовательностей в сети, исследуя селективное давление и аллельные эффекты (предпочтительное связывание с материнским или отцовским аллелем). Некоторые из наших ключевых находок суммированы ниже.
o Транскрипционные факторы человека ассоциируют совместно комбинаторно или контекст-специфическим способом; разные комбинации факторов связывают несколько отличающиеся мишени и связывание одного фактора часто влияет на преимущественное связывание партнеров из др. факторов. Более того, транскрипционные факторы часто обнаруживают разные паттерны совместной ассоциации в проксимальном и дистальном регионах гена.
o Разные части иерархической сети транскрипционных факторов обладают разными свойствами. Напр., средний уровень имеет наибольшее количество бутылочных горлышек для тока информации, обнаруживает тенденцию иметь наибольшее количество регуляторных сотрудничеств между транскрипционными факторами. Напротив, транскрипционные факторы более высокого уровня обнаруживают самую высокую коммуникабельность с др. сетями (напр., phosphorylome).
o Появление петель связей вперёд по цепи (feed-forward) сильно увеличено в сети транскрипционных факторов, поскольку имеется ряд мотивов, по которым два гена совместно регулируются с помощью определенного фактора, соединенных с помощью межбелкового взаимодействия или регуляции с помощью miRNA.
o Элементы сети с высокими связями (как транскрипционные факторы, так и мишени) находятся под сильным эволюционным отбором и обладают более сильной аллель-специфической активностью (это особенно очевидно, когда участвуют множественные факторы). Неожиданно, однако, элементы с аллельной активностью находятся под более слабым отбором, чем неаллельные активности.
Рассмотрены сл. Разделы. Overview of data and processing. Context-specific transcription factor co-association. Comparing co-association across contexts. Assembling pairwise interactions into hierarchies. Layering on distal, ncRNA and protein interactions. Relating network connectivity and genomic properties. Collaboration between hierarchy levels. Enriched network motifs. Allelic behaviour in a network framework. Selection in a network context
Discussion
Данное исследование предоставило первый детальный анализ того, как организована регуляторная информация у человека. Выявляется ряд чётких организующих принципов. Многие из них общи с модельными организмами (Supplementary Table 7), демонстрируя, что они являются генеральными свойствами регуляции с помощью транскрипционных факторов. Во-первых, мы установили, что коммуникабельность и иерархическая организация регуляторных факторов отражается на многих геномных свойствах. Напр., транскрипционные факторы высшего уровня обнаруживают свое связывание более сильно скоррелированным с экспрессией своих мишеней, вобще-то демонстрируя, что они подвержены большему влиянию, как это было описано у модельных организмов47. Далее, средний уровень содержит узкие горлышки для информационных потоков и значительно больше связей с miRNA и с дистальной регуляцией. Целенаправленное прохождение этих бутылочных горлышек (напр., для лекарств) скорее всего наиболее сильно затрагивается информационными потоками посредством регуляторных дуг (circuits). До некоторой степени, клетки смягчают эффект бутылочных горлышек наличием пар транскрипционных факторов среднего уровня сотрудничающих в регуляции. (Совместная регуляция облегчает прохождение бутылочных горлышек.) В-третьих, регуляторная сеть, по-видимому, строится из повторяющегося повторного использования малых, модулярных мотивов. В частности, регуляция между уровнями использует многие feed-forward петли, которые д. быть использованы для фильтрации флюктуаций входящих стимулов. Снова, эти свойства общи с модельными организмами; сетевые мотивы и и кооперация на среднем уровне наблюдается у дрожжей48.
Напротив, различия в проксимальной и дистальной регуляции, по-видимому, уникальное свойство регуляции у человека. Эта находка доказывается анализом как ко-ассоциаций транскрипционных факторов, так и структурой сетей. Проксимально-дистальные различия отражают наличие значительно большего количества крупных межгенных пространств у человека, чем модельных организмов, и соразмерно большее количество дистальных связываний. Наконец, анализ консервации показывает, что наиболее высоко соединенные части сети находятся под более сильным отбором, это согласуется с результатами, полученными на модельных организмах. Однако одна уникальная находка для человека это 'аллельные' эффекты. Наиболее высоко соединенные транскрипционные факторы наиболее склонны обладать аллель-специфическим связыванием. Интересно, что настоящие сайты аллель-специфического связывания обнаруживают тенденцию быть под меньшим давлением отбора. Обнаружение этого взаимодействия между отбором и регуляторными сетями может оказаться критическим для интерпретации вариантов во многих персональных геномных последовательностях в будущем. Совместно опубликованные ENCODE-родственные работы доступны online посредством Nature ENCODE эксплорера (http://www.nature.com/ENCODE), специально разработанного инструмента визуализации, которые позволяет пользователям оценить родственные работы и исследовать темы, обсуждаемые во многих работах.