Посещений:
СОМИТОГЕНЕЗ

Временной генетический контроль

The precise timeline of transcriptional regulation reveals causation in mouse somitogenesis network
Bernard Fongang and Andrzej Kudlicki
BMC Developmental Biology 2013, 13:42 doi:10.1186/1471-213X-13-42

In vertebrate development, the segmental pattern of the body axis is established as somites, masses of mesoderm distributed along the two sides of the neural tube, are formed sequentially in the anterior-posterior axis. This mechanism depends on waves of gene expression associated with the Notch, Fgf and Wnt pathways. The underlying transcriptional regulation has been studied by whole-transcriptome mRNA profiling; however, interpretation of the results is limited by poor resolution, noisy data, small sample size and by the absence of a wall clock to assign exact time for recorded points.
By applying a novel framework for data analysis, we have shown a striking correspondence between gene expression times and their interactions and regulations during somitogenesis. These results prove the key role of finely tuned transcriptional regulation in the process. The presented method can be readily applied to studying somite formation in other datasets and species, and to other spatiotemporal processes.

Механизм сегментации эмбрионов позвоночных зависит от волн экспрессии генов, проходящих через пресомитную мезодерму (PSM) вдоль передне-задней оси тела [1] и использует регуляцию генов путей Notch, Fgf и Wnt [2,3]. Нарушения этого процесса вызывают врожденные уродства позвоночника (CVMs) [4,5], однако, во многих случаях их механизмы неизвестны, хотя получены впечатляющие количества экспериментальных профилей, включая данные по экспрессии всего генома [1-3,6-8]. Согласно модели "clock-and-wavefront" [9], периодичность сомитогенеза управляется молекулярныи осцилляциями, которые управляют волнами генной экспрессии в каудально-ростральном направлении по PSM. Доказательства цикличности генов впервые были получены для PSM эмбрионов кур [10], где c-hairy1 обнаруживает динамические волны каудально-ростральной экспрессии мРНК и которые впоследствии были перенесены и на др. виды, такие как рыбки данио [11-13] и мыши [1,14]. Мыши, несущие мутации в генах, кодирующих лигадны, рецепторы или нижестоящие эффекторы пути Notch обнаруживают тяжелые дефекты сегментации [14-16]. Поэтому считается, что путь Notch является критическим компонентом механизма сегментации позвоночных. В самом деле, известна цикличность генов Notch при сомитогенезе млекопитающих, включая: Hes1/7/5, Hey1/3, Lfng, Nkd1, Nrarp, Maml3, Bcl9l [15]. Также путь передачи сигналов Wnt также ритмически активируется в PSM и описаны гены с циклической активностью этого пути Axin2, Dact1, Dkk1, Sp5, Tnfrsf19, Myc, Has2, Phlda1. Установлено, что инактивация Wnt ингибиторов, таких как Dkk1, приводит к дефектам сегментации [13,15-18]. Др. известные циклические гены, такие как Spry2/4, Dusp6, Shp2, Hspg2, Efna2, Bcl2l11 принадлежат к семейству Fgf.


Figure 1. PSM of the mouse embryo. The sample used in microarray analysis (right posterior half of the embryo; dark blue) contains cells at different phases of the somite cycle, which distorts the observed expression profile. The deconvolution algorithm is used for reconstructing the true profile representing the oscillation of the gene at the tail E(x=0,t),

Детали волнового механизма, стержневой ритмоводитель, а также иерархия между компонентами путей Notch, Fgf и Wnt, а также др. путей, остаются в основном неизвестными. Хотя все три пути, по-видимому, важны для собственно функционирования часов сегментации, нет согласия относительно центрального осциллятора, непосредственно управляющего периодической активацией путей Notch, Wnt или Fgf или напротив, регулируются ли эти пути с помощью осциллятора, действующего выше их (see [19-21 и обзор 22]). Анализ с высоким разрешением профилей экспрессии генов, вкобчая точное время экспрессии генов может облегчить идентификацию дальнейших компонентов сети, пичинные взаимодействия между ними, а также транскрипционные регуляторные элементы, ассоциированные с каждым из генов, улучшив тем самым наше понимание молекулярных механизмов, участвующих в формировании сомитов. Часы сегментации, как полагают, законсервированы между видами; однако некоторые из генов и способы регуляции варьируют между clades [13]. Следовательно, сравнение процессов у разных организмов могут пролить свет на эволюцию процесса и позволить идентификацию большинства законсервированных, примордиальных аспектов.
Активность каждого из трех путей соответствует специфической фазе сомитного цикла. Точно выверенная во времени регуляция транскрипции играет роль в внешнего развития, напр., клеточных делений, метаболических ассоциаций, биогенеза органелл. Точное определение транскрипции генов в специфический временной интервал может быть важным по нескольким причинам. Во-первых, это делает возможной компартментализацию во времени и предупреждает взаимодействия между несовместимыми биохимическими процессами [23]. Во-вторых, с помощью своевременности транскрипции организм не нуждается в накоплении и хранении белков, когда они не используются. В-третих, когда последовательность транскрипции генов следует порядку привлечения субъединиц в белковые комплексы, то облегчается собственно сборка комплексов [24]. Следовательно, естественно предположить, что при сомитогенезе время генной экспрессии д. отражать порядок, в котором продукты генов вовлекаются в свои специфческие пути. Поскольку причинная связь не может действовать обратно во времени, то реконструирование последовательности событий является важной ступенью в направлении выяснения причинных зависимостей между определенными элементами биологической сети. Два традиционных подхода используются для выяснения временной линии экспрессии в экспериментах по выяснению хронологии: определение времени появления наивысших значений и компьютерное определение фазы оптимального соответствия одиночной гармонической волны. При методе наивысшего пика разрешение от природы ограничено выбором источника данных, который обычно низок из-за высокой цены экспериментов с микромассивами. Метод чувствителен к экспериментальным ошробкам или шумам: лишь одно неправильное измерение может приводить резкому изменению временных результатов. Фаза главного способа Fourier [25] более устойчива к шумам, при этом отсутствует ограничение в разрешении, однако он может давать аккуратные результаты только, если данные хорошо апроксимированы одиночной синусоидой, чего часто не наблюдается.


Figure 2. Original measurements (left) and deconvolved (right) profiles forHes1,Axin2,Hes5andArfrp1. The bimodal expression profile of Arfrp1 shows distinct expression peaks in opposite phases of the somite cycle. The measurements are taken as the average of the posterior half of the PSM, while the reconstructed, deconvolved profile represents the gene expression at the embryo's tail, hence the overall shift in expression times.

Figure S1. Profiles of the main genes used in the text and known as Wnt, Notch or Fgf cyclic genes for mouse somitogenesis. The figure presents the individual profiles the well-known cyclic genes compiled as well new candidate cyclic genes.

Format: TIFF Size: 531KB Table S1. Timing of genes known to be associated with Fgf, Wnt and Notch pathways in the data set mouse2. Format: DOCX Size: 16KB Download file
Природа данных микромассивов, где выборка может содержать субпопуляции клеток в разных состояниях или на разных стадиях цикл, делает возможным введение нового метода, базирующегося на алгебраической декомпозиции профиля на серии профилей для каждой из субпопуляций [26]. Измерение в данное время, M(t), считается суммой измерений для разных выборок: M(t)=α1M1(t)+α2M2(t)+…+αkMk(t). Для непрерывного семейства субпопуляций, которые отличаются только по временному сдвигу, сумма принимает форму интеграла: M(t)=∫E(t-τ)h(τ)dτ, где E это настоящий базовый профиль, а h распределение циклических фаз среди клеток экспериментальной выбоки. Было показано [24], что поскольку вероятность распределения временных сдвигов h известна, то используя алгоритм deconvolution (нахождения оригинальной функции), базируясь на априорной вероятности, выводимой из из принципа максимальной энтропии, можно решить это уравнение, реконструкции лежащего в основе сигнала источника E с разрешением почти в 10 раз более высоким, чем по данным источника. Эта процедура автоматически отфильтровывает большинство шумов в данных, поскольку она благоприятствует регуляциям, согласующимися с подлежащей моделью h. Зесь описывается версия этого метода, выполненная для процессов, где уровни экспрессии зависят как от временных. так и пространственных координат.


Figure 3. Gene regulation during mouse somitogenesis. Position of a gene symbol on the plot reflects time of peak expression (angle; clockwise) and the mean expression level (genes with high expression level are closer to the center). Arrows represent the known causation (green arrows connect genes in the causation direction matching those found in the literature and red arrows are in the reverse causation order. Dot links are between genes too distant to indicate direction of causation). Solid black arcs represent the estimated timing accuracy for each gene. Causation directions are compiled from literature [1-10]. Genes are color-coded according to their known pathway association with green for Notch, magenta for Fgf, purple for Wnt; in addition, dashed strokes are used for genes previously not reported as cyclic.

C течением времени, клетки в каждом положении вдоль PSM проходят через все фазы сомитного цикла. Более того, в каждый данный момент времени клетки разных позиций вдоль PSM будут находиться в разных фазах цикла, как следствие того факта, что волна генной экспрессииперемещается вдоль оси тела. Следовательно, экспериментальные выборки (содержащие клетки из разных мест) будут содержать клетки в разных фазах цикла, приводя к искусственно расплывчатому профилю экспрессии. Имеющаяся пространственно-временная версия deconvolution formalism разработана, чтобы компенсировать этот эффект и с помощью компьютера реконструировать оригинальный профиль, свободный от экспериментальных артефактов. Фундаментальое отличие между временной и пространственно-временной deconvolution лежит в конструировании функции kernel (blur) . Во время deconvolution [24] kernel h был сконструирован на базе распределения времени, в которое клетки вступают в цикл. В данном случае, пространственно-временное значение, h получено, исходя из известной геометрии системы выборо из эмбриона и скорости выражения волны.
Deconvolution в пространстве и во времени, т.о., позволяет реконструировать лежащий в основе профиль экспрессии. Зная профиль, мы способны определить время пика экспрессии с разрешением в несколько минут, которое является временной шкалой, на которой оптимизируется транскрипционная регуляция (на более короткой временной шкале время, затрачиваемое на трансляцию гена и посттрансляционные модификации может оказывать эффект). Мы использовали этот метод, чтобы реконструировать пространственно-временные профили экспрессии при сомитогенезе у мышей. Пики в профилях точно указывали время регуляции гена, а их последовательность выявляла детали тонко настраиваемой регуляторной сети. Было показано, что время генной экспрессии тесно связано с временем активности генного продукта, даже если далее необходимы пост-транскрипционные и пост-трансляционные ступени регуляции. Мы полагаем, что такое превалирование just-in-time экспрессии [24] позволяет клетке делать более экономным накопление и поддержание белков, не используемых в данное время.
Мы представили метод Maximum Entropy deconvolution в пространстве и времени и приложили его, чтобы экстрагировать данные хронологии из микромассива, полного пространственно-временного профиля экспрессии генов, участвующих в сомитогенезе мыши. Для регулируемых генов мы реконструировали временные профили и определили время пиков экспрессии в ходе цикла сомита с разрешением в минуты. Наши результаты также показали присутствие нового класса генов (включая Raf1 и Hes7) с двумя пиками активности в двух разных фазах сомитного цикла. Мы продемонстрировали, что временная линия экспрессии генов в точности отражает их функции в биохимических путях и направление причинных связей в регуляторных сетях.
Использованный метод позволил успешно реконструировать транскрипционные события во время сомитогенеза у мышей с высокой точностью и беспрецедентным временным разрешением. Полученные результаты продемонстрировали, что гены, участвующие в этом процессе, транскрибируются в точности, когда их продукты необходимы и что временной график экспрессии генов согласуется с направлением причинности (causation) в регуляторной сети сомитогенеза. Это строго подтверждает, что временная структура процесса сегментации полностью отражает временной график транскрипционной активности. Согласие получено даже для генов с пост-транскрипционными и пост-трансляционными модификациями, (напр. beta-catenin). Правдоподобным объяснением такой сильно преобладающей точной во времени экспрессии является, как полагают, эволюционное давление в направлении экономии ресурсов в живых клетках - предсказуемый временной процесс, когда клетка консервирует энергию и компоненты аминокислот, если генный продукт продуцируется прежде, чем необходим, в качестве противовесе долговременному хранению и поддержанию белков. Deconvolution, действующая как фильтр шумов, выявляет выступающие пики во временых профилях многих генов, ранее не описываемых как циклические (такой как beta-catenin), и для ряда транскриптов с двумя фазами активности на цикл сомитогенеза (включая Raf1 и Hes7). Наши находки подтвердили применение алгоритмов ко второй независимой базе данных. Хотя существуют некоторые отличия между этими двумя наборами данных, упорядоченность причинно-связанных генов почти универсально законсервиррована.
Временной график экспрессии пиков может служить в качестве опорной отметки для вновь идентифицированных причинных взаимодействий в сомитогенезе, а также как инструмент для генерации и тестирования дальнецших гипотез, связанных с участвующей регуляторной сетью. Наши результаты демонстрируют пригодность определения времени с высоким разрешением экспрессии генов для расшифировки инструкций в транскрипционной сети в целом.
Статистические и компьюторые вычислительные методы, разработанные в данной работе действительно приложимы для интерпретации результатов в дальнейших исследованиях экспрессии генов при сомитогенезе у мыщей и др. сидов, а также для др. процессов развития.