Посещений:
ГАСТРУЛЯЦИЯ



Изучение одиночных клеток

Multi-omics profiling of mouse gastrulation at single-cell resolution
Ricard Argelaguet, Stephen J. Clark, Hisham Mohammed et al.
Nature volume 576, pages487–491(2019)

Multiomics, multi-omics or integrative omics is a biological analysis approach in which the data sets are multiple "omes", such as the genome, proteome, transcriptome, epigenome, metabolome, and microbiome (i.e., a meta-genome and/or meta-transcriptome, depending upon how it is sequenced); in other words, the use of multiple omics technologies to study life in a concerted way. By combining these "omes", scientists can analyze complex biological big data to find novel associations between biological entities, pinpoint relevant biomarkers and build elaborate markers of disease and physiology. In doing so, multiomics integrates diverse omics data to find a coherently matching geno-pheno-envirotype relationship or association. The OmicTools service lists more than 99 softwares related to multiomic datanalysis, as well as more than 99 databases on the topic.
Недавние технологические успехи сделали возможным профилирование множественных молекулярных слоёв с разрешением в одну клетку9-13, предоставив новые возможности для изучения взаимоотношений между транскриптомом и эпигеномом во время выбора клетками судьбы. Мы использовали нуклеосомы, метиломы одиночных клеток и секвенирование транскриптома12 (scNMT-seq) , чтобы получить профили 1105 одиночных клеток, выделенных из эмбрионов мышей на 4-й ст развития (день эмбриогенеза (E)4.5, E5.5, E6.5 и E7.5), представляющей выход из плюрипотентности и спецификацию первичных зародышевых слоёв (Fig. 1a-d, Extended Data Fig. 1). Клетки были предназначены, чтобы давать специфические клоны путем картирования их профилей экспрессии РНК, чтобы создать исчерпывающий атлас одиночных клеток4 с той же самой стадии, когда становятся доступными или пригодными маркерные гены (Extended Data Fig. 2). Используя уменьшение размерности, мы показали, что все три молекулярных слоя содержат достаточно информации, чтобы разделять клетки по стадиям (Fig. 1b-d) и клональным особенностям (Extended Data Figs. 2, 3).

Fig. 1: Single-cell multi-omics profiling of mouse gastrulation.

a, Schematic of the developing mouse embryo, with stages and lineages considered in this study labelled. b, Dimensionality reduction of RNA-expression data using UMAP. Cells are coloured by stage. There are 1,061 cells included from 28 embryos sequenced using scNMT-seq and 1,419 cells from 26 embryos sequenced using scRNA-seq. c, d, Dimensionality reduction of DNA methylation data (c) and chromatin accessibility data (d) from scNMT-seq using factor analysis (Methods). Cells are coloured by stage. There are 986 cells included for DNA methylation data and 864 cells for chromatin accessibility data. e, f, Heat map of per cent DNA methylation levels (e) and per cent chromatin accessibility levels (f) by stage and genomic context. g, Scatter plot of Pearson correlation coefficients of promoter methylation (Met) versus RNA expression (x axis) and promoter accessibility versus RNA expression (y axis). Each dot corresponds to one gene (n = 4,927). Red dots depict significant associations for both correlation types (n = 39, false discovery rate (FDR) < 10%). Examples of early pluripotency and germ cell markers among the significant hits are labelled. h, Illustrative example of epigenetic repression of Dppa4. Box and violin plots show the distribution of RNA expression (log normalized counts, green), promoter methylation (red) and accessibility (Acc) (blue) per stage. Box plots show median levels and the first and third quartile, whiskers show 1.5? the interquartile range. Each dot corresponds to one cell.



Epigenome dynamics at pluripotency exit


Мы охарактеризовали изменения метилирования ДНК и доступность хроматина во время перехода каждой стадии. В целом, уровни метилирования повышаются от приблизительно 25% до приблизительно 75% в эмбриональных тканях и примерно на 50% во вне-эмбриональных тканях, управляемые в основном волной метилирования de novo со ст. E4.5 до E5.5, которая преимущественно целенаправленно воздействует на геномные локусы, бедные CpG6,8,14 (Fig. 1e, Extended Data Fig. 3). Напротив, мы наблюдали более постепенное снижение доступности глобального хроматина приблизительно 38% на ст. E4.5 до приблизительно 30% на ст. E7.5 (Fig. 1f), при отсутствии отличий между эмбриональными и вне-эмбриональными тканями (Extended Data Fig. 3). Чтобы связать эпигенетические изменения с транскрипционной динамикой на разных стадиях, мы подсчитывали корреляции - для каждого гена и для всех эмбриональных клеток - корреляцию между экспрессией РНК и соотв. метилированием ДНК или доступностью хроматина промоторов. Их 5000 тестированных генов, мы идентифицировали 125 генов, экспрессия которых демонстрировала достоверную корреляцию с метилированием ДНК промоторов и 52 гена, экспрессия которых обнаруживала достоверную корреляцию с доступностью к хроматину (Fig. 1g, Extended Data Fig. 4, Supplementary Tables 1, 2). Эти локусы в основном представляли маркеры ранней плюрипотентности и зародышевых клеток, такие как Dppa4, Zfp42, Tex19.1 и Pou3f1 (Fig. 1g, h, Extended Data Fig. 4), которые оказывались репрессированными, что совпадало с глобальным повышением метилирования и со снижением доступности. Кроме того, этот анализ идентифицировал гены, включая Trap1a и Zfp981, которые могут иметь пока неизвеcные роли в развитии. Очевидно, гены, которые активируются после E4.5, только 39 и 9 обнаруживают достоверную корреляцию между экспрессией РНК и метилированием или доступностью промотора, соотв. (Extended Data Fig. 4). Это указывает на то, что активация этих генов возможно контролируется др. регуляторными элементами.

Characterizing germ-layer epigenomes


Чтобы понять взаимодействия между всеми тремя молекулярными слоями во время детерминации зародышевых слоёв, мы затем использовали multi-omics factor analysis (MOFA)15 для клеток, выделенных на ст. E7.5. MOFA выполняет неконтролируемое уменьшение размерности одновременно для нескольких модальностей данных, тем самым выявляя глобальные источники межклеточной изменчивости с помощью небольшого числа предполагаемых факторов. В частности, модель использует мультимодальные измерения из одних и тех же клеток, тем самым обнаруживая согласованные изменения между различными модальностями (формами) данных.
В качестве вводных данных для модели мы использовали данные РНК секвенирования (RNA-seq) для генов, кодирующих белки, и метилирующих транскрипцию ДНК белок-кодирующих генов и метилирования ДНК и данные доступности хроматина для предполагаемых регуляторных элементов. Сюда вошли промоторы и специфичная для зародышевых слоёв иммунопреципитация хроматина, при этом определяли пики секвенирования ДНК (ChIP-seq) для дистальных H3K27ac (энхансеров) и H3K4me3 (мест старта транскрипции)16 (Extended Data Fig. 5). MOFA выявил 6 факторов с двумя наилучшими (отсортированными по variance explained), выявляющими появление трех зародышевых слоёв (Fig. 2a, b). В частности, MOFA связал вариации уровня экспрессии гена с совместным метилированием и доступностью изменений в клон-специфических метках энхансеров (Fig. 2c). Напротив, эпигенетические изменения в промоторах или регионах, маркированных H3K4me3, обнаруживают значительно более слабые ассоциации c формированием зародышевых слоёв (Fig. 2a, Extended Data Fig. 6, Supplementary Tables 3, 4). Это подтверждается др. исследованиями, которые идентифицировали дистальные энхансеры в качестве управляющих клонами регуляторных регионов8,17-19. Проверка ассоциаций ген-энхансер выявила энхансеры, связанные с ключевыми маркерами зародышевых слоев, включая Lefty2 и Mesp2 (мезодерма), Foxa2 и Bmp2 (энтодерма), и Bcl11a и Sp8 (эктодерма) (Fig. 2c, Extended Data Fig. 7). В частности, специфичные для эктодермы энхансеры обнаруживают меньше ассоциаций, чем их мезодермальнрые и энтодермальные аналоги.

Fig. 2: Multi-omics factor analysis reveals coordinated epigenetic and transcriptomic variation at enhancer elements during germ-layer commitment.

a, Percentage of variance explained (R2) by each MOFA factor (rows) across data modalities (columns). b, Scatter plot of MOFA factor 1 (x axis) and MOFA factor 2 (y axis). Cells are coloured according to their lineage assignment (n = 840). c, Scatter plots showing differential DNA methylation (x axis) and chromatin accessibility (y axis) at lineage-specific enhancers at E7.5. Ectoderm versus non-ectoderm cells (left, n = 2,992), endoderm versus non-endoderm cells (middle, n = 2,852) and mesoderm versus non-mesoderm cells (right, n = 1,448) are shown. Black dots depict gene-enhancer pairs with significant changes in RNA expression and methylation or accessibility (Pearson's ?2 test, FDR <10%). d, Transcription factor motif enrichment at lineage-defining enhancers. Motif enrichment (Fisher's exact test, ?log(q value), y axis, n = 746 motifs) versus differential RNA expression (log fold change, x axis) of the corresponding transcription factor is shown. The analysis is performed separately for ectoderm- (left), endoderm- (middle) and mesoderm- (right) defining enhancers. Transcription factors with significant motif enrichment (FDR <1%) and differential RNA expression (edgeR quasi-likelihood test, FDR <1%) are labelled.

4 оставшихся фактора соответствуют дополнительным транскрипционным и эпигенетическим показателям (signatures), связанными с формированием передне-заднего осевого (factor 3), формированием хорды (factor 4), формировании паттерна мезодермы (factor 5) и клеточного цикла (factor 6) (Extended Data Fig. 8).
Наконец, мы предприняли поиск, чтобы идентифицировать транскрипционные факторы, которые могут управлять или реагировать на эпигенетические изменения при детерминации зародышевых слоёв. Объединение информации по дифференциальной экспрессии с мотивом, богатым в дифференциально доступных локусах, показало, что клон-специфические энхансеры были обогащены сайтами связывания, ассоциированными с ключевыми онтогенетическими транскрипционными факторами, включая POU3F1, SOX2 и SP8 для эктодермы, SOX17, HNF1B и FOXA2 для энтодермы и GATA4, HAND1 и TWIST1 для мезодермы (Fig. 2d).

Time resolution of the enhancer epigenome


Затем мы исследовали, как эпигеномные паттерны ассоциируют со спецификацией зародышевых слоёв, осуществляемой в ходе развития. Уровни метилирования ДНК в энхансерах, определяющих энтодерму и мезодерму, следуют динамике во всем геноме, увеличиваясь в среднем от 25% до 80% во всех типах клеток (Fig. 3, Extended Data Fig. 9). После спецификации клонов оно подвергаются согласованному деметилированию приблизительно на 50% в зависимости от специфического типа клеток. Противоположный паттерн наблюдается в отношении доступности хроматина; доступность энхансеров, предопределяющих мезодерму и энтодерму, сначала снижается с приблизительно 40% до 30% (следуя динамике всего генома) прежде чем станет более доступной (приблизительно 45%) после спецификации клонов. Общая динамика деметилирования и энхансеров открытия хроматина во время эмбриогенеза, по-видимому, законсервирована у рыбок данио, Xenopus и мышей19. В соответствии с этими данными, когда определяются количественные уровни H3K27ac в энхансерах, определяющих клоны в более дифференцированных тканях (E10.5 средний мозг, E12.5 кишечник и E10.5 сердце)20,21, мы наблюдали, что существенное количество энхансеров остается маркированным по H3K27ac (Extended Data Fig. 5). Это указывает на то, что энхансеры, запущенные на ст. E7.5 в значительной степени поддерживаются и в позднем развитии.



Fig. 3: DNA methylation and chromatin accessibility dynamics at lineage-defining enhancers across development.

a, Illustration of the hierarchical model of enhancer epigenetic dynamics associated with germ-layer commitment. b, UMAP projection based on the MOFA factors inferred using all embryonic cells (n = 1,928). Main plot, cells are coloured by lineage. Smaller plots, cells are coloured by average methylation (top) or accessibility (bottom) at lineage-defining enhancers. For cells with RNA-expression data only, the MOFA factors were used to estimate the methylation and accessibility levels. c, Profiles of methylation (red) and accessibility (blue) at lineage-defining enhancers (enh.) (n = 3,918 for ectoderm, n = 1,930 for endoderm, n = 1,417 for mesoderm) across development. Running averages in 50-bp windows around the centre of the ChIP-seq peaks (2 kb upstream and downstream) are shown. Solid lines show the mean across cells and shaded areas represent the s.d. E5.5 and E6.5 epiblast cells show similar profiles and are combined. Dashed horizontal lines represent genome-wide background levels for methylation (red) and accessibility (blue).

В противоположность энхансерам мезодермы и энтодермы, энхансеры эктодермы открыты и деметилируются самое раннее со ст. E4.5 в эпибласте (Fig. 3, Extended Data Fig. 9). Только в клетках, выбравших мезодермальную судьбу, действуют энхансеры эктодермы, оказываясь частично репрессированными. Соотв., когда измеряется динамика доступности в сайтах, содержащих мотивы для предопределяющих эктодерму транскрипционных факторов (SOX2 и SP8), то мы находим, что эти мотивы уже доступны в эпибласте и доступность теряется специфически после детерминации мезодермы. Напротив, мотивы, ассоциированные с транскрипционными факторами , предопределяющими энтодерму и мезодерму, становятся доступными в соотв. клонах только на ст. E7.5 (Extended Data Fig. 9).
Эти наблюдения могут быть объяснены с помощью или запуска эктодермальной сигнатуры в эпибласте или путем поддержания сигнатуры плюрипотентности в эктодерме. Чтобы исследовать это, мы изучали на ст. E7.5 аннотации энхансеров по опубликованным данным H3K27ac ChIP-seq эмбриональных стволовых клеток (ES cells) и на E10.5 в среднем мозге21,22. На ст. E7.5 эктодермальные энхансеры обладают практически исключительно плюрипотентной или нейральной сигнатурой, при этом заметно отличается динамика метилирования ДНК и доступности хроматина (Extended Data Fig. 10). Энхансеры плюрипотентности со временем обнаруживают увеличение метилирования и снижение доступности, указывая тем самым на репрессию этих энхансеров с динамикой, сходной с таковой в промоторах генов плюрипотентности (Fig. 1g, h). Напротив, энхансеры нейроэктодермы остаются гипометилированными и доступными, начиная с E4.5 (Extended Data Fig. 10).
Наконец, чтобы установить временные зависимости активации энхансеров, мы использовали профили экспрессии РНК, чтобы определить последовательность клеток вдоль двух траекторий, соответствующих детерминации мезодермы и энтодермы (Extended Data Fig. 11). Путем построения средних показателей метилирования ДНК и доступности хроматина для каждого класса клон-определяющих энхансеров, мы установили, что избытку метилирования (и потери доступности) энхансеров эктодермы предшествует деметилирование (и повышение доступности) энхансеров мезодермы и эктодермы. В обоих случаях изменения метилирования и доступности появляются одновременно, указывая на тесную совместную регуляцию двух эпигенетических слоёв.

TET enzymes drive enhancer demethylation


Фермент TET methylcytosine dioxygenase участвует в деметилировании энхансера 23,24, а эксперименты с потерей функции подтверждают, что TET энзимы жизненно важны для гаструляции25,26. Чтобы протестировать действительно ли TET энзимы управляют клон-специфическим деметилированием, мы индуцировали дифференцировку ES клеток дикого типа и ES клеток, дефицитных по всем трем TET энзимам (Tet TKO) , эмбриоидных телах и анализировали клетки с использованием scNMT-seq.
Картирование профилей экспрессии РНК для in vivo атласа гаструляции показало, что эмбриоидные тела дикого типа воспроизводят переход от плюрипотентного эпибласта на 2-й день дифференцировки к первичной полоске между днями 4 и 5 (Fig. 4a, b). На день 6 и 7, мы наблюдали появление структур зрелой мезодермыe, включая гематопоэтические типы клеток (Fig. 4a, b, Extended Data Fig. 12). Экспрессия маркерных генов ограничивается ожидаемым клоном, а дифференциальная экспрессия между клонами сравнима с результатами in vivo ожидаемой клональной и дифференциальной экспрессии между клонами в соответствии с результатами in vivo (Extended Data Fig. 12). Более того, глобальная динамика метилирования ДНК т доступности хроматина в эмбриоидных телах дикого типа в значительной степени отражают данные in vivo (Extended Data Fig. 12).



Fig. 4: TET enzymes are required for efficient demethylation of mesoderm-defining enhancers and subsequent blood differentiation in embryoid bodies.

a, UMAP projection of stages E6.5 to E8.5 of the atlas dataset (no extra-embryonic cells). Top left, cells coloured by lineage assignment. The remaining plots show, for different days of embryoid body differentiation, the nearest neighbours that were used to assign cell-type labels to the embryoid body dataset. Wild-type (WT) cells are red (n = 438), Tet TKO cells are blue (n = 436). We grouped days 4-5 and 6-7 together because of the similarity in the cell types recovered. b, Bar plots showing the numbers of each cell type for each day of embryoid body differentiation, grouped by genotype (n = 438 WT and 436 KO). c, Overlaid box and violin plots show the distribution of DNA methylation (top) or chromatin accessibility (bottom) for lineage-defining enhancers in epiblast-like cells at day 2 (n = 46 (WT) and n = 44 (Tet TKO)) and mesoderm-like cells at days 6-7 (n = 22 (WT) and n = 32 (Tet TKO)). The y axes show methylation or accessibility scaled to the genome-wide levels. Box plots show median levels and the first and third quartile, whiskers show 1.5? the interquartile range. P values shown result from comparisons of group means (t-test). Asterisks denote significant differences (FDR <10%).

Сравнение дикого типа Tet TKO дифференцировки в эпибласт-подобных клетках на день 2 выявило более высокое метилирование ДНК в энхансерах эктодермы в Tet TKO клетках, но не обнаружено различий в энхансерах мезодермы или энтодермы (Fig. 4c). Повторный анализ измерений метилирования у Tet TKO эмбрионов подтвердил, что один и тот же паттерн наблюдается in vivo25 (Extended Data Fig. 12). Нарушения деметилирования также ассоциированы с различиями во времени дифференцировки, при этом Tet TKO клетки обнаруживают повышенную пропорцию дифференцировки ранней мезодермы на день 4-5 (Fig. 4a, b). Однако, на день 6 - 7 Tet TKO клетки не деметилируют соотв. образом клон-специфические энхансеры и не дифференцируются в зрелого типа мезодермальные клетки (Fig. 4c).
Эти наблюдения показывают, что деметилирование энхансеров, детерминирующих клоны, по крайней мере, частично управляется с помощью TET белков. Хотя деметилирование энхансеров, по-видимому, не необходимо для ранней детерминации мезодермы, отсутствие гематопоэтических клеток среди Tet TKO клеток подтверждает, что деметилирование может быть важным для дальнейшей прогрессии клонов. Соотв., Tet TKO эмбрионы способны инициировать гаструляцию, но на ст. E8.5 они обнаруживают дефекты происходящих из мезодермы типов клеток, включая сердце или сомиты25.

Discussion


Наши результаты показывают, что плюрипотентные клетки эпибласта эпигенетически настроены на приобретение судьбы эктодермы, начиная со ст.E4.5. Эта находка подтвеждает существование самопроизвольного ('default') пути в модели эпигенетического ландшафта Waddington's, подтверждая потенциальный механизм феномена 'default' дифференцировки нейроэктодермальной ткани из ES клеток27,28. Напротив, энтодерма и мезодерма активно отклоняются от default пути с помощью деметилирования и открытия хроматина на соотв. энхансерных элементах17,24,25. Т.о., эпигеном зародышевого слоя предопределяется во время гаструляции с помощью иерархической или асимметрической эпигенетической модели (Fig. 3a).
Обобщая, эти результаты имеют важное значение для роли эпигенома в предопределении детерминации клонов. Мы полагаем, что асимметричная эпигенетическая индукция (priming)-посредством ранних предшественников, является эпигенетическим запуском самопроизвольного (default) типа клеток - это может оказаться более генеральным свойством детерминации клонов in vivo. В подтверждение этой гипотезы, два недавних исследования идентифицировали самопроизвольные (default) пути в спецификации передней кишки и остеогенеза29,30. Дальнейшие исследования с использованием multi-omics подходов для исследования клеточных популяций смогут в принципе перевернуть наши представления о выборе клеточных судеб, это будет иметь важное значение для биологии стволовых клеток.