Посещений:
СПЕЦИФИКАЦИЯ ЭМБРИОНАЛЬНЫХ ТИПОВ КЛЕТОК



Оценка транскрипции в отдельных клетках

Single-cell transcriptional profiling: a window into embryonic cell-type specification
• Blanca Pijuan-Sala, • Carolina Guibentif & • Berthold Gottgens
Nature Reviews Molecular Cell Biologyvolume 19, pages399–412 (2018) |

С появлением высокопроизводительного секвенирования одиночных клеток и технологий получения изображений одиночных молекул стало возможны получать молекулярные профили одиночных клеток и количественно оценивать экспрессию генов более аккуратно в определенных многоклеточных тканях. Поскольку выбор клеточных судеб в конечном итоге производится индивидуальными клетками, реагирующими на внешние стимулы, то эти новые транскрипционные технологии оказывают огромное влияние на наше понимание раннего эмбрионального развития.


Single-cell technologies


Одним из наиболее важных открытий в области одиночных клеток стала находка, что одиночные клетки органа или типы клеток, которые ранее рассматривались как гомогенные, часто оказываются функционально и молекулярно гетерогенными. Это первоначально стало очевидным при использовании проточной цитометрии, которая стала одним из первых высокопроизводительных анализов одиночных клеток, этот подход позволяет сегодня оценивать профили экспрессии свыше 40 маркеров клеточной поверхности индивидуальных клеток, если комбинируется с масс-спектрометрией для элементного анализа (rev. ref.1). Появление fluorescence-activated cell sorting (FACS) сделало возможной сортировку индивидуальных клеток или молекулярно определенных клеточных популяций, путем оценки одиночных клеток в отдельности 2. Недавние же технологии позволяют одновременно измерять многие параметры индивидуальных клеток, это внесло вклад в открытие новых регуляторов клеточной дифференцировки и онтогенетических процессов.

Single-cell transcriptomics


Анализ транскрипции одиночных клеток стал важным с появлением амплификации полиаденилированных РНК из индивидуальных гематопоэтических клеток для измерения для измерения относительных количеств транскриптов3. Однако, это был качественный подход и до сих пор не был разработан количественный подход в реальном времени PCR (qPCR)4,5 , когда оказывался выполним к отдельной клетке qPCR (sc-qPCR). Затем был достигнут существенный прогресс в автоматизации и разработаны микрожидкостные системы, позволяющие измерять экспрессию нескольких генов в нескольких одиночных клетках в одном qPCR run6. Такой целенаправленный анализ известных генов стал инструментальным в характеризации молекулярных программ мульти-клональных клеточных предшественников, которые, по-видимому, ко-экспрессировали гены, характерные для разных зрелых типов клеток, которые они должны были давать7,8. Это также важно для изучения специфических сигнальных путей или сетей транскрипционных факторов в развивающихся клеточных популяциях, в пределах от зиготы до дифференцировки определенных клонов клеток, таких как кровяные или эндотелиальные клетки6,9,10.
Транскриптомные технологии начались с разработки микро-массивов одиночных клеток для изучения экспрессии генов в мышином бластоцисте11. Используя эту стратегию, эмбриональные одиночные клетки были молекулярно классифицированы на две группы, эпибласт и примитивная энтодерма, которые стали двумя клонами, как известно, сегрегирующими на стадии бластоциста11 (Box 1). Хотя микро-массивы уже могут помочь различать клетки разных клонов, они ограничены анализом охарактеризованных транскриптов, пробы которых используются для измерения количества транскриптов.
Необходимость в более сложном инструменте привела к разработке первого протокола секвенирования РНК одиночных клеток single-cell RNA-seq (scRNA-seq) в 2009 (ref.12). Этот метод позволял определять существенно более высокие количества генов в бластоцистах по сравнению с микро-массивами одиночных клеток и поэтому была осуществлена подробная характеристика транскрипции этой ст. развития12. Затем несколько оптимизирующих протоколов было разработано, включая Smart-seq2 и cell expression by linear amplification and sequencing 2 (CEL-seq2)13-16 (Box 2). Эти улучшенные методы достигли наивысшего покрытия транскрипции по сравнению с ранними scRNA-seq протоколами и рассматриваются как золотой стандарт в этой области. Однако, они всё ещё нуждаются в выделении индивидуальных клеток в одиночные источники (wells) и поэтому обозначаются как well-based методы. Такие методы используют стратегии, такие как FACS или микро-препарирование, что ограничивает клеточную пропускную способность.
Чтобы транскрипционно охарактеризовать целые органы или стадии эмбрионального развития на уровне одиночных клеток путем исследования всего генома, альтернативой стали droplet-based microfluidics протоколы17,18 (Box 2). Они сделали возможным процессинг тысяч клеток в одном эксперименте, тем самым внесли вклад в открытие редких субпопуляций внутри выборки или в характеристику их молекулярного разнообразия. Такая методология была недавно использована для характеристики транскрипции нескольких биологических систем, таких как популяции ретинальных клеток взрослых18, мышиных эмбриональных стволовых клеток (mESCs)17 и целого эмбриона мыши на 8.25 день развития(E8.25)19. Однако, droplet-based техника также имеет некоторые ограничения такие как высокий риск генерации данных от дублетов клеток, обнаружение транскриптов сдвигается в направлении 3' концов и оказывается менее чувствительным, чем well-based методы благодаря отлавливанию немногих уникальных транскриптов. Поэтому well-based методы остаются хорошим выбором для ответа на специфические вопросы, что лучше или покрытие транскриптома и/или относительно низкие количества клеток.
Независимо от используемого метода (well-based или droplet-based), протоколы транскриптомики одиночных клеток нуждаются в pre-amplification ступени, чтобы получить достаточно материала для следующего за тем метода и, следовательно, исходные данные, получаемые с помощью этого метода, отражают количества амплифицированной кДНК, вместо оригинальных количеств РНК в выборке. Т.к. амплификация PCR осуществляется нелинейным образом, то легко могут быть внесены количественные отклонения в окончательные подсчеты. Поэтому производится оптимизация ряда PCR циклов, чтобы удерживать каждую реакцию внутри экспоненциальной фазы путем осуществления предварительного набора тестов, помогающего снизить риск отклонений. Альтернативно, наиболее точный метод реально оценить количества РНК 0 это добавление молекулярных меток, наз. уникальными молекулярными идентификаторами перед амплификацией биологического материала20. Путем мечения каждого транскрипта индивидуально, могут быть подсчитаны абсолютные количества молекул РНК в каждой клетке, с минимизацией шумов от амплификации.
Из-за небольшого количества стартового материала, данные scRNA-seq склонны к созданию технических шумов, которые негативно скоррелированы с количеством транскриптов21. Более того, групповые эффекты могут спутывать данные анализа и демонстрации (display). Такие эффекты могут вызываться несколькими экспериментальными условиями, в пределах от использования разных смесей реагентов до проведения экспериментов в разные дни. Чтобы противодействовать этим проблемам разработаны стратегии нормализации и методы bioinformatically infer сильно изменчивых генов21-25. Когда осуществляются подсчеты исходных данных секвенирования, современные исследования по транскриптомике одиночных клеток используют dimensionality-reduction подходы, такие как анализ принципиальных компонент, t-distributed stochastic neighbour embedding (t-SNE)26 диффузионные карты27,28, чтобы визуализовать данные (Fig. 1a). В противоположность анализу принципиальных компонент t-SNE и диффузионные карты способны улавливать нелинейную природу биологических процессов; t-SNE является особенно подходящим для идентификации основных транскрипционно охарактеризованных (defined) клеточных групп, которые существуют в массиве данных. Напр., эта стратегия была использована для выявления биологической структуры scRNA-seq данных для набора, состоящего из клеток, собранных во время гаструляции (Box 1). Выявлено существование десяти разных групп клеток, которые включают популяции клеток эпибласта, мезодермальных клеток, клеток предшественников крови и эндотелия и дифференцированные клетки29. Важно, что расстояния между этими отличающимися группами были визуализованы с помощью t-SNE plots, это не должно рассматриваться как биологическая репрезентация родства (relatedness). Соединенные со стратегиями образования кластеров клеток, которые помогают выявлять преобладающие профили генной экспрессии в наборе данных, t-SNE делает возможной транскрипционную характеристику популяций эмбриональных клеток одиночных клеток в пределах ранней пре-имплантационной стадии, гаструляции и органогенеза, а также транскрипционно характеризовать развивающиеся ткани, такие как сердце и кровь10,19,29-32.

Fig. 1: Single-cell transcriptomics.

a | Bioinformatics pipeline used to explore single-cell transcriptomics data. Following the normalization of gene expression data, visualization approaches (left), which are based on dimensionality-reduction techniques, and clustering (right) are applied to the data. Rows in the heat map depict single genes; columns refer to single cells; colours represent gene expression levels, where red is high and blue is low. Cells are clustered into groups A-C based on their gene expression profiles, and genes are grouped into groups X-Z based on their expression profiles. b | Pseudotime analysis. Pseudotime paths, which highlight the progression of the biological process, are inferred from the data set (top), and the dynamics of differentially expressed genes are analysed for each path (bottom). The top diagram is a visualization of the transcriptome data using diffusion maps and the paths that the pseudotime algorithm has inferred. The colour gradient seen in the arrows (from red to blue or to yellow) highlights progression from the starting cells (red) to the end cells (blue or yellow). The bottom diagrams show the different trends of gene expression along each of the paths. c | In single-molecule RNA fluorescent in situ hybridization (sm-FISH) labelling, a fluorophore-based barcode is assigned to a specific RNA sequence. In combinatorial labelling, each RNA transcript is targeted with multiple sequence-specific probes with different fluorophores (three in the example) that can be detected under the microscope using different channels. The identity of each molecule is extrapolated from the pre-established code. In sequential labelling, each RNA is targeted with multiple sequence-specific unicolor probes. Once the sample is imaged, the probes are digested with DNase I, and the next batch of probes with different fluorophores (one per RNA) is hybridized. This will result in a sequential colour-coding, where RNA identities will be assigned using the pre-established code. PCA, principal component analysis; t-SNE, t-distributed stochastic neighbour embedding.


Диффузионное картирование имеет целью получение данных на непрерывном коллекторе (manifold), который поэтому обычно используются, чтобы визуализовать биологические процессы, такие как клеточная дифференцировка. Диффузионное картирование часто купировано с pseudotime алгоритмами, такими как Diffusion Pseudotime9, Wishbone33, Monocle34 и Monocle2 (ref.25) (Fig. 1b). Эти анализы были использованы, чтобы сделать выводы (infer) последовательной прогрессии путем компьютерного упорядочения клеток вдоль координат, которые отражают пути развития и , следовательно, пригодны, чтобы визуализовать дифференцировку многих клеточных клонов, включая клетки крови10,28, лимфоидные клетки33,35 и mESCs9, и помогают открыть новые регуляторы этих процессов. Важно, pseudotime анализ допускает, что эти биологические процессы являются непрерывными и поэтому позиции клеток, которые обладают сходными профилями транскрипции, близки др. к др. вдоль пути развития. Соотв., они могут быть неаккуратными, если биологическая система ведет себя осциллирующим образом или подвергается быстрым переходом состояний, при этом необходимы экспериментальные оценки. В этих случаях предварительные знания, напр., известно, что специфические гены обнаруживают градиенты экспрессии вдоль траектории исследуемых процессов, это может помочь сделать вывод о ходе развития из отрывочных данных. Такой подход был недавно использован для предсказания генов с волнообразной экспрессией во время сперматогенеза у мышей из клеток на ст. E8.25 и это затем было оценено с использованием микро-препарирования 19.

High-throughput single-molecule imaging


Основным ограничением транскриптомики одиночных клеток является отсутствие пространственного и временного разрешения. Многие исследования поэтому использовали технологии получения изображений, чтобы понять, как возникает экспрессия генов и оркестрируется в одиночных клетках внутри данной ткани. Хотя изображения обычно были ограничены в количестве транскриптов, оно могло быть оценено благодаря ограничивающим пределам различной окраски, теперь возможно пространственное разрешение экспрессии приблизительно 103 генов одновременно в одиночной клетке, используя single-molecule RNA fluorescent in situ hybridization (sm-FISH)36-38. Это осуществимо благодаря комбинации разных sequence-specific probes, которые целенаправленно воздействуют на каждый транскрипт многократно, генерируя тем самым уникальный штрих-код транскрипции, который может быть распознана с помощью микроскопии (Fig. 1c). sm-FISH был применен к mESCs, чтобы описать их молекулярную гетерогенность39. Эта техника была также использована вместе с инструментом CRISPR-Cas9, чтобы установить систему, наз. MEMOIR, которая записывает клональную информацию в одиночных mESCs40. Важно, что sm-FISH является целевым подходом, который нуждается в дорогостоящих pre-designed зондах для изучения всех интересующих генов. Более того, сегодня техника нуждается в специальной экипировке для получения изображений и в программном обеспечении, которые , по крайней мере, в ближайшем будущем будут ограничивать его использование. Недавно разработана менее разборчивая стратегия, наз., fluorescent in situ sequencing (FISSEQ)41, которая делает возможным unsupervised секвенирование транскриптов одиночных клеток in situ. Однако, на сегодня его детекция ограничивается приблизительно 200 транскриптами на клетку, а его высокая цена служит существенным недостатком.
Упомянутые выше методы предоставляют временные срезы. Поэтому, чтобы оценить динамику определенных процессов, важно прибегать к технике получения изображений вживую, которая могла бы отслеживать изменения экспрессии генов во времени. В последние годы основные улучшения позволили определять одиночные молекулы в живых клетках. Напр., RNA может быть помечена с использованием систем MS2 и PP7, которые состоят из шпилечных последовательностей РНК, слитых в тандем с интересующим транскриптом и которые связаны с флуоресцентным белком с высокой специфичностью42,43. Однако, практически большинство исследований вживую использовали флуоресцентные репортеры для отслеживания изменений в уровнях белков, вместо уровней транскриптов. Это привело к противоречивым результатам относительно спецификации судеб клеток. Напр., вывод о генной регуляции из исследований транскрипции одиночных клеток у мышей подтвердил, что во время гематопоэза транскрипционные факторы Gata1 и Pu.1 являются главными регуляторами выбора клетками своих судеб между эритроидным и миелоидным клонами, соотв., путем взаимного подавления др. др.44. Недавно эта модель была поставлена под сомнение данными, полученными при отслеживании Gata1 и Pu.1 белков с использованием методов получения изображений вживую, которые показали, что уровни белка Gata1 не зависят от клональной спецификации45. Это подчеркивает важность использования подходов по комплементарному анализу, чтобы оценить модели, выводимые из исследований транскриптомики одиночных клеток.

Heterogeneity in cell fate decisions


Одним из наиболее важных нерешенных вопросов является, как одиночная клетка последовательно детерминирует определенные клоны. Существуют клоны, молекулярно детерминированные на ранних стадиях, когда клетки функционально неотличимы с помощью современных методов или они оказываются ограниченными непосредственно перед их функциональным расхождением? Профилирование транскрипции одиночных клеток решает этот вопрос в контексте первых трех точек разветвления клонов эмбрионального развития: Во-первых, от тотипотентных клеток к внутренней клеточной массе (ICM) и трофэктодерме; Во-вторых, от ICM к эпибласту и примитивной энтодерме; и в-третьих, эпибласта к эктодерме, мезодерме и энтодерме.

From totipotency to the inner cell mass and trophectoderm


Первое клональное расхождение у эмбрионов мыши приводит к генерации т. наз. ICM и трофэктодермы (Box 1). Это расхождение становится морфологически и молекулярно очевидным на ст. бластоциста, когда клетки делятся в округлые ICM клетки, экспрессирующие маркеры эпибласта и примитивной энтодермы, такие как транскрипционные факторы Nanog, Oct4 (известен также как Pou5f1) и Gata6, и в относительно уплощенные клетки наружной трофэктодермы с высокими уровнями маркеров трофэктодермы caudal-type homeobox protein 2 (Cdx2)46-51. Хотя эти клоны были хорошо охарактеризованы, как такая сегрегация происходит, вопрос спорный.
В последние несколько лет некоторые исследования описали гетерогенность транскрипции очень ранних бластомеров в отношении многих факторов, которые обеспечивают качественные особенности ICM или трофэктодермы52,53. Как эта ранняя гетерогенность влияет на выбор клеточных судеб, сегодня вопрос спорный, выдвигаются две контрастирующие гипотезы. Равноценность гипотез указывает на то, что индивидуальные клетки не являются pre-patterned вплоть до восьми-клеточной стадии, когда эмбрион подвергается серии симметричных и асимметричных делений, которые управляют интернализацией клеток, которые становятся частью ICM52,54,-60. Согласно этим гипотезам гетерогенность, наблюдаемая на ранних стадиях объясняется случайными флюктуациями генной экспрессии. Напротив, гипотеза асимметрии предполагает, что неравноправные подразделения происходят во время клеточных делений, это приводит к тому, что клеточные компоненты распределяются неравномерно между дочерними клетками61-65. Эта асимметрия умножается в ходе последующих делений и в конечном счете приводит к клональной сегрегации. Эта гипотеза говорит не только, что клетки будут стартовать, обнаруживая некоторые предпочтения в направлении определенных клонов до восьми-клеточной стадии, но также что эта асимметрия будет честно воспроизводиться между клетками при сравнении разных эмбрионов.
Эксперименты по получению изображений оценивали поведение некоторых маркеров ICM и трофэктодермы, таких как Nanog, Oct4 и Cdx2, показали, что они экспрессируются случайным нескоординированным образом перед разделением клонов, обнаруживаемом на 16-клеточной стадии52. Хотя это как бы поддерживает гипотезу эквивалентности, эти факторы могут, чередуясь, быть важными только однажды при образовании клонов, а некоторые др. гены могут быть ответственны за формирование раннего пре-паттерна. Чтобы понять, действительно ли существуют др. молекулярные кандидаты до ст. 16 клеток, необходимо провести анализ транскриптома для всего генома. Недавно несколько групп использовали scRNA-seq в клетках, полученных на этих стадиях и было показано, что некоторые гены уже на ранних ст. экспрессируются бимодальным способом и что их транскрипция взаимосвязана позитивно или негативно, что вряд ли соответствует случайным флюктуациям66,67.
Гетерогенность экспрессии генов между клетками, по-видимому, начинается на двух-клеточной стадии и увеличивается со временем, различия становятся очевидными при переходах 2-к-4 и 4-к-8 клеткам53,66,67 (Fig. 2a). Переходы сопровождались наивысшими изменениями в экспрессии генов на стадиях maternal-to-zygotic transition (MZT) 66,68. Т.к. этот процесс состоит из деградации материнских транскриптов и активации транскрипции зиготического генома, то ожидалось возникновение бимодального распределения уровней участвующих транскриптов. Хотя время событий и некоторые профили экспрессии отличаются от мышиных69-71, но получены сходные находки в человеческих выборках при исследованиях транскриптомов одиночных клеток и было также показано, что наивысшие изменения в экспрессии генов происходят во время MZT70-72, подтверждая гипотезу, что молекулярное расхождение происходит вскоре после оплодотворения.

Fig. 2: Cell fate specification during mouse embryonic development. a | The decision between the inner cell mass (ICM) and the trophectoderm (TE). Gene expression differences increase as development progresses. Colours depict gene expression profiles. In the case of the 8-cell, 16-cell and 32-cell stages, colours highlight the type of cell division: symmetric or asymmetric. All the outer cells are trophectoderm, including those produced through asymmetric division (yellow cells). Cells become molecularly heterogeneous at the 2-cell stage, and the molecular segregation is amplified in the offspring, represented as a colour progression along the stages. This molecular segregation leads the blue cells to undergo symmetric divisions and become trophectoderm, while yellow cells divide asymmetrically and give rise to both epiblast (EPI) and primitive endoderm (PE). b | The ordered and random models of the decision between epiblast and primitive endoderm. In the ordered model, the first cells to be internalized at the 16-cell stage will give rise to the epiblast and the later-internalized cells will become the primitive endoderm. In the random model, cells are not specified (purple) until the 32-cell stage. c | The interaction between Nanog+ and Gata6+ cells through fibroblast growth factor (FGF) signalling. Nanog represses the transcription factor Gata6 and promotes Fgf4 expression. The resulting Fgf4 emerging from Nanog+ cells binds to both fibroblast growth factor receptor 2 (Fgfr2) and Fgfr1 receptors in a paracrine manner in Gata6+ cells and induces the expression of the primitive endoderm transcription factors Gata4 and SRY box 17 (Sox17). At the bottom of the diagram, the transcriptional status of these cells is described, with Nanog+cells being Nanog+Gata6-Fgf4+Fgfr2-Fgfr1+ and Gata6+ cells being Nanog-Gata6+Fgf4-Fgfr2+Fgfr1+. d | Molecular heterogeneity (left) precedes morphological changes (right), such as the emergence of the primitive streak. First, cells can be divided into T+, Foxa2+ and T+Foxa2+ populations. Next, the primitive streak, where these cells are, is formed.

Однако, эти результаты не доказали, что подобная сегрегация транскрипции непосредственно детерминирует судьбы клеток. Конечно, недавние доказательства подтвердили, то молекулярная изменчивость, наблюдаемая на ранних ст., склоняет клетки к асимметричным или симметричным делениям во время 8-to-16 и 16-to-32-клеточных стадий, это, в свою очередь, д. влиять на клеточные судьбы. Транскрипционный фактор SRY box 21 (Sox21) , как было установлено, гетерогенно экспрессируется на четырех-клеточной стадии. Когда Sox21 был истощен в одном из бластоцистов на двух-клеточной стадии, то снижалась вероятность, что клетка будет делиться асимметрично и что вклад в трофэктодерму будет увеличен53 (Fig. 2a). Эти результаты подтверждают модель, согласно которой ранняя гетерогенность транскрипции некоторых генов влияет на тип клеточного деления и судьбы клеток с очень ранних стадий. Несмотря на это доказательства, представленные в пользу этого заключения, косвенные, отсутствует прямая демонстрация, что сегрегация между бластомерами мРНК и белка Sox21 продолжает сохраняться после четырех-клеточной стадии и что это, в свою очередь, коррелирует с клональной сегрегацией во время перехода от 8-к-16-клеточной стадии. Относительно вопроса, как асимметричные деления могут затем влиять на судьбы клеток, недавно проводили исследования, связанные с судьбой дочерних клеток в зависимости от различий во времени клеточных делений, а также от воздействия разных физических условий, которые затем влияли на интернализацию клеток, чтобы стать ICM58,60,73. Такие физические состояния включали различия в напряжении мембран, наследуемость апикального полюса и контрактильность ICM (rev. refs74,75).

Specification of the inner cell mass to epiblast or primitive endoderm


Первое решение о спецификации в ICM или трофэктодерму частично связано со вторым выбором судьбы, когда клетки ICM становятся или эпибластом или примитивной энтодермой. Впервые было предположено, что клетки сегрегируют клонально в зависимости от своего положения внутри ICM. Однако, в 2006 было продемонстрировано, что клетки сначала оказываются молекулярно специфицированными в виде паттерна 'salt-and-pepper' внутри ICM, а позднее организуют самих себя, чтобы достичь своей финальной конфигурации: внутренние клетки эпибласта, окружены примитивной энтодермой76. Но как это достигается? Как клетки ICM осуществляют выбор между эпибластом и примитивной?
Оказавшись на ст. морулы (8 клеток у мышей), клетки, которые будут формирвоать ICM, интернализуются во время следующих двух раундов асимметричных делений: от 8-к-16 клеткам и от 16-к-32 клеткам57-60. Некоторые доказательства подтверждают, что цикл делений, когда клетки ICM оказываются интернализованными, влияет и на их выбор судьбы эпибласта или примитивной энтодермы77,78 (Fig. 2b). Конкретнее, клетки, которые интернализуются во время первого раунда асимметричных делений, обнаруживают тенденцию становиться эпибластом, тогда как поздняя интернализация с высокой вероятность заставляет клетки становиться примитивной энтодермой. Однако, происходит ли это в действительности, вопрос спорный79 , и был предложен альтернативный механизм, согласующиеся со случайной спецификацией в направлении эпибласта или примитивной энтодермы (Fig. 2b). Какой бы механизм не оказался задействованным (see below), исследования транскрипции одиночных клеток с использованием sc-qPCR и микро-массивов одиночных клеток показали, что во время ранних стадий клетки ICM чрезвычайно гетерогенны и совместно экспрессируют разные маркеры эпибласта и примитивной энтодермы, которые в конечном счете приобретают взаимно исключающиеся паттерны6,80,81.
Функции транскрипционных факторов Nanog и Gata6 и передачи сигналов fibroblast growth factor (FGF), по-видимому, являются ключевыми в сегрегации ICM6,76,78-84 (Fig. 2c). Анализ изображений одиночных клеток показал, что Nanog и Gata6 начинают экспрессироваться по-разному на ст. перехода от 8 клеток к 16, при этом некоторые клетки экспрессируют оба маркера. Чуть позднее эти факторы экспрессируются взаимно исключающим способом, это маркирует инициацию клонального расхождения76,82. Чтобы индуцировать образование эпибласта, активность Nanog нуждается в подвлении экспрессии Gata682. Однако, экспрессии только Gata6 в Nanog-негативных клетках недостаточно, чтобы обеспечить качественными особенностями примитивной энтодермы и передача сигналов FGF также необходима 82. На ст. 16-to-32-клеток (E3.25), Fgf4 начинает экспрессироваться и секретироваться суб-популяцией клеток, которая уже экспрессирует Nanog и это является ключом для паракринной индукции транскрипционных факторов примитивной энтодермы Gata4 и Sox17 в клетках, экспрессирующих Gata6, тем самым детерминируются в клетках качественные особенности примитивной энтодермы82. Очевидно, что немногие примитивные склонные к энтодерме клетки редко, но превращаются в клетки эпибласта с помощью реактивации экспрессии Nanog во время инициальной фазы клональной сегрегации, показывая, что изменение судьбы всё ещё возможно. Тем не менее, как только устанавливаются судьбы эпибласта и примитивной энтодермы после запуска передачи сигналов FGF, изменения судеб не происходят81. Редкие переключения судеб клеток описаны in vitro в ESCs.
Анализ транскриптомов одиночных клеток показал строго отрицательную корреляцию между экспрессией Fgf4 и Fgfr2, подтверждая прямое взаимодействие между fibroblast growth factor 4 (Fgf4) и fibroblast growth factor receptor 2 (Fgfr2), экспрессирующимися в разных клетках, может быть важным для выбора судьбы ICM клеток6,78,80,82. Однако, в то время как мутации в Fgf4 полностью прерывают формирование примитивной энтодермы, мутации в Fgfr2 недостаточны, чтобы устранить образование этого клона83,84. Во время этих ранних стадий развития Fgfr1 также широко экспрессируется в ICM, подтверждая, что он играет роль в выделении ICM 80. Эта гипотеза, происходящая из исследований транскриптомов одиночных клеток, была недавно подтверждена в двух исследованиях одиночных клеток, подтвердивших, что Fgfr1 необходим для спецификации ICM83,84. Т.о., репрессия Gata6 с помощью Nanog инициирует клональную сегрегацию ICM и это затем поддерживается активностью Fgf4, которая завершает спецификацию эпибласта и примитивной энтодермы путем непосредственных взаимодействий с рецепторами Fgfr1 и Fgfr2 (Fig. 2c).

Post-implantation epiblast cells: committing to mesendodermal fates


Как только разделяются эпибласт и примитивная энтодерма, то эмбрион имплантируется в матку и подвергается серии морфологических изменений (see REFS85,86 rev.), начинается гаструляция (Box 1). Во время этого процесса формируются три зародышевых листка - эктодерма, мезодерма и энтодерма. В то время как из клеток эпибласта возникают мезодерма и энтодерма, проходящие через первичную полоску остальные клетки эпибласта становятся эктодермой87. Серии трансплантаций, осуществленные в 1990s показали, что клетки эпибласта, по-видимому, не детерминированы к специфическим клонам во время этой стадии; скорее всего, они, по-видимому, остаются плюрипотентными и принимают определенную судьбу в зависимости от того, где и когда они проходят через первичную полоску88. Однако, исследования по картированию судеб показали, что клетки, располагающиеся в определенных регионах эпибласта, обнаруживают предпочтение к вкладу в специфическую ткань87. Это д. указывать на то, что клетки обладают склонностью уже в эпибласте, но как морфогенетические перемещения оказываются столь организованными на этой стадии, в зависимости от стартовой позиции скорее, чем от специфических различий транскриптомов, и это д. стать детерминирующим фактором вклада эпибласта в позднее образующиеся ткани.
Пост-имплантационные клетки эпибласта недавно были профилированы с использованием транскриптомов одиночных клеток, чтобы определить, действительно ли они обладают какой-либо склонностью в направлении определенного клона29,89. Эти исследования показали, что пост-имплантационные клетки эпибласта являются молекулярно гетерогенными, но они, по-видимому, не экспрессируют маркеры, указывающие на раннюю сегрегацию в зрелые клоны. Интересно, что оба исследования обнаружили некоторые клетки, которые совместно экспрессировали мезодермальные и энтодермальные маркеры, такие как T ген (кодирующий белок Brachyury) и hepatocyte nuclear factor 3β (известен также как Foxa2), показатель качественных особенностей мезодермальных предшественников90,91. Эта субпопуляция, по-видимому, появляется рано на ст. E5.5 (ref.89), когда первичная полоска ещё морфологически не видна, это указывает на то, что она может быть одной из самых ранних клеточных популяций, детерминируемых в отношении мезэнтодермальной судьбы. Более того, это также подтверждает, что молекулярные изменения предшествуют морфологическим изменениям во время гаструляции, однако, для подтверждения этого необходима пространственная информация (Fig. 2d).
С момента возникновения E6.5 пост-имплантационной популяции эпибластных клеток происходит переход от плюрипотентного эпибласта к мезодерме и дефинитивной энтодерме, в это время были исследованы клетки в отношении генов, чтя экспрессия позитивно или негативно скоррелирована с уровнями экспрессии T29. Хотя некоторые из динамически экспрессирущихся генов уже были описаны в литературе, такие как транскрипционный фактор Mixl1, эти анализы также установили некоторые потенциально новые факторы, подобные solute carrier family 35 member D3, который играет важную роль в генерации мезодермы из клеток эпибласта. Их дальнейшая характеризация д. предоставить информацию о регуляции детерминации эпибласта в направлении мезэнтодермы.

Gastrulation


Во время гаструляции клетки проходят через первичную полоску, как время, так и передне-заднее расположение вдоль примитивной полоски, как было установлено, влияют на их клональную судьбу85,88. Молекулярные механизмы, устанавливающие эти различающиеся ранги предшественников вдоль первичной полоски, и транскрипционные факторы, регулирующие дифференцировку мезэнтодермальных клеток в направлении зрелых типов клеток, всё ещё неясны, но анализ транскрипции одиночных клеток внес свой вклад в их характеристику.

Heterogeneity within the mesodermal population


Чтобы исследовать созревание специфических клонов из мезодермы, критическим становится понимание молекулярных свойств определенных мезодермальных предшественников, так чтобы их можно было идентифицировать. Тем не менее определение уникальной комбинации маркеров, определяющих специфические популяции предшественников, затруднительно и большинство на сегодня используемых маркеров экспрессируются в нескольких клонах. Функциональный анализ популяций предшественников, определяемых с помощью неоднозначных маркеров, вносит вклад в аттрибуцию мультипотентности мезодермальных клеток, но оценка одиночных клеток показывает, что это может быть не всегда так. Напр., мезодермальные клетки, экспрессирующие kinase vascular endothelial growth factor receptor 2 (VEGFR2; известен также как Flk1), могут давать кровяные, эндотелиальные и гладкомышечные клетки92-94; однако, эти клетки чрезвычайно гетерогенны на молекулярном уровне29 (Fig. 3a). Др. случаем является транскрипционный фактор ETS translocation variant 2 (Etv2), который необходим для развития эндотелиальных, эндокардиальных и кровяных клеток95,96. Используя scRNA-seq, Etv2-экспрессирующие клетки, как было установлено, широко подразделяются по транскрипции на мезодермальную, кровяную, эндокардиальную и эндотелиальную субпопуляции, подтверждая, что помимо незрелых мультипотентных мезодермальных предшественников, существуют также и унипотентные предшественники97.

Fig. 3: Mesoderm differentiation during gastrulation.

a | Heterogeneity within the mesoderm. Flk1+ progenitors are molecularly heterogeneous (represented by the different colours). If studied as a whole, these will give rise to blood, endothelium and smooth muscle. However, this progenitor population could be composed of populations of unipotent progenitor cells. b | First and second wave of blood differentiation. The box (left) highlights the region in the yolk sac of mouse embryos at E7.5 where the blood islands can be found. During the first wave of haematopoiesis (zoomed box; left), primitive erythrocytes are apparent in the blood islands at E7.5. During the second wave (zoomed box; right), at around E8.25, the haemogenic endothelium generates erythroid and myeloid progenitors (EMPs), which differentiate into definitive blood cells.


Доверие к маркерам также может вводить в заблуждение. Напр., во время развития сердца , кардиальные клетки из двух разных структур: первого и второго поля сердца. Обе популяции клеток, по-видимому, возникают из мезодермальных предшественников, экспрессирующих mesoderm posterior protein 1 (Mesp1), но существует ли общий предшественник или разные кардиальные предшественники на оба поля сердца, не возможно установить популяционными методами98. При отслеживании становления клонов из отдельных клонов, каждый мезодермальный клон вносил вклад или в первое поле сердца или во второе поле сердца, демонстрируя, что сущекствуют две самостоятельные Mesp1-экспрессирующие популяции мезодермальных предшественников99,100. Более того, sc-qPCR выявило, что эти популяции обладают разными молекулярными характеристиками100, подтверждая, что определение транскрипции в популяциях предшественников на уровне отдельных клеток вносит вклад в разрешение их потенциала гетерогенной дифференцировки.

From mesodermal progenitors to differentiated cell types


После гаструляции клетки, как полагают, получают сигналы, способствующие изменениям в экспрессии генов, чтобы управлять спецификацией в направлении определенного клона. Чтобы помочь открыть потенциальные регуляторы этих процессов, были предложены недавно компьютерные методы для получения данных от экспрессии генов в индивидуальных клетках, чтобы понять происхождение клеток крови10,19,29. Во время эмбрионального развития мезодермальные предшественники дают кровь в результате множественных волн, первые две возникают в желточном мешке (Fig. 3b). Чтобы исследовать первую волну дифференцировки крови из мезодермы, определяли профили экспрессии Flk1 или CD41 в одиночных клетках с использованием scRNA-seq и после использования pseudotime inferences, предполагались траектории дифференцировки29. Реконструированные территории выявляли некоторые определяемые с помощью ChIP-seq гены мишени, активируемые регулятором дифференцировки крови Gata1, такие как nuclear factor, erythroid derived 2 (Nfe2), т.к. он активировался после начала экспрессии Gata1, тем самым подтверждая правильность траектории29.
Для выявления новых факторов, участвующих в возникновении определенных клеток крови в желточном мешке, был применен Boolean алгоритм к sc-qPCR данным к клеткам в пределах от недетерминированной мезодермы до появления определенных клеток крови в желточном мешке, это привело к модели, лежащей в основе сети регуляторных генов10. Созданная модель предсказывала ранее не обнаруживаемую регуляцию Erg с помощью Hox и Sox транскрипционных факторов, которые затем были оценены экспериментально. Более того, это предоставило платформу для осуществления in silico пертурбаций, которые предсказывали потребность в подавлении Sox7 для появления крови во время развития желточного мешка. Эта новая находка также была функционально оценена с использованием эмбрионов трансгенных мышей с усилением экспрессии Sox7, показавшее заметный дефект в созревании крови. Дальнейшая характеристика возникновения дефинитивной крови с использованием транскриптомов одиночных клеток была недавно проведена для выявления пути leukotriene, т.к. ранее он не был установлен как регулятор дефинитивного гематопоэза в желточном мешке19. Вместе эти исследования продемонстрировали, как измерения транскрипции в одиночных клетках не только предоставляют срез молекулярных профилей, лежащих в основе процессов возникновения крови, но и также они оказались способны предсказать молекулярные механизмы и сети регуляторных генов, контролирующие эти онтогенетические процессы.

Pluripotency in vitro: stem cells


пре-имплантационные исследования in vivo и предоставили информацию о том, как клетки сегрегируют на эпибласт и примитивную энтодерму, преходящая природа плюрипотентных ICM клеток ограничивала их использование для исследований молекулярных процессов после поддержания вхождения и выхода из плюрипотентности. Понимание этого процесса нуждается в клеточных системах, с которыми легко манипулировать, которые способны к самообновлению и дифференцировке и которые также обладают гибкостью, чтобы следовать за динамикой генной экспрессии во всех переходах между состояниями.

Defining subpopulations within mouse embryonic stem cells


mESCs являются одним из наиболее популярных инструментов, используемых для понимания плюрипотентности. mESCs были получены из ICM в 1981 и были первым растущим в культуре питающим (feeder) слоем клеток101. Успехи в понимании их нужд привели к двум наиболее популярным стратегиям культивирования в отсутствии питающего слоя, а именно, к культивированию в плодной телячьей сыворотке и с добавлением leukaemia inhibitory factor (serum-LIF) или с 2i, который оказался средой, лишенной сыворотки, с добавлением glycogen synthase kinase 3β (GSK3β) и MEK ингибиторов (see ref.102 for a review). Профилирование метилирования ДНК, также как и исследования транскриптомов одиночных клеток показали, что mESCs могут быть разделены, по крайней мере, на две крупные субпопуляции: naive плюрипотентные клетки, экспрессирующие факторы плюрипотентности, и epiblast-primed клетки, экспрессирующие высокие уровни keratins и actins24,39,103. Тогда как mESCs, культивируемые в serum-LIF, чрезвычайно гетерогенны, 2i состояния стремятся к ограничению их наивного состояния39,103,104.
Nanog является фактором плюрипотентности, который широко используется, чтобы охарактеризовать состояние плюрипотентности в культуре, при этом высокая экспрессия Nanog характерна для наивного состояния. Переходы между Nanog-high и Nanog-low популяциями были описаны они являются редкими, это затрудняет исследования механизмов вступления и выхода из плюрипотентности39,105-107. Как видно in vivo уровни экспрессии Nanog также, по-видимому, гетерогенны и динамичны внутри клеточных популяций, растущих в течение времени в среде serum-LIF, это подтверждает, что клеточное состояние изменяется от наивного до primed состояния или vice versa происходит , когда достигается самый низкий или самый высокий уровень экспрессии Nanog, соотв. Важно, что эта гетерогенность не выглядит совершенно случайной, и существует механизм поддержания клеточных состояний клеток или переключения (Fig. 4a). Экспрессия Nanog, по-видимому, коррелирует с клеточным циклом39,105,106: после клеточного деления, когда клетки проходят клеточный цикл, уровни Nanog постепенно возрастают до следующего клеточного деления, когда они внезапно снижаются. Транскрипционные шумы, приводящие к более высокой скорости транскрипции и увеличивающие клеточный цикл являются двумя не исключающими др. др. гипотезами повышения экспрессии Nanog до уровней, которые будут поддерживать плюрипотентность или способствовать переключению клеточных состояний, т.к. оба будут вызывать постепенное накопление Nanog в клетках во время последующих клеточных циклов39 (Fig. 4a). Согласно этим гипотезам, mESCs растут в 2i условиях и состоят в основном из клеток в наивном состоянии, обнаруживая высокую транскрипцию и боле продолжительный клеточный цикл24,39, который будет способствовать состоянию Nanog-high плюрипотентности39,106.

Fig. 4: Pluripotent stem cells to understand cell states.

a | Hypothetical mechanisms regulating Nanog levels that could cause cell fate switch. Expression levels after cell division refer to the daughter cells. Top left: No cell fate switch. Here, Nanog levels constantly increase during the cell cycle until reaching level 2 in the yaxis. After cell division, the levels return to the initial level 1. Top right: fate switch by increasing the transcription rate. A higher transcription rate will result in higher maximal Nanog levels compared with no fate switch cells (level 4 instead of 2). This results in daughter cells with higher Nanog levels, and the effect is amplified through consecutive cell divisions, leading to cell fate switch towards the naive state when Nanog levels are high enough. Bottom: fate switch by extending the cell cycle. An extension of the cell cycle allows Nanog levels to increase, which again results in a gradual increase in Nanog levels in daughter cells during consecutive cell divisions. b | Reprogramming of somatic cells to induced pluripotent stem cells (iPSCs). The diagram highlights the knowledge of reprogramming acquired using single-cell technologies. Upon induction of reprogramming with the OSKM factors (Oct4, Sry-box 2 (Sox2), Kr?ppel-like factor 4 (Klf4) and Myc), a stochastic molecular heterogeneity arises in the cell population. Some of the cells undergo fast proliferation, and these will progress to the next step of the reprogramming process. The next step consists of chromatin remodelling followed by repression of differentiated cell fates with non-coding RNAs (ncRNA). The second phase of reprogramming begins with the activation of endogenous Sox2 expression, which triggers the activation of a hierarchical programme of gene expression that finalizes the conversion of the somatic cell into an iPSC.


Недавно получение изображений одиночных клеток также позволило открыть редкую популяцию клеток внутри культивируемых mESCs, представленную некоторыми молекулярными признаками, напоминающими эмбриональную двух-клеточную стадию (2 C)108. Эта 2 C-подобная популяция экспрессирует Gag и mouse endogenous retrovirus-L (MERVL), которые являются двумя ретровирусными генами, временно экспрессирующимися in vivo во время двух-клеточной стадии108, а также zinc-finger and SCAN domain containing protein 4 C (Zscan4), который важен для стабильности генома109. Первоначально профилировали транскриптомы одиночных клеток, собранных в кластер из 2 C-like клеток на ст. бластоциста во время двух-клеточной стадии24. Однако, недавняя переоценка транскриптомов одиночных клеток продемонстрировала, что гены активируются во время MZT, который происходит приблизительно на 2-to-4-клеточной стадии68,110. В соответствии с присутствием разных типов клеток и в противовес ESCs или клетками эпиласта, 2 C-подобные клетки представляют открыты2й профиль хроматина, а их ДНК гипометилирована, и напоминает тем самым in vivo двух-клеточную стадию110. Дальнейшим подтверждением их идентичности клеткам двух-клеточной стадии, стало то, что 2 C-подобные клетки, по-видимому, тотипотентны, т.к. они способны колонизовать как эмбриональные, так и вне- эмбриональные ткани после инъекций в мышиные бластоцисты108.

Induced pluripotent stem cells: reprogramming towards the pluripotent state


Открытие индуцированной плюрипотентности показало, что у mESC свойства плюрипотентности и самообновления может быть передано зрелым соматическим клеткам в ответ на избыточную экспрессию четырех транскрипционных факторов - Oct4, Sox2, Kruppel-like factor 4 (Klf4) и Myc (OSKM) - это перевернуло наше понимание регуляции плюрипотентности111,112. Индуцированные плюрипотентные, стволовые клетки(iPSCs) не только представляют многообещающую технологию для регенеративной медицины, но и также составляют грозный инструмент для обнаружения, как устанавливаются плюрипотентность и дифференцированные клоны. После этих плодотворных сообщений использование ретровирусом обеспечиваемой избыточной экспрессии OSKM факторов для генерации iPSC111, значительные усилия были предприняты в отношении улучшения первоначально неэффективной величины репрограммирования клеток. Напр., FACS и масс-спектрометрия были использованы, чтобы охарактеризовать и очистить популяции, определяемые маркерами клеточной поверхности, от промежуточных стадий репрограммирования113,114, но и сегодня пропорция продуцируемых iPSCs всё ещё низка.
qPCR одиночных клеток человека и мышей показал, что во время ранних стадий репрограммирования обнаруживается увеличение гетерогенности транскрипции в культуре, что сопровождалось постепенным снижением её со временем115,116. Эта инициальная изменчивость может быть приписана различиями в экспрессии уровней разных OSKM факторов, т.к. индивидуальные клетки, по-видимому, избыточно экспрессируют 4 ретровирусные конструкции с разной стоихометрией во время ранних стадий репрограммирования117. Если оценивать распределение генной экспрессии, то динамически экспрессируемые гены обнаруживают тенденцию стартовать в виде бимодального профиля на уровне популяции и позднее переключаются на одномодальное распределение116,118,119. Сходный сценарий также наблюдается во время ранних стадий дифференцировки mESC17, это может указывать на то, что вследствие внешних сигналов клетки начинают модифицировать профиль своей экспрессии с разными скоростями. Такая инициальная гетерогенность формально была описана, как стохастический процесс, управляемый с помощью упорядоченного набора вероятностных событий, которые регулируют экспрессию каждого гена независимо115,116. Подтверждает эту модель то, что получение изображений вживую одиночных клеток и исследования масс-цитометрии также показали, что в ответ на экспрессию OSKM, клетки начинают делиться с разными скоростями: клетки, пролиферирующие быстро, и уменьшающие свою клеточную область, скорее всего, станут iPSCs120, тогда как те, что имеют низкий профиль пролиферации стремятся возвратиться к исходному дифференцированному состоянию117 (Fig. 4b). Это указывает на то, что скорость пролиферации является ограничивающей ступенью во время ранних стадий репрограммирования и поэтому контролируя его точнее можно обеспечить более высокую скорость продукции iPSC.
Изучив очень ранние стадии репрограммирования в деталях, транскриптомный анализ одиночных клеток показал, что изменения в экспрессии ремодельеров хроматина являются одним из ключевых молекулярных процессов, которые отличают клетки, которые будут подвергнуты успешному репрограммированию, от тех, кто к этому неспособен16 (Fig. 4b). Это согласуется с предыдущими популяционными исследованиями, в которых подчеркивалась важность ремоделирования хроматина во время первых стадий репрограммирования (rev. ref.121). Как только клетки оказываются частично репрограммированы во время промежуточных стадий процесса, то некодирующие РНК, по-видимому, регулируют некоторые из процессов репрограммирования, а именно, путем индукции метаболических изменений, а также с помощью супрессирующих клон-специфических генов, супрессируя тем самым дифференцированные фенотипы клеток111 (Fig. 4b). На этой стадии гены плюрипотентности, такие как Oct4, также начинают экспрессироваться, однако, их экспрессия, по-видимому, не является предсказывающей успешное репрограммирование вплоть до позднего периода113,115, указывая тем самым, что относительно ранняя экспрессия этих факторов недостаточна для репрограммирования в iPSC. Как только клетки вступают в поздние стадии репрограммирования, то факторы плюрипотентности приобретают важность. Напр., sc-qPCR подтвердило, что Sox2 управляет иерархической последовательностью экспрессии генов115, что в конце концов приводит к тому, что клетки достигают состояния iPSC (Fig. 4b). Эта последовательность событий была изучена не только на уровне транскрипции; получение изображений отдельных клеток также показало, что происходит множество локальных изменений транскрипции, таких как реактивация Х хромосомы, которые также осуществляются ступенчато-образно 122.

Future perspectives and conclusion


One of the greatest challenges of single-cell transcriptomics is the absence of spatial and temporal resolution, which is critically relevant in the context of developmental biology. Computational inferences, such as pseudotime ordering, have contributed to our understanding of defined differentiation trajectories by highlighting potential novel relevant factors and have enabled the analysis of an extensive number of genes compared with current live imaging technologies. However, they are not sufficient to unravel the intricate mechanisms underlying early mammalian development. This is especially relevant once the epiblast and the primitive endoderm are established, as the embryo rapidly acquires a high level of complexity that is orchestrated by dynamic morphogenetic movements, cell proliferation and changes in gene expression, which are difficult to comprehensively capture.
In the past few years, there has been considerable progress in determining spatial positions from single-cell transcriptional data. The establishment of imaging strategies to obtain thousands of single-molecule measurements in single cells has provided us with both real spatial coordinates and quantitative data. Moreover, computational biology has developed algorithms to infer cell positions by reconstructing spatial reference maps from images obtained with fluorescence microscopy123,124. New sample-collection techniques, such as tomo-seq or laser capture microdissection, have also enabled the transcriptomic analysis of particular cells extracted from specific spatial positions125,126. Of note, the latter technique has been recently applied to mouse embryonic development and led to the production of a high-resolution map of E7.0 mouse epiblast cells, which has improved our understanding of the different expression patterns occurring at this developmental stage127. Although these techniques are generating promising outcomes, they are laborious and thus require further optimization.
Another area where single-cell technologies are advancing is the development of combined methods to obtain as much information as possible from a single cell. This has currently been implemented at the level of chromatin accessibility, DNA methylation status and the transcriptomic profile128,129, and is expected to give us a mechanistic view of the regulatory systems that govern developmental processes, such as cell differentiation or cell-state transitions. Due to the relatively recent establishment of these techniques, we expect that computational strategies to simultaneously analyse the data will improve in the near future. Moreover, by eliminating the need for reverse transcription and nonspecific amplification, direct sequencing of RNA, which is currently under development for the new generation of nanopore sequencers, also has substantial potential to enhance future scRNA-seq protocols130.
One of the main goals of single-cell transcriptomics remains the reconstruction of lineage trajectories using snapshots of continuous developmental processes. Incorporation of lineage tracing strategies into scRNA-seq protocols would therefore provide invaluable evidence to support the lineage hierarchies postulated from scRNA-seq data analyses. Recent studies have attempted to address this challenge by using the CRISPR-Cas9 genome-editing system to introduce into eukaryotic cells a barcode coupled to a 'scratchpad' sequence harbouring multiple copies of the target sequence of a specific guide RNA40,131. Through successive cell divisions, the Cas9 nuclease will introduce stochastic mutations into the scratchpad sequence, thereby 'recording' the lineage history of the cell and enabling the reconstitution of lineage hierarchies in a given tissue. This powerful technology has been applied in vivo in zebrafish131 and in vitro in mESC cultures40. Coupling this tool to scRNA-seq will take the application of single-cell transcriptomics in developmental biology to a whole new level.
Single-cell technologies have already given us many new insights into early mammalian development. Molecular heterogeneity in early embryos as well as in mESCs underscores their highly dynamic nature, but we still do not fully understand the basis for this heterogeneity. We envisage that, in addition to optimization of current methods and the establishment of new techniques, as protocols mature and become more user-friendly, their adoption by the wider developmental biology research community will accelerate and increase their impact
Box 1 Mouse embryonic development

Fertilization gives rise to a totipotent cell, the zygote, which will generate all the embryonic and supportive extra-embryonic tissues necessary for development. These processes start with the segregation of the embryonic and extra-embryonic lineages before the embryo implants into the uterus wall. Once the embryo is implanted, the embryonic part will further diversify into the different cell types and organs that will form the adult organism.

Pre-implantation


Following fertilization, the zygote undergoes a series of symmetrical divisions until the 8-cell stage. The embryo then becomes compacted, and this aggregation of cells is termed the morula (see the figure, part a). During the 8-to-16 and the 16-to-32-cell stage transitions, some cells will divide symmetrically and will become specified into the outer cell layer, called the trophectoderm (TE), which will contribute to the placenta; other cells will undergo asymmetric divisions, where one of the daughters will become the trophectoderm and the other will become part of the inner cell mass (ICM), which will give rise to the embryo proper. Following this first lineage specification, the ICM undergoes a second fate choice and becomes segregated into the epiblast (EPI) and the primitive endoderm (PE) at the 32-to-64-cell stage, the latter giving rise to the yolk sac. At the same time, the embryo also undergoes a process of cavitation, and the blastocoel will form. Finally, at the blastocyst stage, spatial cell rearrangement gives rise to epiblast cells surrounded by outer primitive endoderm.

Post-implantation


Following implantation, which occurs at embryonic day 4.5 (E4.5), the embryo undergoes extensive proliferation coupled with morphogenetic cell movements. First, at E5.5, it adopts a cup-like shape (dashed rectangle; see the figure, part b), which is characteristic of mouse embryonic development. At this stage, the distal visceral endoderm becomes specified. The distal visceral endoderm is thought to be a signalling centre from which antagonists of the signalling factor Nodal, such as Cerberus (Cer) and left-right determination factor 1 (Lefty1), are expressed and repress Nodal in the adjacent epiblast. Subsequently, through an ill-defined mechanism, the anterior visceral endoderm is specified at the anterior side of the embryo, which also secretes Nodal antagonists that seem to contribute to the formation of the primitive streak at the posterior side. During gastrulation, epiblast cells at the primitive streak undergo an epithelial-to-mesenchymal transition and become mesoderm, which then migrates out and colonizes the different regions of the embryo, including the extra-embryonic yolk sac, and forms the allantois. The primitive streak extends distally as gastrulation progresses, and the cells that ingress later and more anteriorly are thought to become endoderm and colonize other tissues, such as the gut. In parallel, anterior epiblast cells adopt an ectodermal fate and will eventually form a portion of tissues such as the brain or the skin. During this developmental progression, the embryo also undergoes other morphological changes; particularly, the amnion and the chorion, two membranes that delimit the two embryonic cavities (the amniotic and the exocoelomic cavities, respectively) are formed.

Box 2 Advantages and limitations of single-cell transcriptional methods

Over the past few years, several single-cell methods have been developed to transcriptionally profile individual cells. Each method has advantages and limitations, and the choice of technique will depend on the biological question one wishes to address. Single-cell quantitative PCR. Measures the expression levels of a defined set of genes in single cells.
Advantages

  • More sensitive than single-cell RNA sequencing (scRNA-seq), as it captures lowly expressed genes more reliably Limitations
  • Targeted analysis
  • Enables the analysis of a limited number of genes per experiment


  • Well-based scRNA-seq methods (for example, Smart-seq2 and CEL-seq2). A collection of single-cell transcriptomics techniques where individual cells are sorted into single wells and processed separately (see the figure).
    Advantages
  • Genome-wide approach
  • Low transcript 3?-end bias compared with droplet-based methods (see below) Limitations
  • Requires isolating single cells
  • Time-consuming, as each processed plate contains only 96 cells


  • Droplet-based scRNA-seq methods (for example, Drop-seq, inDrop). This group of recently developed methods utilizes microfluidics to transcriptionally profile multiple cells genome-wide in a high-throughput manner. As the figure shows, single cells are combined with barcoded gel beads in oil emulsions (GEMs) (droplets) that are subsequently collected into one tube and processed together.
    Advantages

  • Genome-wide approach
  • High-throughput Limitations
  • High 3'-end bias
  • Lower efficiency of capturing unique transcripts
  • Higher risk of analysing cell doublets