Посещений:
ПРОФИЛИРОВАНИЕ ТРАНСКРИПЦИИ
Одиночные клетки
Single-cell profiling for advancing birth defects research and prevention Thomas B. Knudsen,Malte Spielmann,Sean G. Megason,Elaine M. Faustman Birth Def. Res. https://doi.org/10.1002/bdr2.1870
|
Cellular analysis of developmental processes and toxicities has traditionally entailed bulk methods (e.g., transcriptomics) that lack single cell resolution or tissue localization methods (e.g., immunostaining) that allow only a few genes to be monitored in each experiment. Recent technological advances have enabled interrogation of genomic function at the single-cell level, providing new opportunities to unravel developmental pathways and processes with unprecedented resolution. Here, we review emerging technologies of single-cell RNA-sequencing (scRNA-seq) to globally characterize the gene expression sets of different cell types and how different cell types emerge from earlier cell states in development. Cell atlases of experimental embryology and human embryogenesis at single-cell resolution will provide an encyclopedia of genes that define key stages from gastrulation to organogenesis. This technology, combined with computational models to discover key organizational principles, was recognized by Science magazine as the "Breakthrough of the year" for 2018 due to transformative potential on the way we study how human cells mature over a lifetime, how tissues regenerate, and how cells change in diseases (e.g., patient-derived organoids to screen disease-specific targets and design precision therapy). Profiling transcriptomes at the single-cell level can fulfill the need for greater detail in the molecular progression of all cell lineages, from pluripotency to adulthood and how cell-cell signaling pathways control progression at every step. Translational opportunities emerge for elucidating pathogenesis of genetic birth defects with cellular precision and improvements for predictive toxicology of chemical teratogenesis.
|
Основной целью биологии развития является понимание детального молекулярного прогресса всех эмбриональных клеточных линий, от плюрипотентности до взрослой жизни, и того, как клеточные сигнальные пути контролируют выбор линии на каждом этапе дифференцировки. Технологии профилирования регуляции эмбрионального транскриптома с разрешением в одну клетку стали ключевым направлением исследований для этой цели и, следовательно, заложили основу для механистического понимания дефектов развития. Симпозиум "Одноклеточная революция: Эмбриогенез с высоким разрешением", представленный на 60-й ежегодной встрече Общества по изучению и профилактике врожденных пороков развития, рассказал о некоторых основных концепциях профилирования одноклеточных структур, о том, как эта новая технология формирует наше понимание развития эмбриона, а также о возможностях и проблемах для выяснения тератологических механизмов с точностью до одной клетки (https://www.birthdefectsresearch.org/meetings/2020/).
Секвенирование следующего поколения (например, RNA-seq), ставшее возможным благодаря достижениям в области геномики, вывело молекулярное профилирование на передний план в понимании того, как эмбрион реагирует на физиологические очередности (queues), возникающие в процессе развития, и токсические воздействия. Анализ объемных тканей усредняет эти эффекты в пределах клеточной популяции и тем самым маскирует клеточное разрешение, необходимое для точного определения реакции. Методы пространственной локализации, такие как гибридизация in situ и иммуногистохимия, могут локализовать эти реакции, но только для нескольких генов или белков за раз. Одноклеточная транскриптомика (scRNA-seq) позволяет получить полное представление о динамике экспрессии генов, которая программирует или отражает состояние отдельных клеток в ответ на генетические сигналы, физиологические очереди в микросреде и/или клеточную адаптацию к токсикологическому стрессу. Это позволяет проводить комплексный анализ фундаментальной единицы тканевой организации - клетки, каждая из которых имеет свою уникальную родословную, динамику состояния и микрофизиологию. Сочетание scRNA-seq с другими одноклеточными модальностями (например, in toto imaging, CRISPR/Cas9) и реконструктивной вычислительной биологией представляет собой новый мощный подход к пониманию молекулярной картографии систем формирования паттерна в ходе эмбриогенеза и патогенеза (Cao et al., 2019; Chan et al., 2019; Keller, Schmidt, Wittbrodt, & Stelzer, 2008; McDole et al., 2018; McKenna & Gagnon, 2019; Megason, 2009; Pijuan-Sala et al., 2019; Sladitschek et al., 2020).
2 SINGLE-CELL TRANSCRIPTOMICS WORKFLOW
Впервые представленная в 2009 году, scRNA-seq сегодня насчитывает более 385 подходов (по состоянию на март 2019 года) для предсказания судьбы клеток при дифференцировке (Leuken & Theis, 2019; Ziegenhaein et al., 2017). Типичный рабочий процесс показан на рисунке (Figure 1).
Figure 1 Single-cell RNA-seq reconstruction of gene expression dynamics during embryogenesis. Time-variant experimental tissue samples are prepared by various dissociation methods with microfluidics to isolate and capture individual cells for individual cDNA barcoding. After multiplex RNA-seq analysis, gene ? cell matrices are normalized and processed to identify differentially expressed genes (DEGs). Those highly variable genes (HVGs) are then selected for deconvolution by analytical methods such as t-SNE (t-distributed neighbor embedding) that cluster cells by their individual HVG profile and subsequently reconstruct cell lineage and cell state relationships in pseudotime
2.1 Sample preparation
Для высвобождения и захвата тысяч клеток необходима определенная форма диссоциации клеток. Ключевым вопросом является знание того, насколько хорошо различные типы клеток и их транскриптомы переносят протоколы подготовки, необходимые для получения изолированных клеток из интактной ткани. Различные методы захвата включают микролуночные планшеты (microwell-seq) (Han et al., 2018), высокопроизводительную инкапсуляцию капель (Drop-Seq, inDrops) (Klein et al., 2015) или одноклеточную комбинаторную индексацию (sci-seq) (Cao et al., 2017). Микрокапельные методы используют микрофлюидику для регистрации образца на тысячи крошечных капель, содержащих отдельные клетки. На практике это, как правило, распределение Пуассона - многие капли содержат 0, некоторые - 1, а некоторые - 2 клетки. Отдельные клетки лизируются, и мРНК подвергается обратной транскрипции при мультиплексном секвенировании.
2.2 Sequencing
Библиотеки комплементарной ДНК (кДНК) штрих-кодируются различными метками, которые позволяют отнести их к исходной клетке. Это позволяет объединить транскриптомы отдельных клеток после обратной транскрипции для мультиплексного секвенирования. Штрих-коды идентифицируют отдельные мРНК, транскрибированные с одной и той же геномной последовательности. Штрих-кодирование может также включать маркировку уникальными молекулярными идентификаторами, которые служат для различения чтений секвенирования с одного и того же транскрипта мРНК от отдельных мРНК, транскрибированных с одного и того же гена. Протоколы настраиваются для оптимизации желаемых компромиссов в производительности, длине чтения, глубине секвенирования и покрытии клеток (Leuken & Theis, 2019).
2.3 Data processing
Матрица количества прочтений генов и клеток строится путем выравнивания прочтений по эталонному геному или транскриптому. Для контроля качества анализируется несколько показателей, включая количество отсчетов на штрихкод (глубина отсчета), количество генов на штрихкод (пороговые значения) и доля отсчетов от митохондриальных генов на штрихкод (признак разрушенной плазматической мембраны). Различные подходы могут быть использованы для фильтрации технических артефактов (например, умирающих клеток, дублетов), эффекта партии, ошибок ПЦР и избыточного секвенирования, которые могут создавать искусственные кластеры клеток. Это важная область для современного развития биоинформатики, особенно для исследований, где стоимость, связанная с глубиной секвенирования, может быть снижена за счет фокусировки на конкретных мишенях (https://www.biorxiv.org/content/10.1101/551762v2). Уровни экспрессии различных генов обычно нормализуются, чтобы высоко экспрессируемые гены не подавляли сигнал низко экспрессированных генов. Матрица нормализованных генов на количество клеток является отправной точкой для снижения размерности (Leuken & Theis, 2019). Дифференциально экспрессированные гены (DEGs) далее идентифицируются, чтобы сосредоточиться на высоко вариабельных генах (HVGs) (Klein et al., 2015). Таким образом, биологическое многообразие, на котором расположены траектории клеточной экспрессии, может быть в достаточной степени описано в HVGs. Важный компромисс заключается в том, чтобы отличить HVG от артефактов секвенирования.
2.4 Deconvolution
Двумя распространенными методами визуализации для кластеризации клеток являются t-distributed stochastic neighbor embedding (t-SNE) и Uniform Manifold Approximation and Projection (UMAP). Например, график t-SNE отображает клетки в отдельные кластеры на основе корреляции ближайших соседей в профилях экспрессии HVG, что концептуально похоже на то, как BLAST находит ближайшее соответствие в базе данных последовательностей. Затем кластеры могут быть аннотированы на основе того, какие маркерные гены они содержат (Kiselev, Andrews, & Hemberg, 2019). Несмотря на широкое применение, t-SNE лучше всего рассматривать как грубый инструмент визуализации. Он ограничен потерей крупномасштабной информации о межкластерных связях, медленным временем вычислений и неспособностью осмысленно представлять очень большие наборы данных. UMAP сохраняет больше структуры данных, чем t-SNE, и с меньшим временем выполнения (Becht et al., 2019). Это обеспечивает больший охват и разрешение переходных состояний между основными кластерами клеток. Клетки, не отнесенные к основному эталонному кластеру, имеют большой потенциал для понимания клеточной динамики, поскольку они могут отражать ранее не распознанные или новые состояния, которые отражают непрерывные изменения в транскриптоме, иначе не обнаруживаемые при анализе объемных тканей. Диверсификация линий и состояний может быть представлена как континуум развития с помощью динамических моделей экспрессии генов (вывод траектории), которые отображают клеточную плотность в "псевдовремени". Концепция псевдо-времени в одноклеточном коллекторе заключается в реконструкции временных отношений между состояниями клеток, профилированными в реальном времени (см. Saelens, Cannoodt, Todorov, & Saeys, 2019).
Поскольку континуальные многообразия экспрессии генов снижают размерность расстояний между клетками до виртуальных псевдо-временных траекторий состояний, возникает вопрос, как мы применим scRNA-seq для лучшего понимания процессов развития и патогенеза. Для этого необходимо рассмотреть ряд технических проблем, помимо обычных соображений контроля качества для обычного исследования микрочипов: оценка того, насколько хорошо транскриптомы отдельных клеток выдерживают протоколы диссоциации тканей для получения изолированных клеток из составной системы; сохранение происхождения отдельных клеток при параллельном глубоком секвенировании тысяч клеток; отличие высоко вариабельных генов (HVGs) от технического шума (например, артефакты ПЦР и избыточное секвенирование); и вычислительная реконструкция составной системы из отдельных клеточных кластеров для окончательного развития клона и переходных состояний.
3 ANALYSIS OF SIMPLE INVERTEBRATE MODEL ORGANISMS
Всеобъемлющие "клеточные атласы", построенные на основе данных scRNA-seq для простых модельных организмов (SMOs), демонстрируют уникальные преимущества в картировании траекторий развития в течение эмбриогенеза. Например, SMOs Caenorhabditis elegans, Planaria и Drosophila поддаются прямому анализу клеточных линий и демонстрируют фундаментальный принцип сохранения передачи клеточных сигналов (Cao et al., 2017; Karaiskos et al., 2017; Plass et al., 2018).
3.1 C. elegans
Для классического анализа траекторий развития в анатомически простом организме характерна полная история клеточных линий всех 959 ядер соматических клеток круглого червя, однако знания о молекулярном состоянии каждой клетки фрагментарны. Профили scRNA-seq 50 000 фиксированных клеток, взятых на личиночной стадии L2 (762 соматические клетки на личинку), дали 42 035 штрих-кодированных транскриптомов при глубине секвенирования ~20 000 чтений на клетку, в среднем 431 HVG на клетку. Графики t-SNE сформировали 29 отдельных клеточных кластеров от 131 до 13 205 (31,4% популяции) клеток (рис. 2a). По меньшей мере 10 типов клеток можно было аннотировать с помощью известных маркерных генов, а также было выявлено несколько новых состояний (Cao et al., 2017).
Reconstruction of spatial-temporal dynamics of gene expression defined by scRNA-seq profiling in SMO systems. (Upper left) Caenorhabditis elegans decomposed into 29 main clusters at the L2 larval stage (Cao et al., 2017); (upper right) decomposition of adult planaria (regenerative) into multiple cell states and computational reassembly of divergent lineages in a globally regenerative system (Plass et al., 2018); and (bottom) Drosophila, patterning in a digital embryo visualized during segmentation (Karaiskos et al., 2017)
3.2 Planaria
Плоский червь представляет собой интересную SMOs благодаря своей способности регенерировать части тела из популяции плюрипотентных стволовых клеток во взрослом состоянии, которые могут дифференцироваться в полный набор типов клеток и тканей. Комплексный клеточный атлас, построенный на основе данных scRNA-seq, реконструировал древовидную структуру линий, указывающую на взаимосвязи (рис. 2b). Это создает основу для дальнейших исследований, направленных на обратное клеточное перепрограммирование дерева регенеративных линий (Plass et al., 2018).
3.3 Drosophila
Являясь одной из основных животных моделей для изучения генетики развития и формировани молекулярного паттерна, характеристика динамики экспрессии генов на уровне од βночных клеток у плодовой мушки дает новое представление о генетических принципах организации, формирующих план тела (Karaiskos et al., 2017). Drop-seq охарактеризовал более 10 000 клеток при глубине чтения более 8 000 генов на клетку, а участки tSNE аннотировали 84 клеточных кластера, представляющих 87% клеток эмбриона. Поскольку многие из ключевых транскрипционных факторов и сигнально-рецепторных градиентов, определяющих идентичность клеточных кластеров, были нанесены на цифровые карты с помощью традиционной гибридизации in situ (ISH), HVG, полученные на графиках t-SNE, могут быть пространственно реконструированы с помощью "виртуального ISH" для цифровой визуализации и вычислительного прогнозирования их траекторий развития (рис. 2c).
4 EXPERIMENTAL EMBRYOLOGY
Всесторонние клеточные атласы создаются для моделирования динамики экспрессии генов, когда клетки приобретают определенные судьбы в процессе морфогенеза и дифференцировки. По сути, нам необходимо понять, как HVGs определяют в псевдовремени "грамматику развития" у более анатомически сложных видов, часто используемых для экспериментальной эмбриологии (например, Ascidian, Danio, Xenopus).
4.1 Ascidian
Оболочечные представляет собой интересный вид SMO, поскольку у них развиваются хорда и спинной полый нервный тяж, но не метамерная схема (например, как это у беспозвоночного хордового), и он имеет относительно простую клеточную линию. С помощью scRNA-seq была определена полная история экспрессии генов для каждой клетки на каждом делении вплоть до гаструляции (стадия от 2 до 64 клеток), что дало 6,65 млрд. scRNA-seq-откликов на 1042 клетки 58 эмбрионов (более 8 K генов на клетку); кроме того, физическое положение каждой клетки было визуализировано с помощью цифровой микроскопии светового листа (Sladitschek et al., 2020). Сочетание прослеживания линий и визуализации in toto позволило создать онлайн библиотеку "цифрового эмбриона", где отдельные гены могут быть выбраны и визуализированы с помощью vISH при динамическом моделировании по мере формирования осевого плана тела (http://digitalembryo.org). Пример показан на рисунке 3а для двух генов (chordin, nodal), которые определяют раннее формирование предшественника хорды. Цитируя авторов: "Способность отслеживать систематические, количественные и пространственно разрешенные изменения экспрессии генов в масштабах генома каждой клетки при каждом клеточном делении у эмбрионов откроет новую эру в биологии развития" (Sladitschek et al., 2020).
Gene expression dynamics during early development in Chordate models. (Top) Ascidian, showing dynamic vISH for two patterning genes selected and viewed dynamically from the vegetal pole (left image) and animal pole (right image). Simulated expression of chordin (top) and nodal (bottom) are represented in red shading between the 4- and 64-cell stage in pseudotime executed from the http://digitalembryo.org cell atlas (Sladitschek et al., 2020). (Bottom) Zebrafish developing between 4- and 24-hpf stage (Wagner et al., 2018). Left panel: a comprehensive map of lineage and state with cell diversification trajectories for 105 individual cells. Middle panel: canalization plot colored by trans-specification potential. Right panel: classical Turing-like representation of canalized cell trajectories for normal and chordin CRISPR/Cas9 injection; chordin crispants showed no new cell types but displayed a change in abundance of different cell types (from the work of Megason, Wagner, and Klein)
4.2 Danio
Два знаковых исследования на рыбках данио заложили основу для понимания прочности роста и формы с помощью одноклеточной визуализации и секвенирования. В одном исследовании Drop-seq использовалось для построения древовидной линии из 38 731 клеток, полученных от 694 эмбрионов на 12 стадиях, начиная с 3,3 часа после оплодотворения (hpf) (бластула, сразу после начала зиготической транскрипции, когда большинство клеток являются плюрипотентными) до 12 hpf (фарингула, стадия 6 сомитов, когда многие клетки приобретают дифференцированную судьбу) (Farrell et al., 2018). Поскольку стадия фарингулы является филотипической, например, когда сохранение клеточной сигнализации наиболее очевидно в становлении плана тела позвоночных, принципы организации, вероятно, также сохраняются. Линейное дерево повторило траектории развития 25 кластеров клеток. Большинство аннотированных типов клеток были известны из классической эмбриологии; однако исследование выявило переходные состояния в развитии, что соответствует континууму в псевдо-генном многообразии. Другое знаковое исследование рыбок данио отобразило ландшафт экспрессии генов с помощью inDrops scRNA-seq на более чем 92 000 клеток на семи стадиях для создания комплексной карты траекторий клеточных состояний и клеточных линий в развитии рыбок данио в первые 24 hpf (Wagner et al., 2018). Различные алгоритмы, созданные для вывода ландшафтов экспрессии, определили критические точки ветвления по меньшей мере для 10 типов клеток в непрерывном многообразии состояний с течением времени. Когда данные scRNA-seq были сшиты в раскрашенную по времени схему силового направления, виртуальная реконструкция карты судьбы выявила альтернативные пути с разной степенью перекрытия различных траекторий. Для формального представления надежности траекторий и связей вне дерева авторы присвоили "балл канализации" (рис. 3б).
Канализация (после модели Тьюринга) означает тенденцию развития определенного генотипа по одной и той же траектории в различных условиях (Hallgrimsson, Willmore, & Hall, 2002). Большинство траекторий развития слабо канализированы (например, нервная пластинка, сомитная мезодерма), но некоторые были средне (хордf) или сильно канализированы (зародышевая линия). Поэтому in silico картирование судьбы вдоль ветвей многообразия клеточных линий предполагало несоответствие с прогрессией клеточных состояний (Wagner et al., 2018). Чтобы более точно оценить, как клеточное состояние эволюционировало с течением времени, они использовали линейное кодирование "TracerSeq" с транспозоном Tol2 для оценки тех же клеток dо всем разнообразии. Авторы обнаружили, что клетки могут быть близки по состоянию, но далеки по родословной, демонстрируя не-бинарную смежность с широкими континуумами пространства состояний, сложными схемами ветвления и петлями. Сложная линейных состояний архитектура динамики экспрессии генов подкрепляет парадигму о том, что некоторые клетки сохраняют многосоставной потенциал и могут переходить от одной траектории развития к другой.
Селективное преимущество канализации может заключаться в контроле надлежащего числа клеток во время приобретения клеточной судьбы (bootstrapping) и в детерминанте поведения системы в процессе развития при возмущении генетическими или экологическими факторами (буферизация). Сравнение траекторий у рыбок данио (Wagner et al., 2018) и Xenopus (Briggs et al., 2018) показало, что ортологичные гены демонстрируют в целом вариабельную экспрессию, специфичную для клеточного состояния, (30% консервативны), а транскрипционные факторы являются наиболее консервативными. Это указывает на "функцию над последовательностью", когда транскрипционный контроль генной регуляторной сети и физиологические гены кооптируются в пути для специфической клеточной сигнализации, метаболизма и гомеостаза.
5 MAMMALIAN EMBRYOLOGY
Подавляющее большинство клеточных линий у млекопитающих происходит из слоя эпибласта раннего эмбриона во время гаструляции и раннего органогенеза (эмбриональные дни E6.5-E8.5 у мыши, 14-17 дни после оплодотворения у человека). В этот период также происходит расшифровка фундаментального плана организма посредством формирования примитивной полоски, определяющей передне-заднюю (например, голова-хвост) ось.
5.1 Cell diversification
У мыши гаструляция начинается на стадии яйцевого цилиндра (E6.25), когда клетки из задней части эпибласта сходятся на средней линии и проходят эпителиально-мезенхимальный переход. Примитивная полоска продвигается в переднем направлении и завершается формированием задних областей к стадии головной пластинки (E8.5). График t-SNE был составлен из 116 312 клеток, полученных с помощью scRNA-seq в девяти временных точках между E6.5 и E8.5, от плюрипотентности до всех основных эмбриональных линий (Pijuan-Sala et al., 2019). Эти авторы аннотировали 37 основных кластеров на основе известных генов-биомаркеров для молекулярной диверсификации клеток собственно эмбриона и связанных с ним вне-эмбриональных мембран (рис. 4a). Выводы о сложной сигнализации были основаны на инновационном анализе химерных эмбрионов. Эмбрионы с дефицитом транскрипционного фактора TAL1 погибают в возрасте E9.5 из-за дефектов мезодермальной диверсификации, которые приводят к тяжелой анемии; однако судьбу клеток Tal1(-/-) можно проследить в химерных эмбрионах, полученных путем микро-инъекции меченых эмбриональных стволовых клеток в бластоцисту Tal1(+/+), из которых формируются здоровые эмбрионы (Pijuan-Sala et al., 2019). Оценка scRNA-seq меченых и немеченых клеток, отсортированных из химерных эмбрионов на стадии сгибания головы (E8.5), подтвердила, что мутантные клетки не вносят вклад в кроветворную линию; кроме того, обратный эксперимент показал, что меченые клетки Tal1(+/+) вносят вклад в кроветворную линию при инъекции эмбрионам-хозяевам Tal1(-/-). Сочетание временной и транскрипционной информации может пролить свет на функцию гена.
Profiling cell developmental trajectories in the mouse embryo using scRNA-seq. (Left) Gastrulation-early organogenesis when most cell lineages of the embryo proper emerge; t-SNE lineage identified 37 main clusters staged from 116,312 cells epiblast (E6.5) to headfold (E8.5), graphed in pseudotime by cell frequency (Pijuan-Sala et al., 2019). (Right) composite t-SNE annotated for 38 main cell clusters during organogenesis, the period when most organ systems form; pseudotime representation is superimposed on the composite t-SNE structure for the 151?K cells recorded on E9.5, 370?K cells on E10.5, 603?K cells on E11.5, 468?K cells on E12.5, and 435?K cells on E13.5 (Cao et al., 2019)
В E8.5 эмбрион на стадии головы переходит к органогенезу, увеличиваясь с сотен тысяч до более десяти миллионов клеток, формируя почти все зачатки основных систем органов между E9.5 и E13.5. Этот период был оценен с помощью комбинаторного индексирования на основе одноклеточной РНК-секвенирования изолированных ядер (зафиксированных параформальдегидом) из 61 замороженного эмбриона C57BL/6J, собранных с интервалом в пять дней (Cao et al., 2019). Их методика сбора, не требующая физической изоляции клеток, позволила получить библиотеки со штрих-кодом, где каждая клетка может быть проиндексирована по эмбриону, из которого она происходит. В 26 183 DEGs они идентифицировали 2 863 маркерных гена, специфичных для клеточного типа, что позволило аннотировать 38 основных клеточных кластеров (рис. 4b).
Соответствующий атлас клеток мышиного органогенеза (MOCA, (http://atlas.gs.washington.edu/mouse-rna/)) создает условия для проведения "виртуальных экспериментов" с целью более глубокого анализа ландшафтов клеточных состояний. Из 38 основных кластеров клеточных типов, полученных на основе t-SNE графиков эмбрионов мыши, собранных E9.5-E13.5, более глубокий анализ, основанный на различных траекториях состояний, позволил получить 655 подкластеров (Cao et al., 2019). Например, псевдо-временное упорядочивание клеток апикального эктодермального гребня (AER) на основе 710 DEGs, связанных с известными маркерами для специфической экспрессии AER, позволило выделить траекторию, отличную от общего эпителия, где этот транзиторный тип клеток увеличился до пиковой частоты на E10.5-E11.5 (Cao et al., 2019). Ландшафт клеточных состояний у эмбриона мыши, как и урыбок данио, не строго соответствует карте клеточных линий.
5.2 Cardiogenesis
Врожденные пороки сердца (ВПС) могут возникать после нарушения развития клеток-предшественников сердца или мультипотентных клеток нервного гребня. Например, у мыши генетический дефицит Hand2 приводит к ВПС, но связать патогенез с типами клеток-предшественников, на которые влияют такие мутации, до сих пор не удается. С помощью профилирования одиночных клеток было отобрано 36 000 клеток из кардиогенной области эмбрионов мыши на трех этапах развития: сердечный полумесяц (E7.75), сердечная трубка (E8.25) и сердечная петля (E9.25) (de Soysa et al., 2019). Одноклеточная транскриптомика определила Hand2 как критический определитель линии клеток миокарда, что согласуется с дефектами отводящего тракта и тяжелой гипоплазией правого желудочка, наблюдаемыми у мышей с дефицитом Hand2 (рис. 5). Неожиданно, однако, эта дисрегуляция распространялась только на спецификацию клеток-предшественников миокарда, предназначенных для отводящих путей сердца, а не для правого желудочка.
Profiling early cardiogenic trajectories in the mouse embryo. (Top) Stages of cardiogenesis depicted in the mouse embryo at the cardiac crescent (E7.5), heart loop (E8.5), and outflow tract/secondary heart field stage (E9.5) (from http://www.ibdm.univ-mrs.fr/equipw/genetic-control-of-heart-devlopment/) (Bottom) scRNA-seq profiling of the heart in pseudotime comparing cell cluster sizes in wild-type and Hand2-null embryos. Pseudotime trajectory for the anterior heart field (AHF), outflow tract (OFT), and right ventricle (RV) at E8.25 colored by cluster identity (a), genotype (b), and cell state (c) (de Soysa et al., 2019)
Чтобы лучше понять несоответствие между анализом одноклеточных линий и наблюдаемым фенотипом (например, невозможность связать гипоплазию правого желудочка с недостаточной экспрессией Hand2 у эмбрионов дикого типа), был проведен анализ scRNA-seq на вторичном поле сердца у эмбрионов Hand2-нулевого типа. Это подтвердило транскрипционную дисрегуляцию с потерей функции Hand2 в сердечной петле в E7.75, задолго до явного дисморфогенеза, и, кроме того, выявило дисрегуляцию передачи сигнала ретиноевой кислоты (ATRA) в качестве первичной основы гипоплазии правого желудочка. Механистически это было связано с ATRA-индуцированной постеризацией перспективного правого желудочка в более переднюю (предсердно-подобную) судьбу (de Soysa et al., 2019). Это один из немногих примеров, демонстрирующий набор данных по одиночным клеткам об откровенном врожденном дефекте, и подчеркивающий потенциальное применение данного подхода.
5.3 Pluripotency
Исследования молекулярного профилирования показали, что плюрипотентные mESCs наиболее похожи на эпибласт, который является предшественником почти всех клеточных линий в эмбрионе мыши (Cheng et al., 2019; Han, Chen, et al., 2018; Klein et al., 2015; Pijuan-Sala et al., 2019). Перед гаструляцией с помощью scRNA-seq была построена молекулярная дорожная карта, которая выделяет клетки эпибласта, проходящие через состояния плюрипотентности по мере приобретения ими склонности к формированию примитивной полоски (Cheng et al., 2019). Эпибласт отвечает на сигналы от внезародышевых тканей, постепенно выходит из состояния плюрипотентности и становится готовым к многолинейной спецификации. Линии стволовых клеток мыши, полученные из эмбриобласта (mESCs) и эпибласта (EpiSCs), функционально и морфологически отличаются друг от друга и являются аналогами in vitro в различной прогрессии развития: (1) нативная плюрипотентность (ground-state), представленная пре-имплантационной внутренней клеточной массой и культивированными mESCs; (2) промежуточные эпибласт-подобные клетки (pregastrula); и (3) primed-pluripotency (mid-late gastrulation). Cheng et al. (2019) использовали scRNA-seq для 1 724 клеток, собранных из 28 эмбрионов в E5.25, E5.5, E6.25 и E6.5 (прегаструла) для отслеживания молекулярных состояний по мере прохождения эпибластом своего предполагаемого континуума плюрипотентности. Из 3000 HVG с помощью t-SNE были отображены три основных кластера клеток: эпибласт (768 клеток, кластеризованных в домене Pouf5f1); висцеральная эндодерма (671 клетка, кластеризованная в домене Amn) и вне-эмбриональная эктодерма (ExE, 285 клеток, кластеризованных в домене Bmp4).
5.4 mESCs
Штрихкодирование InDrop было применено к mESCs в качестве модели для оценки проблем параллельной обработки тысяч клеток и всестороннего захвата мРНК (Klein et al., 2015). В данном исследовании они сравнили mESCs ± LIF (лейкемический ингибирующий фактор, цитокин, поддерживающий плюрипотентность) для более 10 000 штрих-кодированных клеток и 3 034 случайно отобранных mESCs, дифференцирующихся в течение 7 дней. Для 935 mESCs, HVG были обогащены для транскрипционной регуляции и плюрипотентности, причем большинство из них отражали гетерогенность между состояниями ICM (высокая плюрипотентность) и эпибласта (низкая плюрипотентность). В соответствии с этим, графики t-SNE показали континуум состояний от высокой до низкой плюрипотентности при отмене LIF, отражающий преимущественно линии эпибласта и примитивной эндодермы, что соответствует внутренней клеточной массе (эмбриобласт) in vivo. Они обнаружили незначительные признаки формирования паттерна на 0 день, слабое формирование паттерна на 2 день, сильное формирование паттерна на 4 день, а на 7 день он исчезает. Таким образом, mESCs находятся в "исходном состоянии" нативной плюрипотентности, которую можно поддерживать с помощью LIF. Вскоре после имплантации (in vivo) или отмены LIF (in vitro) популяция ICM или mESCs, соответственно, переходит в "начальное состояние" спецификации линий, характеризующееся беспорядочной экспрессией генов, которая становится более совершенной по мере постепенной потери плюрипотентности в ходе открытой дифференцировки. Хотя линии стволовых клеток могут быть получены из постимплантационных EpiSCs, они являются линейно-primed (например, с низкой плюрипотентностью). Индуцированные плюрипотентные стволовые клетки человека (iPSCs) обладают молекулярной и функциональной идентичностью пост-имплантационных EpiSCs.
5.5 hESCs
Embryoid bodies (EB), полученные из эмбриональных стволовых клеток человека (hESCs) in vitro, повторяют эмбриональную эктодерму и мез-энтодерму. Одиночные H9 hESCs (n = 4 822) были отобраны для профилирования с помощью scRNA с глубиной чтения 5000 генов на клетку на стадиях naïve (n = 1 491), primed (n = 695) и EB (n = 2 636) (683 клетки на 4-й день, 1953 клетки на 8-й день) (Han, Chen, et al., 2018). Они сообщают о четырех основных кластерах: два (naïve, primed) относительно однородны и два (EB-эктодерма и EB-мез-энтодерма) неоднородны из-за спонтанной дифференцировки. Основываясь на DEGs, они составили карту клеточного ландшафта для primed EB линий, показав слабую гетерогенность на 4-й день по сравнению с 8-м днем (как и следовало ожидать); однако в этом случае они определили три линии предшественников на EB-4 (неопределенная, нейронная, мез-энтодермальная) и шесть линий предшественников на EB-8 (мышечная, стромальная, эндотелиальная, нейронная, эпителиальная, печеночная). Построение траектории ранней дифференцировки EB-8 в псевдовремени выявило две основные ветви (нейроэктодерма, мез-энтодерма), аналогичные развитию in vivo primed EPI в эмбриональную эктодерму + примитивную полоску (эмбриональная мезодерма и эндодерма). Эти авторы (Han, Chen, et al., 2018) также показали, что переходные состояния взаимопревращаемые при определенных условиях in vitro. Например, primed H9 hESCs могут быть стабильно переведены в состояние naïve через 15-20 дней в культуре с коммерческой средой "RSeT" (Han, Chen, et al., 2018). Эта система обеспечивает модель для построения "траекторий сброса" в псевдо-времени в течение культуры H9 с 0-го по 20-й день.
6 SEX DIFFERENTIATION
6.1 Gonad specification
В недавних исследованиях одноклеточное профилирование было применено к более поздним процессам развития, таким как половая дифференцировка. Сборка гонады из соматических клеток у мужчин и женщин включает диморфное расхождение клеточных линий от сексуально индифферентного гонадного зачатка. В этом участвуют клетки поддержки гонады (клетки пре-Сертоли у самцов, клетки пре-гранулозы у самок) и стероидогенные клетки (клетки Лейдига, клетки Тека). Для деконволюции спецификации линий в эмбрионе мыши был проведен анализ scRNA-seq (Stevant et al., 2019). Приверженность к линии поддерживающих клеток включает общий промежуточный этап дифференцировки до появления клеток пре-Сертоли или пре-гранулозы. Была выявлена транскриптомная программа, не зависящая от пола, по мере того, как эти поддерживающие клетки приобретают свою идентичность. У эмбрионов цыплят анализ scRNA-seq показал, что клетки пре-Сертоли и клетки пре-гранулозы происходят не из целомического эпителия, а из новой мезенхимной популяции (Estermann et al., 2020). Эти исследования поднимают вопрос об идентичности сигналов или факторов, которые контролируют спецификацию в сторону опорной или стероидогенной судьбы в ходе эволюции и развития.
6.2 Germline differentiation
Анализ РНК-секвенирования одиночных клеток был проведен для 2 167 половых клеток и клеток их гонадной ниши из 29 женских и мужских эмбрионов человека между 4 и 26 неделями беременности (Li et al., 2017). Анализ t-SNE четко определил 17 кластеров, из которых четыре кластера имели биомаркеры, специфичные для женской зародышевой линии: митотическая фаза, фаза, реагирующая на передачу сигналов ретиноевой кислоты, мейотическая профаза и фаза оогенеза. Для мужской зародышевой линии они выделили три кластера: миграционная фаза, гонадная митотическая фаза и фаза митотического ареста. Они наблюдали взаимные сигнальные взаимодействия между клетками зародышевой линии и соответствующими клетками гонадной ниши, включая активацию сигнальных путей BMP и Notch. Например, мужские гонадные соматические клетки специфически экспрессируют анти-мюллеров гормон (AMH), а женские гонадальные соматические клетки специфически экспрессируют BMP2, тогда как субпопуляции зародышевой линии экспрессируют соответствующий рецептор (BMPR1B).
7 IMPLICATIONS FOR TERATOGENESIS
Хотя токсикология развития еще не испытала на себе профилирование scRNA-seq в рамках нового поколения программ тестирования химических веществ (Thomas et al., 2019), эти исследования дают новое понимание новых механизмов того, как конкретные соединения могут нарушать раннее эмбриональное развитие. В качестве примера показано влияние никотина на динамику экспрессии генов в hESCs (Guo et al., 2019). Исследования на беременных грызунах показали токсичность для развития при воздействии никотина. Guo et al. (2019) провели микрокапельное РНК-секвенирование эмбриоидных тел из hESCs, подвергшихся воздействию 10 µМ никотина (5 646 отдельных клеток), и контрольных культур (6 847 отдельных клеток). Из ~3 000 генов в среднем на клетку они определили шесть основных линий клеток-предшественников на 21 день (мышечная, печеночная, нейрональная, стромальная, эпителиальная и эндотелиальная). Интересно, что воздействие никотина увеличило количество генов для пар лиганд-рецептор, что указывает на потенциал увеличения линий межклеточной коммуникаций, транслируемых между определенными типами клеток (рис. 6).
FIGURE 6
Profiling cell developmental trajectories in the ESCs using scRNA-seq. (Top) t-SNE plots from hESC-derived embryoid bodies on Day 21 of culture; control condition (n =?6,847 individual cells) and 10 µM nicotine. (Bottom) Nicotine exposure increased specific cell-to-cell communication pathways; directed acyclic graph connects ligands to receptors for target cell populations for ligand-receptor pairs (line thickness reflects ligand# in the coupled population) (Guo et al., 2019). See, for example, the thickness increase in pathways for ECs with muscle and USCs
Благодаря недавнему прорыву в одноклеточных технологиях, в настоящее время существует водораздел возможностей для продвижения научного понимания функциональных состояний клеток, прокладывая путь к более глубокому знанию процессов развития и токсичности и открывая новое понимание того, когда, где и как возникают дефекты развития и шаги, необходимые для надежного моделирования токсичности развития человека (Scialli et al., 2018). Одна из задач - помочь составить карту физиологии развития человека от молекулярного до организменного уровня на уровне детализации, подходящем для целей тестирования токсичности. Клеточные атласы, построенные с использованием данных scRNA-seq и пространственного картирования, вносят свой вклад в проект The Human Cell Atlas (HCA) (www.humancellatlas.org) (Behjati, Lindsay, Teichmann, & Haniffa, 2018), которые можно напрямую сравнивать для ряда типов эмбриональных клеток, каталогизированных в Mouse Cell Atlas (MCA) (Han et al., 2018). Возможность пространственного расчленения целевого поля по сходству транскритомного ответа на клеточном уровне, запрашиваемого по MCA-HCA, обеспечивает исходную информацию о динамике экспрессии генов по мере того, как клетки приобретают определенные судьбы в процессе морфогенеза и дифференцировки, и может облегчить использование мышиных моделей для выявления дефектов развития человека.
Еще одна возможность, предложенная Scialli et al. (2018), заключается в интеграции существующих знаний в области химии и токсичности (например, определение основных способов действия токсичности в развитии человека, картирование комплексных путей неблагоприятного исхода (AOPs) для целей тестирования токсичности, определение лимитирующих скорость биологических ключевых событий и соответствующих биомаркеров, а также разработка тест-систем, связанных с биомаркерами). Использование данных scRNA-seq в оценке дозового ответа может предоставить важную информацию на клеточном уровне о состояниях "дозорных клеток", которые могут предсказать токсичность до широкого поражения органов или организмов, когда методология усреднения массы данных маскирует небольшие дозорные изменения даже в, казалось бы, однородной ткани или клеточной линии. Сила scRNA-seq заключается в том, чтобы разобщить гетерогенные клеточные популяции в непосредственной пространственной близости, которые исторически трудно охарактеризовать транскрипционно с помощью ручного препарирования тканей или выделения репортерных генов.
Анализ траекторий развития позволяет выявить перспективные типы клеток задолго до того, как они станут морфологически различимыми. Это может улучшить создание и тестирование вычислительных инструментов для прогнозирования токсичности (интегрировать результаты количественных тестов в сетевую модель AOP, определить пороги неблагоприятного воздействия на уровне интегрированной модели) (Scialli et al., 2018). Вычислительная биология и моделирование неизбежно будут играть важную роль в переводе динамики клеточного состояния в прогрессирование болезни на уровне клетки за клеткой и взаимодействия за взаимодействием. Вычислительные алгоритмы для псевдо-временнóго упорядочивания раннего развития в SMOs и дифференцирующихся ESCs начали определять грамматику развития, посредством которой плюрипотентные клетки приобретают свои судьбы (например, программирование, канализация; Cao et al., 2019; Wagner et al., 2018). Переходные состояния клеток, извлеченные из данных scRNA-seq в псевдо-времени, по сути, присвоят временную метку каждой клетке в гетерогенной популяции после физиологического стимулирования или возмущения. Продвижение по траектории дифференциации является асинхронным/непрерывным и может выявить критические точки бифуркации, предвещающие токсичное действие на развитие. Определение токсичности развития и репродуктивной токсичности было сложной задачей, чтобы определить ключевые события во время нормального развития, а также отследить пораженные клетки и процессы вдоль измененной траектории развития. Непрерывность многообразия экспрессии генов уменьшают размерность расстояний между клетками до виртуальных псевдо-временных траекторий состояния. Это позволяет встроить токсикодинамические модели в общую парадигму оценки риска.
8 TRANSLATABILITY TO HUMAN RISK ASSESSMENT
Оценка риска для здоровья человека - это процесс, в ходе которого мы собираем научную информацию о том, как химические вещества, агенты или события могут повлиять на здоровье человека. При оценке риска необходима как информация о воздействии, так и информация об опасности (токсичности). Что касается токсичности для развития, то эта информация необходима до зачатия, во время беременности и после родов в период полового созревания, чтобы понять последствия для здоровья детей. Одноклеточная транскриптомика предоставляет уникальную возможность понять воздействие на конкретные клетки-мишени в разные периоды развития. Она предоставляет новый способ отслеживания изменений в конкретных клетках в определенных местах и на конкретных стадиях дифференцировки. Кроме того, это дает беспрецедентный взгляд изнутри на поведение клеток и их вклад в развитие органов и организмов. Когда временная экспрессия генов будет связана с морфологическим расположением, эти методы будут обладать огромной силой, чтобы ответить на вопросы о чувствительности конкретных клеток к воздействию токсикантов в конкретных органах и у конкретных видов, а также об их значимости для прогнозирования последствий для здоровья человека. Например, присутствуют ли клетки-мишени только в определенных местах или воздействие наблюдается только у определенных видов?
Хотя в данном обзоре мы сосредоточились на гаструляции-органогенезе, недавние исследования применили одноклеточное профилирование к более поздним процессам развития, таким как созревание легких и развитие мозга. Например, дыхательные пути легких являются основным местом развития заболеваний при астме и муковисцидозе. Анализ клеточного состава и иерархии эпителия трахеи мыши с помощью scRNA-seq и прослеживание линий in vivo в возрасте 6-12 недель выявил новый специализированный ионоцит как основной источник транскриптов регулятора трансмембранной проводимости при муковисцидозе у мыши (Cftr) и человека (CFTR), тогда как ранее считалось, что CFTR экспрессируется во всем эпителии легких (Montoro et al., 2018; Plasschaert et al., 2018). В рамках перспективной стратегии по решению проблемы пространственной организации мозга, зависящей от типа клеток (Cembrowski, 2019), scRNA-seq используется для характеристики транскрипционной динамики в нише нейрогенных стволовых клеток и клеточно-специфических дисфункций, лежащих в основе нарушенного нейрогенеза (Zywitza, Misios, Bunatyan, Willnow, & Rajewsky, 2018), выявления различных переходных состояний во время спецификации нейронных и глиальных предшественников (Weng и др., 2019), оценить переходные состояния при активации микроглии во время нейровоспаления (Sousa et al., 2018) и определить предполагаемые терапевтические мишени для опухолевой прогрессии в специфических для пациента моделях органоидов головного мозга (Krieger et al., 2020). Эти примеры также показывают, как одноклеточное профилирование может позволить улучшить сравнение траекторий in vitro и in vivo, расширяя наши знания о сроках и траекториях развития и, таким образом, информируя о дизайне эксперимента и времени лечения для тестирования токсичности развития.
На семинаре Национальной академии наук в марте 2019 года было признано беспрецедентное разрешение и инновационность профилирования одноклеточных для изучения биологических систем и их возмущения химическими веществами (Zhang et al., 2019). Для прецизионной токсикологии концепция одноклеточного профилирования имеет очевидную привлекательность, основанную на чувствительности и специфичности, продемонстрированных в ходе ее применения в биологии развития. Однако для специалистов по оценке риска, заинтересованных в определении уровней воздействия для человеческих популяций без неблагоприятных последствий, детализация scRNA может быть чрезмерной. Интеграция данных scRNA-seq в системы на основе AOP может быть полезной для определения конкретных клеток-мишеней и стадий.
В заключение следует отметить, что технологические достижения в настоящее время создали условия для использования профилирования одиночных клеток в области исследования и профилактики врожденных пороков развития для: (1) определения траекторий процессов развития, определяющих дифференцировку и функции; (2) характеристики сходства/различия типов клеток и функциональных состояний по видам, тканям и органам; (3) предоставления важной информации для создания и тестирования данных для соответствующих систем AOPs; (4) квалификации данных in vitro и моделей in silico для новых методологий подхода, направленных на уменьшение зависимости от испытаний на животных; и (5) улучшения нашей способности выявлять ранние события и отслеживать траектории развития заболеваний с большей пользой для развития человека. Конечно, некоторые из существующих ограничений технологий профилирования одиночных клеток, такие как очень высокая стоимость, малочисленность данных, сложность вычислительного анализа и масштабируемость, указывают на необходимость дальнейшего развития технологии, чтобы можно было проводить множество экспериментов параллельно. Как и любой быстро развивающийся метод, scRNA-seq сталкивается с проблемами научного и технологического развития, а также с необходимостью знать, какое приложение использовать для этих целей и соответствующие меры контроля качества для обеспечения прозрачности и воспроизводимости. В последние годы появилось множество различных методов обработки и анализа, и мы ожидаем улучшения понимания того, какие подходы могут лучше подходить для тех или иных целей в раскрытии сложных траекторий состояния клеток во время процессов развития и токсических воздействий.
|