Посещений:
ООЦИТЫ



Исследования одиночных клеток

Oocytes, a single cell and a tissue
Di Wu, Jurrien Dean
https://doi.org/10.1101/2020.02.17.952929

RNA-seq одиночных клеток продвинуло исследования транскриптомов, трансформирующих судьбы клеток по время развития. Использование UMI (unique molecular identifiers) сегодня является стандартом для определения количеств (read quantification), это существенно улучшает точность данных и воспроизводимость, особенно для подсчетов низкочастотных генов [1-3]. Проверка гетерогенности и взаимодействий между типами клеток делает возможными исследования многоклеточных тканей и возникновение опухолей.
Как одиночная клетка ооцит млекопитающих является уникальным благодаря своему большому размеру, униформной морфологии, высокому содержанию РНК и широкому набору видов нуклеиновых кислот. Во время созревания ооцита, за которым немедленно наступает рост , материнский транскриптом драматически деградирует и перестраивается во время приготовления к оплодотворению и раннему развитию. Когда осуществляется RNA-seq одиночного ооцита[4], это становится очень популярным для multi-omic исследований у мышей. Эти преимущества позволяют лучше понять развитие и генетическую изменчивость, а также получить детальную информацию о совместной регуляции транскриптов, что влияет на качество и старение ооцитов [5-7]. Однако, не существует прямой оценки RNA-seq одиночных ооцитов по сравнению с объединенными ооцитами. С помощью парного анализа нескольких опубликованных данных RNA-seq одиночных и объединенных ооцитов, мы установили высокую воспроизводимость RNA-seq одиночных ооцитов. Кроме того, путем осуществления базирующейся на UMI или Picard deduplication, мы показали, что deduplication не вызывает достоверного улучшения RNA-seq одиночных ооцитов. Наконец, мы продемонстрировали, что внешние spike-in молекулы, такие как ERCC (External RNA Control Consortium), могут эффективно вычислять изменения размеров транскриптома во время созревания ооцитов и демонстрируют сходство использования ERCC и constGenes для cross-stage нормализации. Такая нормализация позволяет лучше понять гетерогенность ооцитов на стадии зародышевого пузырька (GV). ConstGenes или ERCC нормализация могут стать стандартами для сравнения между стадиями (cross-stage) в будущих исследованиях секвенирования одиночных ооцитов.

Single oocyte RNA-seq has high reproducibility


Чтобы определить воспроизводимость RNA-seq мышиных ооцитов, мы получили несколько опубликованных баз данных от одиночных и объединенных ооцитов на ст. GV (geminal vesicle) и ст. MII (мейоз II), которые начинали и заканчивали созревание ооцита, соотв. [6-10]. Мы подвергали процессингу все сырые файлы секвенироания параллельно. Благодаря разному распределению транскриптов от всех выборок, мы осуществили только coding reads транскрипции (Fig. 1a; Table S1). Интересно, что RNA-seq одиночных ооцитов (GSE141190, GSE96638, GSE44183) выявило более высокую корреляцию внутри группы, чем при сравнении объединенных ооцитов той же стадии (Fig. 1b). Кроме того, MII обнаруживали боле высокие отклонения результатов секвенирования poly(A) в противовес RiboMinus, возможно благодаря существованию дремлющих РНК и гипер полиаденилированных мРНК, начинающих активно транслироваться (Fig. 1b) [11]. Путем образования кластеров принципиальных компонентов, группы одиночных ооцитов обнаруживали высокое сходство, несмотря на доминирующие различия в экспериментах и методах (Fig. 1c-d). Т.о., мы пришли к выводу, что секвенирование одиночных ооцитов может давать высоко воспроизводимые и устойчивые результаты.

Figure 1. Single mouse oocyte RNA-seq exhibited higher reproducibility.

a Bar graph of read coverage in coding, UTR, intronic and intergenic regions in different datasets. b Plots of transcript abundance regression analysis of single or pooled oocytes RNA-seq results. Normalized mean of gene counts: mean of gene counts from all libraries normalized by library sizes in each condition. In each plot, the x-axis and y-axis are the log10 count values from different sequencing results. Three gray dashed lines: y=x, y=x+1 and y=x?1. Red number: the correlation coefficient of each comparison. The library names: GV/MII_single/pooled_polyA/riboMinus_GEO abbreviation. The GEO abbreviation is listed in Availability of data and materials. c-d Principal component analysis (c) and sample distance matrix (d) of the single and pooled oocytes RNA-seq datasets at GV and MII stages.




Deduplication improved the single oocyte RNA-seq limitedly


RNA-seq одиночных клеток чувствительно к ряду влияний, включая захват генов, обратная транскрипция и ампилификация кДНК [12]. Использование UMI (unique molecular identifiers) существенно улучшало воспроизводимость секвенирования одиночных клеток с помощью quantifying reads с большей точностью [3]. Чтобы проверить, что UMI также благоприятно для RNA-seq одиночных ооцитов, мы повторно анализировали результаты GSE141190 RiboMinus RNA-seq, используя UMI квантификацию (Fig. 2a-b), которая определяла дупликаты с помощью UMI и insert reads. N8 UMI, способна различать свыше 65536 молекул, этого достаточно чтобы различать ~20000 разных РНК, экспрессирующихся в ооцитах мыши [3, 7]. В среднем, число считываний Dedup (UMI-based) выборок составляло 43%±15% от их оригинальных (без deduplication) выборок (Fig. 2c-d; Table S2). После отфильтровывания low-count генов, линейная регрессия подсчета генов в Original и Dedup групп, нормализовалась по размеру библиотеки, обнаруживалась высокая корреляция на одной и той же стадии (Fig. 2e).

Figure 2. Deduplication of single oocyte RNA-seq reads does not significantly improve results.

a Outline of single oocyte RNA-seq adapted from Ovation Solo RNA-seq system. b Structure of the sequencing reads, including the insert (cDNA), cell barcode and N8 random sequence (UMI, unique molecular identifier). c Bar graph of Original, UMI-based (Dedup) and Picard deduplicated (Picard) counts. d Dot plot of the Original and UMI-based (Dedup) gene counts at GV stage. The chosen genes are the top 30 after ranking by their Ensembl gene ID. e Plots of transcript abundance regression analysis of Original vs Dedup gene counts normalized by library sizes. f-g Principal component analysis (f), sample distance matrix (g) of combined Original and Dedup samples. h-i Differential analysis of MII vs GV in Original and Dedup groups (h) and the comparison of the log2FC (MII vs GV) in Original and Dedup groups (i). j MA plots of differentially expressed genes of Original vs Dedup in GV and MII oocytes.


Кроме того, мы осуществили нижестоящий дифференциальный анализ, используя подсчет как в Original, так и в Dedup. Original и Dedup подсчеты от одного и того же ооцита оказались сходными, демонстрируя как иерархическое образование кластеров принципиальных компонентов, так и distance calculations (Fig. 2f-g). Результаты дифференциального анализа MII в противовес GV в Original и Dedup группах также были очень сходными (Fig. 2h-i; Table S3). С др. стороны, не было идентифицировано достоверных изменений в экспрессии генов (P-adjusted < 0.01) при сравнении Original и Dedup на одной и той же стадии (Fig. 2j; Table S3), это подтверждает, что UMI deduplication несущественно улучшает точность квантификации при RNA-seq одиночных ооцитов.
Чтобы далее оценить насколько важна deduplication при RNA-seq одиночных ооцитов, мы определяли преимущества Picard deduplication, которая определяет дупликации, базируясь только на картировании координат. Как и ожидалось, Picard урезала (trimmed off) ещё больше считываний (Fig. 1c). Несмотря на это корреляция между Original и Picard оставалась достаточно высокой (Fig. 3a). Как и ожидалось дифференциальный анализ Original в противовес Picard на ст.GVили MII показал, что определенные группы генов, включая те, что кодируют рибосомальные белки (Rpl19, Rpl32, Rps20) оказались чувствительными к deduplication (Fig. 3b; Table S4). Мы также использовали ERCC spike-in молекул, чтобы визуализовать linearization между их подсчетами и сырыми концентрациями (Fig. 3c-e). Мы пришли к выводу, что deduplication дает только ограниченные преимущества при RNA-seq одиночных ооцитов, возможно благодаря высокому изобилию РНК, что делает ооциты очень сходными с тканью скорее, чем с стандартными одиночными клетками.

Figure 3.Picard deduplication of single oocyte RNA-seq reads does not significantly improve results...



External and internal normalization for cross-stage comparison


...

Better understanding of GV oocyte heterogeneity


Наконец, мы исследовали гетерогенность GV ооцитов, подразделив их на две субпопуляции по конфигурации ядра: SN (surrounded nucleolus) и NSN (non-surrounded nucleolus) ооциты [15]. SN ооциты имели полностью конденсированный хроматин, не обнаруживали транскрипции и были готовы к созреванию. NSN ооциты имели остаточную транскрипцию и неполный мейотический аппарат с пониженной онтогенетической компетентностью [15]. Различия транскриптомов NSN и SN были изучены с помощью секвенирования микромассивов и pooled, которое показало разные уровни рибосомальных белков и компонентов мейотического веретена [16, 17]. Секвенирование рибосомных РНК показало, что усиление активности 5'ETS у rRNA связано с блокированием созревания в NSN [7]. Мв исследовали 3 NSN и 4 SN ооцита с помощью unsupervised clustering и с помощью анализа считывания рибосомальных РНК в выборках GV (Fig. 6a-b). Дифференциальный анализ выявил легкое снижение регуляции транскриптома во время перехода от NSN к SN (Fig. 6c; Table S11). Дифференциально экспрессирующиеся гены были обогащены на некоторых компонентах эндомембран, таких как эндоплазматический ретикулум, Гольджи и лизосомы, которые, как известно, активно перестраиваются во время прорыва ядерной оболочки (Fig. 6d) [18, 19]. Др. события, такие как модификации zinc-finger белков, обусловленные хроматином, ассоциируют с инактивацией транскрипции, РНК-свзывающие белки обеспечивают экспорт РНК, вызывая деградацию транскриптов и отмечается достоверное увеличение белков, связанных с клеточным делением (Fig. 6d) [6, 20].

Figure 6. Single oocyte RNA-seq allows better evaluation of oocyte heterogeneity.

a PCA of GV oocytes from the GSE141190 polyA GV samples. Two groups could be visualized based on the distribution, which were putatively NSN (non-surrounded nucleolus) and SN (surrounded nucleolus) indicated by (b). b Heatmap of rRNA coverage obtained from GSE141190 polyA GV samples mapped to the rRNA genomic region. c-d MA plots of differentially expressed genes in SN vs NSN GV oocytes counted at coding region (c) and their functional analysis (d). e MA plots of differentially expressed genes in SN vs NSN GV oocytes counted at intronic region. f Quadrant chart showing coding and intronic sequences that overlapped significantly in differentially expressed genes. g Plot from Integrative Genomics Viewer (IGV) showing the read distribution of Nlrp5 in the SN and NSN oocytes. Blue box: coding region; blue line: intron region. h Differential expression fold change of SN vs NSN of the chromatin modification genes.


Интересно, что интронные регионы обнаруживают сходное снижение (Fig. 6e; Table S11). Большинство (75/81) из дублей существенно изменяют гены, обнаруживающие общее снижение считывания кодирующих и интронных последовательностей (Fig. 6f). Кроме того, устойчивое распределение считываний подтверждает, что остаточные интроны, скорее всего, происходят из не подвергшихся сплайсингу pre-mRNAs, это согласуется с высокой активностью транскрипции в NSN ооцитах (Fig. 6g). Функциональное описание 81 дифференциально экспрессируемого гена показало их достоверное увеличение в генах, связанных с цитоскелетом (modified Fisher Exact P-value 0.037). Сюда вошли Farp1/2, Dnm3, Eml6, Epb41l2, Flnb, Fmn1, Myo10/19, Arhgef18 и Sptan1, которые предоставили доказательства, что SN ооциты содержат больше белков, необходимых для организации мейотического веретена. Более того, известно снижение транскриптов histone demethylase во время перехода от NSN к SN, при этом было также установлено снижение их в SN группе, включая Kdm1b, Kdm4b, Kdm5a, Kdm3b, Kdm5c (Fig. 6h; Table S12) [6].
Итак, исходя из высокой воспроизводимости и известной генетической и онтогенетической гетерогенности, RNA-seq одиночных ооцитов, по-видимому, наилучший метод анализа транскриптома ооцитов мыши. Когда ожидаются общие изменения размера транскриптома, то внешние spike-in или constGenes рекомендуется нормализовать, чтобы получить лучшую информацию о биологических изменениях транскриптома.
Кроме того, мы продемонстрировали, что базирующиеся на UMI (unique molecular identifiers), и др. методы deduplication обнаруживают ограниченную способность улучшать точность получаемых данных. Нормализация различий между выборками при cross-stage сравнениях, показывает, что внешние spike-in молекулы сравнимы с использованием эндогенных генов, стабильно экспрессирующихся во время созревания ооцитов. Способность нормализовать данные для одиночных клеток предоставит информацию о гетерогенности ооцитов мышей.