Посещений:
ЛИЦО ЧЕЛОВЕКА



Генетический контроль формирования лица

Insights into the genetic architecture of the human face
Julie D. White, Karlijne Indencleef,  Sahin Naqvi,  et al.
doi: https://doi.org/10.1101/2020.05.12.090555

Полногеномный поиск ассоциаций (GWAS) между геномными вариантами и фенотипическими признаками
Atchley and Hall, 19911, p.102 в своем обзоре описали "сложную онтогенетическую хореографию" в которой прирожденные генетические факторы, эпигенетические факторы и взаимодействия между ними создают генотип потомства, который взаимодействуя с внешними условиями в конечном итоге создает сложные морфологические признаки (структуры), состоящие из ряда отдельных комплектующих частей1. Сегодня мы знаем, что прирожденные генетические факторы в конечном итоге вносят вклад в сложные морфологические свойства, состоящие не только из одиночных вариантов измененных белковых структур и/или функций, но также из некодируемых вариантов и взаимодействий между вариантами, при этом каждое затрагивает многие ткани и временные точки развития. Это неизбежно влечет за собой развитие и использование методов, способных описывать генетическую архитектуру сложных морфологических признаков, это связано с идентификацией индивидуальных генетических вариантов, вносящих вклад в морфологические вариации, также как и в их взаимодействия2,3.
Лицо человека является примером сложной морфологической структуры. Оно состоит из многих структур, возникающих в результате сложной координации генетических, клеточных и внешнесредовых факторов4–6. Посредством предшествующих генетических исследований количественных признаков, 51 локус оказался участвующим в формировании нормальной черепно-лицевой морфологии и еще 50 локусов оказались ассоциированы с характеристиками размера носа или впадины на подбородке в большой когорте исследований7 (Table S1). Однако, в связи со всей сложностью морфологических признаков, наша способность идентифицировать и описывает генетическую архитектуру лица ограничена из-за неспособности аккуратно характеризовать его фенотипические вариации4, идентифицировать варианты как крупных, так и малых эффектов8 и идентифицировать взаимодействия между вариантами. Ранее мы описали новый данными управляемый подход к фенотипированию лица, который облегчает идентификацию и репликацию 15 локусов, участвующих как в глобальной, так и локальной вариации лицевой морфологии9. Здесь мы использовали этот фенотипирующий подход в двух очень крупных когортах из США и Англии (n = 8246; Table S2) и использовали продвинутую многомерную технику для выявления новых биологических представлений в генетической архитектуре лица человека. Теперь мы идентифицировали 203 сигнала, расположенных в 138 цитогенетических bands, ассоциированных с морфологией лица в нормальных пределах (Fig. 1). Многие из этих локусов обладают генами , участвующими в черепно-лицевых синдромах, которые, как было установлено, также затрагивают и нормальные вариации лица и большое количество новых сигналов, в принципе указывают на ранее неизвестные гены и пути, участвующие в нормальном и аномальном развитии лица. Используя биоинформационные инструменты и ChIP-seq базы данных для эпигеномных характеристик, мы показали, что варианты на наших GWAS пиках участвуют в регуляции активности энхансеров в типах клеток, контролирующих морфогенез лица в ходе развития. Более того, мы выявили взаимодействия между вариантами разных локусов, затрагивающих сходные аспекты изменчивости формы лица, выявив некоторые скрытые ансамбли генов, работающих совместно над строением лица человека. В ходе этой работы мы не только способствовали нашему пониманию человеческого лица, но и также проиллюстрировали потенциал для изучения спорных Atchley и Hall’s проблем, за счет интенсивной характеристики сложной морфологической изменчивости и использования продвинутых методов по идентификации факторов, участвующих в онтогенетической хореографии сложных морфологических структур.

Fig. 1. Overall results of US-driven and UK-driven meta-analyses. On the left, blocks representing the facial segments arranged and colored according to quadrant (I = orange; II = red; III = light blue; IV = dark blue), and the full face (white), and segments 2 (light orange) and 3 (ice blue). The histogram arranged on the left side represents the number of lead SNPs reaching their lowest p-value in each segment, colored by quadrant, with the US-driven meta-analysis results on the outside circle and the UK-driven meta-analysis results on the inside circle. In the center, the first three levels of the facial segmentation [segments 1 - 7], also colored to match with the quadrants on the left. On the right, a Miami plot of the US-driven meta-analysis p-values on the outside and the UK-driven meta-analysis p-values on the inside, with chromosomes colored and labeled. P-values are -log10 scaled (range: [0-80]). The red line represents the genome-wide significance threshold (p = 5 x 108) and the black line represents the study-wide threshold (p = 6.25 x 1010). Created using Circos v0.69-8101.



Multivariate phenotyping and meta-analysis framework


Чтобы исследовать лицевые вариации на глобальной и локальной шкале, мы начали со сканирования 3D лицевых структур, после чего мы картировали плотность ячеек сети из гомологичных вершин10. Затем мы использовали управляемый данными подход лицевой сегментации, определяемый группировками верхушек, которые строго коррелировали с используемым иерархическим спектральным кластрированием9. Конфигурации каждого из возникающих в результате 63 сегментов затем независимо подвергали анализу Generalized Procrustes, после чего анализировали принципиальные компоненты в сочетании с параллельны анализом отлавливания главных фенотипических вариаций в каждом лицевом сегменте11 (Fig. S1). Внутри каждого сегмента вместо a priori выбора интересующих принципиальных компонент (PCs), мы использовали канонический анализ корреляций (CCA), чтобы сначала идентифицировать линейную комбинацию компонентов максимально коррелирующих с SNP, в условиях аддитивной генетической модели, в идентификационной когорте (т. н. комбинация PCs "фенотипических признаков"). Затем когорта после верификации проецировалась на на каждый из этих изучаемых признаков, создавая одномерные фенотипические переменные, которые затем тестировали на предмет генотип-фенотипических ассоциаций. Идентификация и верификация p-значений затем подвергалась метаанализу с использованием метода Stouffer’s12,13. Весь процесс затем повторялся, модуляцию базы данных использовали для идентификации и верификации, в результате это приводило к двум наборам данных p-значений мета-анализа после каждой перемены идентификации и верификации (pMETA-US и pMETA-UK; Fig. S2).
Мы впервые оценили степень, с которой изменчивость в каждом лицевом сегменте обладает одними и теми же паттернами генетических ассоциаций в зависимости от генома путем вычислений Spearman корреляции среди всех результатов генетических ассоциаций для каждой пары лицевых сегментов. Затем мы использовали эти парные корреляции, которые мы верифицировали, оказались не связанными с неравновесным сцеплением или по всему геному, или с геномными достоверными SNPs (Fig. S3), как в иерархическом кластере лицевых сегментов, так и в видимых между сегментами корреляциях (Fig. S4). Эти анализы выявили два ключевых признака паттернов глобальной ассоциации. Во-первых, корреляции были наивысшими между сегментами одного и того же лицевого квадранта (т.e. губы, нос, нижняя часть лица, верхняя часть лица), оценка иерархического образования кластеров использовала первоначально определенные сегменты. Объединение в кластеры лицевых сегментов базируется на результатах генетических ассоциаций, полученных на четырех основных кластерах, каждый соответствовал сегментам одного и того же квадранта полярной дендрограммы (Fig. S5). Во-вторых, несмотря на значительное сходство внутри квадранта, имеются заметные корреляции между группами сегментов из разных квадрантов. Некоторые и з этих специфических корреляций отражают тесную физическую близость сегментов в разных квадрантах (напр., сегмент 51-19; Fig. S4), но некоторые корреляции, по-видимому, отражают общее эмбриологическое происхрождение группы сегментов. В частности, сегменты, представляющие нос (Quadrant II) и верхнюю часть лица (Quadrant IV) образуют совместный кластер, а сегменты, представлющие губы (Quadrant I) и нижней части лица (Quadrant III) образуют совместный кластер (Fig. S5). Квадранты II и IV вместе почти соответствуют фронто-назальным возвышениям, которые появляются раньше в развитии, чем мандибулярное и максиллярное возвышения, которые соответствуют Quadrants I и III14. Итак, эти результаты показывают, что иерархическое призрачное (spectral) образование кластеров лица базируется на структурных корреляциях, эффективно участвующих в передаче подлежащих генетических сигналов в биологически когерентные группы.
В целом мы идентифицировали 17612 SNPs с p-значениями (pMETA-US и/или pMETA-UK) ниже, чем геномный порог (p ≤ 5 x 10-8) и 11319 SNPs с p-значениями ниже, чем изученный Bonferroni порог (p ≤ 6.25 x 10-10)(Fig. S6). Для каждого пика мы определяли SNP с наинизшим p-значением для всех лицевых сегментов, как "lead SNP," это очистило наши результаты до 218 лидирующих SNPs, все ниже геномного (genome-wide) порога. Из них, 203 обнаруживали устойчивые эффекты на фенотипические признаки, идентифицированные при US- и UK-driven мета-анализе в лицевых сегментах с наинизшими p-значениями для таких SNP (Fig 1; Table S3). Сходство признаков тестировали с использованием регрессии наклона каждого из фенотипических признаков, обнаруженных на стадии идентификации для каждой permutation, при этом результаты выглядели довольно сходными, если они были ниже false discovery величины p ≤ 3.66 x 10-2. Результаты нашего мета-анализа оказались двойными. Во-первых, p-значения мета-анализа облегчают статистические доказательства ассоциации между SNPs и этими обнаруженными признаками. Кроме того, для каждого SNP и в каждом сегменте, мы оказались способными получить данные, чтобы управлять идентификацией фенотипических признаков большинства, ассоциированных с таковыми SNP в сегменте. Это открыло возможность установить, что SNPs могут иметь ассоциации со многими разными признаками в сегментах, что позволило нам лучше описать генетическое влияние на морфологию лица человека.

Genes near lead SNPs are enriched for both craniofacial and limb development


Используя FUMA15 и GREAT16 анализы, мы установи ли, что гены, расположенные внутри 500 kb лидирующих SNPs оказались сильно используемые для процессов и фенотипов, ассоциированных с черепно-лицевым развитием и морфогенезом у людей и мышей (Fig. S7A). Значительно часто фенотипическим отклонением у людей оказываются оро-фациальные расщепления, указывающие на существенные перекрывания между генами, участвующими в нормальной изменчивости лица и теми, что обычно вызывают врожденные черепно-лицевые дефекты у людей. Более того, многие окружающие гены в отношении которых ведущие SNPs были аннотированы , как известно, участвуют в путях, имеющих отношение черепно-лицевому развитию, такие как пути передачи сигналов WNT и TGFB (Fig. S7B). Наши GWAS сигналы были также часты в процессах, ассоциированных с развитием конечностей и родственными фенотипами, подчеркивая общность генетической архитектуры между лицом и конечностями (Fig. S7A). Количество генов вблизи GWAS локусов (напр. Dlx гомеообоксные гены, BMPs, и FGFR2) обладают хорошо известными ролями в развитии конечностей17. Эти находки были также подтверждены большим числом синдромов у людей с нарушениями лица и конечностей18. Пики лицевых GWAS встречаются часто в энхансерах, специфичным для типов клеток, которые участвуют во временной шкале лицевого развития.
Чтобы оценить возможные типы клеток и онтогенетические временные точки, в которых наши GWAS регионы активны, мы использовали эпигенетическое картирование баз данных, полученных от человеческих клеток краниального нервного гребня (CNCCs) и др. типов клеток, имеющих отношение а эмбриональному развитию. Чтобы измерять активность, мы анализировали ChIP-seq сигналы ацетилирование гистона H3 по лизину K27 (H3K27ac), который является маркером промоторов транскрипционно активных генов и активирует дистальные энхансеры19,20. Мы скомбинировали H3K27ac ChIP-seq сигналы от приблизительно 100 разного типа клеток и тканей, включая CNCCs, плодные и взрослые остеобласты, хондроциты, происходящие из мезенхимных стволовых клеток, а также выделенные эмбриональные черепно-лицевые ткани (Carnegie stages 13-20). Как CNCCs, так и черепно-лицевые ткани обнаруживали нацвысшие уровни сигналов H3K27ac вблизи 203 ведущих SNPs, тогда как не было обнаружено сигналов H3K27ac у 203 случайно выбранных SNPs, сходных по аллельной частоте и расстоянию от ближайшего гена (Fig. 2A). Эти наблюдения согласуются с эмбриональным происхождением лицевых вариаций у людей вдоль временной оси лицевого развития, тогда как CNCCs представляли раннюю временную точку в лицевом развитии, а черепно-лицевые ткани представляли все более поздние временные точки.

Fig. 2. Regions near the 203 lead SNPs are enriched for enhancers preferentially active in cranial neural crest cells and embryonic craniofacial tissue. (A) Each boxplot represents the distribution of H3K27ac signal in 20 kb regions around the 203 lead SNPs (top) or 203 random SNPs (bottom) in one sample, with cranial neural crest cells and embryonic craniofacial tissue highlighted in blue and orange, respectively. For each class of regulatory element in either cranial neural crest cells (B) or embryonic craniofacial tissue (C), the number of elements within 10 kb of the 203 lead SNPs was compared to the number within 10 kb of 203 random SNPs by Fisher’s exact test. Points represent estimated odds ratio and 95% confidence intervals. Asterisk (*) indicates any adjusted p-value < 0.05. For embryonic craniofacial tissue, enrichments were calculated for each Carnegie stage separately, as Wilderman et al.22 performed chromatin state segmentation for each stage separately. Descriptions of mnemonics for significantly enriched or depleted chromHMM states are as follows: EnhA2, active enhancer 2; EnhAF, active enhancer flank; EnhW2, weak enhancer 2; Quies, quiescent/low; Het, heterochromatin. Descriptions of all mnemonics can be found at: https://egg2.wustl.edu/roadmap/web_portal/imputed.html#chr_imp.

H3K27ac маркирует активность кодирующих и некодирующих элементов; это позволяет делать отличия между двумя исследуемыми сигналами хроматина в CNCCs и эмбрионральных черепно-лицевых тканях более детально, используя ChIP-seq данные в качестве дополнительных меток хроматина и транскрипционные факторы для любого типа клеток21,22. Как в CNCCs, так и в черепно-лицевой ткани на всех исследованных стадиях развития , кандидаты на роль регуляторных регионов вблизи 203 ведущих SNPs были достоверно обогащены предсказанными энхансерами (CNCCs: сильные и промежуточные энхансеры; черепно-лицевая ткань: активные, фланговые и слабые энхансеры), но не промоторами (Fig. 2B and C). Это стало особенно интригующим результатом, т.к. недавние доказательства описывали действие множественных энхансеров, каждый из которых обнаруживается в самостоятельной ткани или в специфическое время при модулировании уровней экспрессии, влияющих на черепно-лицевое развитие23. Т.о., посредство промоторов может быть столь же важно для развития, увеличение количества наших ведущих SNPs в предсказанных энхансерных регионах имеет значение столь же важное как и энхансеры в регуляции изменчивости лица в нормальных пределах.
Поскольку CNCCs и черепно-лицевые ткани обнаруживают очень сильную концентрацию, когда рассматриваются 203 ведущих SNPs вместе, мы полагаем, что специфичные для типов клеток паттерны активности могут быть использованы в дальнейшем для подразделения 203 ведущих SNPs. Поэтому мы объединили 203 ведущих SNPs в 6 самостоятельные группы на базе H3K27ac сигнала среди всех ~100 типов клеток. Как и ожидалось, наибольшая фракция ведущих SNPs обнаруживала специфическую активность в CNCCs и черепно-лицевых тканях (напр. cluster 5; Fig. 3); интересно однако, что некоторые SNPs обнаруживали преимущественную активность или в CNCCs или черепно-лицевой ткани (напр. clusters 1 и 2; Fig. 3). Наивысшая специфичность для CNCCs могла возникать из-за того, CNCCs составляют относительно небольшую пропорцию клеток, присутствующих в черепно-лицевой ткани на стадии Carnegie 13-20, тогда как наивысшая специфичность для черепно-лицевой ткани могла быть обусловлена активностью в будущих дифференцированных типах клеток лица. Дополнения к нашим более ранним результатам показали, что некоторые гены вблизи наших GWAS пиках участвуют в развитии как лица, так и конечностей, субнабор SNPs обнаруживает преимущественную активность, кроме того, в проиходящих из in vitro типах клеток, имеющих отношение к лицу и остаткам склетной системы, включая остеобласты, хондроциты, дифференцирующиеся в скелетные мышцы, миобласты, фибробласты и кератиноциты (напр. cluster 3; Fig. 3). В качестве иллюстрации, ведущий SNP rs1367228 расположен внутри последовательности связывающей транскрипционный фактор в интроне гена EFEMP1 (2p16.1) и msk ассоциирован в этом исследовании с лицевыми вариациями вокруг глазниц и скулы и была продемонстрирована преимущественная активность в линиях клеток плодных остеобластов и происходящих из MSC хондроцитов (Fig. S9). Вместе экспрессии результаты подтверждают, что генетическая изменчивость лежит в основе лицевой морфологии и оперирует посредством активности энхансеров во всех множественных типах клеток в ходе всего времени эмбрионального развития лица.

Fig. 3. Activity of 203 peak SNPs in all cell-types studied. H3K27ac signal calculation and k-means clustering of SNPs were performed as described in Methods. Average linkage clustering on Euclidean distances was performed both within each of the 6 row clusters and for all columns. SNPs in cluster are active primarily in CNCCs, representing activity in an early time point in development. Cluster 2, 3, and 5 represent SNPs likely active across development, displaying activity in both CNCCs and craniofacial tissue, with SNPs in clusters 2 and 3 additionally active across many cell types and tissues, suggesting broad roles in general development.



Known and novel loci and SNP effects on multiple facial phenotypes


Мы идентифицировали 86 GWAS пиков, которые перекрываются с предыдущими результатами исследований ассоциаций лицевых фенотипов в нормальных пределах, мы наблюдали новые детали, предоставившие больше ньюансов для понимания подлежащей генетической архитектуры. Напр., варианты в локусе TBX15/WARS2 (1p12) ранее были описаны, как ассоциирующие с лобным выпячиванием9 и автоматически с ямкой на подбородке7, указывая, что этот локус оказывает множественные пространственно разделенные эффекты на лице. В нашем современном анализе мы наблюдали тоже самое влияние на морфологию лба (ведущий SNP rs3936018, расположен в промоторном регионе WARS2), как это было обнаружено и ранее (Fig. 4)9. Интересно, что этот ведущий SNP перекрывается своим местоположением с rs12027501, но каждый SNP связан с отдельным кластером неравновесного сцепления, а rs12027501 оказался наиболее важным в сегменте 48, представляющим часть щек (Fig. 4). Мы также обнаружили сиглнал приблизительно на 275kb выше TBX15 (rs7513680), которые оказался наиболее сильно ассоциирован с морфологией в сегменте 51, представляющим нижнюю часть области щёк в углах рта (Fig. 4). Наконец, др. GWAS пик присутствует приблизительно на 301 kb ниже WARS2 (rs17023457) с влиянием на ту же самую область посредством двух пиков, удаленных приблизительно на 725 kb (Fig. 4). Это результаты, c помощью которых, мы были способны точно определить эффект SNP даже внутри сложной геномной области, что подчеркивает пригодность использование иерархического кластрирования сегментов лица. Мы обнаружили 24 таких локусов со множественными пиками, каждый из которых влияет на разный лицевой фенотип, указывая тем самым, что эти варианты могут перекрываться с или испытывать влияние со стороны регуляторных элементов, которые затрагивают лицо очень специфическим способом (Table S4, Fig. S10).

Fig. 4. TBX15-WARS2 multi-peak locus. LocusZoom plots and facial effects for four association signals near the TBX15-WARS2 locus. Clustering based on linkage disequilibrium was performed to separate independent signals, resulting in the identification of four lead SNPs. Color for each SNPs is based on cluster association, with saturation indicating linkage disequilibrium with the lead SNP. SNPs represented by diamonds are the lead SNPs also present in the 1000G Phase 3 dataset; SNPs represented by circles are adjacent SNPs also present in the 1000G Phase 3 dataset; SNPs represented by asterisks are those not present in the 1000G Phase 3 dataset. For the segment in which each lead SNP had its lowest effect, we plot the facial effects for the lead SNPs reaching significance in that segment as the normal displacement (displacement in the direction normal to the facial surface) in each quasi-landmark going from minor to major allele, with red colored areas shifting outward while blue colored areas shift inwards.

Все 64 GWAS пика, наблюдаемые в нашем анализе, расположены предполагаемые черепно-лицевые гены (участвующие в уродствах у людей или животных моделей), но которые пока не были выявлены в GWAS для лицевой морфологии в нормальных пределах. Напр., MSX1 участвует в оро-фациальных расщеплениях у людей24,25 и мышей25,26, а также широко экспрессируются в тканях губ и десен во время развития27. Мы наблюдали два самостоятельных пика в локусе MSX1 (4p16.2), один приблизительрно на 55 kb выше MSX1 с выраженным эффектом на боковые части верхних губ (ведущий SNP rs13117653) и второй пик примерно 323 kb выше MSX1 и расположенный в интроне STX18, участвующий в боковых частях нижних губ и нижней челюсти (ведущий SNP rs3910659; Fig. S11). "nn результат может указывать на потенциальную роль STX18 в черепно-лицевой развитии или предоставляет дальнейшие доказательства, что эффекты, наблюдаемые в нашей выборке людей могут быть результатом действиях множественных регуляторных элементов внутри одиночного локуса. В подтверждение этому, Attanasio et al., продемонстрировали, что активность Msx1 во второй фарингеальной дуге и максиллярном выросте на ст. e11.5 эмбрионов воспроизводится за счет комбинированной активности двух отдельных энхансеров, расположенных на расстоянии 1 и 235 kb выше промотора гена23.
Наши GWAS кроме того выявили 53 пика в локусах, обладающих генами с ранее неизвестной ролью в черепно-лицевом развитии или болезнях, посредством многих участвующих генов в этих локусах, которые , как известно, обладают общей ролью в процессах развития, критической для собственно морфогенеза. Напр., DACT1 определен как антагонист для пути передачи сигналов WNT, который , как известно, участвует в черепно-лицевом развитии28, хотя DACT1 ранее не был ассоциирован с морфологией лица. DACT1 в основном исследовался как участник в раке желудка, однако было также установлено, что онн подавляет отделение нейральных стволовых клеток, это еще сильнее подкрепляет участие его в развитии лица29. В данном исследовании локус DACT1 был ассоциирован с морфологей нижней челюсти, в частности с регионом подбородка (Fig. S11). DACT1, и др 52 сигнала ранее не были ассоциированы с черепно-лицевой морфологией, и являются многообещающими новыми канидатами на потенциальные роли в лицевой морфологии.
Принимая во внимание близость наших GWAS к энхансерам и понимая, что некоторые регионы генома известны своим влиянием на множественные фенотипы, мы полагаем, что некоторые ведущие SNPs могут иметь дополнительные ассоциации с лицевыми фенотипическими признаками помимо тех, которые изначально были связаны во время CCA. Чтобы проверить это мы проверяли парные линейные регрессии между каждым из лицевых фенотипических признаков, выявляемых во время ступени CCA и генотипами всех остальных ведущих SNPs (см. cross-peak ассоциации вMethods; Fig. S12), и выявили 13 SNPs с ассоциациями со многими фенотипическими признаками по многим квадрантам (Table S5). Напр., rs1370926, мобильный фактор, связывающий сайт, расположенный на 34 kb выше PAX3 (базируясь на Ensembl GRCh37 аннотации30), обнаруживает ассоциации с фенотипическими признаками в сегментах, имеющих отношение к морфологии носа (Quadrant II; сегменты 5, 10, 11, 20, 22, 23, 40, 44, 45 и 47), верхней губы (quadrant I; сегменты 9, 36), лба (Quadrant IV; сегмент 28), и глаз (Quadrant IV; сегмент 60). Это указывает на ассоциацию между PAX3 и многими лицевыми регионами, это согласуется с предыдущими находками GWAS , указывающими на участие PAX3 в общей морфологии лица, не зависимо от метода фенотипирования или выборки7,31–34. Эти 13 SNPs могут обнаруживать ассоциации во множественных сегментах благодаря близости к последовательностям энхансеров, экспансивными эффектам на многие клеточные популяции или раннее действие в развитии лица, вообще-то во многих лицевых выпячиваниях, которые затем распространяются вдоль лицевых регионов с низкой фенотипической корреляцией в нашей выборке (т.e. в разных лицевых сегментах). PAX3, напр., играет ключевую роль в раннем развитии за счет влияния на индукцию нервного гребня и пролиферацию черепно-лицевых клеток нервного гребня35. 7 из этих SNPs могут быть сгруппированы на базе H3K27ac сигнала в кластерах, которые обладают наивысшей активностью в CNCCs и черепно-лицевых тканях (clusters 1, 2 и 3; Fig. 3). Более высокая активность в черепно-лицевой ткани согласуется с эффектами во многих частях лица, из-за их более высокой активности внутри ткани с таким количеством типов клеток, которое характерно скорее для лица эмбриона благодаря тому, что эти SNPs активны во многих типах клеток, имеющих отношение к изменчивости лица.

Genetic interactions impacting facial variation


Учитывая сложность человеческого лица и его компонентов, становится ясно, что генетическая архитектура вклада в изменчивость лица включает не только геномные регионы, оказывающие воздействие на многие части лица, как было описано выше, но и также группы геномных регионов, вносящие вклад в один и тот же лицевой признак, вообще-то действуют в сходных типах клеток или ли на определенные взаимодействия между вариантами. Чтобы лучше анализировать возникающие эффекты множественных генотипов на признаки лица, мы использовали structural equation modeling (SEM) , чтобы очистить наше понимание какая из групп вариантов лучше всего объясняет наблюдаемую изменчивость в каждом лицевом сегменте. SEM является многомерным статистическиим анализом техники, которая обладает способностью анализировать структурные взаимоотношения между измеряемыми переменными (напр. генетическими вариантами и ковариантами) и латентными конструкциями (одномерными фенотипами, происходящими из PCs анализируемого лицевого сегмента). Это было проделано повторяющимся способом, приводящем в конечном счете к 50 SEM моделям (соответствующим 50 лицевым сегментам), которые успешно конвергировали и были оценены прекрасно подходящие, базируясь на рекомендованной модели сравнения параметров (Table S6). Для каждой из этих 50 моделей, исход включал одномерную латентную переменную и список вариантов, ранжированных по их подсчитанному вкладу в эту переменную (между 1 и 60, в зависимости от модели), подчеркивая полигенную природу лицевой изменчивости, определяемую c помощью латентной переменной. Важно, что SNPs , которые существенным образом объясняют переменную в одном и том же сегменте, обнаруживают высокие корреляции cross-sample H3K27ac активности, чем при сравнении недостоверных SNPs для этого сегмента, указывая, что SEM-очищенный список SNPs для каждого сегмента, скорее всего, тех, что сходны или пространственной или временной клеточной активностью (Fig. S13). Далее мы анализировали эти списки очищенных SNP чтобы определить генетические взаимодействия путем оценки для каждой из 50 моделей, в зависимости или от взаимодействий между генотипами, увеличивающими или снижающими медианное распределение латентных переменных. 4 комбинации SNP обнаруживали достоверные парные эпистатические взаимодействия (Table 1; Fig. 5; Fig. S14). Напр., rs76244841 (PRDM16 ассоциированный) и rs62443772 (GLI3 ассоциированный) , как было установлено, обнаруживают значителльное взаимодействие в лицевым сегментом 9, который покрывает межчелюстные (premaxillary) мягкие ткани от основания центрального столба (columella) до углов рта (oral commissure). PRDM16 кодирует транскрипционный фактор цинковые пальчики36,37 и, как было установлено, затрагивает процесс подъема нёбных пластинок путем репрессии передачи сигналов TGFβ38,39. GLI3 кодирует активатор транскрипции и репрессор пути передачи сигналов sonic hedgehog (Shh), который играет роль в развитии конечностей40–42. Кроме того, получены доказательства, что нулевые мутанты Gli3 у мышей обеспечивают фенотип широкого носа43 геномное сканирование ранее показало, что GLI3 участвует в формировании морфологии носа33. Связь между PRDM16 и GLI3 проявляется в их взаимодействии посредством SUFU посредника. Многие исследования, проведенные на дрозофиле получили доказательства, что тетрамерный сигнальный комплекс Hedgehog представлен Fu, Ci (ортолог PRDM16), Cos2 и Su(fu) (ортолог SUFU), предоставляет доказательства, что Su(fu) соединяется непосредственно с Ci44–46. SUFU , как было установлено, также обеспечивает фосфорилирование GLI3 посредством GSK347 и взаимодействует с GLI1-3 zinc-finger ДНК-связывающими белками48,49. В целом эти результаты показывают, что статистические доказательства групп SNP, влияющих на полигенную лицевую изменчивость, идентифицируемую посредством SEM, и четкие варианты взаимодействий, подтвержденные эпистатическим анализом, являются потенциально представляющими действительные биологические взамоотношения, но они д. быть подтверждены последующмими исследованиями.

Table 1.Four SNPs with evidence of epistatic interactions. For each of the 50 segments with a refined SEM model, we used the latent variables and SNP lists to test for evidence of epistasis. For the four SNP pairs with significant evidence of epistatic interactions, this table lists the epistasis p-value, rsID, GRCH37 location, and gene annotation. The phenotypic and marginal distributions for the pairs are depicted as boxplots in Fig. 5 and Fig. S14. Fig. 5. Phenotypic and marginal distributions for rs62443772 - rs76244841 epistatic pair Plotted in the first column and last row are the marginal phenotypic distributions of the genotypes, which shows the phenotypic distribution that would occur if the two genotypes were acting independently. The median phenotype based on the two genotype distributions (blue dashed lines on the colored plots) was also calculated for each diplotype. The observed diplotype median (black line on the colored plots) was compared to the expected diplotype median (blue dashed lines on the colored blots) via Mood’s Median test95 with one degree of freedom. The resulting log transformed p-value was used to color the boxplots to illustrate significance, unless the difference was non-significant (i.e p > 0.05; log(p) < 1.30), in which the color was automatically set to grey. Within each colored boxplot is the untransformed Mood’s median p-value as well as the number of individuals used for significance testing. The phenotypic distribution facial image in the lower left corner was constructed by comparing the principal components.



Conclusions


Итак, полученные результаты иллюстрируют путь для изучения скоординированных процессов в сложных морфологических структурах, подобных лицу человека, на более глубоком уровне, чем одиночные ассоциации между генотипом и одномерным фенотипом. Имея идентифицированными очень большие количества сигналов, ассоциированных с морфологией лица, включая смесь известных и новых локусов, мы кроме того попытались получше описать процессы и взаимодействия, посредством которых принимают участие геномные регионы и могут влиять на лицо. Геномные регионы, идентифицированные в данном исследовании, скорее всего, активны в течение всего периода времени развития лица, что доказывается предпочтительной активностью H3K27ac в клетках, представляющих ранние временные точки (CNCCs) и поступательно более поздние временные точки (черепно-лицевые ткани), и, скорее всего, влияющие на морфолгию лица посредством модулирования активности вблизи энхансеров. Наши результаты, кроме того, иллюстрируют, что мы теперь способны исследовать ранние раздельные онтогенетические процессы, связанные со множественными сложными структурами, в частности развитие лица и конечностей. Это подтверждается генами вблизи наших ведущих SNPs, влияющих на паттерны и процессы, имеющие отношение как к анатомическим регионам, так и к образованию кластеров некоторых ведущих SNPs посредством предпочтительной активности H3K27ac в типах клеток, важных как для лица, так и скелета. Наконец, благодаря знанию сложных фенотипов, подобных лицу, являющихся полигенными, мы теперь впервые точно описали очищенные группы SNPs, влияющие на одни и те же аспекты изменчивости лица в каждом лицевом сегменте. Эти группы показали скоррелированные паттерны активности H3K27ac, а 4 пары SNPs предоставили доказательства эпистатических взаимодействий, влияющих на изменчивость лица. Эти результаты иллюстрируют потенциал биоинформционной техники, подчеркивая, что пространственные и временные группировки SNPs и связи между SNPs, представляющие основную ступень в направлении нашей способности характеризовать полигенную генетическую архитектуру сложных морфологических структур, подобных лицу. Мы предвидим, что наши результаты будут пригодны для исследователей модельных организмов и для подходов к клеточной экспрессии в будущих функциональных исследованиях для уточнения расположения, времени и связей, которые мы выявили в данном исследовани и которые помогут лучше понять биологические силы, которые формируют морфологические формы у человека и животных.
Итак, лицо человека сложное и состоящее из множества частей, а характеризация его генетической архитектуры остается интригующей проблемой. Используя GWAS для многомерных фенотипических форм, мы идентифицировали 203 геномных региона, связанных с нормальной изменчивостью лица, 117 из них были новыми. Ассоциированные регионы обогащены как генами, имеющими отношение к морфогенезу черепа и лица, а также конечностей, так и энхансерной активностью в клетках краниального нервного гребня и черепно-лицевых тканях. Генетические варианты группируются по их вкладу в сходные аспекты изменчивости лица, демонстрируя высокую внутригрупповую корреляцию активности энхансеров, а 4 пары SNP предоставили доказательства эпистаза, указывая на потенциальные скоординированные действия вариантов внутри одного итого же типа клеток или тканей. Следовательно, наш анализ предоставил новую информацию для понимания того, как сложные морфологические признаки формируются c помощью как индивидуальных, так и скоординированных генетических действий.