Посещений:
Законсервированные Не-Генные Последовательности

Функциональное Значение
CONSERVED NON-GENIC SEQUENCES — AN UNEXPECTED FEATURE OF MAMMALIAN GENOMES
Emmanouil T. Dermitzakis , Alexandre Reymond, Stylianos E. Antonarakis
Nature Reviews Genetics 6, No. 2, 151-157 (2005); doi:10.1038/nrg1527
Mammalian genomes contain highly conserved sequences that are not functionally transcribed. These sequences are single copy and comprise approximately 1–2% of the human genome. Evolutionary analysis strongly supports their functional conservation, although their potentially diverse, functional attributes remain unknown. It is likely that genomic variation in conserved non-genic sequences is associated with phenotypic variability and human disorders. So how might their function and contribution to human disorders be examined?


Рис.1.
 | Distribution of conserved non-genic sequences in the human genome.


Рис.2.
 | Conservation of conserved non-genic sequences and genes in mammals.


Рис.3.
 | Long-distance regulatory conserved non-genic sequences and mutation.

Табл.1 Numbers and characteristics of exons, conserved exons and CNGs for each human chromosome

Links

DATABASES
Entrez: LMBR1 | SHH | Sox9 | POU3F4

FURTHER INFORMATION
National Human Genome Research Institute | Human Genome Project


Одной из основных целей Human Genome Project было идентифицировать все функциональные элементы в геноме человека. Первоначально предполагалось, что большая часть ДНК человека не имеет функции и что большая часть функциональных ДНК находится внутри кодирующих областей. Даже когда геномные последовательности человека наконец стали доступны идентификация всех функциональных геномных элементов (включая сами гены) осталась затрудненной.
Геномные сравнения часто были использованы для идентификации функциональных не-кодирующих последовательностей; в основном регуляторных регионов. исследователи Drosophila недавно предприняли попытку идентифицировать потенциальные регуляторные области на базе консервации между удаленными видами Drosophila, такими как Drosophila melanogaster и Drosophila virilis1,2. Несколько попыток было сделано на млекопитающих, в частности на мышах, чтобы идентифицировать области с регуляторными функциями посредством консервативных последовательностей3. Успешность этих подходов привела к предположению, что сравнение геномов человека и мыши д. позволить выявить большинство регуляторных областей4-6.
Недавнее сравнение геномов человека и мыши выявило много последовательностей, которые остались консервативными в течение более 70-100 миллионов лет7-10 - приблизительное время разделения двух видов млекопитающих. Некоторые из этих последовательностей соответствуют кодирующим генам или не-кодирующим РНК; однако, почти две трети из них вряд ли продуцируют функциональные транскрипты. Эти последовательности представляют собой новую категорию элементов с неизвестной на сегодня функцией, которые коллективно обозначены как conserved non-genic sequences (CNGs).

What is a CNG?


Первоначально специфический критерий для определения функционально консервативных последовательностей был предложен - в ранних исследованиях, для последовательностей, чтобы квалифицировать как функционально консервативные те, что имеют, по крайней мере, 70% идентичных или, по крайней мере, более 100 п.н. непрерываемых выверенных последовательностей человека и мыши4,7,11,12. Хотя очевидно, что эти критерии произвольны, но они выше среднего уровня консервации нейтральных последовательностей у человека и мыши (только 40% мышиного генома м.б. can приравнено к человеческому геному, из этого 67.2% нуклеотидов идентичны13). Количество последовательностей, отобранных по этому критерию представило около 1% генома человека. Исследования, использовавшие этот критерий, идентифицировали функционально важные геномные последовательности, такие как новые гены в Williams-Beuren области хромосомы 7 и энхансер внутри interleukin кластера11,12. Критерий непрерываемого сходства выявляет склонность в отношении идентификации кодирующих последовательностей, которые в целом ограничены гибкостью в изменчивости длины из-за потребности поддерживать ORF. Тот факт, что даже несмотря на эти тенденции большинство законсервированных последовательностей являются не генными, указывает на то, что их обилие даже выше, чем м. подсчитать сегодня.
Имеются альтернативные методы для определения таких консервативных последовательностей, которые не принимают во внимание длину и/или специфический уровень консервации14, но во всех случаях остается фактом, что большинство избирательно ограниченных нуклеотидов не принадлежат генетическим последовательностям8. Мы обозначили эти последовательности как CNGs, чтобы указать на то, что эти консервативные последовательности не являются генными; они не продуцируют транскриптов (кодирующих или не-кодирующих) с функциональными свойствами на уровне РНК или белка. Др. из предложенных названий - conserved non-coding sequences15 (сокращенно CNSs или CNCs), multiple species conserved sequences16 (MCSs), highly conserved regions4 (HCRs) или non-coding conserved regions (NCCRs) и каждое из этих названий каким-то образом отражает характеристики этих последовательностей.
Первые анализы целых хромосом на CNGs проведены с использованием human chromosome 21 (HSA21) (Ref. 7). Не-генная природа большинства из 2262 CNGs этой хромосомы была подтверждена компьютерными и эволюционными подходами, также как и экспериментальными тестированием потенциальных моделей генов. В частности, паттерны замен между человеком и мышью во всех потенциальных ORFs показали, что CNGs не обнаруживают каких-либо пристрастий к избыточным предположительно синонимным заменам. Более того, кумулятивный анализ различных кусков вычислительных и экспериментальных доказательств (по человеческим и мышиным ESTs, генам, экзонам и не-кодирующим РНК прогнозам и геномным массивам) показал, что CNGs вряд ли транскрибируются. Также прямое экспериментальное тестирование с обратной transcriptase PCR (RT-PCR) выявило немного продуктов7 (только 2 из 123 моделей оказались успешными).
Имеется приблизительно 327000 CNGs (по крайней мере, со 100 п.н. непрерываемых совпадений и , по крайней мере, с 70% идентичных нуклеотидов) в геноме человека, как показало сравнение геномов человек-мышь, из них 65% являются межгенными и 35% являются интронными, исходя из современного описания генов, репродуцированного GALA (Genome Alignment and Annotation database)17 (Табл. 1). Удивительно, но эти последовательности не являются повторяющимися и не обнаруживают общих признаков, которые м.б. быть идентифицированы при сравнении первичных последовательностей. BLAST поиск по всем CNGs и снова по всему геному человека оказался не в состоянии идентифицировать существенных совпадений (matches) за исключением случая старых паралогов, которые явились результатом сегментных дупликаций. (Это остается верным даже, если консервативные последовательности определяли по разным критериям, таким как описанные Margulies et al.14, это позволяет заключить, чтt 99.6% из CNGs не имеют существенных совпадений с чем-либо в геноме человека.) Идентифицированные наборы CNGs м. также включать некоторые последовательности, которые нейтрально подвержены (evolving) низким скоростям замен (из-за низкой скорости мутирования или более эффективных репаративных механизмов). Однако, независимо от метода селекции, с любым количеством видов лишь 1% или меньше геном млекопитающих попадает в эту выборку. Следовательно, очевидно, что данный критерий не вызывает избыточной оценки количества функциональной ДНК и дает в результате высокий уровень обогащения для функциональных элементов. Более того, исследования нуклеотидной изменчивости в CNGs показывают, что имеются даже последовательности, которые консервативны во всем филогенетическом древе млекопитающих, они м. б. изменчивы на нуклеотидном уровне в человеческих популяциях, это ослабляет аргумент о низкой скорости мутирования (E.T.D. and S.E.A., unpublished observations).

Where in the genome?


Геномная локализация м. дать важные указания о роли CNGs. Если функция CNG осуществляется благодаря их близости к кодирующим областям, то следует ожидать, что CNGs будут формировать кластеры вокруг генов. Фактически наши последние исследования, сконцентрированные на HSA21 (Ref. 18), показали, что распределение CNGs негативно скоррелировано с распределением генов - они в основном занимают области, которые не заняты генами. Внутри межгенных последовательностей CNGs, по-видимому, распределены униформно. Измерения селективных ограничений CNGs, таких как уровни консервации и образование кластеров замен, не коррелируют с расстоянием от генов или с локализацией в богатых генами или бедных генами областях, в межгенных или интронных последовательностях. Распределение CNGs по типу их независимости от генной локализации согласуется с удаленными дистанционными или независимыми от расстояний взаимодействиями и/или с ролью CNGs, которая не связана с непосредственным контролем генной экспрессии.
Такого типа анализ был проведен для всех CNGs в геноме человека. Наивысшие показатели CNGs внутри областей бедных генами указывают на то, что все хромосомные области одинаково селективно закреплены и , следовательно, не являются функционально 'необитаемыми пустынями' геноме (Рис. 1).
Паттерн распределения, независимый от локализации генов не обнаруживается при изучении небольших фракций CNGs, присутствующих в геномах людей и мышей19 и/или высоко законсервирован среди видов позвоночных (людей, мышей, pufferfish и цыплят). Установлено, что эти ультра-законсервированные последовательности образуют кластеры вокруг генов, которые выполняют онтогенетическую роль19,20 и являются скорее всего регуляторными областями, участвующими в раннем развитии.

How conserved is 'conserved'?


Их уровни консервации и распределения в геноме указывают на то, что CNGs м.б. критическими для функционирования генома. Одним из способов исследовать их является изменение уровней селективной закрепленности у др. видов млекопитающих, которые более или менее удаленно связаны скорее с человеком, чем с мышами. Несколько недавних исследований анализировали распределение у множественных видов и охарактеризовали паттерн консервации CNGs. Эти исследования использовали или третий вид, обычно собак9,18,21,22 или несколько видов млекопитающих одновременно16,23,24, чтобы сделать вывод о селективном закреплении. CNGs, которые были первоначально определены как консервативные для людей и мышей, обнаружили также тенденцию высокой консервации и у более удаленных родсвенных видов, таких как слоны, утконосы и кенгуру-валлаби24 (Рис. 2). Некоторые CNGs столь же или даже более законсервированы, чем кодирующие последовательности в течение огромного эволюционного отрезка16,24,25, указывая тем самым на строгий отрицательный отбор. Эти характеристики не напоминают те, что присущи многим известным регуляторным областям, которые часто представлены избыточными протеин-связывающими мотивами и часто обнаруживают значительно меньшие уровни консервации26-28. Напр., locus control region (LCR) of β-globin не считается высоко законсервированной между видами. Несмотря на это некоторые экспериментальные результаты указывают на то, что существенная фракция CNGs м. участвовать в генной регуляции.

Evolutionary and other characteristics


Сравнение CNGs от нескольких видов и использование их филогенетических взаимоотношений м. предоставить важную информацию о паттерне замен и селективном закреплении, которые испытывают эти виды. Так было показано24, что многие CNGs имеют эволюционные характеристики, которые отличают их от кодирующих последовательностей и не-кодирующих РНК. Напр., некоторые CNGs содержат перемежающиеся короткие последовательности высокой и низкой консервации, это указывает на присутствие селективно закрепляемых сайтов связывания белка. Кроме ттго, они имеют, по-видимому, разные паттерны замены нуклеотидов относительно функционально транскрибируемых последовательностей. Margulies и др.14 предложили два метода для идентификации селективно закрепленных последовательностей, используя parsimony- или binomial-based модели, приложимые к мульти-видовым сравнениям (alignments). В случае parsimony-based модели показатель консервации подсчитывался с помощью определения минимального числа замен, необходимых, чтобы объяснить наблюдаемый уровень консервации, учитывая соотв. филогенетическое древо, и сравнивая с распределением тех же самых количеств замен, исходя из предположения нейтральной эволюции. При binomial-based модели показатель консервации подсчитывался путем определения времени дивергенции видов в сравнении со взвешенной схемой, а значимость подсчитывалась сравнением этого с четрыех-кратно degenerate сайтами (third-codon positions for which any base codes for the same amino acid). Они установили, что не все видовые сравнения одинаково хороши для идентификации CNGs (или не-кодирующих MCSs, согласно их терминологии). Напр., сравнение мышь-человек было наилучшим для идентификации CNGs, тогда как сравнение человек-курица было наилучшим для идентификации кодирующих экзонов. В целом анализ полученных данных от нескольких видов является более мощным, чем парные сравнения последовательностей. Фактически способность выявлять не-генные функционально законсервированные элементы увеличивались, чем больше использовалось видов16,23. Стало очевидным, что происходит экстенсиваная потеря некоторых из этих элементов и одной из задач является понять механизмы, с помощью которых эта потеря компенсируется.
Bejerano и др.19 недавно показали, что имеется множество последовательностей более длинных, чем 200 п.н., которые идентичны у людей и мышей. Эти последовательности в основном являются не-кодирующими и преимущественно законсервированы у людей и кур с высокими уровнями идентичности. Кроме того, они содержат меньше SNPs, что ожидается в модели случайного распределения, это указывает на то, что эти ультра-законсервированные последовательности сильно закреплены во всей филогении позвоночных. Некоторые из этих последовательностей перекрываются с хорошо известными энхансерами, поэтому возникает вопрос о структуре таких энхансеров и как они сохраняются19. Это исследование19, вместе с предыдущим24 указывает на то, что многие CNGs более законсервированы, чем белок-кодирующие последовательности в противоположность более ранним представлениям26.

Potential functional roles


Хотя мы мало знаем о функциях CNGs, разумно высказать некоторые инициальные гипотезе на базе имеющихся данных. В последнее время CNGs стали предрекать функцию регуляторных областей4-6. Гетерогенность характеристик CNG и недавние экспериментальные подходы показали, что часть CNGs, но не большинство, являются cis транскрипционными регуляторами (напр., энхансерами или сайленсерами; Рис. 3).
Возможно, что некоторые CNGs выполняют структурную роль, но её природа неясна. Недавние исследования показали, что примерно 10% CNGs м.б. областями прикрепления к матриксу29 - т.е., они м. служить в качестве последовательностей, которые регулируют конформацию хроматина благодаря специфическому связыванию определенных белков. Они м. также участвовать в межхромсомных взаимодействиях, которые осуществляются посредством белковых мостиков и которые сводят вместе хромосомы в ядре. Эта последняя гипотеза особенно интригующая. Установлено, что хромосомы занимают соё положение в ядре видо- и ткане-специфическим образом30-32. Такая организация ядра м. иметь отношение к специфическим функциональным взаимодействиям между хромосомами, которые обеспечиваются белковыми взаимодействиями, вовлекающими CNGs. М. предположить, что если такие межхромосомные взаимодействия происходят, то возможно, что CNGs м. функционировать также как регуляторные области в trans положении к генам. которые они регулируют33, способом подобным TRANSVECTION у D. melanogaster34. Эти структурные конформации наблюдаются и у млекопитающих35, но участие CNGs в этих взаимодействиях еще не установлено.
Др. возможностью является то, что, по крайней мере, некоторые CNGs выполняют функции, которые сегодня невозможно предсказать - м. существовать множество др. функций в геноме человека, о которых мы ничего не знаем. Неожиданный паттерн консервации и распределения CNGs в геноме, который не обнаруживает определенной корреляции с известными геномными функциональными единицами, согласуется с этими новыми функциями.
Существующие функциональные исследования CNGs позволяют предположить, что CNGs скорее всего являются регуляторными областями генной экспрессии. Loots et al.12 четко продемонстрировали регуляторную функцию CNG в interleukin кластере путем генерации нокаутов CNG по bacterial artifical chromosome (BAC), экспрессирующей lacZ, которая недавно была внесена в мышиный геном. Последующие исследования с использованием репортерных конструкций на клеточных линиях и у трансгенных мышей показали, что некоторые CNGs м. функционировать в качестве регуляторных областей, но имеющиеся экспериментальные методологии остаются неадекватными для выявления полной функциональности CNGs20,23,36.
Были предприняты попытки определить функцию CNGs путём делетирования 2, длиной примерно в 1-Mb, генных пустот на мышиных хромосомах 3 и 19 (Ref. 37). Эти сегменты содержат всего 1243 последовательностей, которые являются длиной >100 п.н. и >70% идентичны у человека и мыши, но не содержат каких-либо элементов, которые законсервированы у pufferfish. Мыши, гомозиготные по каждой из делеций, не обнаруживали каких-либо чрезвычайных фенотипических эффектов помимо небольших изменений в экспрессии генов, соседствующих с делециями37. Хотя это и указывает, что не все законсервированные генные пустоты в геноме млекопитающих являются функциональными, но не ясно, способны ли мы выявить все возможные фенотипические эффекты. Некоторые геномные функции являются условными в среде или генотипах из др. локусов, тогда как др. м.б. едва заметными. Чтобы понять важность этих наблюдений важно проанализировать значительное большее число делеций. Тем не менее этот эксперимент37 показал, что необходимы тщательные интерпретации селективного закрепления исходя только из консервации мышь-человек.
Возможно, что эти регуляторные CNGs являются 'low hanging fruit' - т.к. в большинстве случаев протестированы лишь немногие CNGs в отношении регуляторной функции - необходима идентификация функций большого количества др. CNGs26. Напр., Nobrega et al.20 установили, что CNGs, которые высоко консервативны у людей и pufferfish обладают регуляторными функциями, но эти последовательности представляют собой лишь наиболее законсервированные субнаборы CNGs, которые законсервированы у человека и мыши. that are conserved between human and mouse. Лишь немногие из гипотез (напр., что CNGs метят регуляторные области или некоего типа структурные элементы) м.б. протестированы экспериментально.

CNGs, phenotypic variation and disease


М. ли геномная изменчивость CNGs вноситьт вклад в фенотипичевскую изменчивость и болезни человека? Нет сообщений о величине нуклеотидной изменчивости CNG в популяциях людей. Если эволюционная консервация CNGs у млекопитающих имеет функциональное значение, то следует ожидать, что CNGs м.б. подвержены патогенетическим мутациям, которые вызывают высокую пенетрантность 'моногенных' Менделевских фенотипов или предрасположенность к сложным общим признакам24,25.
Не удивительно, что первыми примерами патогенных мутаций в дистальных регуляторных элементах были мутации в LCR генного кластера β-globin. Точки разрывов транслокаций и делеций в этом законсервированном элементе вызывали β-thalassaemia благодаря замалчиванию гена β-globin, который картируется на расстоянии 50 kb ниже LCR38,39.
Наиболее впечатляющим случаем патогенетических одно-нуклеотидных мутаций в CNGs является форма аутосомно-доминантной PREAXIAL POLYDACTYLY, обуславливаемае одиночным локусом, который картируется на хромосоме 7q36. A CNG из ~750 нуклеотидов (наз. ZRS; или ZPA (ZONE OF POLARIZING ACTIVITY) regulatory sequence) идентифирован в интроне 5 гена LMBR1 и он, по-видимому, регулирует экспрессию sonic hedgehog (SHH), который картируется в области, которая отстоит от него ~ на 1 Mb40. Идентифицированы 4 разных замены одиночных нуклеотидов с полной пенетрантностью, каждый в разной семье с преаксиальной полидактилией. Для одной из этих мутаций, было изучено более 1000 нормальных индивидов (многие из которых жили в той же деревне, что и затронутая семья) , но предполагаемая патогенная мутация никогда не обнаруживалась у здоровых индивидов. Замены происходят в нуклеотидах, которые законсервированы у двух др. видов млекопитающих и pufferfish. Кроме того, нуклеотидная замена в том же самом мышином CNG вызывает Hx (hemimelic extra toes) синдром у мышей40. Функция этого CNG, который м. представлять собой подкласс, который определен по свой консервации у pufferfish, скорее всего проявляется в виде дистального cis регулятора SHH. Интересно, что трансгенная инсерция, которая вызывает удвоение этого CNG обусловливает преаксиальную полидактилию у Ssq (sasquatch) мышей41. Наконец, de novo транслокация, t(5;7), которая отделяет CNG от контекста SHH, также вызывает преаксиальную полидактилию41. Очевидно, что разрушение удаленного регуляторного элемента, или перестройкой или мутацией, оказывает прямой фенотипический эффект.
Др. примером полиморфизма CNG, который имеет фенотипическое проявление, является пример влияния на уровни экспрессии insulin-like growth factor 2 у свиней. Идентифицирована геномная область ~30 kb с двумя основными гаплотипами, которые вызывают изменчивость, затрагивающую рост мышц, отложение жира и размеры сердца42. Секвенирование двух разных гаплотипов у разных индивидов выявило 285 SNPs. С помощью коррелирующей сегрегации потенциальных нуклеотидов количественных признаков с наблюдаемым фенотипом, был идентифицирован вероятный функциональный вариант, который располагается внутри регуляторного CNG. Последующие исследования подтвердили, что CNG выполняет регуляторную функцию42.
Имеются и др. примеры в литературе по геномным аберрациям, которые располагаются примерно на 1 Mb от гена, который отвечает за фенотип и продуцирует эффекты, которые напоминают фенотип, вызываемый точковыми мутациями в этом гене43. Большинство из них являются или делециями или хромосомными перестройками, которые возможно затрагивают регуляторный элемент. Примером этого м. служить мутация у Odsex (Ods) мышей, у которых XX мыши, несущие делецию в 150-kb (~1 Mb выше Sox9) дают стерильных XX самцов44. У людей точки транслокационных разрывов ~850 kb от гена SOX9 ассоциируют с campomelic dysplasia45. Транслокация t(5;16), которая затрагивает genomic-control домен MAF (basic region leucine zipper (bZIP) транскрипционного фактора), ассоциирует с аномалиями развития глаз, такими как катаракта, дисгенез переднего сегмента и микрофталмия46. Кроме того, горячая точка для микроделеций у пациентов с X-linked deafness type 3 (DFN3) идентифицирована на 900 kb проксимальнее от гена, кодирующего DFN3, POU3F4 (Refs 47,48). М. предположить, что эти геномные повреждения отделяют функциональные регуляторные CNGs от гене, который они регулируют.
Опубликованы также примеры транслокационных точек разрывов, которые располагаются на расстоянии 50-300 kb от затрагиваемого гена, что м.б. связано с нарушением позиционного эффекта CNG. Сюда входит t(2;8) сбалансированная транслокация, которая имеет точки разрывов вблизи человеческого HOXD комплекса, который обусловливает mesomelic dysplasia и дефекты позвонков49; хромосомные разрывы ~90kb выше гена RIEG/PITX2 у пациентов с синдромом Rieger50; транслокационные точки на 5 kb от 3' конца TWIST у пациентов с Saethre-Chotzen синдромом51; и кластер CNGs (который также законсервирован у pufferfish) который расположен ~250 kb выше HOXD кластера, идентифицирован и назван глобальной контролирующей областью, которая контролирует экспрессию гена Lnp, Evx2 и Hoxd52. Кроме того, мутация мыши Ulnaless (Ul) обусловлена большой сбалансированной инверсией, котрорая разрушает топографические взаимоотношения между этой global control region и ее генами-мишенями, модифицируя тем самым регуляторный пейзаж52.
Приведенные выше случаи представляют собой лишь меньшинство из болезненных мутаций, но до сих пор исследователи обычно не занимались поиском патогенных мутаций в CNGs частично из-за того, что интерпретация функциональности потенциальных мутаций не легка и частично из-за того, что локализация CNGs раннее была неизвестна. Сегодня мы не знаем, как не-регуляторные CNGs м. влиять на возникновение болезней у людей.

Future directions


На базе того факта, что разные группы CNGs дифференциально законсервированы у позвоночных и обладают гетерогенными эволюционными характеристиками 14,16,18,24,29, кажется, что они составляют гетерогенную группу функциональных последовательностей. Однако, два типа экспериментов д. привести к выяснению некоторых функциональных характеристик CNGs. Во-первых, скрининг д. помочь подразделить функциональные характеристики CNGs. Некоторые из экспериментов м.помочь проанализировать паттерны метилирования ДНК внутри CNGs, гиперчувствительность к DNaseI CNGs53, исследования иммунопреципитации хроматина гистоновых модификаций, чтобы выявить HISTONE CODE, или скринирование по транскрипционным факторам. которые связываются с CNGs54. Во-вторых, необходимы др. эксперименты более прямой природы. Это д.б. анализ активации репортерных генов с помощью CNGs в клеточных линиях; детекция белок-ДНК взаимодействий с CNGs, используя YEAST 1-HYBRID протокол, SOUTHWESTERN ANALYSIS или mobility shift подход; IN VIVO FOOTPRINTING; анализ активации репортерного гена из CNGs у эмбрионов мышей, чтобы определить, м. ли CNGs модулировать транскрипцию in vivo; и целенаправленные делеции в CNGs в эмбриональных стволовых клетках и у мышей (knockouts). Последнего типа эксперименты особенно информативны и м. помочь выяснить роль CNGs, которые сегодня вне рамок сегодняшних гипотез.
Большой консорциум, который финансируется National Human Genome Research Institute (NHGRI) под названием ENCODE в первую очередь занялся характеристикой функцийэтих и др. последовательностей в 1% генома человека. Пилотный проет запланировано завершить к концу 2006 и результаты этих усилий существенно улучшат наше понимание CNGs и функции генома.
Помимо прямых экспериментальных подходов м. также изучать вклад CNGs в функциональную изменчивость в человеческих популяциях. Довольно амбициозный, но потенциально пригодный подход д. исследовать величину регуляторных вариаций внутри CNGs, которые влияют на уровни экспрессии соседних генов. Такой подход позволит выявить CNGs, которые вносят вклад в фенотипические атрибуты и потенциально в болезненные фенотипы у людей. Для решения этой задачи не обязательно идентифицировать все регуляторные CNGs в геноме, а просто оди, который м. вносить вклад в чувствительность к болезни. Такие проекты малого и большого масштаба уже запущены в некоторых лабораториях мира.
The understanding of the function of these sequences will benefit substantially from the recruitment of researchers from various molecular biology specialties for experimental and computational analysis of CNGs. Only with continuous feedback from experimental data will we be able to annotate and properly characterize the large amount of non-coding functional sequence that is contained in the human and other mammalian genomes.
Сайт создан в системе uCoz