Посещений:
Цис-Регуляторные Последовательности

Новые Подходы Исследования

New Technologies, New Findings, and New Concepts in the Study of Vertebraye cis-Regulatory Sequences
J.L. Gomez-Skarmeta, B.Lenhard, T.S. Becker
Dev. Dyn. - 2006. - V.235, No 4.- P. 870-885




Рис.1.
 | Figure 1. Highly conserved noncoding regions (HCNRs) spanning the loci of genes for key transcription factors involved in development and differentiation (adapted from Sandelin et al.,[2004b]). Each of the three sequence windows covers 4 Mb of genomic sequence around HCNRs. Yellow triangles represent individual HCNRs. Different structural classes of transcription factor genes are shown in different colors (red, homeobox; green, C2H2 zinc finger; purple, other TF; light gray, other [non-TF] genes). Meis2 is spanned by the largest array of 84 HCNRs. DACH is flanked by two gene deserts that contain HCNRs. HoxD cluster is controlled by HCNRs that span the loci of several neighboring genes.


Рис.2.
 | Figure 2. Representing transcription factor binding site motifs: an example of carbohydrate response element (CREB). A: Consensus sequence using IUPAC symbols for degenerate positions. B: An equivalent regular expression. C: Sequence logo, showing contributions of individual positions and individual nucleotides therein to the overall specificity of the binding site. D: A position-specific score matrix, used for direct scoring of DNA sequences.


Рис.3.
 | Figure 3. An example of de novo motif discovery. A large number of genes whose products are involved in amino acid biosynthesis in the yeast Saccharomyces cerevisiae are induced under the conditions of amino acid starvation. A Gibbs sampling algorithm implemented in the program AlignACE (Hughes et al.,[2000]) correctly locates the motif corresponding to the binding site of the protein Gcn4p, a known master regulator of the amino acid starvation response (Natarajan et al.,[2001]).


Рис.4.
 | Figure 4. The principle of phylogenetic footprinting. A,B: A genomic region of interest is aligned with one or more orthologous regions of another, suitably distant species (A), and the most conserved regions are identified using a scoring function that produces a conservation profile (B). Regions exceeding a selected conservation score are extracted for further analysis.


Рис.5.
 | Figure 5. An example of phylogenetic footprinting in action. A: The result of scanning a single sequence (region from -1,400 to +100 of human muscle creatine kinase) with a subset of the most specific (information content >10 bits) transcription factor matrix models from the JASPAR database (Sandelin et al.,[2004a]). Previously characterized binding sites are marked by red boxes. B: The same region after the phylogenetic footprinting with the orthologous mouse sequence, shown along with the corresponding conservation profile. In this case, all known sites are retained, whereas most of the false predictions were filtered out because of their absence at the corresponding positions in the mouse sequence. The analysis was performed using ConSite (Sandelin et al.,[2004c]).


Рис.6.
 | Figure 6. Multiple highly conserved noncoding regions (HCNRs) within the IrxB cluster harbor cis-regulatory elements. A:VISTA view of the occurrence of conserved sequence domains in the two gene deserts between the Irx genes of the IrxB cluster. Shown from top to bottom are Human vs. Mouse, Human vs. Chick, Human vs. Xenopus tropicalis, and Human vs. Fugu global alignments. Colored peaks (purple, coding; pink, noncoding) indicate regions of at least 100 bp and 75% similarity. The number of HCNRs increases as evolutionarily closer species are compared. B: The gene deserts between Irx genes contain multiple HCNRs. Most of them show enhancer activity in zebrafish transgenic assays and activate expression in subdomains of those expressing Irx genes (green boxes). Because in many cases these subdomains are common to more than one Irx gene in the complex, these enhancers are likely to be shared. Although not proven, some of these regions may also harbor negative elements (red boxes). Three examples of the enhancer activity of some of these regions are shown. These enhancers are located within the HCNRs marked with an green asterisk in A. In these cases, the genomic conserved noncoding regions are driving enhanced green fluorescent protein (EGFP) expression in transgenic zebrafish assays. As a result of the action of positive and negative cis-regulatory elements on more than one IrxB gene, all Irx genes in this complex show relatively similar expression pattern.


Рис.7.
 | Figure 7. Enhancer detection integrations in a zebrafish gene desert. Four integrations were recovered in a 320-kb interval upstream of the sox11b gene. A highly conserved noncoding regions (HCNRs) was mapped to the corresponding gene desert in the human and mouse genomes. Note how the insertions closest to the HCNR exhibit the same expression patterns (which corresponds to sox11b expression), whereas the one most distal (CLGY205) retains only weak expression in the telencephalon. Numbers under the photomicrographs denote distance in bas pairs from the start codon of sox11b. See Ellingsen et al. ([2005]) for further details.

Footprinting, DNAase

DNA with protein bound is resistant to digestion by DNAase. When a sequencing reaction is performed using such DNA, a protected area representing the footprint of the bound protein will be detected. This permits identification of the protein binding regions of the DNA.
Проэкт ENCODE (под руководством Nat. Hum. Genome Res. Inst, . (The ENCODE Consortium, 2004)) имеет целью идентификацию функциональных элементов в геноме человека. Помимо экзонных последовательностей, которые составляют примерно 3.7% от генома человека, имеются дополнительно 1-2% одиночных копий законсервированных негенных последовательностей, распознаваемых путем сравнения мышь-человек, для огромного большинства которых функия еще неизвестна (Dermitzakis et al., 2005). Они обозначаются как ultraconserved regions (UCR; Bejereno et al., 2004; Sandelin et al., 2004b), conserved noncoding elements (CNE; Woolfe et al., 2005), conserved nongenic sequences (CNG; Dermitzakis et al., 2005) или highly conserved noncoding regions (HCNRs; de la Calle-Mustienes et al., 2005). Также Bejerano et al., (2004) экстрагировали 481 элемент с удивительной консервацией более 200 или более пар оснований между мышами и людьми, тогда как Sandelin et al., (2004b) идентифицировали 3583 сегментов из 50 или более п.н. с более чем 95% консервацией между человеком и мышью, которые обнаружвают сходство с рыбами fugu и не наруживают признаков транскрипции в зрелую РНК (Woolfe et al., 2005).
С помощью трансгенных подходов на мышах, лягушках и данио было показано, что некоторые из этих областей действуют как энхансеры (Muller et al., 2002; Nobrega et al., 2003; de la Calle-Mustienes et al., 2005; Goode et al., 2005; Poulin et al., 2005; Woolfe et al., 2005). Часто эти области разбросаны на большие расстояния в геномах позвоночных, но образуют кластеры в регионах н изкой плотности генов вокруг генов, кодирующих транскрипционные факторы или, реже, сигнальные молекулы, такие как факторы роста или их рецепторы и партнеры по связыванию (Sandelin et al., 2004b; Woolfe et al., 2005). Более того, геномные области генома человека, содержащие эти законсервированные регионы и ассоциированные онтогенетические гены, обнаруживают достоверную синтению не только с грызунами, но и с teleosts (костистыми рыбами)(Woods et al., 2000; Goode et al., 2005). Однако, не все регуляторные последовательности высоко законсервированы, но их активность может быть выявлена, по крайней мере, у модеьных teleost с помощью случайных инсерций репортерных векоторов (Ellingsen et al., 2005).

Computional Approaches to Characterization of cis-Regulatory Elements


Одним из первых предварительных условий для выявления и описания регуляторных элементов является полное и реальное описание генома с положением транскриптов полной длины. Это больше не проблема для генов человека и мыши, благодаря широкомассштабному секвенрованию транскриптома, приведшего к точному определению положения последовательностей транскрипта, благодаря чему может дедуцировать позиции 5'концов, а также разные альтернативные транскрипты. Правда для геномов рыб не существует прямолинейного рекартирования полных транскриптов, исходя из др. позвоночных.
У Caenprhaditis elegans и дрозофилы как и для большинства ткане-специфичных генов позвоночных первым местом для поиска регуляторных элементов являются проксимальные области, непосредственно выше места старта, хотя нередко энхансерные элементы встречаются в интронах или нижестоящих транскрипционных единицах, особенно у мух (Nelson et al., 2004). Точная локализация мест старта транскрипции важна для аккуратного определения core and proximal промотерных элементов; для детекции дистальных энхансеров она имеет меньшее значение. Геномная организация закосервированных элементов вокруг онтогенетических генов позвончных (Sandelin et al., 2004b) показывает, что они не обнаруживают предпочтения в локализации на 5' концах генов, но распространены по всему генному локусу и обнаруживаются на 5' и 3' концах и в интронах (Рис. 1). Кроме того, тип и состав core промотора скорее всего связаны с его чувствительностью к дальнодействующим энхансерам.

Sequence Motif Detection


Простейший подход к поиску сайтов связывания индивидуальных танскрипционных факторов это использование известной модели мотива. Эта стратегия прямолинейна теоретически, но вызывает критику относительно доступности и качества моделей сайтов связывания. Сайты связывания могут быть представлены как консенсусные строки или регулярные выражения или как более информативные position-specific score matrices (PSSM) (Stromo, 2000): примеры различных представителей чувствительных к углеводам элементов у млекопитающих представлены на Рис. 2. Обзор о методах детекции сайтов связывани транскрипционных факторов и ассоциированных инструментах см. Wasserman, Sandelin (2004).
Использование известных моделей мотивов для сканирования предполагаемых сайтов связывания транскрипционных факторов работает достаточно хорошо для коротких индивидуальных регуляторных регионов, в котором более или менее известно, что ожидать. В отсутствие информации исследовательский поиск сайтов связывания тарнскрипционных факторов характеризуется низким отношением сигнала к шуму (Wasserman, Sandelin , 2004) и крупными размерами некодирующих регионов, которые могут потенциально обладать регуляторными детерминантами у высших эукариот (Bondarenko et al., 2003). Такая низкая специфичность индивидуальных транскрипционных факторов эукариот мешает их использованию для анализа по всему геному (Stromo, 2000). Единственные доступные биологически многозначительные данны по сайтам связывания транскрипционных факторов получены пока из всё ещё относительно редкого экспериментального анализа предполагаемых регуляторных регионов (Koide et al., 2005; von Bubnoff et al., 2005). Однако помимо того факта, что многие гены позвоночных имеют различимую проксимальную промоторную область с ТАТА-боксом, СААТ-боксом и GC-боксом (Bucher, 1990) - которые не являются универсальными (Smale, Kadonaga, 2003) - информация о др. промоторных регуляторных элементах бедна (Fickett, Wasserman, 2000). Это подкреплено доказательствами, что результаты, полученные в экспериментальных системах для изучения регуляторных элементов, таких как метод in vitro связывания (Tronche etal., 1997) и иногда даже in vivo репортерные конструкции генов, не всегда хорошо коррелируют с паттернами экспрессии изучаемых регуляторных генов в их оригинальном геномном контексте (напр., Woolfe et al., 2005). Т.к. эти исследования часто используют гетерологичные промоторы, то возможно, что не все проксимальные части промоторов взаимодействуют со всеми энхансерами тем же самым способом.
Только два хранилича профилей PSSM присутствуют в базах данных открытом доступе JASPAR (Sandelin et al., 2004a) и и более представительная комерческая TRANSFAC база данных (Matys et al., 2003).

De Novo Sequence Motif Discovery


Чтобы осуществлять поиск сайтов связывания транскрипционных факторов, предварительно д.существовать коллекция регуляторных последовательностей, которые, как предполагают, содержит один или несколько типов сайтов связывания совместно, или путем действительного обладания общим регуляторным механизмом или путем физического связыания одного и того же белка в экспериментальной системе. Напр., открытие de novo мотива в регуляторных элементах генов, позитивно регулируемых у дрожжей в ответ на аминокислотное голодание, выявло общий мотив, который связывает GCN4 белок (Рис. 3), известный регулятор реакции (Natarajan et al., 2001). Новые мотивы выявляются с помощью одного из многих алгоритмов открытия. Наиболее известные были сравнены и проверены с помощью эталонного теста (Tompa et al., 2005) и представлен новый метод (Down, Hubbard, 2005). Алгоритмы открытия мотивов не имеют отношения к предсуществующим моделям и могут в принципе обнаруживать новые, ранее не известные мотивы. Однако алгоритмы обычно математически интенсивны и склонны к "motif drowning", если последовательности слишком длинные по сравнению с силой и плотностью мотива.

Modeling and Discovery of cis-Regulatory Modules


Некоторый погресс достигнут при анализе некоторых ткане-специфических генов, которые регулируются с помощью cis-regulatory modules (CRM). CRM определяется как кластер сайтов связывания транскрипционных факторов, связанных с физиологической функцией, распространяющейся на короткое расстояние в соседние регионы или интрон гена мишени. CRMs позволяют построить первую успешную предсказуемую модель ткане-специфичности генов млекопитающих (Wasserman, Fickett, 1998; Krivan, Wasserman, 2001) и даже более простые модели для онтогенетических генов дрозофилы (Berman et al., 2002; Rajewsky et al., 2002). Все эти подходы базируются на предыдущих знаниях состава сайтов связыания транскрипционных факторов некоторых экспериментально охарактеризованных CRMs? которые и послужили для конструкции предикативных моделей. Однако, считалось, что многие из этих моделей контекст=специфической экспрессии контролируются с помощью CRMs, но эксериментальные доказательства действительно сайтов связывания, были недоступны. Недавно разработан такой инструмент как MSCAN (Alkema et al., 2004) и EMCMMODULE (Gupta, Liu, 2005), которые позволяют осуществить 'CRM discovery' , т.е. обнаруживать кластеры соместно появляющихся сайтов транскрипционных факторов без предвартельного биологического занания.

Phylogenetic Footprinting


Главной удачей стало использование сравненй между видами в поиске регуляторных последовательностей (Wasserman et al, 2000). Идея Phylogenetic Footprinting заключается в том, что функционально важные части геномных последовательностей эволюционируют более медленно, чем их нефункциональные соседи. Учитывая два или более ортолога некодирующих последовательностей, их расположение и локализацию наиболее законсервированных областей может сузить границы, в которых необходимо производить поиск активных регуляторных элементов (Рис. 4). Филогенетические отпечатки сами по себе не являются инструментом открытия мотивов, а методом уменьшения пространства поиска последовательностей. Обычно он используется в комбинации с детекцией и открытием мотивов, при этом увелисивется отношение сигнала к шуму при детекции сайта свзывания транскрипции на порядок величин (Рис.5) с издержкой лишь в незначительном снижении чувствительности (Lenhard et al., 2003). Филогенетическая фильтрация комбинируется успешно с др. методами детекции, такими как выявление CRM (Krivan, Wasserman, 2001) и открытием мотивов de novo (Blanchette, Toma, 2002), приводя к существенному повышению специфичности предсказания. В самом деле, было показано для некоторых случаев, что филогенетические отпечатки чрезвычайно пригодны для выбора регионов кандидатов, которые были функционально тестированы с помощью трансгенных подходов (Muller et al., 2002; Nobrega et al., 2003; de la Calle-Mustienes et al., 2005; Goode wt al., 2005; Poulin et al., 2005; Woolfe et al., 2005).
Сравнение по многим видам может еще больше увеличить отношение сигнала к шуму в филогенетическом footprinting, делая возможной дейстительно по всему геному детекцию и обнаружение регуляторных мотивов в геномах дрожжей и млекопитающих (Thomas et al., 2003; Habrison et al., 2004; Xie et al., 2005). Необходимо отметить однако, что малые размеры функциональных сайтов связывания транскрипционных факторов, по-видимому, не законсерированы на эволюционных расстояниях, обычно используемых в филогенетическом footprinting (некоторые примеры приводят Moses et al., 2004). Многие из них всё еще законсервированы у более близко связанных сидов, но имеющееся фоновое расхождение часто настолько высоко, чтобы идентифицировать эти элементы от действительно нефункционального окружения. Когда ортологические последовательности от множественых близко родственных видов доступны, то возможнен альтернативный подход, чтобы добавить (очень редко) различия между множественными последовательностями для идентификации областей, которые мутируют быстрее и, следовательно, не испытывают селективного давления, действующего на них. Этот комплементарный подход известен как phylogenetic shadowing и он применяется для идентификации специфичных для приматов цис-регуляторых элементов (Boffeli et al., 2003) и идентификации генов пре-микроРНК (Berezikov et al., 2005). Lh/ эффективным подходом для идентификации эволюционно законсервированных регионов, не выявляемых простым попарынм сравнением последовательностей, является целенаправленное секвенирование определенных геномных областей у разных видов позвоночных, как это проделано для геномного фрагмента хромосомы 7 человека, включая ген, мутантный при кистозном фиброзе (Thomas et al., 2003). Издержки этого метода в том, что необходимы последовательности у относительно большого количества видов для эффективной филтрации и эти последовательности в настоящее время не доступны для большинства генов.

Methods for Detection of Transcription Factor Binding Sites Shared by Coregulated Sets of Genes


Выявленные и открытые предполагаемые сайты связывания транскрипционных факторов являются потенциальной крупной утилитой для детекции элементов, общих для широкого круга энхансеров, если комбинируются с подходящими дескрипторами их паттернов пространственно-веременной экспрессии. Простейшим реальным дескриптором, который широко используется, являются данные microarray profiling. Для отслеживания экспрессии онтогенетических генов и их энхансеров о время эмбрионального развития многие данные по струкуированной онтологии могут оказаться предпочтительными, разбитые на пространственные (анатомические) и временные (по стадиям развития) категории. Также высокая производительность гибридизации in situ, подобная той, что у данио рерио (Thisse et al., 2001; www.zfin.org) , в комбинации с Sanger данио рерио данными может позволить детекцию ко-регулируемых генов. Как только мы получин наборы действительно ко-регулируемых генов, то мы вскоре окажемся перед лицом выбора, желаем ли мы поискать новые мотивы (т.е. паттерн открытия) или выявлять избыточно представленные мотивы, борющиеся за известные гены. Последнее затрудняется большим количеством мотивов нами тестируемых для избыточной репрезентации, тогда мы будем сталкиваться со стандартной статичстической проблемой множестенного тестирования, коррекция которых может серьезно снизить уровни доверитеьных интервалов для мотива избыточной репрезентации. Один из подходов, который прекрасно раотае для прикладных целей, связан с использованием ограниченного числа моделей семейных сайтов связывания (Sandelin, Wasserman, 2004), которые генерализуют позиционно-специфические score матрицы, которые вылавливают стержневые ДНК связывающие свойства целого структурного класса транскрипционных факторов. Среди инструментов, доступных для детекции сайтов связыанаия транскрипционных факторов или педопределенных комбинаций в наборе последовательностей, есть такие как oPOSSUM (Ho Sui et al., 2005) и SynoR (Ovcharenko, Nobrega, 2005), успешно используемые для детекции избыточно предстваленных сайтов, общих с наборами ко-регулируемых генов позвоночных из уже опубликованных исследований профилей экспрессии. Дальнейшей мощной техникой для идентификации сайтов связывания транскрипционных факторов in situ является серийный анализ оккупирования хроматина (Impey et al., 2004).

Extracting Conserved Noncoding Regions and Determination of Their Genomic Organization


Упомянутые выше высоко законсервированные элементы, участвующие в онтогенетической регуляции могут быть выявлены на базе их консервации в геномах разных позвоночных (Bejerano et al., 2004; Sandelin et al., 2004b; Woolfe et al., 2005) и соответ. выбора критерия консервации может быть также выявлена их общая геномная органзация (Sandelin et al., 2004b). Имеется несколько методов для экстракции законсервированных некодирующих регионов у модельных организмов (Loots,Ovcharenko, 2005); о более расширенных сценариях может посмотреть в недавно опубликованных протоколах с обзором доступных методов (Bejerano et al., 2005; Papatsenko, Levine, 2005). Если анализ осуществляется на геномных последовательностях организма с доступным геномным ансамблем, то это наболее обдуманный анализ, чтобы манипулировать со всеми выявленными регионами в качестве геномных координат. UCSC Genome Browser (Karolchik et al., 2003; Web site: http://genome.ucsc.edu) недавно стал экипирован инструментом пакетной (batch) конверсии, чтобы картировать по новому координаты между разными версиями геномных ансамблей, а также между близко родственными видами. Для HCNRs функция повторного картирования прекрасно работает для геномов разных млекопитающих.

Pattern Composition of Highly Conserved Noncoding Regions


Т.к. уровни консервации HCNRs не могут быть объяснены только селективным давлением, чтобы сохранить специфичность связывания транскрипционных факторов, поэтому их последовательности обладают отличающимися свойствами. HCNRs являются более богатыми АТ, чем в среднем некодирующие последовательности и многие имеют высоко избыточно представленные мотивы, напоминающие гомеобоксные сайты связывания и некоторые др. мотивы, участвующие в эмбриональном развитии и дифференцировке (Sheng, Lenhard, in preparation). Базируясь на них и их энхансерной активности стало очевидным, что многие HCNRs служат как места регуляторных входящих импульсов, которые дают приют кластерам связывающих сайтов, которые связываются разными транскрипционными факторами комбинационным способом, чтобы продуцировать сложные простраственно-временные паттерны экспрессии. Следовательно, одной из ближацших задач анализа этих элементов является определение этих связывающх сайтов и транскрипционных факторов, которые с ними связываются (Vavouri, Elgar,2005).

Transgenic Tools for Testing of cis-Regulatory Sequences


Как только потенциал цис-регуляторных элементов идентифицирован, они верифицируются экспериментально и это осуществляется обычно путем помещения последовательностей в репортерную конструкцию, которая затем используется для трансфекции в клетки культивируемой ткани или чтобы тестировать экспрессию в эмбрионах или в виде временных assays или стабильных трансгенов. Хотя много было выяснено об энхансерах и чувствительных элементах в культуре клеток, но перенос генов в эмбрионы в конечном итоге единственный путь для выяснения тканеспецифической пространственно-временной экспрессии в контексте целого развивающегося организма. Системы позвоночных наиболее часто используются, чтобы выяснить, какой цис-регуляторной активностью обладают последовательности кандидаты у мышей. У них хорошо разработаны методы трансгенеза, а также имеется возможность генерировать сайт-специфические делеции с помощью гомологичной рекомбинации. Однако, манипуляции с мышиным геномом трудоемки и дороги, а наблюдение эмбрионального развития невозможно вне матери. Лягушки, рыбки данио рерио и Medaka развиваются вовне и с ними относительно легко манипулировать. Системы у рыб обладают дополнительными преимуществами в виде прозрачности эмбрионов и быстрым развитием, а также возможно наблюдение за целым эмбрионов с использованием флюоресцентных белковых маркеров (Megason, Fraser, 2003), что позволяет тестировать энхансерную активность на уровне одиночной клетки. Электропортация у эмбрионов кур также используется для тестирования потенциальных энхансеров, метод, который является быстрым, но ограниченным в основноном генами, экспрессируемыми в нервной трубке (Ghislain et al., 2003; Uchikawa et al., 2003). Хотя целенаправленное получение делеций ещё не возможно ни у лягушек, ни у рыб, но некоторые технологические разработки указывают на то, что обе эти системы могут позволить их использование в дополнение к мышам в вопросе выяснения цис-регуляции у позвоночных. Разработаны эффективные протоколы трансгенеза для лягушек (Amaya, Kroll, 1999), у которые спермии могут быть трансгенными и использоваться для оплодотворения ооцитов, давая трансгенных эмбрионов, у которые экспрессия репортера, обычно зеленого флюоресцентного белка (GFP), может наблюдаться в реальном времени (Hartley et al., 2001; Latinkic et al., 2004; Martynova et al., 2004; de la Calle-Mustienes et al., 2005; Khokha, Loots, 2005). Это мощная система, которая позволяет тестировать предполагаемые последовательности в течение дней, а не месяцев, как это происходит при использовании мышей. Хотя эта методология недоступна для систем модельных рыб, имеется нескоько методов для высокопроизводительного трансгенеза (Amsterdam, Becker, 2005). Эмбрионы этих видов прозрачны и позволяют наблюдать GFP внутри эмбриона. Тестирование репортерной конструкции может проводиться временно, т.е. у нетрансгенных эмбрионов рыб, которым инъецируется и у которых экспрессия репортера наблюдается мозаичным способом. В пионерских исследованиях с помощью этой техники идентифицировали энхансерные элементы в локусе sonic hedgehog (Muler et al., 1999). После она была использована для анализа энхансеров у рыбок данио рерио ( Muller et al., 2002; Dickmeis et al., 2004). Недавно эта стратегия была использована для тестирования нескольких элементов, законсервированных у людей и рыб (de la Calle-Mustienes et al., 2005; Goode et al., 2005; Woolfe et al., 2005). Хотя этот подход и быстр, но недостатком является то, что наблюдается не во всех клетках, в которых д. активироваться экспрессия репортера в стабильном трансгене; хотя паттерн экспрессии может быть скомпилирован от многих инъецированных эмбрионов. Кроме того, наблюдение паттернов экспрессии в течение нескольких дней становится чрезвычайно утомительным. Альтернативой является генерация трансгенных рыб, которые недавно стали эффективным предприятием в основном благодаря использованию плазмид ДНК, ретровирусов или транспозонов, которые интегрируются в зародышевую линию рыб (Shafizadeh et al., 2002; Kawakami, 2004; Amsterdam, Becker, 2005). Для помощи может также использоваться система tol2 транспозона, которая обеспечивает высокую частоту интеграции ДНК преимущественно на очень ранних стадиях и обеспечивает более устойчивые паттерны активности энхансера у инъецировнных эмбрионов данио (Kawakami, 2004). Эта система не была ещё использована экстенсивно для тестирования цис-регуляторных последовательностей.
Дальнейшей технологией у данио рерио является детекция энхансеров, техника, где базовый промотор, управляющий кассетой флюоресцентного белка, включается случайно в геном рыб, предполагается, что если такая конструкция вставляется вблизи эндогенного энхансера, то она будет активрована, а флюоресценция позволит наблюдать пространственно-временную специфичность цис-регуляторных последовательностей (Balciunas et al., 2004; Parinov et al., 2004; Ellingsen et al., 2005). Этот подход может быть использован как для детекции активрованных последовательностей, путем использования базового промотора с отсутствием эндогенной активности или путем использования повсеместного промотора и затем отбора на ограниченный паттерн экспрессии (Amsterdam, Becker, 2005). Большое количество трансгенных линий можно продуцировать и охарактеризовать, поэтому эти технологии может быть использованы для проверки генома на локальную цис-регуляторную информацию. Будучи установленным паттерн экспрессии, то инсерция ретровируса или транспозона может быть локализована путем выделения последовательностей, фланкирующих инсерцию, и картирования (Amsterdam, Becker, 2005; Ellingsen et al., 2005). Хотя эта техника сама по себе не позволяет идентифйицировать регуляторные последовательности, т.к. как упоминалось выше, эти последовательности могут быть очень далеко от гена, который они регулируют, но комбинация его с филогенетическим footprinting/shadowing делает этот мощный подход добавлением к др. доступным инструментам. Напр., инсерции в и около Нох кластеров позволяют выявить цис-регуляторную активность в точной геномной локализации и тем самым позволить измерить степень регуляторного домена данного энхансера (Ellingsen et al., 2005; T.S. Backer unpubl.).

Enhancers in Vertebrates Often Correlate with Conserved Noncoding Regions


Neurogenin гены позвоночных необходимы для индукции нервной дифференцировки внутри нервной системы позвоночных и они, по-видимому, участвуют в становлении качественных особенностей определенных субтипов нейронов (Bertrand et al., 2002). У мышей паттерны экспрессии обоих Ngn1 и Ngn2 являются результатом активности специфических цис-регуляторных элементов, разбросанных вдоль локуса Ngn, на 5' и 3' генов Ngn (Scardigli et al., 2001; Nakada et al., 2004). Сходным образом у данио рерио в гене ngn1 найдены две независимы области, которые действуют как удаленные энхансеры, которые активируют экспрессию в латеральныйх первичных нейронах и в передней части нервной пластинки, соотв...

Далее см. Full Text
Сайт создан в системе uCoz