Non-Coding Regulatory RNAs
НЕ КОДИРУЮЩИЕ РЕГУЛЯТОРНЫЕ РНК

Beyond the proteome: non-coding regulatory RNAs

Maciej Szymański, Jan Barciszewski
Genome Biology. 2002 3(5): reviews0005.1-0005.8

http://genomebiology.com/2002/3/5/reviews/0005

(Рис.1.)
 |  Functional classification of non-protein-coding RNA transcripts


(Рис.2.)
 |  Translational regulation of the E. coli σ factor RpoS by the non-coding RNAs DsrA and OxyS

(Табл.1) Functional classification of non-protein-coding RNA transcripts

NON-CODING RNA GENES AND THE MODERN RNA WORLD
Sean R. Eddy
Nature Reviews Genetics 2, 919 -929 (2001)


Два больших семейства малых ядрышковых РНК участвуют в направленных сайт-специфических модификациях рРНК и др. РНК, а количество известных генов этого семейства продолжает быстро расти.
Описано новое большое семейство эукариотических РНК генов, microRNAs - РНК из 21-24-нуклеотидов, которые, по-видимому, действуют как регуляторы трансляции белок-кодирующих РНК.
Описаны новые системы скрининга новых ncRNA генов у Escherichia coli, которые привели к экспериментальному подтверждению существования более 30 новых не кодирующих транскриптов с неизвестными пока функциями, а компьютерный анализ предсказывает еще большее их количество.
RNA гены, как полагают, являются редкими реликтами от исходного "RNA world", который в последствии был в основном замещен более эффективными белками. Предполагается, что ncRNAs м.б. более многочисленными и высоко адаптированными к своей роли у современных организмов.
РНК лучше всего подходят для специфического распознавания др. РНК путем спаривания комплементраных оснований. Эволюция м. благоприятствовать в пользу ncRNAs вместо белков для выполнения некоторых ролей; напр., как пост-транскрипционных регуляторных молекул, взаимодействующих со специфическими мРНК.


(Рис.1.)
 |  Diagrams of snoRNAs guiding modification to target rRNA bases.


(Рис.2.)
 |  Examples of proposed interactions between the Caenorhabditis elegans lin-4 microRNA and a target mRNA.


(Рис.3.)
 |  Three examples of microRNAs.


(Рис.4.)
 |  Example of an Escherichia coli riboregulator.


(Рис.5.)
 |  Jacob and Monod's proposal for the nature of "regulatory genes".



Dnm3os, a non-coding RNA, is required for normal growth and skeletal development in mice
Tokumitsu Watanabe, Takahiro Sato, Tomokazu Amano, Yumiko Kawamura, Naohiro Kawamura, Hiroshi Kawaguchi, Naohide Yamashita, Hiroki Kurihara, Takashi Nakaoka (takashin@ims.u-tokyo.ac.jp)
Developmental Dynamics 237:3738-3748, 2008.


Dnm3os, ген, который транскрибируется в non-coding RNA (ncRNA), содержит три micro RNAs (miRNAs), miR-199a, miR-199a* и miR-214, чьи функции остаются неизвестными у млекопитающих. В данном исследовании вносили lacZ ген в Dnm3os локус, чтобы воспроизвести паттерн его экспрессии и нарушить его функцию. Dnm3os+/lacZ гетерозиготные эмбрионы обнаруживали активность β-galactosidase, которая отражала аутентичный паттерн экспрессии Dnm3os РНК. Большинство Dnm3oslacZ/lacZ гомозиготных детенышей погибало в течение месяца после рождения. Такие мышата обнаруживали скелетные аномалии, включая черепно-лицевую гипоплазию, дефекты дорсальных частей дуг и спинальных отростков позвноков и osteopenia. Важно, что экспрессия miR-199a, miR-199a* и miR-214 существенно подавлялась у Dnm3oslacZ/lacZ эмбрионов, подтверждая тем самым предположение, что Dnm3os служит в качестве предшественника для этих трех miRNAs. Т.о., Dnm3os выступает как miRNA-кодирующий ген, который обязателен для развития скелета и роста тела у млекопитающих.
Более 20 лет тому назад открытие каталитических свойств РНК субъединицы рибонуклеазы P и self-splicing активности в группе I интронов привело к предположению, что РНК м. выполнять роль и помимо участия в экспрессии белок-кодирующих генов. Было продемонстрировано, что РНК может выступать как эффективные catalysts ('ribozymes'). Исследования кристаллической структуры больших субъединиц бактериальных рибосом показало, что рибосомальная 23S РНК играет ключевую роль в процессе образования пептидных мостиков во время трансляции, и продемонстрировано, что рибосомы являются фактически рибозимами.
Функциональные не кодирующие РНК являются молекулами не только ископаемыми, доставшимися от организмов, состоящих исключительно из РНК. Они играют важную роль и у современных организмов. Протеин-кодирующих генов недостаточно, чтобы объяснить всю сложность высших организмов. Так геном Caenorhabditis elegans и Drosophila melanogaster содержит лишь вдвое больше генов, чему дрожжей или некоторых бактерий, а геном человека содержит лишь вдвое больше генов, чем у беспозвоночных.
В протеом-ориентированном анализе геномные последовательности, гены, которые дают не-белок-кодирующие транскрипты, часто игнорируются. С повышением сложности организма вклад белок-кодирующего генома снижается (Рис. 1). Подсчитано, что около 98% транскриптов эукариотических геномов являются РНК, которые не кодируют белков; сюда входят интроны и транскрипты, которые не дают белков, последних насчитывается 50-75% от всех транскриптов у высших эукариот. Помимо tRNAs и rRNAs, идентифицировано много новых транскриптов, не кодирующих белки. Такие транскрипты гетерогенны и не обладают одной специфической функцией. Сначала не кодирующими РНК называли эукариотические РНК, которые транскрибировались RNA polymerase II и имели poly(A) хвосты на 3' конце и 7-methylguanosine cap структуру на 5' конце, но у которых отсутствовала единая длинная открытая рамка считывания (open reading frame (ORF)). Теперь это определение расширено и включает все РНК транскрипты, которые не обладают белок-кодирующей способностью, иногда термин используется для описания участка РНК, который не кодирует белок, включая интроны. Принято не кодирующие белки РНК подразделять на два класса (Табл. 1). Housekeeping РНК обычно постоянно экспрессируются и необходимы для нормального функционирования и выживания клеток; они рассмотрены во многих обзорах и не будут тут представлены. Регуляторные не кодирующие РНК, включая те, которые экспрессируются на определенных стадиях развития организма или дифференцировкие клеток или как ответ на внешние стимулы, м. затрагивать экспрессию др. генов на уровне транскрипции и трансляции (Табл. 1).

Transcriptional regulation

Регуляция экспрессии определенных генов обычно с участием специфических белковых транскрипционных факторов, которые связываются с контролирующими областями ДНК (промоторы и энхансеры), тем самым активируя или репрессируя транскрипцию одиночного гена или оперона. У эукариот экспрессия множественных генов в специфических областях хроматина м. также регулироваться путем изменения структуры хроматина (ремоделирования хроматина), что облегчает или ограничивает доступ транскрипционной кухни (machinery) к локусу. <р4 class=my>Dosage compensation
У большинства животных самцы и самки отличаются по числу Х хромосом. Уровни экспрессии Х-хромосомных генов д.б. уравнены у двух полов (dosage compensation). Это м.б. достигнуто или инактивацией Х-хромосомы XX клетках или усилением активности одиночной Х хромосомы в XY клетках. Используются оба механизма - разными видами - и оба зависят от экспрессии не кодирующих регуляторных РНК, которые являются ключевыми элементами пути, ведущего к ремоделированию хроматина и тем самым к контролю транскрипции.
У Drosophila, дозовая компенсация связана с двухкратным усилением экспрессии генов самцовой Х хромосомы. Усиление ее транскрипционной активности зависит от специфического ацетилирования гистонов H4 по лизину 16. Эта модификация осуществляется с помощью комплекса MSL (male-specific lethal) белков. Две РНК, roX1 и roX2 (RNA on X chromosome),ответственны за сборку MSL белковых комплексов и их направление к специфическим местам самцовой Х хромосомы. Показано, что два компонента комплекса MSL complex, MOF (males absent on the first) белок (отвечающий за ацетилирование гистона H4) и MSL-3 белок, м. взаимодействовать непосредственно с РНК через свои хроматин-связывающие домены (chromodomains, обнаруженные в ряде хроматиновых регуляторных белков). Это указывает на то, что хромодомены могут быть помещены в специфические сайты хромосом путем взаимодействия с не кодирующими РНК.
У млекопитающих дозовая компенсация достигается посредством инактивации второй Х хромосомы у самок. Гистоны в хроматине инактивированной Х хромосомы гипоацетилированы, а ДНК гиперметилирована, состояние типичное для молчащих генов. Хотя не все детели инактивации Х хромосом полностью известны, однако известно, что оно инициируется на ранних стадиях развития. Оно осуществляется по правилу 'n-1', которое ведет к транскрипционному молчанию всех кроме одной Х хромосомы. Оно контролируется с помощью X-chromosome inactivation center (Xic), в котором расположен ген Xist (X inactive specific transcript). Продуктом транскрипции Xist является не кодирующая РНК длиной в 17 kilobase (kb); ее точная роль в молчании X-хромосомы неясна. Предполагается, что сам процесс транскрипции Xist м.б. достаточным. чтобы изменить структуру хроматина Х хромосомы таким способом, что он позволяет присоединяться silencing факторам. С др. стороны, накопление Xist РНК на X хромосоме, которая будет молчать, т.е. будет инактивирована, указывает на то, что ее присутствие может быть важным для диспозиции silencing факторов и последующей модификации хроматина, напр., с помощью деацетилирования гистонов и метилирования промторов Х-сцепленных генов. Установлено, что инактивированная Х хромосома в клетках мышей имеет повышенные уровни специфической изоформы гистона, macroH2A1.2, это указывает на то. что этот вариант гистона м.б. эффектором процесса молчания. Эта идея подтверждается наблюдением, что Xist РНК и macroH2A1.2 м. формировать стабильные рибонуклео-протеиновые комплексы и что локализация macroH2A1.2 в X-хромосоме зависит от экспрессии Xist. Функция Xist РНК м.б. необходима macroH2A1.2 как для установления, так и поддержания неактивного состояния.
Др. геном, ассоциированным с инактивацией Х хромосомы, который локализован в Xic области, являетсяTsix (antisense transcript from Xist locus). Экспрессия Tsixдает 40 kb не кодирующей Tsix РНК, которая очевидно играет роль в регуляции инактивации Х хромосомы путем репрессии функции Xist. Предполагается, что спаривание оснований между Xist и Tsix транскриптами м. взаимодействовать со связыванием белков, таких как macroH2A1.2, с XistРНК. Др. возможность, что транскрипция в антисмысловом направлении ингибирует синтез смысловых транскриптов Xist.

Genetic imprinting

Др. феномен, напоминающий инактивацию Х-хромосомы - это генетический импринтинг, феномен преимущественного молчания аллеля одного из родителей. Различия в экспрессии отцовской и материнской копии импринтируемых генов связаны с дифференциальным метилированем ДНК или состоянием хроматина. Импринтируемые гены часто появляются кластерами и их скоординированная регуляция зависит от активности импринтинг контролирующего элемента. В некоторых случаях установлено, что активность генов не кодирующей РНК является существенной для поддержания импринтированного состояния соседних генов. Напр., у млекопитающих ген H19 (кодирующий РНК, не кодирующую белок)содержит область, контролирующую импринтинг, которая дифференциально метилируется и репрессирует отцовский аллель H19 и материнский аллель соседнего insulin-like growth factor 2 (Igf2). Сходным образом IPW (импринтирован при Prader Willi) РНК, как полагают, функционирует как нетранслируемая РНК, возможно регулирующая транскрипцию в cis в импринтируемой области, ассоциированной с синдромом Prader Willi у человека и мыши. Пока неизвестно имеют ли сами эти транскрипты какую-то специфическую функцию: их экспрессия м. служить как индикатор транскрипционного статуса соседней хромосомной области. Предполагается, что в случаях, при которых не кодирующя РНК транскрибируется с антисмысловой нити импринтированного гена, то антисмысловая РНК может участвовать непосредственно в установлении и поддержании импринтированного состояния (путем ремоделирования хроматина или метилирования ДНК). Напр., ген KvLQT1 (кодирует voltage-регулируемые калиевые каналы) в хромосомном диске 11p15 импринтируется и экспрессируется с материнского аллеля, который разрушен у некоторых пациентов с синдромом Beckwith-Wiedemann syndrome (BWS). Антисмысловая ориентация транскрипта внутри KvLQT1, названная LITi (long QT intronic transcript 1) экспрессируется обычно с отцовского аллеля, но аномально экспрессируется с материнского аллеля у пациентов с BWS и м.б. ассоциирован с молчанием матерински экспрессируемых генов на той же самой хромосоме. Др. возможность это то, что он м. заставлять молчать ген-мишень с помощью RNA interference (RNAi), механизма, с помощью которого присутствие двунитчатой РНК индуцирует деградацию мРНК посредством 'small-interfering' промежуточной РНК, продуцируемой с помощью активности RNase. Разрушение генов, кодирующих не кодирующие РНК, участвующие в регуляции импринтировнных генов, лежит в основе некоторых генетических нарушений у человека, включая DiGeorge syndrome, Angelman syndrome и Prader-Willi
Ген NTT (не кодирующий транскрипт T клеток), продукт в 17 kb, который экспрессируется в некоторых активированных CD4+ T клетках, представляет др. пример возможного вовлечения не кодирующей РНК в регуляцию транскрипции. В отличие от транскриптов с импринтированных генов, рассмотренных выше, продукт гена NTT продуцируется с обоих родительских аллелей. Точная функция NTT РНК не известна, но она локализуется близко к IFN-γR (кодирующего рецептор для цитокина interferon-γ) и обнаруживает тот же самый паттерн экспрессии что и IFN-γR, указывая тем самым, что она м.б. вовлечена в регуляцию экспрессии IFN-γR.

Translational regulation

Многие не кодирующие РНК участвуют в модуляции экспрессии генов на посттранскрипционном уровне. Этот тип регуляции широко используется у прокариот и используется также и эукариотами.
У Escherichia coli, наиболее экстраординарной является РНК DsrA. Избыточная экспрессия этой в 87 нуклеотидов РНК ревертирует транскрипционное молчание, которое зависит от глобального репрессора H-NS и стимулирует трансляцию чувствительного к стрессам фактора σ(RpoS) RNA polymerase. Это ведет к индукции двух групп генов: тех, которые репрессируются H-NS, и тех, которые активируются с помощью RpoS. Уровни H-NS и RpoS белков модулируются на уровне трансляции: трансляционная активация RpoS зависит от непосредственных RNA:RNA взаимодействий между 5' untranslated region (UTR) rpoS мРНК и 5' частью DsrA. DsrA конкурирует со вторичной структурой внутри rpoS мРНК, которая служит в качестве cis-действующего ингибитора трансляции. Эта модель подтверждается наблюдением, что комплементарность последовательностей между rpoS мРНК и DsrA РНК является существенной для стимуляции трансляции. Взаимодействия между РНК DsrA с 5' и 3' частями ORF внутри hns мРНК также ответственны за репрессию трансляции hns mRNA. Следует отметить, что DsrA РНК обнаруживает последовательности, комплементарные частям нескольких др. генов, которые могут посттранскрипционно регулироваться. Положение сопоставляемых последовательностей в мишени мРНК относительно стартового кодона трансляции м.б. определено в зависимости от того, взаимодействие с DsrA обладает стимулирующим или репрессивным эффектом. Интересно, что трансляция, RpoS также индуцируется осмотическим шоком. который не дает в результате усиления транскрипции DsrA РНК. В этом случае, функция активатора выполняется RprA - др. не кодирующей РНК. Хотя вторичная структура RprA РНК предсказывает сходство с таковой у rpoSРНК, в ней отстутствует значительные последовательности комплементарности с rpoS а механизм ее действия неясен. Др. стресс-чувствительный не кодирующий транскрипт у E. coli это в 93 нуклеотида micF РНК, ответственная за посттранскрипционный контроль гена наружной мембраны porin ompF. Ингибирование трансляции ompF обусловлено связыванием micF РНК с ompF мРНК и это взаимодействие индуцирует деградацию ompF мРНК.
Изучение гетерохронных мутаций у C. elegans, которые затрагивают временные характеристики событий развития, позволило идентифицировать др. класс не кодирующих РНК, чья регуляторная функция зависит от антисмысловых взаимодействий с мРНК-мишенями. the Продукты гетерохронных lin-4 и let-7 генов идентифицированы как в 22 и 21 нуклеотида РНК, соотв., которые возникают в результате процессинга предшественников в 61 и 72 нуклеотида. Активность этих РНК, первоначально названных small temporal RNAs (stRNAs), по-видимому, зависит от комплементарности последовательностей с 3' UTRs различных онтогенетических мРНК. Подавление трансляции достигается после иниационной ступени: мРНК-мишени обнаруживаются ассоциированными с полирибосомами, но белкового продукта не образуется. Установлено, что lin-4 и let-7 РНК являются членами нового класса крошечных РНК (microRNAs), широко представленных у всех организмов. Скрининг генома C. elegans по областям, не кодирующим белки, сопровождаемый экспериментальной верификацией транскрипционной экспрессии этих регионов, привел к открытию новых независимых microRNA генов, кодирующих короткие (примерно в 65 нуклеотидов) предшественники транскриптов, которые м.б. свернуты в stem-loop вторичные структуры. Далее они м. подвергнуться процессингу специфическими рибонуклеазами, чтобы генерировать зрелые РНК в 21-25 нуклеотида. MicroRNAs экспрессируются также у Drosophila и млекопитающих. Некоторые из этих РНК (напр., mir-1 и mir-87) имеют гомологов как у беспозвоночных, так и позвоночных и помимо контроля временных параметров развития они м. осуществлять ткане-специфические функции.
Антисмысловые, базирующиеся на РНК механизмы также ответственны за регуляцию гена HFE у человека, который участвует в метаболизме железа и м. б. вовлечен в наследуемое нарушение у человека, hereditary hemochromatosis. Антисмысловой не кодирующий транскрипт, происходящий с антисмысловой нити гена HFE, идентифицирован и показано включение части, комплементарной экзону 1 смыслового транскрипта. Хотя нет прямых доказательств его функции in vivo, , но исследования in vitro показывают, что антисмысловой транскрипт супрессирует трансляцию HFE мРНК.
Антисмысловой транскрипт, который м. функционировать как негативный регулятор экспрессии гена, идентифицирован также у растений. that may function as a negative regulator of gene expression has also been identified in plants. У бобов Lotus japonicus, экспрессия позднего nodulin гена LjNOD16контролируется с помощью двунаправленного промотора, локализованного внутри интрона гена LjPLP-IV (LjPLP-IV кодирует phosphatidylinosiol transfer-like protein). Транскрипция с оппозитной нити дает антисмысловой транскрипт, отвечающий за контроль экспрессии LjPLP-IV в корневых узелках, где его уровень достоверно ниже, чем в цветках. Однако, детали неизвестны.

Modulating protein function

Некоторые не кодирующие РНК м. затрагивать активность белков непосредственно. Ассоциация белка с регуляторной РНК м. влиять на его структуру и энзиматическую и/или лиганд-связывающую активность. Одной из ключевых регуляторных РНК, работающих таким образом у E. coli является 6S РНК. Не выявлено аберрантных фенотипов, ассоциированных или с нулевыми мутациями или с избыточной экспрессией 6S РНК, поэтому ее функция остается загадочной. Недавно было установлено, что 6S РНК формирует стабильный комплекс с σ70 голоэнзимом RNA polymerase. Это взаимодействие модулирует активность РНК полимеразы в стационарной фазе (при отсутствии роста популяции), возможно, оно м.б. ответственным за общее снижение транскрипции σ70-зависимых генов или дифференциальное использованиеσ70-зависимых промоторов.
Подобно DsrA РНК, OxyS РНК, которая экспрессируется в ответ на оксидативный стресс уE. coli, также является регулятором экспрессии реагирующего на стрессσ фактора RpoS. В этом случае, однако трансляция rpoS мРНК не регулируется с помощью антисмыслового механизма, зависящего от РНК:РНК взаимодействия, а с помощью конкуренции за РНК-связывающий белок Hfq, который вместе с DsrA РНК необходим для трансляции rpoS мРНК (Рис. 2. РНК OxyS также негативно регулирует трансляцию fhlAмРНК (которая кодирует транскрипционный активатор гена для formate hydrogenlyase system). В этом случае, OxyS функция зависит от антисмыслового взаимодействия с мРНК-мишенью, которое блокирует рибосомальные сайты связывания. У млекопитающих, новая не кодирующая РНК, steroid receptor activator (SRA) РНК, функционирует в качестве модулятора рецепторов стероидного гормона. Она выделена из клеток человека и мыши и было установлена ее функция как специфического ко-активатора различных стероидных рецепторов, включая рецепторы для андрогенов,эстрогенов, глюкокортикоидов и прогестинов. SRA РНК обнаружена в ассоциации с рибонуклеопротеиновым комплексом со steroid receptor coactivator 1 (SRC-1), который рекрутируется посредством стероидных рецепторов. Мутации внутри потенциальной ORF в SRA не затрагивают его активности, а экспрессия различных изоформ является специфичной для типов клеток.

Regulation of RNA and protein localization

В ооцитах амфибий,правильная локализация материнских мРНК в анимальной и вегетативных областях детерминирует нормальное развитие эмбриона. Помимо мРНК вегетативный кортекс ооцитов Xenopus содержит и не кодирующие транскрипты Xlsirt, которые содержат от 3 до 13 повторов из 79-81 нуклеотидных элементов. Xlsirt РНК локализуются в вегетативном кортексе на ранних стадиях оогенеза и считается, что они м. б. конституитивными структурными компонентами кортекса. ответственными за локализацию др. РНК. ВажностьXlsirtРНК подтверждается на примере локализации мРНК, кодирующей Vg1, члена семейства transforming growth factor β (TGF β). Vg1 мРНК оказывается диспергированой после деструкции Xlsirt РНК . У Drosophila ядерные транскрипты не кодирующей hsr-ω обнаружены в комплексах с heterogenous nuclear RNA binding proteins (hnRNPs) в межхроматиновом пространстве. Предполагается, что hsr-ω ядерные транскрипты играют роль в регуляции переноса и доступности hnRNPs в ядре.

Non-coding RNAs with unknown functions

Bone morphogenetic proteins (BMP) и osteogenic proteins (OP), члены сверхсемейства TGF-β, которые были идентифицированы как факторы, отвечающие за индукцию формирования кости in vivo, кроме того, по-видимому, участвуют в не кодирующих РНК транскриптах. Два белка, BMP-2 и OP-1, специфически индуцируют транскрипцию в 3 kb не кодирующей BORG РНК (BMP/OP-responsive gene), которая м. играть ключевую роль в дифференцировке остеобластов, хотя точная ее функция неизвестна. Недавно было установлено, что избыточная экспрессия специфического не кодирующего транскрипта с гена DD3 связана с раком простаты. Первая характеристика генных транскриптов показала, что они существуют в нескольких вариантах как из-за альтернативного сплайсинга, так и из-за альтернативного полиаденилирования. Их экспрессия ограничивается клетками озлокачествленной простаты и не выявляется существенной гомологии с любыми др. генами. Функция этой РНК неизвестна и механизм, лежащий в основе избыточныой экспрессии в злокачественных клетках еще не установлен.
Некоторые не кодирующие РНК выделены и частично охарактеризованы и у растений. Одной из первых идентифицирована ENOD40 РНК, которая продуцируется в ответ инокуляцию индуцирующих узелки бактерий Rhizobium или др. факторы nodulation. Эта РНК, длина которой колеблется между 0.4 и 0.9 kb, обнаружена у разных видов растений. РНК CR20 продукт гена , чувствительного к cytokinin, который репрессируется в ответ на cytokinins (гормоны растений) или на стрессовые условия, впервые изолирован у огурцов, а позднее у разных видов растений. Др. гормонально регулируемый транскрипт GUT15 (ген с нестабильным транскриптом 15) из табака. Функция CR20 и GUT15 транскриптов неизвестна, но их гормональная регуляция и низкая стабильность указывают на то, что они м. играть регуляторную роль. Medicago truncatula Mt4 РНК и TPSI1 помидор представлют др. семейство растительных не кодирующих транскриптов, активируемых при нехватке фосфатов. Члены этого семейства обнаруживают очень высокую степень консервации нуклеотидных последовательностей, но нет доказательств, что они транслируются в белки.

Searching genomic sequences for non-coding RNAs

Большинство ген-находящих алгоритмов предназначено для нахождения белок-кодирующих последовательностей, которые м.б. легко идентифицированы по сравнению с не кодирующими РНК с помощью свойств своих ORFs, сигналов полиаденилирования, законсервированных областей промотора или сигналов сайтов сплайсинга. Предполагается, что не кодирующие РНК должны иметь стабильную вторичную структуру. Модифицированный подход использует stochastic context-free 'grammar' для предсказания структуры РНК при скрининге различных геномных последовательностей. Результаты этих исследований привели к заключению, что вторичная структура настоящих не кодирующих белок РНК не м.б. отличена от структур, предсказанных для случайных РНК последовательностей, так что этот метод оказался непригодным.
В настоящее время идентификация РНК-кодирующих генов в геномных последовательностях базируется на гомологии структуры или последовательностей. Имеются эффективные программы, которые отыскивают tRNA или small nucleolar RNA (snoRNA) гены по законсервированным структурным элементам или последовательностям уже известных РНК. Используются методы computational нейральных сетей и поддерживающих векторных машин для экстрагирования общих характерных последовательностей и структурных элементов из известных РНК; эти параметры затем используются для скрининга eubacterial и archaeal геномов. Полученные результаты показывают, что РНК-кодирующие последовательности, фактически, содержат информацию, которая м.б. использована для правильного нахождения генов.
Многообразие геномных последовательностей сейчас известно для различных организмов, что делает возможным сравнительный анализ последовательностей для идентификации важных последовательностей, которые не м.б. установлены при анализе индивидуальных геномов. Такие сравнения должны отличать структурные РНК от др. законсервированных последовательностей, предполагается, что структурные РНК должны обнаруживать компенсаторные мутации, согласующиеся с их вторичной структурой. Сравнение межгенных областей генома E. coli с геномами 5 др. enterobacteria и анализ pairwise BLASTN последовательностей с использование программы QRNA, позволило идентифицировать 275 потенциальных не кодирующих последовательностей РНК. Некоторые из этих последовательностей, действительно, оказались функциональными не кодирующими РНК генами.
Др. подход, используемый для поиска новых не кодирующих РНК генов, это комбинация компьютерных и экспериментальных методов. Поиск дрожжевых промоторов RNA polymerase III обычно выявляет их в малых РНК генах (таких как tRNA гены), а анализ экспрессии последовательностей из "промежутков" между предсказуемыми ORFs, ведет к идентификации новых не кодирующих РНК транскриптов и РНК, содержащих небольшие ORFs. Имеются указания на то, что не кодирующие РНК м. широко использоваться как сигнальные молекулы у растений. Все растительные не кодирующие РНК, описанные более или менее подробно, имеют характеристики мРНК, такие как poly(A) хвосты и шапочки, expressed sequence tag (EST). Последовательности Arabidopsis thaliana систематически скринируются. идентифицировано 19 клонов, которые вероятно функционируют как не кодирующие белок РНК. Эти клоны, по-видимому, специфичные для растений транскрипты, не имеющие гомологов вне царства растений.
С точки зрения клеточной экономии РНК наиболее подходят на роль сигнальных молекул: РНК м. синтезироваться в ответ на определенные стимулы и могут быстро разрушаться без использования дорогостоящего синтеза белков. Предполагается, что регуляторные молекулы РНК м. возникать из интронов белок-кодирующих генов как функциональные ко-продукты.
Сайт создан в системе uCoz