Посещений:
ДЛИННЫЕ МЕЖГЕННЫЕ НЕ-КОДИРУЮЩИЕ РНК
Функции и уникальные свойства
The functions and unique features of long intergenic non-coding RNA Julia D. Ransohoff, Yuning Wei & Paul A. Khavari
Nature Reviews Molecular Cell Biology volume19, pages143–157 (2018)
|
Long intergenic non-coding RNAs (lincRNAs) are autonomously transcribed RNAs of more than 200 nucleotides in length that do not overlap protein-coding genes. They often lack sequence conservation and have undergone rapid evolution in higher organisms.
lincRNAs are distinguished from mRNAs by their lower expression levels and greater tissue specificity, as well as by their biogenesis, degradation and epigenetic regulatory features.
The small number of lincRNAs that have been functionally characterized have diverse roles, including enforcing stable and repressive chromatin states that increase or suppress transcriptional activation, orchestrating higher-order nuclear architecture, and acting as protein and RNA scaffolds and decoys.
The transcription of lincRNAs can regulate gene neighbourhoods independently of the lincRNA transcripts themselves, suggesting the involvement of enhancer-like activity.
lincRNA-derived small open reading frames are rapidly being described and can give rise to functional micropeptides, suggesting the need to revise the definition of some lincRNA loci to coding loci and the potential for loci to possess both coding and non-coding functions.
|
Длинные межгенные некодирующие РНК (lincRNAs) считаются автономно транскрибируемыми не-кодирующими РНК длиннее 200 нуклеотидов, которые не совпадают с известными кодирующими генами. lincRNAs обладают свойствами сходными с др. транскриптами семейства длинных не-кодирующих РНК (lncRNA) и составляют более половины lncRNA транскриптов у людей (Table 1). Существование lincRNAs было впервые подтверждено в исследованиях с использованием геномного секвенирования, которое выявило вездесущую транскрипцию1,2 в регионах с неизвестными кодирующими генами3-6. Оценка сигнатур состояний хроматина в типах клеток мышей предоставила подтверждение присутствия активных транскрипционных единиц предполагаемых локусов для этих транскриптов7. lincRNAs отличаются от более широкого класса транскриптов lncRNA, поскольку многие lncRNAs обладают последовательностью кодирующих локусов.
Table 1: Definitions and classifications of lncRNA and lincRNA
Согласно скромным подсчетам GENCODE v25 annotations, 51.8% генома человека транскрибируется, но только 1.2% кодируют белки. Открытие роли lincRNA X-inactive specific transcript (Xist) в X chromosome inactivation (XCI) и в компенсации дозы генов в начале 1990s (Refs 10,11), затем было установлено в 2000s, что HOTAIR, репрессирует транскрипцию генов семейства HOX12. Эти исследования стимулировали интерес к функции lincRNA а специфических клеточных контекстах, типах клеток, на ст. развития и при болезнях13. Из тысяч lincRNAs постепенно аннотированных технологиями секвенирования следующего поколения, небольшая фракция была функционально исследована и определены роли в разных процессах регуляции генов, при болезнях14-26.
Помимо отсутствия физического перекрывания между lincRNAs и белок-кодирующими генами, подтверждены различия между lincRNAs и lncRNAs путем анализа генной экспрессии, эволюционно законсервированного паттерна и целенаправленного разрушения генов, которые не меняли соседние белок-кодирующие гены или genic РНК. Обладают ли lincRNAs и genic lncRNAs общими свойствами. Присутствие lincRNAs внутри пустыни генов может ослаблять бремя эволюционной консервации, делая возможной быструю функциональную диверсификацию lincRNA локусов и давая транскрипты с немногими характеристиками мРНК по сравнению с genic lncRNAs. Альтернативно, отделение lincRNAs от genic lncRNAs может отражать семантические отличия, т.е. не связанные с биологией 14. Характеристика потенциальных систематических отличий между lincRNAs и genic lncRNAs область активных исследований, также как и отношение этиъ РНК к регуляции генов и к энхансерной функции.
Evolutionary conservation of lincRNAs
GENCODE на сегодня аннотировал 13255 lincRNA транскриптов, возникающих с 8598 генов. Несмотря на заметное отсутствие консервации первичных последовательностей, lincRNAs не являются эволюционно нейтральными, обнаруживая более высокую консервацию, чем родоначальные повторяющиеся последовательности, но меньшую, чем у белок-кодирующих генов. Их бедная консервация служит проклятием для попыток предсказать функции lincRNA у разных видов17,27,28, но она помогает также подчеркнуть фокальные области потенциально функционально значимых 29,30.
По сравнению с белок-кодирующими РНК и др. не-кодирующими РНК, lincRNAs млекопитающих имеют меньше ортологов у беспозвоночных и подвергаются более быстрому эволюционированию14. Приблизительно 5% lincRNAs млекопитающих законсервировано у рыбок данио и консервация обычно ограничивается короткими участками полинуклеотидов31. Некоторые ортологи у мышей и человека, однако, фенотипически замещают потерю функции lincRNA у рыбок данио, как и в случае lincRNA cyrano14, которая является критической для эмбрионального развития, демонстрируя, что, по крайней мере, некоторые lincRNAs функционально законсервированы между видами.
lincRNAs выполняют функциональные роли у ряда видов. У почкующихся дрожжей Saccharomyces cerevisiae, lincRNAs участвуют в различных стрессовых реакциях, включая пищевое голодание32. У Arabidopsis thaliana, lincRNAs экспрессируются на Более низких уровнях, чем белок-кодирующие гены, но некоторые субнаборы lincRNAs обладают ткане0специфичностью и чувствительными к стрессам паттернами экспрессии33,34. Caenorhabditis elegans lincRNAs обладают свойствами теми же, что и др. беспозвоночные и позвоночные. C. elegans lincRNAs обладают короткими законсервированными регионами, не являющихся предметом эволюционного сдвига последовательности из соседних регионов гена. C. elegans-специфические роли lincRNA часто воспроизводятся и напоминают те, что у дрожжей32, включая формирование dauer и спермиев, становление качественных особенностей самцов и взаимодействуя с транскриптами, специфическими для спермиев35. Т.о., у видов беспозвоночных lincRNAs участвуют в метаболических и ткане-специфических процессах.
Степень сходства между мышиными и человеческими lincRNAs варьирует в зависимости от способа аннотации. Почти половина мышиных не-кодирующих транскриптов из библиотеки cDNA кодируется в геноме человека. Только 14%, обнаруживают доказательства экспрессирующихся последовательностей меток (tags) или кДНК указывает на существование транскриптов ортологов у человека36, подтверждая, что субнабор гомологов скромен37,38. Хотя низкая консервация не обязательно указывает на сходство функций, маловероятно, что эволюционные надстройки (clades) могли независимо развивать сходные функции для таких устойчивых геномных фракций. Эти находки говорят о том, что вопрос консервации функций lincRNA и мотивированной разработки альтернативных методов аннотаций остается14,38. Распределение по категориям транскриптов базируется на паттернах гистоновых пост-трансляционных модификаций локусов, которые кодируют их, это позволило идентифицировать более 1000 ранее неописанных мышиных lincRNAs с существенной (>95%) перекрестной между млекопитающими консервацией7.
Нокаут мышиных lincRNA выявил lincRNAs с перинатальными и постнатальными летальными фенотипами, а также фенотипы с дефектами роста и развития определенных органов, которые не могли быть изучены аналогичным образом у людей39. Большинство мышиных не-кодирующих РНК экспрессируется в нервной ткани и определенных регионах коры40. Многие имеют отдаленные куриные и opossum ортологи41, которые вместе с их паттернами экспрессии42, подтверждают, что они играют роли в нейрогенезе и в ткане-специфичной тонкой настройке экспрессии генов, хотя окончательное предназначение функции lincRNA, базирующееся на нокаутных фенотипах, не является удовлетворительным, поскольку фенотипическое отклонение может быть также результатом нарушений регуляторных элементов гена внутри локусов lincRNA. Генетические исследования на мышах являются подходящими моделями для изучения биологии lincRNA человека, хотя они и ограничены как эволюционным расхождением, так и экспериментальными затруднениями, исключающими независимые от РНК эффекты. Как в мышиных моделях, так и человеческих клеточных линиях в целом довольно трудно определить, действительно ли восстановленный фенотип, обнаруживаемый путем предоставления lincRNA-кодирующей ДНК в транс-положении, обусловлен зависимым от транскрипта эффектом, действием самой транскрипции, эффектами др. генов или транскриптов, взаимодействиями с др. белками или происходящими от lincRNA пептидами. Более того, транс-экспрессирующиеся lincRNAs , способные восстанавливать, могут и не продуцировать правильный фенотип, если экспрессируется на не физиологических уровнях или если экспрессируется в неправильном субклеточном положении.
Картирование транскриптов lncRNA человека, включая lincRNAs, у видов в пределах от мышей до рыб показывает, что ~12% имеют не человеческие гомологи43. Сегменты ортологов занимают 21-56% длины транскриптов и в целом обнаруживают умеренную консервацию. Фракция идентичных оснований между lncRNAs, которые картированы в разных регионах генома, ниже, чем чем между ортологами пар кодирующих генов, выше, чем в случайных геномных регионах и сходны с syntenic блоками28. Более значительная консервация lincRNA промоторов, чем их нижестоящих регионов44 подтверждает селективное давление энхансер-подобных функций7,27,45, это в самом деле предсказуемо для существенного субнабора lincRNAs46, наз. e-lincRNAs (Table 1).
lincRNAs обладают рядом паттернов консервации. Варьирующая консервация на уровне нуклеиновых кислот может лежать в основе более значительной консервации на (secondary or tertiary) структурном уровне. Минимальное количество lincRNAs сильно законсервировано как в отношении последовательности, так и на уровне вторичной структуры РНК. Этот субнабор включает несколько хорошо изученных молекул, включая MALAT1 (Ref. 47),которые под давлением отбора сохраняют интрон-экзоновую организацию, а также вторичную структуру; MALAT1 это стабилизированная на своем 3' конце структура с тремя спиралями14. Др. lincRNAs обнаруживают законсервированную склонность в отношении своих 5' концов и обнаруживают быстрые изменения на своих 3' концах у позвоночных. TINCR, напр., является законсервированной по 5' концу у позвоночных. Их 3' конец законсервирован у макак резус, но не у мышей48; др. хорошо изученная lincRNA с 5' консервацией обнаруживает склонность действовать как MYC proto-oncogene protein-associated PVT1 (Ref. 49). Такой паттерн указывает на то, что специфичные для последовательностей функции могут формировать кластер, нацеленный на 5' конец и потенциально, что видо-специфические функции могут управляться с более отличающегося 3' конца. Др. lincRNAs обладают фокальной консервацией, коорая может отражать фактически, что некоторые гены, сегодня считающиеся lincRNAs, являются действительно не-кодирующими РНК, но фактически содержат небольшие открытые рамки считывания (smORFs)29,40. Субнабор lincRNAs обладает законсервированными smORFs, которые дают полипептиды с биологическими функциями50. Напр., полипептид в 90 аминокислот small regulatory polypeptide of amino acid response (SPAR) кодируется с smORF, которая законсервирована у мышей и людей в lincRNA LINC00961 (Ref. 18). Альтернативно, фокальная консервация д. лежать в основе функций, зависящих от последовательности lincRNA, таких как взаимодействия с др. нуклеиновыми кислотами или белками или сцепленной с трансляцией, но независимой от пептидов, активностью. Наконец, расхождение последовательностей может указывать на на расхождения транскриптов, по крайней мере, для некоторых lincRNAs19,20, напр., в локусе Blustr мышей, где активность транскрипции в основном не зависит от продуцируемого транскрипта, может затрагиваться транскрипция соседнего гена19.
Итак, lincRNAs обнаруживают разный характер консервации и подвергаются быстрой эволюции у разных видов. Хотя они и обладают меньшей перекрестно-видовой консервацией, чем белок-кодирующие гены, lincRNAs не являются эволюционно нейтральными и могут обладать зависимыми от транскрипции и/или безразличными к транскрипции видо-специфичными функциями.
Comparison of lincRNA and mRNA features
lincRNAs отличаются от мРНК своими количествами, локализацией в геноме и субклеточной локализацией, а также своими метаболическими профилями, эпигенетической регуляцией и тканевой специфичностью.
Abundance, size and genomic localization. Чмсло lincRNAs продолжает увеличиваться, согласно GENCODE v25 описанию 8598 генов удовлетворяют нашим критериям lincRNAs (Table 1), по сравнению с 19950 белок-кодирующими генами. Cap анализ генной экспрессии с помощью консорциума FANTOM5 недавно был использован для идентификации 27919 генов lncRNA у человека, из которых 13105 были генами lincRNA46. Специфические lincRNA, соответствующие критериям, включают хроматиновые характеристики (signatures)7 и расстояние от соседнего кодирующего гена (чтобы учитывать не-аннотировнаные, альтернативно сплайсированные транскрипты)27, хотя униформный размер отдоления отсутствует. lincRNAs располагаются согласно нескольким базам данных на расстоянии более 3 Mb от ближайшего белок-кодирующего гена, медиана расстояния 40 kb - 28% находятся на расстоянии 10 kb (Ref. 28), и почти половина отстоит более чем на 50 kb, они считаются как 'isolated' lincRNAs (Table 1). Относительно мРНК транскрипты lincRNA имеют меньше экзонов (в среднем 2.9 по сравнению с 10.7), они короче (средняя длина 1 kb по сравнению с 2.9 kb)27,44 и экспрессируются в 10 раз на меньшем уровне44. Этот низкий уровень экспрессии lincRNAs наблюдается во всей ткани органа, т.е. тканевые выборки , происходящие из сложных органов содержать множественные тканевые субтипы - которые могут быть результатом специфичной для типа клеток экспрессии, по крайней мере, в сложных тканях44,51, это согласуется с предположением о роли lincRNAs в предопределении ткани.
Subcellular localization. мРНК в основном переносятся в цитоплазму, где они подвергаются трансляции. lincRNAs, напротив, чаще всего располагаются в ядре, чем в цитоплазме согласно in situ гибридизации48 и профилированию рибосом52. lncRNAs в целом обнаруживают сходное ядро : цитоплазма соотношение у разных типов клеток27, хотя геномная субклеточная (по компартментам) количественная оценка lncRNA ещё не осуществлена. Концентрация в ядре lincRNAs может указывать на повышенную стабильность и функци в ядре, хотя существуют доказательства более значительной стабильности их в цитоплазме44 и существуют доказательства деградации ядерных экзомов53. Последнее может объяснить относительную концентрацию lincRNA в хроматине, но не истощение в нуклеоплазме по сравнению с мРНК53. В недавней работе было предложено классифицировать lncRNA, исходя из метаболических профилей РНК в соответствии с гипотезой, что виды РНК, обладающие такими метаболическими профилями, могут также обладать и общими функциональными профилями54. В этой работе было установлено, что lncRNAs синтезируются менее эффективно, а деградируют более эффективно и подвергаются более медленному сплайсингу, чем мРНК, lincRNAs, как было установлено, случайно распределяются по широко определяемым функциональным классам РНК, подтверждая, что ни расположение в геноме, ни метаболический профиль не коррелируют глобально с функциональной классификацией РНК54.
Transcriptional regulation, biogenesis and splicing. RNA polymerase II (Pol II) транскрибирует приблизительно 150000 pre-mRNAs в геноме человека, которые подвергаются 5' capping, сплайсингу и 3' расщеплению и полиаденилированию 55. В варьирующей степени, lincRNAs обладают общими с ними свойствами процессинга, но в то время как мРНК более мощно одновременно с транскрипцией подвергаются сплайсингу и полиаденилируются, lincRNAs чаще всего одновременно с транскрипцией расщепляются и заканчиваются преждевременно (Fig. 1a). Недавно у млекопитающих было использовано mammalian native elongating transcript sequencing (mNET-seq) чтобы снять профили lincRNAs 53. mNET-seq определяло геномную плотность Pol II путем детекции статуса фосфорилирования Pol II C-terminal domain (CTD) с разрешением в одно основание. Фосфорилирование CTD по Thr4 ассоциирует с завершением транскрипции и обогащает Pol II, расположенной ниже сайта полиаденилирования мРНК, но в lincRNAs оно обнаруживается вдоль всей транскрипционной единицы. Это подтверждает, что в то время как Pol II вызывает паузу неэффективно в промоторах lincRNA, она вызывает паузу по всей единице транскрипции , приводя к более частому завершению транскрипции, чем это наблюдается в белок-кодирующих генах 53. lincRNAs довольно часто лишены phospho-CTD особенности белок-кодирующих генов и, следовательно, не постоянно ассоциируют с формами фосфорилирования CTD, которое увеличивает мРНК-подобный процессинг 53.
Figure 1: Distinguishing features of long intergenic non-coding RNAs (lincRNAs) and mRNAs.
a | During transcription, some lincRNAs undergo cleavage and premature termination, whereas others are spliced and polyadenylated similarly to mRNAs53. b | LincRNAs are generally more abundant in the nucleus, whereas mRNAs are generally more abundant in the cytoplasm, where they associate with ribosomes. LincRNAs and mRNAs have similar occupancy (residence) at the chromatin, whereas lincRNAs are relatively depleted in the nucleoplasm compared with mRNAs, possibly as a result of degradation by the nuclear exosome53. Poorly processed lincRNAs may be targeted to the nuclear exosome for degradation at least partially by microprocessor complex subunit DGCR8, whereas those more similar to mRNAs may remain in the cytoplasm, where they are stable. Cytoplasmic lincRNAs and mRNAs can be degraded following 5? decapping. c | LincRNA-coding and protein-coding genes have globally similar chromatin profiles7,53. LincRNAs are distinguished by enrichment in histone H3 Lys9 trimethylation (H3K9me3) at their promoters. This is a canonically repressive mark, but in lincRNAs, it is instead associated with greater tissue specificity; the mechanism has not yet been described. H3K4me1 is associated with enhancers and H3K4me3 is associated with promoters. Pol II, RNA polymerase II; TSS, transcription start site.
Pol II транскрипты могут быть определены по их позиционному взаимоотношению с кодирующими генами: по промотору вышестоящих транскриптов в анти-смысловом направлении (PROMPTs)56 и энхансеру РНК (eRNAs)57, происходящему из промотора кодирующего гена и энхансерных элементов, соотв. Большинство промоторов эукариот являются дивергентными (двунаправленными) и могут генерировать транскрипты как в смысловом (мРНК), так и анти-смысловом направлении. Дивергентная транскрипция продуцирует приблизительно 13% из описанных lincRNAs, расположенных в 10 kb от промотора кодирующего гена, из них 65% находятся в 1 kb от места старта транскрипции28. Дивергентная транскрипция ассоциирует с ацетилированием гистона H3 Lys56 (H3K56) и Pol II Tyr1 фосфорилированием, ей способствуют SWI/SNF ремодельеры хроматина и она репрессируется с помощью RNA deadenylase CAF1 (Refs 17,58,59), особенность, которая может указывать четко на дивергентную транскрипцию РНК и механизмы процессинга РНК.
Связывание синтезируемых транскриптов с помощью spliceosomal U1 small nuclear RNA (snRNA) подавляет использование сигналов альтернативного полиаденилирования, препятсвуя тем самым преждевременно деградации транскриптов. Двунаправленные промоторы приводят к асимметричному обогащению сайтов полиаденилирования (PASs) в антисмысловых lincRNA транскриптах и к обогащению U1 связывающих сайтов в смысловых мРНК транскриптах, такая асимметрия д. способствовать преждевременному завершению транскрипции и к полиаденилированию анти-смысловых lincRNAs, но к эффективным элонгации и сплайсингу мРНК60. В противовес первоначальному описанию немногих U1 сайтов в дивергентно транскрибируемых lncRNAs по сравнению с их promoter-paired мРНК60, недавнее исследование lincRNAs специфически выявило сравнимые количества U1 связывающих мотивов и истощение мотивов полиаденилирования ниже места старта транскрипции - т. наз. U1-PAS ось - в lincRNAs и мРНК44. Несмотря на эти доказательства, lincRNAs подвергаются процессингу менее эффективно: они обнаруживают меньше сплайсинга во время транскрипции и расщепления 3' конца и полиаденилирования53. Однако, они производят в результате альтернативного сплайсинга в среднем 2.3 изоформы на локус28. Снижение сплайсинга в lincRNAs по сравнению с мРНК mRNAs может быть следствием более слабых сигналов от внутренних 3' сплайс-сайтов и меньшего связывания фактором сплайсинга U2AF65 (Ref. 44). Это подмножество lincRNAs преобразуется довольно одинаково с мРНК, может быть более стабильным, чем др. lincRNAs и выполняет зависимые от транскрипта роли. Напр., Xist и Firre, транскрипты которых обнаруживают хорошо известные функции, имеют больше законсервированных мест сплайсинга и подвергаются более эффективному сплайсингу, чем в целом у lincRNAs44. Однако, эффективность сплайсинга lincRNAs не коррелирует с рибосомальной ассоциацией52, указывая, что в отличие от мРНК, после эффективного сплайсинга lincRNAs распознаются не лучше аппаратом трансляции. Большинство дивергентно транскрибируемых lincRNAs подвергаются сплайсингу в своих тканях максимальной экспрессии, но их экспрессия не очень строго коррелирует с таковой в соседних кодирующих генах, т.к. половина тканеспецифичных дивергентных lincRNAs оказываются в паре с повсеместно экспрессирущимися кодирующими генами; эта находка указывает, что процессинг lincRNA не обязательно влияет или отражает экспрессию соседнего гена28.
В дополнение к обладанию уникальной особенностью сплайсинга lincRNAs также влияют на сплайсинг др. РНК путем взаимодействия со сплайс-факторами или путем маскировки сплайс-сигналов61. Напр., the lincRNAs MALAT1 (Ref. 62) и GAPLINC63 связывают сплайс-фактор PSF, подтверждая, что обеспечиваемый с помощью lincRNA сплайсинг др. генов влияет на способность опухолей к инвазии и метастазированию путем регуляции активности онкогенов или супрессоров опухолей. Интересен класс lncRNAs, наз. 5' small nucleolar RNA-capped and 3' polyadenylated (SPAs), участвующий в патогенезе синдрома Prader-Willi. SPAs затрагивают связывание некоторых РНК-связывающих белков, включая TDP43 и RBFOX2, с их RNA interactors, тем самым поддерживая паттерны альтернативного сплайсинга, соответствующие болезненному состоянию64. Кроме того, анализ принципиальных компонентов дифференциальной экспрессии генов lncRNA и дифференциального сплайсинга при аутизме выявил высокую корреляцию между измененной экспрессией и активностью сплайсинга, снова подтверждая роль lncRNAs в модулировании активности сплайсинга в зависимости от функциональной активности65.
Stability and degradation. В то время как цитоплазматические мРНК часто стабильны, степень стабильности lincRNAs менее ясна. Ранние работы установили относительную нестабильность lincRNA по сравнению с мРНК66, но более недавний анализ lincRNAs в парах с мРНК со сходным уровнем экспрессии выявил сходные уровни стабильности для lincRNAs и мРНК44, подтверждая, что мРНК, экспрессирующиеся на сравнительно низких уровнях, которые соответствуют уровням экспрессии lincRNA, могут быть менее стабильны, чем мРНК, экспрессирующиеся на довольно высоких уровнях. До некоторой степени неожиданно, что footprinting анализ рибосом выявил мощные ассоциации цитоплазматических lncRNA с рибосомами67. Более половины lncRNAs обнаруживается в цитоплазме и 70% из этих lncRNAs имеют более половины своих цитоплазматических транскриптов, ассоциированными с рибосомами52. Ассоциированные с рибосомами lncRNAs имеют длинные pseudo-5'-UTR cap структуры и лишены повторяющихся последовательностей. Использование рибосом стабилизирует некоторые lncRNAs, т.к. остановка рибосом вследствие подавления трансляции повышает стабильность некоторых связанных с рибосомами lncRNAs52. Такое использование может дополнительно отражать трансляцию smORFs в функциональные микропептиды68. В целом, цитоплазматические мРНК деградируют с помощью трех основных механизмов: 3' deadenylation, 5' decapping вследствие с помощью 5'-to-3' экзонуклеазы-обусловленного распада, и расщепление с помощью endoribonuclease. lincRNAs деградируют с помощью тех еж механизмов, но также с помощью независимых механизмов, таких как целенаправленное воздействие на ядерные экзосомы17,53.
Поскольку они глобально лишены канонических ORFs, а ORFs, которые они содержат имеют преждевременные стоп кодоны, большинство транслируемых lincRNAs подвергаются раннему завершению трансляции и подобно неправильно транслируемым мРНК, могут подвергаться нонсенс-обусловленному распаду69. lincRNAs могут также подвергаться независимой от трансляции дестабилизации, напр., с помощью microRNAs (miRNAs; miRNA let-7 дестабилизирует HOTAIR70), РНК-связывающих белков (HuR способствует распадц lincRNA71) и процессинга 3'-конца72. Недавно было предположено, что lincRNAs, которые подвергаются спорадическому окончанию транскрипции, подвергаются целенаправленному воздействию pre-miRNA-processing factor DGCR8 для деградации с помощью ядерных экзомов (Fig. 1b), с учетом доказательств, что подавление ядерного экзома стабилизирует нуклеоплазматические lincRNAs53. В ортогональном исследовании было установлено, что вследствие подавления транскрипции lincRNAs и мРНК имеют неотличимые периоды полу-жизни44. Касательно стабилизации транскриптов с помощью HuR, мРНК оказываютя преимущественно связанными с HuR своими 3' концами, но lincRNAs соединены эквивалентно по всему своему транскрипту44, подтверждая, что разные паттерны связывания HuR не влияют на стабильность транскриптов. Примирение очевидного противоречия в отношении стабильности lincRNA в разных исследованиях может зависеть от анализа специфических субнаборов lincRNA с большим вниманием к деталям. Возможно, что частично транскрибируемые и плохо сплайсированные lincRNAs деградируются с помощью ядерного экзома, тогда как те, что подвергаются преобразованию, более сходны с мРНК по избеганию подобной судьбы и поэтому остаются цитоплазматическими и устойчивыми.
Epigenetic regulation. lincRNAs и мРНК могут позитивно или негативно регулировать экспрессию своих собственных генов или целенаправленно воздействовать на др. гены путем взаимодействия с хроматин-модифицирующими комплексами, чтобы модулировать эпигенетический ландшафт хроматина. lincRNA-кодирующие гены и белок-кодирующие гены одинаково глобально обогащены в своих промоторах активирующими транскрипцию гистоновыми модификациями, такими как H3K27ac, H3K4me3 и H3K9ac17,27, и многие lincRNA гены характеризуются H3K4me3 в своих сайтах старта транскрипции и H3K36me3 вдоль тела гена. В противовес числу lincRNAs, связывающих EZH2, каталитический компонент polycomb recessive complex 2 (PRC2), который закладывает репрессивные H3K27me3 модификации73, хотя специфичность74 и потребность75,76 во взаимодействиях lincRNA-PRC2 для функционирования lincRNA недавно была поставлена под вопрос. Субнабор активных lincRNA промоторов обогащен репрессивной H3K9me3 модификацией, и здесь ассоциация осуществляется с большей тканевой специфичностью скорее, чем с дифференциальной экспрессией; ни значение, ни механизм этой модификации пока неизвестны44 (Fig. 1c). У мышей нокаут Dicer1, который кодирует miRNA-processing RNase Dicer, снижает экспрессию lncRNA, особенно дивергентных транскриптов. Этот эффект, по крайней мере, частично обеспечивается с помощью активации Dicer онкогенного MYC, вовлеченного в miRNA и MYC цепь (circuitry) по поддержанию экспрессии lncRNA, независимо от регуляции мРНК77. Снижение экспрессии lncRNA у Dicer1-нокаутных мышей ассоциировано со снижением уровней H3K4me3 и H3K36me в подавляемых локусах lncRNA, это подтверждает, что Dicer обладает хроматин-модифицирующей функцией, которая поддерживает экспрессию lncRNA77. У дрожжей четыре АТФ-зависимых ремоделирующих хроматин факторов - Isw2, Swr1, Ino80 и Rsc - репрессируют транскрипцию ряда анти-смысловых lncRNAs, чтобы регулировать экспрессию перекрывающихся мРНК78.
Tissue specificity and developmental patterning. lincRNAs часто обнаруживают заметную тканевую специфичность и могут функционировать в тонкой настройке экспрессии своих генов мишеней ткане-специфическим способом. Одно исследование осуществило unsupervised кластерный анализ, чтобы подсчитать показатели тканевой специфичности экспрессии индивидуальных транскриптов. Согласно этому измерению, 78% lincRNAs оказались ткане-специфичными по сравнению с 19% мРНК. Этот результат оказался независимым от различий в экспрессии транскриптов, т.к. наивысшие показатели характеризовали более высоко экспрессирующиеся lincRNAs 28. Используя данные RNA-sequencing (RNA-seq) по 30 тканям, осуществленную genotype-tissue expression (GTEx) консорциумом, срединный показатель tau тканевой специфичности 0.90 был подсчитан для lincRNAs, по сравнению с 0.77 для мРНК (Fig. 2a), при этом 60.8% из lincRNAs и 29.4% из мРНК оказались ткане-специфическими (Fig. 2b). Абсолютное количество lincRNAs с отличающимися сигнатурами экспрессии в одиночной ткани выявило избыточную представленность ткане-специфичных lincRNAs в головном мозге и семенниках (Fig. 2c). Др. исследование сходным образом показало, что треть lincRNAs обнаруживает специфичную для семенников экспрессию 28; эти lincRNAs могут тонко регулировать репродуктивную функцию, как это делают lincRNAs у дрожжей 32 и C. elegans35. Недавнее исследование открыло возможность, что эта тканевая специфичность может отражать функцию почти половины lincRNAs как и e-lincRNAs, представляя таким образом энхансер-специфическую для типов клеток экспрессию 46.
Figure 2: Tissue specificity of long intergenic non-coding RNA (lincRNA) expression.
a | We calculated the individual tau (tissue specificity) scores, which range from 0 to 1 (0 for uniform expression; 1 for single-tissue expression), of 7,842 lincRNAs (blue) and 22,285 mRNAs (red) across 30 human tissues from the GTEx Analysis v6 data set (dbGaP Accession phs000424.v6.p1 based on GENCODE v19 (hg19; July 2013)). We additionally calculated tau scores after permutation of each RNA to its assigned tissue to estimate the false discovery rate (FDR). The results are depicted as a violin plot of tau score distributions, demonstrating greater tissue specificity for lincRNAs than mRNAs (median 0.90 for lincRNA; 0.77 for mRNA; 0.47 for permutation; one-sided Wilcoxon test, ***P < 0.001). The white dots represent the median; thick and thin bars represent one or two standard deviations from the median, respectively. b | Proportion of lincRNAs and mRNAs that are tissue-specific by tau score. c | For each lincRNA with significant tissue specificity (tau >0.88; FDR <0.05 by permutation distribution), we re-calculated its tau score 30 additional times, each time excluding one tissue to estimate the individual contribution of the tissue. If tissue specificity no longer reached significance with exclusion of one tissue, we designated the lincRNA as specific to that tissue. Given that such a lincRNA may have tissue specificity through enrichment or depletion, we also calculated the direction of its contribution (one-sided Student's t-test, P < 0.05). Shown is the number of lincRNAs with a distinct expression signature in a single tissue owing to enrichment (positive y axis) or depletion (negative y axis), which highlights the abundance of tissue-specific lincRNAs in the testis and brain.
Белок кодирующие гены с lincRNA, расположенной на расстоянии 10 kb, обогащены регуляторами транскрипции и функциями формирования онтогенетического паттерна28. Хотя некоторые lincRNAs демонстрируют регуляторные взаимоотношения со своими соседним локусами19, в целом экспрессия lincRNAs вблизи кодирующих генов не является неизменно более скоррелированной с таковой у соседей по сравнению с экспрессией соседних кодирующих локусов28. Попытки охарактеризовать функции lincRNA путем выявления кластеров с expression-matched скорее, чем с проксимальными кодирующими генами позволили специфицировать lincRNAs с предполагаемыми ткане-специфическими функциями28. Более того, ассоциированные с признаками lincRNAs преимущественно локализованы на границах топологически ассоциированных доменов и часто происходят из эволюционно законсервированных энхансерных регионов. Их экспрессия коррелирует с белок-кодирующими генами, ассоциированными с тем же самым признаком, подтверждая присутствие общего цис-регуляторного механизма, который участвует в модуляции архитектуры хроматина79 и те, которые обладают общей регуляцией и тканевой экспрессией, могут обладать общей функцией.
Итак, тканевая специфичность lincRNAs подтверждает, что они тонко регулируют экспрессию др генов благодаря физической близости, сходства паттернов экспрессии и одинаковым фенотипическими вкладами 28. Интересно, что репрессивные H3K9me3 модификации, обогащающие промоторы lincRNA генов, коррелируют c более значительной тканевой специфичностью, а не с низкой экспрессией как в случае мРНК 44. Эти данные показывают, что специфичность экспрессии lincRNA может способствовать становлению и поддержанию ткани и что функции lincRNA могут быть интимно связаны с таковыми мРНК или с др. не-кодирующими РНК, экспрессирующимися в той же ткани.
The functions of lincRNAs
Согласно последнему релизу (January 2015), база данных lncRNAdb содержит в каталоге 156 lncRNAs человека с предполагаемой функцией. Это представляет собой незначительное меньшинство из тысяч описанных lncRNAs. Мы обсудим пределы функций lincRNA, описанные в базе, которые включают регуляцию топологии хроматина с помощью как цис-, так и транс-механизмов, образования каркасов из белков и др. РНК, действуя как белковые и РНК ловушки, регуляцию соседних генов и продукцию микропептидов. Функция lincRNAs широка по настройке генной экспрессии путем прямого воздействия на архитектуру ядра и путем секвестрации внутриклеточных молекул или способствования их функции, а также более косвенно посредством эффектов на их транскрипции или трансляцию. Появляются доказательства существования smORFs в субнаборе аннотированных lincRNAs, это подчеркивает необходимость пересмотреть классификацию некоторых lincRNAs в отношении кодирующих РНК. Известные примеры lincRNAs, непосредственно участвующих в патогенезе болезней человека, и их потенциал в качестве биомаркеров и терапевтических мишеней рассмотрены в др. обзорах 16,80 и суммированы в Table 2. Аннотации и функциональные характеристики lincRNA суммированы в Table 3.
Table 2 : LincRNAs in human disease and development
Table 3: Profiling lincRNA biogenesis, coding potential and interactomes
Chromatin topology. lincRNAs могут поддерживать как стабильное, так и репрессивное состояние хроматина - т.е., они увеличивают или репрессируют активацию транскрипции. Они могут локально регулировать структуру хроматина в цис-положении - Также как и меж-хромосомную ядерную архитектуру в транс-положении16,21,80,81. Цис lincRNA-обусловленные взаимодействия хроматина включают образование петель хроматина82 и активацию транскрипции83 или репрессии84 генов мишеней. Транс-положением lincRNA-обусловленные взаимодействия хроматина широкие и включают регуляцию совместной экспрессии кодирующих генов с помощью образования петель хромосом82 или с помощью непосредственного связывания хроматин-модифицирующих комплексов74 и транскрипционных факторов85.
HOTTIP является цис-действующей lincRNA которая способствует экспрессии гена HOXA. Транскрибируемый с 5' конца локус HOXA, непосредственно взаимодействует в HOTTIP локусе с адапторным белком WD repeat-containing protein 5, который является компонентом myeloid/lymphoid или mixed-lineage leukaemia protein 1 (MLL1; известен также как KMT2A) histone lysine methyltransferase комплексом и посредством петли хроматина целенаправленно заставляет MLL1 воздействовать на HOXA локус - который расположен выше на 40 kb - вызывая тем самым триметилирование H3K4 и транскрипцию HOXA 82 (Fig. 3a). Далее была продемонстрирована его цис-активность, истощение HOTTIP снижает экспрессию HOXA, но не экспрессию высоко гомологичного гена HOXD 82.
Figure 3: The diverse functions of long intergenic non-coding RNAs (lincRNAs).
a | Regulation of chromatin structure and function in cis and in trans. HOTTIP associates with the myeloid/lymphoid or mixed-lineage leukaemia protein 1 (MLL1) complex, which catalyses histone H3 Lys4 trimethylation (H3K4me3) to activate HOTTIP transcription in cis(left). HOTAIR interacts in trans with the polycomb recessive complex 2 (PRC2) to mediate its deposition of the repressive H3K27me3 modification and with the KDM1A-CoREST-REST complex to mediate H3K4 demethylation, to coordinate transcription repression at target loci (right)125. b,c | LincRNAs scaffold proteins and RNAs in the nucleus and cytoplasm. b | TINCR binds Staufen1 in the cytoplasm, and binds and stabilizes mRNAs through its TINCR box motif to promote epidermal differentiation48. c | In the presence of HuR, lincRNA-p21 is destabilized by recruitment of the microRNA (miRNA) let-7 in complex with Argonaute 2 (Ago2). HuR association with the lincRNA-p21 target mRNAs JUNB and CTNNB1 results in their translation. In the absence of HuR, lincRNA-p21 remains stable, accumulates and associates with the JUNB and CTNNB1 transcripts in a mechanism that is at least partially mediated by co-association with the RNA-binding protein Rck and represses their translation by decreasing their ribosome association71. d,e | LincRNAs act as protein and RNA decoys. d | The expression of the lincRNA Gas5 is induced by growth arrest. Gas5 mimics the glucocorticoid response element (GRE) and binds the DNA-binding domain of the glucocorticoid receptor (GR), which sequesters the glucocorticoid receptor from its target genes103. e | Linc-RoR is abundant in pluripotent stem cells, where it acts as a decoy of the miRNA miR-145, thereby inhibiting the targeting and downregulation of the mRNAs of the pluripotency factors octamer-binding protein 4 (OCT4), the transcription factor SOX2 and homeobox protein Nanog. As linc-RoR levels decrease during differentiation, miR-145 is released and mediates the degradation of its targets to promote differentiation106. Part a is from Ref. 125, Macmillan Publishers Limited.
lincRNAs могут модулировать онтогенетически регулируемые гены в транс-положении45. Напр., HOTAIR12, который транскрибируется с локуса HOXC, вызывает молчание HOXD, а также генов др. хромосом86. HOTAIR формирует каркас для PRC2 с KDM1A-coREST-REST комплексом, индуцируя тем самым триметилирование H3K27 деметилирование H3K487, соотв., чтобы скоординировано репрессировать транскрипцию (Fig. 3a). Сравнительно недавно PRC2 зависимость от HOTAIR-обусловленной репрессии транскрипции была поставлена под сомнение доказательством, что HOTAIR-PRC2 взаимодействие несущественно для функции HOTAIR76. Эти находки подтвердили необходимость дальнейших исследований и пересмотра предыдущих данных о специфичности и функциональном значении взаимодействий lincRNA-PRC275.
lincRNAs сами регулируются с помощью цис- и транс-механизмов. Напр., Xist контролирует XCI в цис-положении10. Это транскрипт в 17 kb88 экспрессируется с X инактивационного центра89, который находится в области в 500 kb, который также содержит Xist вышестоящую регуляторную не-кодирующую РНК Jpx и Ftx90. У самок млекопитающих Xist необходим для случайного замалчивания одной из двух X хромосом, путем распределения вдоль неё и рекрутирования PRC белков в будущей неактивной X хромосоме (Xi)91. Транскрипт Jpx транс-активирует Xist на Xi92 путем оттитровывания CTCF прочь93; напротив, на активной Х, Xist противодействует с помощью своей анти-смысловой не-кодирующей РНК Tsix. Tsix индуцирует асимметрию хроматина между Х хромосомами, устанавливая бинарное Xist состояние транскрипции94,95. Нуклеация Xist на Xi нуждается в связывании аутосомного YY1 транскрипционного фактора с YY1-связывающими мотивами в повторяющемся домене C в Xist85. Хотя Xist является стабильным и может диффундировать в нуклеоплазму, когда не связан с хроматином, он не является разнородным в своем связывании с хроматином, на это указывает отсутствие связывания Xist с YY1-связывающими мотивами, присутствующими в аутосомах. Это подтверждает, что факторы, иные чем YYI вносят вклад специфичность прикрепления Xistв цис-положении85. Xist, как было установлено, влияет на архитектуру ядра путем непосредственного соединения с рецептором Lamin B, который прикрепляет Xist ядерной ламине, ограничивая тем самым подвижность Xi, чтобы секвестрировать покрытые Xist регионы от активной Х и поддерживать репрессивное состояние гена96. Xi подразделена на два репрессивных хромосомных мегадомена с помощью DXZ4 пограничного элемента, который необходим для становления конформации Xi хромосомы, но не молчания, 97,98.
Недавно, lincRNAs, которые используют цис- транс-механизмы действия,как было установлено, участвуют в трехмерной организации ядра. lincRNA Firre, которая необходима для адипогенеза, располагается в регионе в 5 kb вокруг региона места старта транскрипции и необходима для обеспечения меж-хромосомного соединения в транс-положении, по крайней мере, с 5 локусами, устанавливая тем самым компартменты ядра, которые могут поддерживать свою роль в адипогенезе81. Ядерный матричный белок HNRNPU связывает в 156-нуклеотидов повторяющуюся последовательность в Firre и необходим для становления мульти-хромосомных взаимодействий, возможно путем закрепления Firre на хроматине, чтобы инициировать формирование ядерных компартментов81.
Scaffolding and modulating the activity of proteins and RNA. lincRNAs могут взаимодействовать с нуклеиновыми кислотами посредством комплементарных последовательностей и с белками посредством структурных элементов РНК. Каркасные белки и их модуляции с помощью lincRNAs часто предопределяют функцию lincRNA. В ядре lincRNAs регулярно обеспечивают поддержку PRC белков, действуя тем самым на доступность хроматина, архитектуру ядра и экспрессию генов. Не-кодирующая РНК RepA, расположенная в Xist локусе, непосредственно связывает EZH2, являющийся каталитической субъединицей PRC2; образование такого каркаса необходимо для инициации XCI и распространения Xist99. Xist-связанный протеом был недавно описан с помощью масс-спектрометрии и это подразумевает существование ландшафта динамических взаимодействий lincRNA-белок, который изменяется во время клеточной дифференцировки100. Помимо образования каркаса с помощью HOTAIR из PRC2 и хроматина на локусе HOXD12, более чем 20% из транскриптов lincRNA (и более 2% мРНК) взаимодействуют с PRC2 (Ref. 74), указывая тем самым на существование неспецифического связывания с помощью PRC2 РНК75.
Принимая во внимание их низкое количество, особенно в цитоплазме44,53, lincRNAs могут эффективно и временно формировать каркасы из многих белков или участвовать в формировании стабильных, редко встречающихся комплексов. Цитоплазматические lincRNAs меняют стабильность48, деградацию101 и состояние трансляции71 мРНК мишеней. Напр., TINCR формирует каркас из РНК-связывающего белка staufen1, при этом эпидермальные способствующие дифференцировке мРНК, которые связывают мотив TINCR box, тем самым облегчают свою пост-транскрипционную стабилизацию и накопление48 (Fig. 3b). В то время как при миогенезе staufen1 способствует как стабилизации, так и распаду мРНК, при эпидермальной дифференцировке он взаимодействует с РНК, вызывающими дифференцировку, и способствует только стабилизации мРНК с помощью неизвестного механизма102. lincRNA-p21 соединяется с JUNB и CTNNB1 транскриптами и репрессирует их трансляцию; этому эффекту противодействует связывание lincRNA-p21 bс помощью HuR, который рекрутирует RNA-induced silencing complex (RISC), чтобы дестабилизировать lincRNA-p21 и способствовать трансляции JUNB и CTNNB1 (Ref. 71) (Fig. 3c).
Protein and RNA decoys. lincRNAs могут подавлять активность белков, мРНК и miRNA за счет их секвестрации. lincRNA Gas5 воспроизводит glucocorticoid response element (GRE) путем образования двунитевой структуры, которая связывает ДНК-связывающий домен глюкокортикоидного рецептора. Это взаимодействие не позволяет глюкокортикоидному рецептору соединяться со своими генами мишенями и активировать их транскрипцию (Fig. 3d). Уровни Gas5 низкие в пролиферирующих клетках и увеличиваются после ареста роста, во время которого Gas5 репрессирует GRE-обеспечиваемую экспрессию энзимов, участвующих в скорость-ограничивающих этапах глюконеогенеза и glycogenolysis103. Как часть стрессовой реакции на подавление протеосом, активация lincRNA NEAT1 способствует сборке ядерных paraspeckles и секвестрации транскрипционных факторов, чтобы контролировать экспрессию генов104. MALAT1, которая необходима для собственно сплайсинга, может сходным образом секвестрировать сплайс-факторы внутри ядерных paraspeckles, чтобы модулировать эффективность сплайсинга47.
Competing endogenous RNAs (ceRNAs) секвестрируют miRNAs от их мРНК мишеней, увеличивая тем самым экспрессию мРНК мишеней. Предполагаемый ceRNA механизм действия показывает, что некоторые lincRNAs, транскрипты псевдогенов и циркулярные РНК выполняют эту цель путем поддержания множественных сайтов мишеней для miRNA, которые секвестрируют miRNAs, не позволяя соединяться с комплексами RISC и т.о. предупреждая целенаправленное воздействие и деградацию мРНК105. Этот механизм прекрасно иллюстрируется с помощью linc-RoR, которая поддерживает плюрипотентность стволовых клеток. В плюрипотентных стволовых клетках linc-RoR секвестрирует miR-145, способствуя тем самым накоплению фактора плюрипотентности octamer-binding protein 4 (OCT4; известен также как POU5F1), транскрипционного фактора SOX2 и гомеобоксного белка Nanog, которые являются мишенями для miR-145 (Fig. 3e). Уровни linc-RoR снижаются во время дифференцировки и miR-145 высвобождается и способствует деградации мишеней, способствующих плюрипотентности106. Сходным образом, lincRNA TUG1, которая ассоциирует с PRC2 в ядре, действует как губка из PTEN-targeting miRNAs в цитоплазме22, приспосабливаясь тем самым к компартмент-специфическим ролям.
Regulators of neighbouring transcription. Менее 1% lincRNAs были функционально охарактеризованы, поэтому существует возможность, что многие транскрипты lincRNA не имеют предопределенной функции. Хотя крупномасштабный скрининг ORFs с помощью CRISPR-Cas9-обеспечиваемого разрушения оказывается эффективным, он не является естественно переносимым на скрининг lincRNA, поскольку большинство lincRNAs не функционирует посредством ORF-обеспечиваемой активности. Альтернативно, CRISPR interference (CRISPRi), которая использует nuclease-dead, каталитически неактивную Cas9, слитую с доменом белкового репрессора, чтобы репрессировать транскрипцию, недавно была использована для скрининга 17000 локусов lncRNA в 7 линиях клеток человека, участвующих в клточном росте. Нарушения транскрипции в 449 локусах lincRNA влияли на рост клеток; супрессия 89% этих lincRNAs вызывала фенотипические отклонения только в одном типе клеток, в противоположность белок-кодирующим генам, которые обычно обнаруживали общую потребность для роста всех типов клеток. Нарушения14 из этих lincRNAs вызывали локальные изменения транскрипции внутри набора из 20 генов, окружавших каждую из lncRNA, демонстрируя, что небольшая фракция lncRNAs влияет на транскрипцию локально20. Это исследование подчеркивает важность широкой потребности как транскрипт-зависимых, так и транскрипт-независимых функциях локусов, также как и важность клеточного контекста.
Др. недавнее исследование изучало независимые от последовательностей роли lincRNA. Нркаут 5 из 12 локусов в клетках мышей затрагивал экспрессию генов в цис-положении, в основном благодаря потере энхансер-подобной активности элементов ДНК в промоторах lincRNA. Зависимая от последовательности транскрипция оказалась несущественной для всех локусов. В одном из таких локусов lincRNA, Blustr, длина транскрипта и уровень транскрипционной активности коррелировали с экспрессией вышестоящего локуса Sfmbt2, но активация локуса Sfmbt2 не нуждалась в Blustr-специфической последовательности. Более того, транскрипция Blustr и Sfmbt2 нуждается в сплайсинге только 5' конца Blustr, подразумевая, что сплайсесомы на синтезируемом транскрипте Blustr участвуют в регуляции Sfmbt2 (Fig. 4a). Кроме того, 5' назначение (designation) сплайс-сайта, т.е. независимая от последовательности функция, ассоциирует с общей транскрипционной активностью Blustr, которая может включать рекрутирование ко-фактора, изменение структурц хроматина и накопление белка, способствующего транскрипции 19.
Figure 4: Long intergenic non-coding RNAs (lincRNAs) that function through their transcriptional and translational activity.
a | LincRNAs can regulate neighbouring genes by sequence-independent regulatory functions. In mice, splicing of the 5? end of the lincRNA Blustr as well as general transcriptional activity at the Blustr locus activate the transcription of the upstream locus Sfmbt2, possibly by recruiting cofactors, accumulation of pro-transcription proteins and chromatin alteration19. b | Some lincRNAs encode micropeptides. A conserved, small open reading frame (smORF) in the lincRNA LINC00961 produces the peptide small regulatory polypeptide of amino acid response (SPAR). In the presence of amino acids, SPAR interacting with the Ragulator complex impairs the recruitment of mTORC1 to the lysosome and thus inhibits mTORC1 activation18. c | In the absence of ultraviolet irradiation, ASCC3 is efficiently transcribed to produce a long, coding transcript that produces the ASCC3 protein, which is a component of the ASCC complex that represses ultraviolet-induced DNA damage repair. Ultraviolet irradiation leads to slower transcription at the ASCC3 locus and induces the use of an alternative, proximal last exon and the expression of a short, non-coding RNA. This non-coding RNA antagonizes the function of the ASCC complex, thereby promoting recovery from ultraviolet-induced DNA damage24. Pol II, RNA polymerase II; U1, U1 small nuclear RNA.
Недавно было предположено, что действие транскрипции является причиной, а не следствием конформационнных изменений ядра, затрагивающие экспрессию генов107. Подтверждением этой модели является то, что транскрипция с активной Х хромосомы достаточна для поддержания открытого состояния хроматина108. lincRNA транскрипция может изменять эпигенетическое состояние соседних кодирующих локусов, способствуя взаимодействиям с комплексами белков, организующих ядро, и избегать потребности в накоплении или стабильности lincRNA, т.е. даже низкие уровни транскрипции lincRNA могут способствовать формированию множественных макромолекулярных комплексов - состоящих из белков, нуклеиновых кислот, углеводов или липидов - без присутствия самих lincRNAs в высоких количествах или сравнительно стабильных. Напротив, стабилизация макромолекулярных комплексов с помощью lincRNAs нуждается в высоких количествах или в стабильности lincRNA. Эти находки подчеркивают необходимость в осуществлении генетических экспериментов по восстановлению любой lincRNA с предполагаемыми функциями, которые исходно свойсивенны их РНК транскриптам.
Потенциал широко распространенных функций lincRNAs, таких как eRNAs привлек большое внимание. Поскольку они часто не перекрываются с интронами или экзонами кодирующих генов, то многие eRNAs рассматриваются как межгенные109. eRNAs могут действовать путем регуляции образования петель хроматина, управляющих энхансерами посредством сборки mediator комплекса110,111. PROMPTs и eRNAs могут быть следствием накопления Pol II на сайтах инициации транскрипции кодирующих генов и могут поэтому не представлять собой классические, независимые транскрипционные единицы53. В соответствии с этим, гедавнее картирование 5' конца lincRNA показало, что 45.8% проанализированных lincRNAs происходят из энхансеров открытого хроматина и могут т.о. представлять важный подкласс eRNAs46 (e-lincRNAs; Table 1). В этой связи, lncRNAs соответствуют ассоциированной с болезнью expression quantitative trait loci (eQTL) локусов, экспрессии в типах клеток, имеющих отношение к болезни, и ко-экспрессирующихся с их перекрывающимися eQTL-содержащими мРНК; такими как e-lncRNAs, участвующими в регуляции экспрессии им соответствующих кодирующих генов46.
Белки, такие как транскрипционные факторы OCT4, SOX2 и Nanog112 могут регулировать свою собственную экспрессию путем взаимодействия с цис-регуляторными элементами своих собственных локусов. Поскольку белки д. быть импортированы в ядро из цитоплазматических сайтов синтеза белка, что прямо регулировать транскрипцию, но механизм авто-регуляции транскрипции белков не является в точности cis-регуляцией. lincRNAs, путем сравнения продуцируются и могут действовать в ядре и , следовательно, сбалансированы, чтобы более интимно регулировать свою собственную экспрессию или экспрессию соседних локусов только в цис-положении17. Диапазон lncRNA cis-регуляторных механизмов генной экспрессии пока не описан для меж-генного субнабора17. Эти механизмы включают регуляцию с помощью eRNAs111, lncRNAs, транскрибируемых с импринтируемых локусов113, авто-регуляторных lncRNAs и анти-смысловых lncRNAs17. Помимо анти-смысловых lncRNAs, которые по определению перекрывают кодирующие локусы, эти механизмы могут быть также общими для lincRNAs.
Encoding functional micropeptides. Ribosome profiling with deep sequencing (Ribo-seq)67,114 и протеомные подходы115 позволяют идентифицировать функциональные smORF-кодируемые микропептиды из менее 100 кодонов в длину, происходящих с не-кодируемых локусов у мух, мышей и людей115,116. Некодирующие ORF-обладающие локусы могут составлять до 10% генома, и сотни или тысячи предполагаемых микропептидов возникают в генах, обозначаемых сегодня как некодирующие115,117.
Первичные последовательности smORFs менее консервативны, чем у белок-кодирующих генов, но более консервативны, чем интроны50, не содержащие ORF регионы транскриптов и lincRNA транскрипты, как класс. Регионы smORF истощены по не-синонимным мутациям и лишены инсерций и делеций, подтверждающих консервацию на уровне пептидов118,119. Предполагаемые lincRNAs, обладающие икропептидами, экспрессируются на высоких уровнях и в виде менее ограниченного паттерна, чем lincRNAs, лишенные smORFs119, это указывает, что их трансляция или их пептидные продукты могут функционировать более широко, чем транскрипция или транскрипты lincRNAs, лишенных smORFs. Наиболее исчерпывающий каталог smORF получен в результате предсказаний на основании перекрестно-видовых базирующихся на консервации in silico smORF119. Др. исследование описало численные вариации предполагаемых, происходящих из lincRNA, smORF без использования критерия консервации50. Т.к. функциональная характеристика smORFs находится на ранней стадии исследований, их количественная оценка и определения являются привлекательной областью исследований.
Два полипептида, происходящие из аннотированных lincRNAs, регулируют функцию SERCA мембранного насоса, контролирующего реляксацию мышц: это myoregulin и DWORF. Myoregulin является консервативным, трансмембранным, α-спиральным микропептидом, кодируемым LINC00948 и экспрессирующимся исключительно в скелетных мышцах. Он непосредственно взаимодействует с SERCA чтобы подавлять потребление кальция в саркоплазматическом ретикулуме. DWORF является человеческим, кодируемым LOC100507537 микропептидом, который смещает подавляющие SERCA пептиды, чтобы повысить потребление саркоплазматическим ретикулумом кальция и способствовать контрактильности миоцитов120. Пептид NoBody транслируется с LINC01420 lincRNA и взаимодействует с мРНК decapping белков, контролирующих количество P-телец118. SPAR является пептидом, законсервированном у человека и мыши, кодируемым LINC00961, который подавляет активацию mTORC1 и мышечную регенерацию18 (Fig. 4b).
Важно, что только небольшая фракция консервативных lncORFs имеет peptidomic доказательства при масс-спектрометрии, по-видимому, данные занижены благодаря происхождению этих данных только из немногих типов клеток119. Мы идентифицировали 1179 lincRNAs, которые содержат 1432 законсервированных smORFs, которые, кстати, включают 6 lincRNAs, продуцирующих 6 экспериментально подтвержденных микропептидов. Эти lincRNAs включают RP1-302G2.5 (84 aa продукт без названия); RP11-672F9.1 (40 aa продукт без названия); RP11-451G4.2 (34 aa продукт DWORF); LINC00948 (известен также как MRLN; 46 aa продукт, myoregulin); SPAAR (известен также как LINC00961; 75 aa продукт, SPAR); и NBDY (известен также как LINC01420; 68 aa продукт, NoBody). lincRNAs, кодирующие эти smORFs д. быть классифицированы более точно, как кодирующие скорее, чем не-кодирующие гены18,68,81,118-121. Принимая во внимание, что более 80% регионов транскриптов этих родительских lincRNAs являются не-кодирующими - т.е. лишены трансляционной активности - интересно предположить, что некоторые локусы могут поддерживать как кодирующие, так и некодирующие функции.
Большинство предполагаемых smORF продуктов лишено гомологии с известными пептидами, это подчеркивает тот факт, что критерий консервации может быть недостаточным для определения smORFs. Более того, имеется мало информации о функциях пептидов с гомологией, тем самым необходима характеристика пептидов de novo, которая не может быть прямой при отсутствии благонадежного скрининга119. Экспертиза биологической химии может внести большой вклад в идентификацию большего числа микропептидов, выяснения их функций и исследования микропептидов как лекарственных мишеней67.
Случайно любая достаточно длинная последовательность может содержать ORF, хотя lincRNAs определяются по отсутствию у них канонических ORFs. Могут ли lincRNA с кодирующей способностью также обладать не-кодирующей функцией? Интересен недавний пример переключения, индуцируемого с помощью УФЛ, с экспрессии с длинных белок-кодирующих ASCC3 транскриптов на экспрессию короткой не-кодирующей изоформы ASCC3. Не-кодирующая изоформа противодействует ASCC3 белку, который способствует восстановлению транскрипции после повреждений, вызываемых УФЛ
24 (Fig. 4c).
Conclusions and future perspectives
How can coding functions evolutionarily replace or exist alongside non-coding functions? Protein-coding genes may be under stringent selective pressure to retain coding capacity. During evolution, some loci may lose coding functions and gain non-coding functions, possibly subsequently to gene duplication. These non-coding loci, including lincRNAs, may regulate three-dimensional nuclear organization107 and affect gene expression solely by their transcriptional activity and may modulate protein and nucleic acid interactions directly by their transcripts. Some lincRNA loci may undergo additional changes to produce smaller RNAs or regain coding capacity and produce micropeptides122 that have peptide-dependent or translation-linked functions. In this fashion, a single locus may evolve both non-coding and coding regulatory capacities123. The act of lincRNA transcription and translation, as well as the resulting products, may thus evolve to regulate activity at other coding loci124.
The lincRNA landscape continues to expand and exhibit the diversity of identity and function of lincRNAs. Recent work has demonstrated the dispensability of some lincRNA transcripts for local gene regulation, their role in encoding micropeptides and their implication as enhancer RNAs. Modelling lincRNAs as genetic repositories with the capacity to develop multiple functions, freed from the evolutionary constraints of mRNAs, offers a framework for integrating the diverse functions of the non-coding transcriptome.
|