Recent advances have fuelled rapid growth in our appreciation of the tremendous number, diversity and biological importance of non-coding (nc)RNAs. Because ncRNAs typically function as ribonucleoprotein (RNP) complexes and not as naked RNAs, understanding their biogenesis is crucial to comprehending their regulation and function. The small nuclear and small nucleolar RNPs are two well studied classes of ncRNPs with elaborate assembly and trafficking pathways that provide paradigms for understanding the biogenesis of other ncRNPs.
Рис.1. | Anatomical features of Sm- and Lsm-class small nuclear RNAs.
Рис.2. | Biogenesis of Sm-class small nuclear RNPs.
Рис.3. | Anatomical features of C/D and H/ACA RNAs.
Рис.4. | Coordinated synthesis, assembly and trafficking of C/D and H/ACA RNPs.
Менее 2% генома человека транслируется в белки, более 40% генома. как полагают, транскрибируется в РНК1. Большая часть не транслируемой части транскриптома человека включает воистину удивительный ряд функциональных non-coding (nc)RNAs2. В самом деле, с начала открытия нового класса ncRNA (напр., microRNAs, short interfering (si)RNAs, ассоциированных с повторами РНК и специфичных для зародышевой линии РНК) и новых членов существующих классов (напр., small nucleolar (sno)RNAs) подчеркивается широта и глубина функции ncRNA. Важно, что ncRNAs ведут себя как ключевые транс-действующие регуляторы разных клеточных активностей во всех трех доменах жизни3-7 (Table 1). Среди известных активностей ncRNAs находятся: эндонуклеолитическое расщепление РНК и ligation, сайт-специфические модификации РНК, метилирование ДНК, синтез (теломерной) ДНК и модуляция белковой функции. Эти активности важны (на многих уровнях) для генной экспрессии и также для стабильности генома (Table 1).
В некоторых случаях молекулярные механизмы, с помощью которых функционируют ncRNAs, хорошо изучены, тогда как др. полностью неизвестны. ncRNAs обычно действуют как адапторы, которые обеспечивают безопасность и позиционируют молекулы мишени нуклеиновых кислот для ферментативной активности, которая катализируется с помощью ассоциированных белков партнеров. Следовательно, активность ncRNA обычно управляется за счет спаривания оснований8 и часто использует несколько белков партнеров; т.е. функциональной единицей является non-coding ribonucleoprotein (ncRNP). Ступени сборки ncRNP часто недостаточно хорошо определены, но, что важно, могут быть регулируемы, чтобы контролировать активность комплекса, поэтому важно детальное понимание их биогенеза.
Small nuclear (sn)RNPs и snoRNPs безусловно лучше всего изученные примеры ncRNPs, а анализ их биогенеза выявил непредвиденную сложность их сборки, переноса и механизмов действия.
The snRNAs
snRNAs представляют собой небольшую группу очень богатую не-полиаденилированными, не-кодирующими транскриптами, которая функционирует в нуклеоплазме. snRNAs могут быть подразделены на два класса на базе общих последовательностей и белковых кофакторов. Sm-class РНК характеризуются 5'-trimethylguanosine шапочкой, 3' stem-loop и сайтом связывания для группы из семи Sm белков (Sm сайт), которые формируют heteroheptameric кольцевую структуру (Fig. 1a). Lsm-class РНК содержит monomethylphosphate шапочку м 3' stem-loop, заканчивающуюся на участке из uridines, которая формирует сайт связывания для характерного heteroheptameric кольца из Lsm белков (Fig. 1b).
Sm класс snRNAs представлен U1, U2, U4, U4atac, U5, U7, U11 и U12, тогда как класс Lsm состоит из U6 и U6atac. За исключением U7 snRNP, который участвуют в процессинге гистоновых пре-мРНК, др. богатые уридином snRNPs формируют стержень spliceosome и катализируют удаление интронов из пре-мРНК9. Аккуратное удаление интронных последовательностей осуществляется благодаря взаимодействиям спаривающихся оснований между snRNAs сплайсесом и соединениями между экзонами и интронами. В ходе сплайс-реакции специфические и динамические взаимодействия спаривающихся оснований происходят среди и между самими snRNAs. Более 150 белков партнеров также используются в этом процессе10,11.
Менее изучена история жизни snRNPs до их сборки в сплайсесомы. Недавние исследования показали, что транскрипция и 3' процессинг большинства snRNAs связаны с системой, которая параллельна, но отличается от той, которая продуцирует мРНК. Более того, описаны клеточные системы, которые участвуют в ядерном транспорте и сборке snRNPs (и возможно др. ncRNPs).
Coupled transcription and 3' processing
Sm-класс snRNA генов обладает некоторыми общими свойствами с генами кодирующими белки, включая расположение вышестоящих и нижестоящих контрольных элементов (Fig. 1c). Sm-класс генов транскрибируется с помощью специализированной формы RNA polymerase II (Pol II), которая функционально сходна с Pol II, используемой генами, кодирующими белки у млекопитающих12. Promoter-swap эксперименты, осуществленные более двух десятков лет тому назад13,14, показали, что факторы, которые важны для аккуратного распознавания 3'-processing сигналов (Fig. 1c), д. загружаться на полимеразу на промоторе; однако, факторы, ответственные за расщепление этих не-полиаденилированных транскриптов, идентифицированы лишь недавно.
Baillat et al.15 очищали комплексы из клеток человека, названные Integrator, которые ассоциируют с С-терминальным доменом (CTD) Pol II и могут быть ко-преципитированы с промоторными последовательностями snRNA, но не с теми, что контролируют мРНК или гистоновые гены. Более того, два очищенных белка, INT9 и INT11, обладают существенным сходством с факторами расщепления и специфичности полиаденилирования CPSF-100 и CPSF-73, соотв.15, это существенно для собственно расщепления и полиаденилирования 3' концов мРНК и для образования не-полиаденилированных 3' концов гистоновых пре-мРНК16,17 (Fig. 1c). Более того, INT11 по-видимому, является эндонуклеазной субъединицей Integrator комплекса, т.к. истощение эндогенного белка или избыточная экспрессия конструкции, содержащей мутацию в законсервированном metal-chelating остатке, ингибирует образование 3'-конца в snRNA15. Поэтому очевидно, что CPSF-73 обладает каталитической ролью в двух независимых комплексах 3'-процессинга мРНК и что родственный белок, INT11, выполняет сходную роль в расщеплении 3' концов Sm-класса snRNA.
У metazoa, CPSF и Integrator комплексы взаимодействуют с CTD Pol II, чтобы связать транскрипцию с нижестоящими событиями процессинга РНК. Роль CPSF в обеспечении коммуникаций между транскрипцией и полиаденилированием законсервирована среди эукариот. Однако, предполагаемая роль metazoan Integrator белков в купировании транскрипции с процессингом, по-видимому, осуществляется с помощью Nrd1 комплекса у дрожжей18-20. Вместе со своими белками партнерами Nab3, Sen1 и др., комплекс Nrd1 соединяется с Pol II CTD и управляет образованием 3'-конца не-полиаденилированных транскриптов, таких как snRNAs и не-интронных snoRNAs21-23. Эволюционные взаимоотношения, если они есть, между белками Nrd1 комплекса и теми из Integrator комплекса, еще не установлены.
Lsm-класс snRNA генов (U6 and U6atac) транскрибируются с помощью Pol III, используя специализированные наружные промоторы24. Участок из уридинов, который формирует Lsm-связывающий сайт на 3' конце (Fig. 1b), также дублируется в качестве терминатора Pol III транскрипции. Следовательно, имеется немного параллелей между Lsm-class генами и генами, кодирующими белки.
Nuclear export systems
У высших эукариот Lsm-класс snRNAs никогда не покидает ядро, в то время как биогенез Sm-класса snRNPs является многоступенчатым процессом, который осуществляется в отдельных субклеточных компартментах. Sm-класс snRNAs экспортируется из ядра для цитоплазматического созревания. Структура 5' шапочки и длина РНК являются ключевыми детерминантами для ядерного экспорта и главные компоненты системы переноса установлены.
После транскрипции и 3' процессинга в ядре, вновь транскрибированные Sm-класса snRNAs транспортируются в цитоплазму с помощью экспортного комплекса (Fig. 2), который содержит snRNA-специфический экспортный adaptor proteinPHAX, export receptor chromosome region maintenance-1 (CRM1; известный также как exportin-1), cap-binding complex (CBC; который состоит из белкового гетеродимера CBP80-CBP20) и Ran GTPase25. Способность PHAX экспортировать snRNAs зависит от его состояния фосфорилирования. Гиперфосфорилированный PHAX преимущественно ядерный. Вместе с CBP80 и CBP20, PHAX образует мостик между snRNA и CRM1 (Fig. 2).Гипофосфорилированный PHAX преимущественно цитоплазматический, не может связываться с snRNAs и подвергается рециклингу в ядро посредством импортирующего рецептора importin-β26. Kinase(s) и phosphatase(s), которые регулируют этот процесс, не идентифицированы. Однако, не совсем ясно, экспортируются ли snRNAs грибов, т.к. их геномы не содержат распознаваемых ортологов PHAX.
Также неясно, как PHAX различает 5' шапочки определенных предшественников snRNA от общей массы РНК. Ohno с коллегами показали, что когда происходит экспорт РНК, то длина действительно существенна27,28. Путем вставления всё более длинных последовательностей в разные позиции U1 snRNA, они показали, что экспорт может отклонять свой маршрут от PHAX пути на ядерный экспорт с помощью nuclear export factor-1 (NXF1)-обусловленного пути экспорта мРНК27,28. Напротив, не-интронные мРНК могут быть принуждены изменить маршрут с NXF1-обусловленного на PHAX-обеспечиваемый путь с помощью последовательных делеций28. Следовательно, длина также является важным детерминантом выбора пути экспорта РНК.
Однако, длина РНК и структура шапочки не объясняют всей истории, т.к. некоторые snoRNA транскрипты имеют сходные размеры и имеют ту же самую 5' шапочку. что и snRNAs, но по-прежнему остаются в ядре29,30. Напр., недавние доказательства указывают на то, что PHAX соединяется с предшественником U3 snoRNAs31 и поставляет её в Cajal bodies (скорее, чем цитоплазму), где она взаимодействует с 5'-cap hypermethylase trimethylguanosine synthase-1 (TGS1) перед своим накоплением в ядрышках30. Предполагается, что сборка со стержневыми snoRNP белками (see below) и гиперметилирование 5' шапочки могут запрещать экспорт snoRNP. U3 транскрипты с мутациями в элементах консервативного бокса C и D (Fig. 3) экспортируются в цитоплазму30,32,33. Эти результаты вместе с находками Smith и Lawrence34 указывают на то, что предшественники U2 snRNA, которые содержат 3' расширения, также локализуются в тельцах Кахаля (Cajal), это ведет к предположению существования дискриминационной ступени для экспорта РНК, которая имеет место в окружении телец Кахаля.
Cytoplasmic assembly of the core snRNP by SMN
Экспорт в цитоплазму, сборка в стабильные Sm-core частицы осуществляются с помощью survival motor neuron (SMN) белкового комплекса (Fig. 2). Доказательства указывают на то. что SMN комплекс участвует также в сборке др. RNPs35,36. Мутации потери функции в гене SMN1 человека вызывают нейрогенетические нарушения, называемые spinal muscular atrophy (Box 1). Вместе с его ассоциированными факторами, известными как Gemins, комплекс SMN соединяется со вновь экспортированными предшественниками snRNA и с семью Sm белками, которые формируют стержень RNP35,37 (Fig. 2). Недавние данные указывают на WD-repeat белок, Gemin-5, как фактор специфичности, который соединяется с snRNAs, которые содержат консенсусный Sm сайт38,39. Пока неясно, как U7 snRNA, которая содержит необычный Sm сайт (Fig. 1a), распознается с помощью субнабора SMN комплексов, которые содержат U7-специфические Sm-подобные белки LSM10 и LSM11 (Ref. 40). Дополнительные факторы в комплексе SMN помогают укладываться Sm белкам в складку, но деталей мало.
Import and assembly of snRNP-specific factors
После сборки Sm стержня и ассоциации с комплексом SMN (Fig. 2), snRNA 7-methylguanosine (m7G) шапочка гиперметилируется с помощью TGS1 белка. чтобы сформировать 2,2,7-trimethylguanosine (TMG) шапочку41. Кроме того, немногие нуклеотиды на 3' концах snRNAs срезаются прочь с помощью предположительно exonuclease, возможно ускоряя тем самым кинетику импорта snRNPs42. Sm-класс snRNPs содержит два nuclear localization signals: TMG шапочку и сам стержень Sm (Figs 1, 2). Каждый сигнал использует импортирующий рецептор importin-β, чтобы транспортировать snRNPs в ядро43. Однако, адаптор, который специфически распознает TMG шапочу, называется Snurportin-1, в то время как SMN комплекс (или его субкомплекс) является адаптором для Sm стержня44,45. Sm-core и TMG-cap сигналы импорта функционируют независимо in vitro46,47, однако, скорее всего, что адапторы (Snurportin-1 и SMN комплекс) действуют in vivo синергично.
Оказавшись в нуклеоплазме snRNPs свободно диффундируют по всему межхромосомному пространству. Вновь возникшие RNPs временно накапливаются в тельцах Кахаля (Fig. 2) прежде чем накапливаться в ядерных субдоменах, известных как perichromatin fibrils и interchromatin granule clusters48. Дополнительные ступени ремоделирования и сборки RNP, как полагают, имеют место в тельцах Кахаля35, включая РНК-обусловленную модификацию snRNAs сплайсесом (see below) и сборку факторов, которые специфичны для данного вида snRNP49-53. Помимо своей роли в de novo сборке RNP, тельца Кахаля могут также участвовать в рециклинге и ремоделировании U4/U6 snRNP комплексов, которые разрушаются во время реакции сплайсинга49,52.
The snoRNAs
РНК, обычно обозначаемые как snoRNAs представлены двумя семействами, C/D и H/ACA РНК. Термин small nucleolar RNA первоначально отражал локализацию в ядрышках первых членов этой группы по сравнению с их нуклеоплазматическими кузинами, snRNAs. Большинство C/D и H/ACA РНК участвуют в модификации и процессинге ribosomal (r)RNA в ядрышке. Однако, C/D и H/ACA РНК участвуют и во внушительном наборе функций и мишеней, а также в соотв. ранга паттернах клеточной локализации, которые включают сайты вне ядрышков (чтобы получить доступ к разным субстратам). Поэтому snoRNA семейство растет, включая всё больше членов не соответствующих первоначальному названию.
Functional diversity and anatomy of the RNAs
В то время как клетки эукариот содержат меньше десятка видов snRNA, они содержат более 200 уникальных C/D и H/ACA РНК54,55. C/D и H/ACA РНК находятся среди наиболее многочисленных и функционально разнообразных транс-действующих ncRNAs56-60. Более того, эти РНК присутствуют в archaea также как и у эукариот, указывая тем самым. что они возникли более 2-3 биллионов лет тому назад.
C/D и H/ACA РНК существенны для основных биологических процессов, включая трансляцию белков, сплайсинг РНК и стабильность генома (Table 1). Большинство известных C/D и H/ACA РНК вызывают модификации др. ncRNAs. Два класса РНК вызывают разные модификации нуклеотидов: C/D РНК управляют 2'-O-ribose метилированием, а H/ACA РНК управляют pseudouridylation (превращением uridine в pseudouridine). C/D и H/ACA РНК участвуют параллельно как в процессинге, так и модификации рибосомальных РНК. Эти RNPs модифицируют ключевые области rRNA (напр., peptidyl transferase centre и mRNA-decoding centre), и оба типа модификаций существенны для функции рибосом60,61. Др. мишени модификаций включают snRNAs у эукариот62, транспортные RNAs у archaea63, сплайсированные лидерные РНК у trypanosomes64 и вообще, по крайней мере ,одну специфичную для головного мозга мРНК у млекопитающих65-67. Функция сплайсесом также зависит от модификаций snRNAs с помощью C/D и H/ACA RNAs60. Кроме того, одна H/ACA РНК, telomerase RNA, необходима для синтеза теломер68. Более того, существование значительного количества орфановых РНК, для которых, по-видимому, не установлены субстраты мишени (т.е., мишени, такие как rRNAs и snRNAs). указывают на то, что C/D и H/ACA РНК функционируют также на мишенях и в процессах, которые еще предстоит идентифицировать69,70.
C/D and H/ACA РНК определяются как консервативные signature-sequence элементы и характерные вторичные структуры (Fig. 3). C/D и H/ACA модификации вызывающие РНК являются архетипами с простейшими (и возможно наиболее родоначальными) конфигурациями. РНК распознают и обеспечивают безопасность молекул мишеней посредством антисмысловых элементов (Fig. 3). C/D и H/ACA РНК, которые специализируются на обеспечении др. функций (включая процессинг пре-рРНК и синтез теломер) обнаруживают вариации базовой архитектуры (Fig. 3). Все РНК из каждого семейства взаимодействуют со стержневыми наборами из высоко законсервированых белков, чтобы сформировать C/D и H/ACA RNPs (Box 2). В случае обеспечивающих модификации RNPs, эти белки вместе с ведущей РНК достаточны для функционирования in vitro71-76. Др. белки необходимы для специализированных функций и для действия in vivo57,59.
Architecture of the C/D and H/ACA RNPs
Подобно др. ncRNAs, C/D и H/ACA вызывающие модификации РНК действуют как адапторы, которые связывают каталитический компонент RNP с мишенью. Восстановление функциональных archaeal C/D71-74 и H/ACA модификации вызывающих RNPs75,76 быстро продвинули наше понимание организации и функции этих комплексов. Структуры с атомным разрешением всех стержневых компонентов archaeal C/D77-81 и H/ACA RNPs82-86, включая некоторые мультикомпонентные комплексы, также теперь доступны, они предоставляют захватывающую структурную информацию. C/D и H/ACA RNPs иллюстрируют разные способы рекрутирования и позиционирования энзимов партнеров с помощью ведущей РНК и ряд существенных функций, вносимых с помощью др. стержневых белков.
The H/ACA RNP: direct binding of the enzyme. Простейшая парадигма рекрутирования была обнаружена для H/ACA RNP, в котором белок энзим взаимодействует непосредственно и специфически с ведущей РНК посредством законсервированных свойств РНК75,76,84,86. Centromere binding factor-5 (Cbf5; известный как dyskerin у людей) является pseudouridine synthase с каталитическим доменом и PUA (pseudouridine и archeosine transglycosylase) доменом. Box ACA и нижняя часть ствола ведущей РНК, связанные с помощью PUA домена из Cbf5, закрепляют антисмысловые элементы вблизи каталитического сайта86 (Box 2). У людей точковые мутации, которые затрагивают кластер аминокислот в PUA домене белка dyskerin приводят к dyskeratosis congenita82 (Box 1). Кластер этих мутаций dyskeratosis congenita был открыт с помощью картирования широко разбросанных мутаций dyskeratosis congenita в контексте предсказанной трехмерной структуры белка человека (смоделированной исходя из кристаллической структуры archaeal Cbf5)82. Затронутые аминокислотв оказывались в непосредственной близи, но не были включены в те аминокислоты, которые непосредственно вовлечены во взаимодействия ведущей РНК и белков (они безусловно должны были существенно нарушать РНК взаимодействия и вызывать более тяжелые дефекты)82,86. В согласии с этой гипотезой то, что мутации, вызывающие болезнь, затрагивают (но не элиминируют) РНК связывание, количества H/ACA РНК, включая, telomerase RNA и snoRNAs, редуцированные у пациентов с dyskeratosis congenita и у мышиных моделей болезни87-89. Тем не менее имеются и др. жизнеспособные гипотезу молекулярных основ этой болезни82,86.
Др. три белка H/ACA RNP являются тем не менее существенными для функции комплекса75. Gar1 и Nop10 каждый соединяется с самостоятельным сайтом на каталитическом домене Cbf5, тогда как L7Ae взаимодействует непосредственно с ведущей РНК75,82-84,86 (Box 2). Имеющиеся доказательства показывают, что Gar1 участвует в связывании и/или высвобождении мишени РНК82,86. Nop10 располагается вдоль верхней части ствола ведущей РНК между Cbf5 и L7Ae, и, по-видимому, взаимодействует с L7Ae и ведущей РНК (а также с Cbf5) в контексте комплекса, указывая на скоординированную функцию86. L7Ae связывает kink-turn (k-turn) motif, который располагается на верхней части stem-apical loop ведущей H/ACA РНК (Fig. 3), и индуцирует крупный изгиб (или загиб) в РНК85,86. Остается определить, как возникающие изменения могут вносить вклад в функцию H/ACA RNP. H/ACA РНК может иметь одну, две или три шпильки, а имеющиеся доказательства указывают на то, что каждая шпилька служит в качестве сайта связывания для полного набора из 4-х стержневых белков H/ACA RNP75,90. У млекопитающих H/ACA РНК почти исключительно состоят из двух единиц шпилек, а имеющиеся доказательства указывают на то, что организация RNP сходная91,92.
The C/D RNP: a protein bridge to secure the enzyme. Ассоциация methyltransferase fibrillarin с C/D ведущей РНК зависит от формируемого мостика с помощью двух др. стержневых белков, L7Ae и Nop56/58 (Refs 71,73,74). L7Ae nucleates ансамбль из C/D RNP. Т.к. в H/ACA RNP, L7Ae связывает k-turn мотив в C/D ведущей РНК, то в таком случае формируются в результате взаимодействия элементы box C и D (Fig. 3; Box 2). Возникающая в результате реструктуирования РНК, по-видимому, создает новые сайты связывания, которые распознаются с помощью Nop56/58 белка93. Nop56/58 в свою очередь рекрутирует каталитический белок fibrillarin, чтобы закончить сборку функционального комплекса.
Данная C/D РНК может иметь одну или несколько функциональных единиц (каждая представленная box C, box D и антисмысловым элементом; Fig. 3). Недавние результаты также показали белковые мостики между этими функциональными единицами (Box 2). Рентгеновские структуры высокого разрешения fibrillarin и Nop56/58 выявили fibrillarin-Nop56/58-Nop56/58-fibrillarin комплекс, в котором два fibrillarin-Nop56/58 гетеродимера соединены посредством экстенсивных coiled-coil взаимодействий между Nop56/58 белками79. Этот комплекс моста обладает потенциалом помещать Nop56/58 и fibrillarin на вторую функциональную единицу и объясняет очевидное отсутствие потребности в L7Ae связывании на второй единице в некоторых системах73,94. Более того, новая структура комплекса, по-видимому, принимает разные конформации, приводящие к существенному движению шарнира, которое может быть вовлечено в собственно помещение fibrillarin на сайт модификации мишени (S. Oruganti, Y. Zhang, H. Li, M. T., R. T., W. Yang and H. Li, unpublished observations) и вызывает беспокойство, возникающее из анализа расстояний внутри комплекса, которые не предполагают движения79.
Regulated assembly and trafficking in eukaryotes
Результаты последних исследований показали, что сборка и трафик C/D и H/ACA RNPs хитроумно регулируются в клетках эукариот (Fig. 4). Кажется, что комплексы собираются как неактивные pre-RNPs на синтезируемых ведущих РНК транскриптах на генах. pre-RNPs транспортируются в тельца Кахаля, где, как установлено, они созревают до функциональных комплексов. Наконец, RNPs д.быть доставлены к местам, где они функционируют, но , по крайней мере , в одном случае, доставка, по-видимому, регулируется, чтобы контролировать активность RNP. Регуляция транспорта и сборки, по-видимому, использует временные взаимодействия с различными факторами, некоторые из которых уже и звестны.
Co-transcriptional assembly of pre-RNPs. Когда H/ACA РНК транскрибируется, то три из 4-х стержневых белков H/ACA RNP и фактор сборки, называемый nuclear assembly factor-1 (Naf1), ассоциируют с РНК (Fig. 4a). Субнабор из трех белков H/ACA RNP - Cbf5, Nop10 и Nhp2 (гомолог L7Ae) - и Naf1 обнаруживается на транскрипционно активных H/ACA генах95-98. Naf1 взаимодействует также с компонентами Pol II транскрипционной кухни, включая CTD из крупной субъединицы polymerase, указывая тем самым на интимную связь сборки RNP с транскрипцией97,99.
Naf1 может гарантировать сборку стабильного H/ACA pre-RNP, который является неактивным до тех пор, пока Naf1 не будет заменен на Gar1. Имеющиеся доказательства указывают, что Naf1 и Gar1 взаимодействуют с общим сайтом на Cbf5 взаимоисключающим образом82,95,97,99. Naf1 и Gar1 обладают общей областью гомологии, которая, по-видимому, обеспечивает связывание с Cbf5, но во всем остальном белки существенно отличны. Gar1 является важным для функции H/ACA RNPs75, но является лишь стержневым белком, который не нужен для накопления H/ACA РНК. Naf1 необходим для накопления всех классов H/ACA РНК95,99-102. Однако, Naf1 не обнаруживается в ассоциации с H/ACA RNPs, который задействованы функционально. Замена Naf1 на Gar1 д.быть ключевой ступенью в регуляции перехода от pre-RNPs в активные H/ACA RNPs.
Сборка C/D RNPs, по-видимому, происходит одновременно с транскрипцией103-105 и тесно связана со сплайсингом пре-мРНК106. Молекулярная связь между этими двумя процессами была установлена, так как генеральный фактор сплайсинга, наз. IBP60, который соединяется выше интронных C/D РНК и обладает предположительно helicase активностью, которая, по-видимому, и запускает сборку C/D RNP107. Сборка C/D RNP использует также фактор обмена, наз. Bcd1 (box C/D RNA). Подобно Naf1, Bcd1 является существенным для накопления всех C/D РНК108,109, но не является стабильным компонентом зрелых RNPs. Bcd1 также, по-видимому, взаимодействует с Pol II кухней. Т.к. единственный стержневой белок, который не нужен для накопления C/D РНК у эукариот, Nop56 может быть Bcd1-exchange партнером (аналогично Gar1).
C/D и H/ACA RNPs являются также предметом ко-транскрипционного контроля качества. Аберрантные РНК или RNPs, по-видимому, направляются на деструкцию с помощью механизма, участвующего в ядерном полиаденилировании с помощью TRAMP complex и деградируют с помощью exosome110. Эта система ядерного контроля тесно связана с транскрипцией и процессингом 3' концов18,21,111,112. Имеется несколько дополнительных факторов, участвующих в ко-транскрипционной сборке C/D и H/ACA RNPs. Напр., две предполагаемые РНК и ДНК геликазы, наз. RVB1 и RVB2 (известные также как TIP49a и TIP49b, или как p50 и p55), существенны для накопления C/D и H/ACA РНК31,113. Эти геликазы могут выполнять роль помощников сборки RNP или помогать высвобождению синтезируемых транскриптов с генов.
Maturation at Cajal bodies. Все C/D и H/ACA RNPs, по-видимому, быстро доставляются на тельца Кахаля114-116, что как полагают, существенно для ступеней созревания (Fig. 4b). Как было показано выше, PHAX может играть роль в локализации определенных C/D и H/ACA РНК на тальцах Кахаля. Тельца Кахаля являются сложными внутриядерными структурами, богатыми факторами, участвующими в модификации РНК и в сборке РНК-белковых комплексов35,117,118. В частности, эти факторы включают TGS1, энзим, ответственный за гиперметилирование 5'-шапочки, покрывающей C/D и H/ACA РНК105, и SMN комплекс. Как рассматривалось выше, SMN комплекс является установленным snRNP-assembly фактором37,119. Однако, SMN комплекс ассоциирует также с C/D и H/ACA RNPs. Более того, SMN комплекс взаимодействует с fibrillarin и Gar1 посредством одних и тех же доменов, которые обеспечивают связывание и сборку snRNPs120-122, а накопление U3 C/D РНК зависит от SMN комплекса31.
Distribution to functional sites. В зависимости от своей функции C/D и H/ACA РНК в конечном итоге локализуются в ядрышках, тельцах Кахаля или теломерах (Fig. 4c). Ядрышковые РНК быстро движутся через тельца Кахаля в ядрышки. Доставка в ядрышки этих РНК зависит от сигнатурных последовательностей (box C и D или box H и ACA) и соседнего ствола, который закрепляет box элементы123,124. Субнабор из C/D и H/ACA ведущих РНК, называемый small Cajal body (sca)РНК62, остается в тельцах Кахаля, чтобы модифицировать snRNAs. Интересно, что scaRNAs могут быть гибридными, содержащими как C/D, так и H/ACA мотивы62. Удерживание H/ACA scaRNAs в тельцах Кахаля обеспечивается с помощью Cajal body (CAB) boxes (Fig. 3), однако, H/ACA домен (т.е., nucleolar targeting element) также необходим для локализации в тельцах Кахаля115. Мутации CAB боксов вызывают появление РНК в ядрышках, указывая, что CAB сигнал обычно вытесняет сигнал поставки в ядрышки115,125. Субнабор Sm белков. как недавно было показано, ассоциирует с scaRNAs CAB-box-зависимым способом и было бы интересно посмотреть, важны ли Sm белки для локализации в тельцах Кахаля126. Показано, что PHAX и CRM1 взаимодействуют с немногими C/D РНК, которые независимо транскрибируются и покрыты m7G-шапочкой (Box 3), и играют роль в доставке в тельца Кахаля и ядрышки, соотв.30,31. Однако, огромное большинство у позвоночных C/D и H/ACA РНК спасаются (salvaged) в интронах и остаются без шапочек (uncapped) (Box 3), a факторы, участвующие в их поставках, остаются неизвестными.
Возникает интересная регуляторная парадигма при изучении telomerase: H/ACA RNP (у позвоночных), которые участвуют в синтезе теломер127,128. Показано, что доступ telomerase RNA (и её белкового партнера, telomerase reverse transcriptase (TERT)) к их субстрату регулируется в зависимости от клеточного цикла, чтобы ограничить активность энзима telomerase S фазой. В клетках человека, telomerase RNA сохраняется в тельцах Кахаля в течение всего клеточного цикла посредством CAB бокса127,128. В то же самое время, TERT обнаруживается в самостоятельных ядерных фокусах (которые не соответствуют тельцам Кахаля)127. Во время S фазы telomerase RNA и TERT движутся в теломеры127,128. Доставка обоих компонентов, по-видимому, использует промежуточные ступени в ядрышках и фокусах, которые возникают немедленно по соседству с тельцами Кахаля, указывая на дальнейшую регуляцию биогенеза и транспорта этих энзимов127,128. У дрожжей telomerase напоминает Sm snRNP129 скорее. чем H/ACA snoRNP, и поэтому трафик этого энзима регулируется др. путями у др. организмов.
Paradigms for the biogenesis of ncRNPs
Интенсивные исследования snRNPs и snoRNPs вознаградили нас пониманием РНК-обусловленных механизмов модификации, расщепления и сплайсинга РНК. Концепция нацеливания ферментативной активности с помощью ведущих РНК, которые обладают антисмысловыми элементами (возникла в результате исследований snRNAs и snoRNAs) помогает подготовить почву для открытия и понимания многих др. ncRNAs.
Благодаря snRNPs и snoRNPs, мы узнали, что члены данного семейства ncRNP могут участвовать в различных процессах. Это может сопровождаться специализациями ncRNAs, которые приводят ко взаимодействиям с разными наборами белков партнеров (так в случае C/D и H/ACA RNPs участвуют в процессинге rRNA). В некоторых случаях (напр., как это предполагается для сплайсесом), ферментативная активность может быть врожденно присуща РНК.
Начав исследования snRNPs и snoRNPs неожиданно были выявлены сложные пути биогенеза. Эти РНК могут продуцироваться посредством интересных вариаций хорошо знакомых путей продукции мРНК, но могут также возникать в результате неожиданных путей, таких как спасение в интронах (Box 3). В самом деле, два наиболее разнообразных семейства ncRNAs (snoRNAs и microRNAs) преимущественно кодируются интронами в клетках человека. Биогенез ncRNPs может также использовать симбиотические взаимоотношения, там, где биогенез одного ncRNP семейства нуждается в функции др., и наоборот. Напр., snRNPs необходимы для высвобождения спрятанных в интронах snoRNAs, a snRNAs, в свою очередь, нуждаются в snoRNP-обеспечиваемой функции пост-транскрипционных модификаций.
ncRNAs часто нуждаются в белках партнерах, которые обеспечивают различные существенные функции в дополнение к очевидным ассоциированным энзиматическим активностям. Напр., C/D и H/ACA RNP функция, по-видимому, нуждается в подгонке конформации ведущей РНК путем связывания вспомогательного белка L7Ae.
Общим принципом биогенеза snRNPs и snoRNPs является сборка стабильных, неактивных pre-RNPs, которые нуждаются в созревании в местах, удаленных от мест функционирования. Сборка функционального комплекса и поставка его к месту функции может регулироваться путем прохождения через динамическую серию промежуточных комплексов и субклеточных фокусов. Изучение snRNAs и snoRNAs выявило клеточные системы, которые участвуют в транспорте и сборке ncRNPs, включая PHAX, SMN комплекс и тельца Кахаля. Некоторые из этих систем участвуют в биогенезе как snRNPs, так и snoRNPs, указывая на существование общих путей. Недавние исследования показали, что siRNA комплексы, которые участвуют в метилировании ДНК у Arabidopsis thaliana также собираются в тельцах Кахаля130,131. Telomerase иллюстрирует потенциал для регуляции функции ncRNP путем контроля независимого трафика РНК и белковых компонентов.