Посещений:
МИЕЛОДИСПЛАСТИЧЕСКИЙ СИНДРОМ (MDS)
мутации факторов сплайсинга и структура сплайсесом
Splicing Factor Mutations in Myelodysplasias: Insights from Spliceosome Structures Clara L. Kielkopf Correspondence information about the author Clara L. Kielkopf Email the author Clara L. Kielkopf DOI: http://dx.doi.org/10.1016/j.tig.2017.03.001
|
Somatic mutations of pre-mRNA splicing factors recur among patients with myelodysplastic syndrome (MDS) and related malignancies. Although these MDS-relevant mutations alter the splicing of a subset of transcripts, the mechanisms by which these single amino acid substitutions change gene expression remain controversial. New structures of spliceosome intermediates and associated protein complexes shed light on the molecular interactions mediated by 'hotspots' of the SF3B1 and U2AF1 pre-mRNA splicing factors. The frequently mutated SF3B1 residues contact the pre-mRNA splice site. Based on structural homology with other spliceosome subunits, and recent findings of altered RNA binding by mutant U2AF1 proteins, we suggest that affected U2AF1 residues also contact pre-mRNA. Altered pre-mRNA recognition emerges as a molecular theme among MDS-relevant mutations of pre-mRNA splicing factors
|
Figure 1. SF3B1 and U2AF1 Domains and Functions in Pre-mRNA Splicing
(A) SF3B1 (top, yellow) and U2AF1 (bottom, cyan) domains and the positions of mutational 'hotspots' (red) [114, 115]. N626 only recently was classified as a statistically significant hotspot across tumors [115] and is shown in lighter font. Mutation of R1074 (green) confers pladienolide-resistance. (B) Roles of SF3B1 and U2AF1 in the early stages of spliceosome assembly at the 3' splice site. Abbreviations: AG, adenosine/guanosine consensus sequence preceding the 3' splice site; BP, branch-point sequence; ESE, exonic splicing enhancer; HR, HEAT repeat motif; p14, p14-binding site; Py, polypyrimidine; RS/Gly-rich, arginine/serine-rich repeats with poly-glycine stretch; snRNP, small nuclear ribonucleoprotein particle; SS, splice site; UHM, U2AF homology motif; ULM, U2AF ligand motif; ZnK, zinc-knuckle motif
Trends
Мутации факторов сплайсинга пре-мРНК являются широко распространенными мутациями среди пациентов с MDS и родственными миелоидными неоплазиями и обнаруживаются также в некоторых солидных опухолях.
'Hotspot' мутации факторов сплайсинга пре-мРНК изменяют сплайсинг субнабора транскриптов.
Структуры активированных до B-стадии сплайсесом показывают, что горячие точки в SF3B1 контактируют с местами сплайсинга в пре-мРНК.
Мутации горячей точки U2AF1 изменяют его сродство связывания для слайс-сайтов РНК способом, который коррелирует с изменениями сплайсинга пре-мРНК.
Апо-структура гомолога у делящихся дрожжей показывает расположение горячей точки в U2AF1 на поверхности zinc-knuckle, а структурная гомология подтверждает, что эти остатки контактируют с РНК.
Соматические мутации фактора сплайсинга пре-мРНК приводят к появлению у пациентов myelodysplastic syndrome (MDS) и родственных злокачественных состояний. Хотя эти связанные с MDS мутации изменяют сплайсинг субнабора транскриптов, механизмы, с помощью которых эти одиночные аминокислотные замены изменяют экспрессию генов, остаются дискуссионными. Новые структуры промежуточных образований сплайсесом и ассоциированных белковых комплексов проливают свет на молекулярные взаимодействия, обеспечиваемые с помощью 'hotspots' SF3B1 и U2AF1 факторов сплайсинга пре-мРНК. Часто мутантные остатки SF3B1 контактируют с сайтом сплайсинга пре-мРНК. Базируясь на структурной гомологии с др. субъединицами сплайсесом и на недавних находках изменений связывания РНК мутантными U2AF1 белками, мы предположили, что затронутые остатки U2AF1 также контактируют с пре-мРНК. Изменение распознавания пре-мРНК возникает вкачестве молекулярной темы среди важных для MDS мутаций факторов сплайсинга пре-мРНК.
Recurrent Somatic Mutations of Pre-mRNA Splicing Factors in Cancers
Преимущественно приобретаемыми мутациями факторов сплайсинга пре-мРНК при раке были открыты первоначально в результате секвенирования всего экзома при myelodysplastic syndromes (MDS) [1-4], chronic lymphocytic leukemias (CLLs) [5, 6], и родственных нарушениях (Box 1). Прежде всего, 4 гена факторов сплайсинга оказались мутантными при этих миелоидных неоплазиях: SF3B1, U2AF1, SRSF2 и ZRSR2 (Figure 1, Key Figure). Повторяющиеся мутации SF3B1, U2AF1 и SRSF2, изменяющие аминокислоты в специфических 'горячих точках' (картированы в SF3B1 и U2AF1 белковых доменах Figure 1A; в SRSF2 горячей точкой является P95). Исключениями явились нулевые и миссенс мутации, которые распределялись по всему ZRSR2 (известен также как URP), который ассоциирован с 'минорной' U12-типа сплайсесомой скорее, чем с 'большой' U2-типа сплайсесомой (Box 2) [7]. Один фактор сплайсинга часто доминирует в мутационном спектре при разных подтипах рака. Напр., мутации SF3B1 возникают в большинстве рефрактерных анемий с ringed sideroblasts (RARS) [8]. Напротив, SRSF2 мутации появляются у более чем трети chronic myelomonocytic leukemias (CMMLs) [9]. Соматические мутации определенных сплайс-факторов также возникают среди разнообразных солидных опухолей - прежде всего SF3B1 мутации при увеальной меланоме [10, 11], pancreatic ductal adenocarcinoma [12, 13] или раке груди [14, 15], а мутации U2AF1 при pancreatic ductal adenocarcinoma [13] или аденокарциноме легких [16,17].
Box 1 Myelodysplastic Syndromes and Related Myeloid Neoplasms
Box 2 The Spliceosome - A Molecular Machine for Pre-mRNA Splicing
Некоторые генетические атрибуты намекают на то, что мутации в горячих точках факторов сплайсинга наделяют новыми функциями скорее, чем подавляют существующие. Во всяком случае, аллельные затруднения мутантных аллей факторов сплайсинга (~50%) согласуются с гетерозиготными мутациями (напр., [18]). В самом деле, дикого типа (WT) копии SF3B1, SRSF2 и U2AF1 факторов сплайсинга необходимы для пролиферации клеток (напр., [19, 20, 21], среди прочего), хотя многие одиночные клетки, несущие только мутации SF3B1, были обнаружены в последовательности одиночных клеток в выборках от пациентов с CLL [22]. Сходным образом, одновременные мутации во многих сплайс-факторах отсутствуют в выборках от пациентов (напр., [23]). В подтверждение появления новых функциональных атрибутов, вызываемых мутациями сплайс-факторов, большинство измененных сплайс-сайтов в присутствии мутаций в горячих точках фактора сплайсинга отличается от сплайс-сайтов, возникших в результате нокдауна этого фактора сплайсинга [3,24-27].
Мы рассмотрели ряд прекрасных обзоров [28, 29]) и сфокусировались на недавних структурах нуклеопротеинов и взаимодействии РНК, которые повысил наш уровень понимания последствий мутаций SF3B1 и U2AF1 при миелоидных неоплазиях и раковых опухолях.
SF3B1 and U2AF1 Splicing Factors Function in Spliceosome Assembly
Связанные с MDS факторы сплайсинга пре-мРНК действуют во время ранних стадий сборки сплайсесом (Figure 1B and Box 2), которая осуществляется посредством дискретной серии разделимых комплексов, наз. 'E-', 'A-', 'B-', 'C-', пост-сплайсинг комплексами и их активируемых промежуточных образований. Белок SF3B1 (известен также как SF3b155 или SAP155) является одной из, по крайней мере, семи субъединиц, которая представлена SF3b компонентом из U2 snRNP [30]. U2AF1 (известен также как U2AF35) формирует трехчастный комплекс вместе с U2AF2 (известен также как U2AF65) [31] и splicing factor-1 (SF1) [32, 33]. В самой ранней из 'E-complex' сплайсесоме, U2AF1 сайт-специфически поперечно связан с консенсусом AG на 3' splice-site соединении и облегчает сплайсинг in vitro сайтов сплайсинга, предшествующих 'слабым' полипиримидиновым (Py) участкам, которые дивергируют от U-богатого консенсуса [34-36]. Вперемежку U2AF2 распознает сигналы от сайта с 'сильным' U-богатым Py-участком, который предшествует большинству 3' сплайс-сайтов [37, 38]. U2AF2 первоначально соединяется с SF1, который является первым белком распознавания branch-point sequence (BPS) пре-мРНК (rev. [39]). Затем при переходе к 'A-complex' U2AF2 ассоциирует с регионом 'U2AF ligand motif' в SF3B1 (rev. [40]), смещая SF1. U2 snRNA гибридизируется (anneal) с BPS [41], это в конечном итоге приводит к нуклеофилии (nucleophile) для первой ступени реакции сплайсинга. Гетеродимер U2AF, как полагают, действует совместно с SF3B1 субъединицей, чтобы стабилизировать ассоциацию U2 snRNP с 3' сплайс-сайтом, принимая во внимание, что SF3B1 поперечно связан с окружающим BPS-U2 snRNA дуплексом [42]. Сборка сплайсесом далее зависит от ATФ-зависящего действия DEAD/H-box RNP unwindases, включая PRP5 , а также др., при переходе от 'E-' к 'A-' комплексу.
Несмотря на обширные биохимические исследования, только недавно был пролит свет на точное расположение и взаимодействия важных для MDS остатков в SF3B1 and U2AF1. Характеристика структур с помощью cryo-electron microscopy (cryoEM) промежуточных образований сплайсесом, выделенных из дрожжей, включая SF3B1-содержащий комплекс, который, скорее всего, представляет BACT-стадию сплайсесом [43, 44]. Хотя сегодняшняя структура сплайсесомы лишена U2AF1 субъединицы per se, две субъединицы (CWC2 и CWC24) обладают сильным структурным сходством с мутантными U2AF1 доменами. В целом структура сплайсесомы показывает, что имеющие отношение к MDS горячие точки SF3B1 контактируют с пре-мРНК и также подтверждает, что мутантные U2AF1 остатки контактируют с 3' сайтом сплайсинга. Кристаллические структуры человеческой SF3b частицы [45], и отдельно у делящихся дрожжей U2AF1 связанной с фрагментом U2AF2 [46], ещё больше детализировали расположение горячей точки.
Cancer-Relevant SF3B1 Mutations Promote Cryptic 3' Splice Sites via Alternative BPS
SF3B1 является наиболее часто мутирующим фактором сплайсинга среди широкого круга миелоидных неоплазий и солидных опухолей. Соматические мутации в гене SF3B1 особенно превалируют среди пациентов с RARS (50-75% пациентов) [2, 8], uveal меланомой (15-20%) [10, 11, 47] и CLL (~15%) [5, 6]. Мутации SF3B1 также обнаруживаются при раке поджелудочной железы и молочных желез (2-4%) [12-15, 48]. Главными горячими точками, важными для рака, при мутациях в SF3B1 являются те, что расположены в 5 по 8 повторяющихся последовательностях белка, которые картируются с 4-го по 7-ой α-спиральных 'HEAT' повторах (HR) (Figure 1A). Замена K700E наиболее частая среди SF3B1 мутаций в гематологических злокачественных состояниях, а также в раках поджелудочной железы и груди, Тогда как мутации R625 (в некоторых случаях K666) превалируют при uveal меланомах. Несколько групп продемонстрировали, что мутации SF3B1 при раке и гематологических озлокачествлениях ассоциируют с измененным отбором 3' сплайс-сайтов для ряда транскриптов [47, 49-52], включая сплайсингом вызываемые понижающую регуляцию транспортеров железа, которые могут увеличивать накопления железа при RARS [53].
Два недавних исследования изучали молекулярные механизмы изменения выбора 3' сплайс-сайта в присутствии мутантного SF3B1 (SF3B1 MUT) (Figure 2A) [24,25]. Эти исследования сошлись на ключевом наборе общих заключений относительно пределов контекстных выборок и мутаций SF3B1, включая K700E/R625/K666 и др. мутации в CLL выборках, в немногих солидных опухолях и клеточных линиях рака поджелудочной железы [25], или K625/K666 мутации при uveal меланоме и моделях мини-генов в клеточных линиях [24]. Как аберрантные, так и нормальные 3' сплайс-сайты обнаруживают консенсусный 'AG' сигнал сплайс-сайта, предшествующий соединению интрон-экзон. SF3B1 MUT стимулирует использование скрытого 3' сплайс-сайта (AG') собранного в кластер в положении -12 по -24 nt выше нормального сплайс-сайта (AG 0). Важно. что A-содержащая последовательность, которая напоминает BPS splice-site signal (BPS') располагается в промежутке -1 по -14 nt выше каждого аберрантного AG'. В самом деле, предполагаемая комплементарность этого пре-мРНК региона для гибридизации (annealing) с U2 snRNA, а значит 'сила', была значительнее у BPS', чем для нормального BPS (BPS 0). Мутагенез и экспериментальное картирование подтвердили, что эти стоящие выше аденозины используются как место ответвления во время эксцизии интрона лассо от сплайс-сайта, чувствительного к SF3B1MUT. Были сделаны разные предположения для объяснения переключения на BPS' и AG' в присутствии мутантного SF3B1, включая те мутации, которые могут улучшить взаимодействия SF3B1 MUT с пре-мРНК последовательностями, фланкирующими BPS', снижение взаимодействий SF3B1 MUT с BPS 0, и/или запуск конформационных изменений в SF3B1 MUT, таких как 'более сильная' комплементарность U2 snRNA с BPS' вперемежку с превосходящим по весу BPS 0 [24, 25]. Недавняя структурная информация представила поразительную изменчивость этой гипотезы, а именно то, что горячая точка мутаций SF3B1 может влиять на конформацию связанного с пре-мРНК сайта сплайсинга.
Spatial Locations Point to Roles for SF3B1 Hotspots in 3' Splice-Site Conformation
Разрешение в 3.5 ангстрем структуры дрожжевого SF3B1 в BACT сплайсесоме показывает α-helical HEAT домен окружает в 23 nt нить пре-мРНК [43] (Figure 2B). Как упоминалось выше, наблюдаемое количество HRs в SF3B1 [43, 45] значительно меньше предполагаемого на базе анализа первичной последовательности [54]. Вместо этого, разрешение в 3.1 ангстрем структуры человеческого SF3B1 показало, что HEAT домен наводит и покрывается одиночной α-спиралью [45]скорее, чем двумя антипараллельными α-спиралями. которые формально составляют HR (rev. [55]). Глубоко внутри искривленной структуры SF3B1, дуплекс BPS-U2 snRNA захватывается в тиски, представленные N-терминальным HEAT повтором (HR1) в малой борозде и несколькими C-терминальными HRs (HR14-HR19), выстилающими (lining) фосфодиэфирный остов пре-мРНК. Безусловно, ключевой остаток, для которого мутация в гистидин обеспечивает резистентность к ингибитору клеточного цикла pladienolide и его производным (R1074 в HR15) [56] вносит вклад частично в карман связывания для extrahelical branch-site аденозина. В самом деле, не инициализированная плотность электронов в кристаллической структуре SF3B1, скорее всего, отражает совместную очистку branch-site РНК [45]. К 5' стороне BPS, 20 nt из однонитчатой пре-мРНК пересекает впадину на поверхности SF3B1и заканчивается непосредственно после загиба (kink) на остатке горячей точки. Типичное BPS-AG разделение ~25 nt в транскриптах человека [57] подтверждает, что соединение интрон-экзон или соответствует или находится очень близко к 5' концу SF3B1-связанного с пре-мРНК в структуре сплайсеомы BACT.
Совмещение карт мутационных горячих точек в структуре человеческого SF3B1 с дрожжевым гомологом в B ACT сплайсесоме (Figure 2B). Горячие точки SF3B1 возникают в 4-х последовательных HRs (HR4-HR7) вблизи N-конца домена HEAT. Эти ключевые остатки соотв. расположены на N-терминальных кончиках второй α-спирали в двуспиральных HR единицах, где несколько позитивно заряженных остатков дополняют α-helical дипольные моменты для взаимодействий с негативно заряженной РНК. Боковые цепочки располагаются на пространственно соприкасающихся поверхностях, которые, по-видимому, стабилизируют изогнутую конформацию для 5' нуклетотидов, связывающих пре-мРНК. Наиболее распространены повторяющиеся мутации, резко изменяющие форму и заряд затронутых остатков (еапр., K700E). Как таковые аминокислотные замены в горячих точках д. разрушать локальные взаимодействия РНК и диссоциировать 5' конец пре-мРНК от поверхности белка SF3B1 MUT. Поскольку мутантные сайты связывания РНК расположены приблизительно в 10 nt от предшествующего контакта с пре-мРНК на SF3B1 HR9 и заканчиваются также уникальным пурином, которые д. соответствовать нормальному сигналу AG сплайс-сайта, нарушенные взаимодействия пре-мРНК на этом интерфейсе д. объяснять более короткое до 10 nt расстояние BPS'-AG' предпочитаемое SF3B1 MUT по сравнению с нормальным расстоянием BPS-AG [24, 25]. Как таковая связанная с РНК структура SF3B1 в B ACT сплаайсесомах подтверждает, что мутации в горячей точке д. изменять SF3B1 MUT-связанную конформацию пре-мРНК скорее, чем специфичность последовательности РНК или саму конформацию белка.
Cancer-Relevant U2AF1 Mutations Promote Alternative 3' Splice Sites
Приобретенные мутации фактора сплайсинга U2AF1 обычны среди гематопоетических озлокачествлений [1, 3, 4], особенно при MDS без кольцевых сидеробластов (~11%), вторичных AML (~9%) и CMML (8-11%), также как и для hairy cell leukemia variant (HCLv) (10%) [58]. Среди солидных опухолей U2AF1 мутирует в аденокарциноме протоков поджелудочной железы со сходными частотами, что и SF3B1 (~2% случаев) [13] и является главным мутантным геном фактора сплайсинга, обнаруживаемым при аденокарциномах легких (~3%) [16, 17]. Мутации горячей точки в U2AF1 сфокусированы более узко на кодонах для остатков S34 и Q157. В самом деле, S34F объясняют 60-80% мутаций в U2AF1 при MDS [1,3] и почти все задокументированные мутации U2AF1 при HCLv, легочных аденокарциномах и раке поджелудочной железы [13, 16]. Менее часто остаток S34 изменяется в тирозин (10-15% от U2AF1 мутаций при MDS), которые обнаруживают сходные ароматические признаки с фенилаланином, и когда Q157 остаток изменяется или в пролин или аргинин (до 20% от мутаций U2AF1 при MDS) [1, 3]. Мутации U2AF1 ассоциируют с изменениями сплайсинга ~5% транскриптов генов в выборках от пациентов и клеточных линиях [59-62], преимущественно как результат пропуска/включения кассеты экзонов, или, в меньшей степени, альтернативного выбора 3' сплайс-сайта. Как и в случае мутаций SF3B1, события сплайсинга, которые затрагиваются мутациями U2AF1, обнаруживают низкое перекрывание с мутациями, вызываемыми нокдауном U2AF1 [21, 62], это указывает, что эти мутации слегка изменяют распознавание сайта сплайсинга скорее, что полностью выводят из строя сплайсесомы. Эти гены, нарушающие сплайсинг, оказываются в пути, имеющем отношение к раку, включая реакции на повреждения ДНК, эпигенетическую регуляцию и апоптоз. Недавно было установлено, что мутации U2AF1 S34F повышают использование дистальных сайтов расщепления и полиаденилирования (~40% из S34F-заионутых транскриптов BaF3 линии клеток) [63]. Мы сфокусировались на молекулярных механизмах, лежащих в основе выбора 3' сплайс-сайта в присутствии мутантного U2AF1.
Событя сплайсинга, которые изменяются с помощью S34 в противоположность мутациям Q157 в U2AF1, распределяются по разным группам (Figure 3). Каждая из этих групп обладает одинаковой последовательностью тенденций окружать законсервированный консенсус 'AG': S34 мутанты преимущественно пропускают сплайс-соединения, которым предшествует -3U, и сплайсируют те, которым предшествует -3C/A [59-62], тогда как Q157 мутанты преимущественно пропускают сплайс-соединения, сопровождаемые +1A и сплайсируют те, которые сопровождаются +1G [62]. Мини-гены и in vitro методы сплайсинга определили варианты сплайс-сайтов, которые воспроизводят такие S34F-зависимые тенденции (sequence trends) [62]. Минимальный U2AF гетеродимер от делящихся дрожжей (SpU2AF MIN), и отдельно почти полной длины комплексы U2AF1-U2AF2 человека с SF1, были приготовлены в достаточных количествах для количественных исследований связывания РНК [21, 61, 64]. Мутация S34F снижала ассоциацию SpU2AF MIN белка со стержневым в 5 nt РНК олигонуклеотидом (5'-CUAGG, AG консенсус подчеркнут, -3 и +1 nt жирным) [64], хотя слабое сродство связывания находится вне пределов isothermal titration calorimetry (ITC) эксперимента (>threefold penalties reduce thec value = [macromolecule in sample cell]/KD to below the limit of ~10 for a reliable ]). Незначительное увеличение в связывании РНК скорее, чем снижение, наблюдалось у SpU2AF MIN несущих аналогов мутации Q157R ы этой РНК (~2) [64]. Хотя неожиданного отличающиеся, эти мутациями вызываемые изменения обнаруживают тенденцию связывания SpU2AF MIN с CUAGG РНК подходящей последовательностью среди затронутых сплайс-сайтов affected splice site; а именно, мутанты S34F страдают от наказания за соединение с -3U РНК, которое обычно пропускается в затронутых сплайс-сайтах, тогда как мутации Q157R аналога предпочитают соединяться с +1G РНК, который обычно сплайсируется в затронутом сплайс-сайте. Мы использовали метод quantitative fluorescence anisotropy, чтобы сравнить серии сплайс-сайтов РНК с разным связыванием -3 нуклеотидов с S34F или WT вариантами трехсоставных комплексов U2AF1-U2AF2-SF1 человека [21, 61]. Хотя изменения в связывании РНК как результат мутаций S34F были слабыми (2-7 раз), почти во всех случаях эти тенденции связывания соответствовали наблюдаемым последствиям для сплайсинга: мутации S34F обычно снижали связывание U2AF1с сайтами, которым предшествовали -3U, а в некоторых случаях увеличивали сродство у -3C. Итак, эти результаты подтверждают гипотезу, что S34 остаток в U2AF1 распознает -3 нуклеотид, в то время как Q157 распознает +1 нуклеотид в соединении 3' сплайс-сайта, а мутации меняют подобное распознавание затронутых сплайс-сайтов.
RNA Contacts in Homologous Structures Support Roles for U2AF1 Hotspots in Splice-Site Recognition
Горячие точки U2AF1 расположены в двух CCCH-типа zinc knuckles, которые окружают U2AF2 heterodimerization motif (UHM [40]), а именно S34 в N-терминальном ZnK1, а Q157 в C-терминальном ZnK2 (Figure 1A). Вплоть до недавнего времени ZnK-RNA комплексы были ограничены двумя структурами: NMR структурой из TIS11d, которая представлена тандемом ZnK1 и ZnK2, связанным с AU-богатым мРНК регуляторным элементом [66], а разрешение в 1.7 ангстрем кристаллической структуры регулятора альтернативного сплайсинга MBNL1, который представлен GCU-содержащей РНК, связанной с тандемом RNA ZnK1 и ZnK2 (формально ZnK3 и ZnK4 в интактной последовательности MBNL1 белка) [67]. Несмотря на усилия [46,62], генерация реальной модели комплекса U2AF1-РНК базируется на исключительно на их начальных структурах, наталкивающиеся на некоторые затруднения. Во-первых, 5'-to-3' ориентация нитей РНКe относительно связи с ZnK показывает противоположные направления между структурами MBNL1 и TIS11d (Figure 4A,B). Это расхождение стало неожиданным, принимая во внимание, что др. RNP fold семейства обладают сходными ориентациями белок-РНК (напр., [55, 68, 69]). Во-вторых, глобальные конформации тандема ZnK1 и ZnK2 отличаются между двумя структурами: в MBNL1 ZnK1 и ZnK2, каждый связан с отдельными нитями РНК , тогда как в TIS11d ZnK1 и ZnK2 связаны с соседними сайтами соприкасающихся олигонуклеотидов. Новые структуры сплайсесом теперь установлены в двух примерах CCCH-типа ZnKs, связанных с РНК: CWC24 связан с 5' экзоном BACT комплекса [43], а CWC2 связан с U6 snRNA в BACT, C, C* и ILS комплексах [43, 44, 70-75]. Более того, недавняя структура SpU2AFMIN [46] содержит полную длину субъединицы U2AF1 делящихся дрожжей, которая обнаруживает 55% идентичных последовательностей с человеческим U2AF1, и как таковой представляет собой реальную стартовую точку для моделирования предполагаемых взаимодействий РНК с мутантными доменами ZnK1/ZnK2.
U2AF1 ZnK1 обнаруживает значительно большую идентичность последовательностей с CWC24 ZnK (40% идентичности), тогда как U2AF1 ZnK2 напоминает MBNL1 ZnK1 (45% идентичности) (Figure 4C). Сравнение структур ZnK показывает, что конформация связанной РНК из CWC24 ZnK сильно напоминает таковую MBNL1 ZnK1 и ZnK2 (Figure 4A). Структура CWC2 ZnK-RNA обнаруживает также сходство 5'-to-3' ориентации нитей РНК по сравнению с CWC24 и MBNL1 структурами, хотя точные траектории изменений РНК приблизительно 30° (Figure 4B). Напротив, ориентация TIS11d-связанной нити РНК направляется антипараллельно относительно др. структур ZnK-RNA, установленных на сегодня (Figure 4B). Дальнейшая экспансия доступных структур ZnK-RNA необходима для полного освобождения от выпадающих показателей. Независимо от этого, CWC24, CWC2, MBNL1 и TIS11d структуры уже показали разносторонние способы для распознавания однонитчатой РНК с помощью модулей ZnK, аналогично разнообразным взаимодействиям РНК с членами хорошо охарактеризованного RNA recognition motif (RRM) fold семейства [76].
Мутации S34 или Q157 к фенилаланину или пролину, как полагают, оказывают незначительное влияние на укладку белка, учитывая их соотв. расположение или в неструктуированной петле или на N-терминальном витке α-спирали, которая не нужна для водородных мостиков остова для соотв. упаковки. Вместо этого, сиквенс-специфические взаимодействия РНК, по-видимому, скорее всего, затрагиваются. S34 аналог CWC24, также как и его структурные паралоги MBNL1 ZnK1 и ZnK2, взаимодействуют с 5'-терминальным нуклеотидом связанного динуклеотида. Для CWC24, этот остаток (K160) предоставляет водородные мостики от остова пептида к гуаниновому основанию и от боковой цепи ribose oxygen (Figure 4C, left). Хотя точные последствия замен в горячей точке на фенилаланин непредсказуемы, внесение большой ароматической боковой цепи определенно будет изменять положение нуклеотида и взаимодействия в этом сайте. Q157 аналог из MBNL1 ZnK1, MBNL1 ZnK2 или CWC24 ZnK преимущественно взаимодействует с 3'-терминальным нуклеотидом связанного динуклеотида. По аналогии, мутации в горячей точке в Q157 дающие остаток пролина, который отсутствует в пептидной N-H группе, д. уничтожать водородные мостики пептида с nucleobase. Сходным образом, боковыми цепочками обеспечиваемые водородные мостики с соседними nucleobase будут теряться.
Структура SpU2AF MIN обеспечивает реальную поддержку для сборки этих гомологов, РНК-связанных структур в составной модели (Figure 4D). Итак, вследствие наложения соотв. SpU2AF1 ZnK1 и ZnK2, связанные динуклеотиды из CWC24 и MBNL1 структур формируют соприкасающиеся нити РНК вследствие добавления одиночной связи фосфодиэфира. Вставка дополнительного нуклеотида в последовательность будет или выпячивать центральный нуклеотид или приобретать конформационное изменение, отделяющее U2AF1 ZnK1 от ZnK2. C-конец гетеродимерного SpU2AF2 ориентируется в направлении 5' нити РНК, что согласуется со связыванием C-терминальными U2AF2 RRMs с вышестоящим сигналом Py участка [77, 78]. Положение SpU2AF2 N-конца, обращенного к RNA 3'-концу согласуется с направленным hydroxyl radical footprinting доменом U2AF2 RS в находящемся ниже экзоне [79]. Однако, footprinting (определение участков нуклеиновых кислот, образующих комплексы с белками) U2AF2 N-конца внутри BPS [79, 80] подтверждает, что RS домен является динамичным и/или, что конформация РНК искривлена. Если мы сменим конформацию U2AF1-связанного с РНК, на соотв. той, что в TIS11d [66], то изменение ориентации этих взаимодействующих доменов будет противоречить биохимическим результатам. В самом деле, наложение SpU2AF1 с CWC24 и MBNL1 естественно соединит мостиком ZnK1 и ZnK2 с 4 nt РНК, согласующимся с положением -3 нуклеотида из интрона и +1 нуклеотидом из экзона, соседствующего с S34 и Q157 остатками (Figure 4D). Хотя альтернативная модель пока не исключена, эти структурные сравнения подтверждают непосредственную роль U2AF1 горячих точек в последовательность-специфичных считываемых соединениях сплайс-сайта.
Concluding Remarks
Recent structural information, together with sequence trends among affected splice sites, implicate the cancer-relevant mutational hotspots of SF3B1 and U2AF1 in pre-mRNA splice-site contacts. Nevertheless, additional evidence will be necessary to fully understand the mechanistic underpinnings and downstream consequences of recurrent splicing factor mutations (see Outstanding Questions). Already, the RNA-binding affinities of recombinant U2AF1 proteins support the importance of the S34 and Q157 residues for recognizing the -3 and +1 nucleotides surrounding the 3? splice-site junction [21, 61, 64]. Although the recombinant SF3B1MUT protein remains capable of RNA binding at saturating concentrations [45], the RNA affinities and specificities of SF3B1 and its mutated variants remain to be evaluated for 'strong' (consensus) compared to 'weak' (divergent) splice sites. Regardless, a mutation-induced conformational change in the bound RNA would not necessarily alter the apparent RNA affinity, and instead calls for structural characterization. Greater changes in the rate constants of RNA binding could underlie subtle apparent changes in the equilibrium RNA-binding of mutant compared to WT splicing factors. Accordingly, the U2AF1 S34F mutation appears to delay the rate of spliced transcript release [81], which in turn is expected to alter splice-site choice (reviewed in [82]). Notably, the P95 hotspot of SRSF2, which is frequently mutated among CMML patients, is also located at its RNA interface [83] and interferes with RNA binding when mutated [26, 84]. Such roles for hotspot residues in contacting pre-mRNA splice sites may emerge as a common theme among MDS-relevant mutations of splicing factors.
Nevertheless, RNA interactions by splicing factor hotspots offer only a partial, albeit potentially complementary, explanation for the multifaceted effects of hotspot mutations. Recently, the DEAD-box RNP-unwindase PRP5 (also called DDX46) was found to interact genetically and physically with the yeast SF3B1 homolog (called HSH155), and hotspot mutations altered this interaction [85, 86]. Considering SF3B1-RNA contacts, an appropriate conformation of the SF3B1-pre-mRNA complex could serve as a checkpoint for the ATPase activity of PRP5, which is required for stable association of the U2 snRNA with the BPS. Auxiliary to pre-mRNA splicing, the impacts of SF3B1 mutations on its chromatin association and nucleosome positioning [87] have yet to be tested. For U2AF1, the S34F mutation has already been found to alter the cleavage and polyadenylation sites of a subset of affected transcripts. In particular, S34F-associated use of a distal polyadenylation site in the ATG7 transcript was sufficient to transform BaF3 or small airway cell lines, and also was observed in patient samples [63]. Although the coupling of pre-mRNA splicing to cleavage and polyadenylation, and specific association of U2AF subunits with polyadenylation factors, have been established ([36]; rev. [88]) how these processes crosstalk in the downstream progression of U2AF1 mutations to malignancies remains an outstanding question. Altogether, current findings represent only a starting point for fully understanding the mechanistic effects of recurrent splicing factor mutations. Future efforts to elucidate these possibilities would guide longer-term efforts to exploit the therapeutic potential of spliceosome inhibitors [89].
|