Мутации зародышевой линии в генах DNA mismatch repair (MMR) MLH1, MSH2, MSH6 и PMS2, являются причиной Lynch синдрома (первоначально наз. hereditary non-polyposis colorectal cancer, HNPCC), и др. родственных наследственных раковых состояний, включая Muir-Torre синдром и constitutional mismatch repair deficiency syndrome (CMMR-D) [1-3]. Идентификация семей, позитивных по мутациям, важна для определения риска для родственников при пред-симптоматическим скринингом и поведении для снижения риска и для осуществления клинических стратегий по снижению риска вторичных раков у пациентов [4].
Растет осознание, что существенная пропорция выявляемых вариантов генов зародышевой линии, ассоциированных с болезнью, включая гены MMR, вызывает аномалии сплайсинга [5]. Эти 'spliceogenic' варианты возникают в результате альтераций цис-действующих сигналов сплайсинга (напр. разрушение канонических сплайс-сайтов или использование сайтов de novo, из-за возникновения новых сплайс-сайтов и/или активации скрытых сайтов) или сплайс-регуляторных элементов (напр., экзонных энхансеров или сайленсеров сплайсинга (exonic splicing enhancers and silencers, ESEs and ESSs, соотв.) [6]. Как показано на Рис. 1, такие альтерации часто присходят к событиям, таким как полная или частичная делеция (включая пропуск целых экзонов) и превращение в экзоны (exonization) интронных последовательностей (intron retention, pseudoexon inclusion) [7, 8].
Из-за их очень высокого сходства с измененным сплайсингом, нуклеотидные варианты, изменяющие консенсус интронных динуклеотидов в естественном 5'-donor (GT) и 3'-acceptor (AG) сайтах, часто рассматриваются как патогенные мутации, не нуждающиеся в мРНК анализе и используются только, чтобы управлять уходом за пациентами [5]. Т.к. остающиеся интронные и экзонных варианты, это рутина для многих клинических лаборатории в проведении анализа мРНК для оценки клинической значимости [9], после предварительного отбора, базирующегося на биоинформационных предсказаниях вариант-индуцированных альтераций сплайсинга. Наиболее часто используются подходы по детекции интересующих транскриптов, базирующихся на reverse transcriptase polymerase chain reactions (RT-PCR), сопровождаемой: agarose gel electrophoresis и sequencing of gel-purified products [10]; capillary electrophoresis using fluorescently labelled primers [11]; и/или molecular cloning of RT-PCR products [12]. Базирующийся на PCR метод enriching alternatively spliced isoforms (EASI) также был разработан для идентификации новых вариантов транскриптов [13]. Методы минигенов предоставляют ex vivo метод для оценки эффектов вариантов на сплайсинг. Поэтому они особенно пригодны, когда РНК пациента недоступна, иликогда варианты индуцированных аберрантно сплайсировнных транскриптов возникают in vivo? но трудны для обнаружения из-за деградации с помощью nonsense-mediated decay (NMD) [14-16]. Более того, подходы с минигенами могут непосредственно оценивать взаимоотношение причина-эффект, а именно между вариантом и им вызываемым неожиданным дефектом сплайсинга. Измененные паттерны сплайсинга, выявляемые с помощью упомянутых выше экспериментальных подходов могут быть использованы, чтобы помочь определить молекулярные последствия и тем самым клиническое значение нуклеотидных вариантов [5].
Альтернативный сплайсинг широко распространен у эукариот и имеет важные биологические последствия, т.к. может вносить вклад в регуляцию экспрессии генов и увеличивает разнообразие белковых изоформ, продуцируемых каждым геном. Напр., альтернативный сплайсинг может регулировать ткане-специфичную экспрессию ряда генов [17, 18]. Помимо функциональных белковых изоформ альтернативный сплайсинг может приводить к продукции транскриптов с преждевременными стоп-кодонами (PTCs), которые деградируют с помощью NMD. Было предположено, что многие из этих транскриптов не имеют функционального значения, т.к. большинство, по-видимому, не законсервировано у млекопитающих, но что они, скорее всего, представляют собой биологические шумы, вызываемые ошибками сплайсинга, иногда они наз. illegitimate splicing, [19-21]. Однако, некоторые PTC-содержащие транскрипты, как было установлено, возникают в результате событий регулируемого альтернативного сплайсинга, которые вносят вклад в регуляцию экспрессии белка, также наз. regulated unproductive splicing and translation (RUST) [22, 23].
В случае MMR и др. раковых генов, описано несколько альтернативно сплайсированных мРНК транскриптов без видимой ассоциации с мутациями [7, 10]. Эти альтернативные транскрипты могут маскировать присутствие сходного размера ассоциированных с мутациями аберрантных транскриптов при RT-PCR анализе или могут даже выступать как специфичные для пациента аберрации сплайсинга. Доказательства показали, что количество и уровень альтернативных транскриптов, потенциально несущих PTCs, может заметно варьировать между индивидами и между тканями у данного индивида [10, 11, 24, 25]. Поэтому очень важно установить базовую линию количества и уровня экспрессии естественно возникающих альтернативно сплайсированных транскриптов для данного гена.
Это первый систематический обзор, сфокусированный на естественно возникающих альтернативно сплайсированных транскриптах MMR генах
MLH1, MSH2, MSH6 и PMS2. Целью обзора было обнаружение всех MMR писанных транскриптов (public databases and/or the literature), чтобы составить каталог для замысла и интерпретации сплайсинга. Обзор показал важность предыдущих знаний о естественно возникающих альтернативно сплайсированных транскриптах, чтобы интерпретировать их варианты и создать каталог естественно возникших транскриптов после альтернативного сплайсинга, который может быть использован как базовый справочник информации для разработки и интерпретации клинических исследований мРНК.
Discussion
Наши находки показали, что транскрипты MLH1 и MSH2 подвергаются множественным событиям альтернативного сплайсинга, всего описано 30 альтернативных транскриптов MLH1 и 22 для MSH2. Этот высокий уровень альтернативного сплайсинга осложняет интерпретацию данных РНК, получаемых от пациентов, несущих варианты нуклеотидов в этих генах (Table S4).
Описанные ассоциации между MMR альтернативными транскриптами и вариантами нуклеотидов не всегда подтверждают биоинформационные предсказания. Для MLH1, ~20% исследований (Table S4) описывают альтерации в уровне естественно возникающих транскриптов в связи с изменчивостью экзонных последовательностей, которые оказывались не соотв. биоинформационным предсказаниям. Расхождения частично могут быть обусловлены неаккуратностью silicopredictions, в особенности тех, что связаны с альтерациями сплайсинга регуляторных элементов [62]. Однако, предоставление неточной информации об альтернативных транскриптах, как о вариантах индуцированных аберраций, скорее всего, вносит вклад. Более того, 89% (66/74) опубликованных рассмотренных здесь исследований не отмечают определенных ассоциированных с пациентом транскриптов и описывают естественно возникающие альтернативные транскрипты у контрольных индивидов. Важно, что ни одно из этих исследований не использует настоящие количественные методы для оценки уровней транскриптов. В отсутствие такой информации трудно отличить естественные флюктуации от индуцированных мутациями аберрантные сплайс-варианты. Поэтому аллель-специфические количественные исследования необходимы для каждого варианта, которые находятся в регионе, склонном к альтернативному сплайсингу. Мы отметили, что InSiGHT Variant Interpretation Committee в настоящее время рекомендует получение дополнительных клинических доказательств (e.g. segregation, tumour pathology) для подтверждения причинной связи для всех потенциальных сплайс-мутаций, если мРНК транскрипты не были оценены с помощью аллель специфических проб [5].
Биологическое значение MMR альтернативных транскриптов в основном неизвестно и возможно зависит от относительного уровня альтернативно сплайсированных транскриптов по сравнению с абсолютным уровнем сопутствующих транскриптов полной длины. Ожидается, что многие альтернативно сплайсированные транскрипты, вносящие вклад в кодоны преждевременного окончания, будут, скорее всего, элиминированы в некоторой степени за счет механизмов пост-транскрипционного надзора, таких как NMD [63]. Многие из альтернативных транскриптов, закодированных in-frame, также могут быть 'не функциональными'. Было показано с использованием анализа in vitro, что экспрессия изоформ белка MLH1, несущих делеции in-frame (MLH1 Δ9/10, Δ16 и Δ17) может вызывать устранение функции репарации ДНК [39-41, 44, 45]. Однако, необходимо отметить, что не все in-frame альтернативно сплайсированные транскрипты будут обязательно вызывать потерю функции белка. Напр., в белке BRCA2, изоформа Δ12, которая была идентифицирована у контрольных индивидов (James Fackenthal, personal communication) и в нормальной ткани груди [64], обнаруживает сохранение в целости функции репарации ДНК [65]. Это подчеркивает важность понимания фенотипических последствий индуцированного мутациями усиления естественно возникающих событий альтернативного сплайсинга.
Эти транскрипты возможно участвуют в регуляции экспрессии генов посредством непродуктивных сплайсинга и трансляции, которые были описаны для некоторых факторов сплайсинга [66, 67]. Транскрипты после альтернативного сплайсинга генов MMR у человека, по-видимому, не законсервированы у мышей (data not shown), это может указывать на отсутствие их биологического значения. Однако, описана корреляция между частотой непродуктивных слайс-вариантов для повсеместно экспрессирующейся DNA polymerase B и продолжительностью жизни у приматов [68], столь же адаптивное значение может иметь увеличение альтернативного сплайсинга, наблюдаемое у людей для MLH1 и MSH2. Необходимы дальнейшие исследования, чтобы определить, какие альтернативные транскрипты MMR могут возникать в результате регулируемых событий и какие могут быть результатом незаконного сплайсинга.
Некоторые описанные альтернативные сплайс-вариант MMR могут быть следствием незаконного сплайсинга, вызываемого с помощью стрессом индуцированного снижения точности аппарата сплайсинга [69, 70]. В этом случае, присутствие некоторых альтернативно сплайсированных MMR транскриптов в потенциально 'старых' лимфоцитах периферической крови по сравнению с клетками лимфобластоидной линии (LCLs - происходящей из EBV-иммортализованных B лимфоцитов) [12, 71] может в конечном счете объяснено потенциалом восстановления точности сплайсинга посредством процесса иммортализации лимфоцитов [70, 72]. Высокие уровни экспрессии альтернативных транскриптов были измерены по РНК лимфоцитов от контрольных индивидов с использованием полуколичественных методов [11, 24, 25], но взаимоотношение между 'возрастом' преобразующихся клеток не описаны.
Имеются сообщения о дифференциальной экспрессии некоторых MMR транскриптов в разных нормальных тканях [10, 71]. Это не является неожиданностью, принимая во внимание, что имеется множество примеров ткане-специфичной регуляции экспрессии генов посредством альтернативного сплайсинга [73]. Отсутствие альтернативных транскриптов в ткани может быть обусловлено частично использованием низко чувствительных технологий для оценки альтернативных транскриптов. Используя более чувствительную технику, недавние исследования альтернативного сплайсинга BRCA1 показали, что все мРНК транскрипты экспрессируются в базирующихся на крови источниках РНК и ткани груди, но соотношение транскриптов отличается [27]. Тестирование большого числа соотв. лимфоцитов и др. нормальных тканей, в особенности тех, которые чувствительны к дефектам MMR, такие как колон и эндометрий, могут стать идеальным подходом для изучения ткане-специфичных паттернов альтернативного сплайсинга MMR. итак, эти наблюдения подчеркивают важность анализа выборок из одной и той же ткани при стандартизованных условиях, которые могут контролировать различия в экспрессии транскриптов, обусловленных несанкционированным сплайсингом, или различиями в типе ткани.
Данный обзор подчеркивает преобладание альтернативно сплайсированных MMR транскриптов и предоставляет каталог в помощь разработки и интерпретации подходов к сплайсингу этих генов. Наши находки показывают, что идентификация и количественная оценка естественно возникающих транскриптов во многих здоровых контролях (from appropriately processed tissue samples) необходимы, чтобы определить диапазон вариабельности, ассоциированный с нормальным паттерном сплайсинга MMR и тем самым помочь дальнейшей интерпретации неправильной регуляции транскриптов у носителей вариантов MMR. Это требует использования мощных технологий. В этом смысле, недавно разработанный транскриптомный подход , RNAseq [75] и на сегодня наиболее чувствительный метод RNA capture-seq [76] внушают большие надежды на глубокую характеристику паттерна альтернативного сплайсинга многих ассоциированных с болезнями генов, таких как MLH1, MSH2, MSH6 и PMS2, как у здоровых индивидов, так и у носителей вариантов (пациентов и не имеющих симптомов родственников).