Посещений:
СПЛАЙСИНГ мРНК

Методы оценки

A review of mismatch repair gene transcripts: issues for interpretation of mRNA splicing assays
B.A. Thompson, A. Martins3 and A.B. Spurdle
• Clinical Genetics > Vol 87 Issue 2 , pages 100-108, February 2015

Many mismatch repair (MMR) gene disease-causing mutations identified in cancer patients result in aberrant messenger RNA (mRNA) splicing. However, mRNA assay interpretation can be complicated by the existence of naturally occurring alternative mRNA transcripts, most of which have not been formally described or fully characterized. Here, we provide a comprehensive catalogue of all MMR transcripts described to date, and a review of MMR nucleotide variants associated with an apparent upregulation of alternatively spliced transcripts. This work sets reference starting points for designing and interpreting MMR RNA analyses. Our database and literature searches retrieved 30 MLH1, 22 MSH2, 4 MSH6 and 9 PMS2 alternative transcripts, many predicted to introduce premature termination codons. Furthermore, we collected information on 66 MLH1, 24 MSH2 and 6 PMS2 nucleotide variants reported to be associated with altered expression of at least one of these alternative transcripts, and in many instances reported as splicing mutations. This review shows that there are many alternatively spliced MMR transcripts, which have potential to confound interpretation of splicing assays. These findings highlight the need to perform RNA analysis of patients systematically in parallel with control individuals, and call for the implementation of quantitative assessment of transcript levels for informed interpretation of mRNA assays.

Мутации зародышевой линии в DNA mismatch repair (MMR) генах MLH1, MSH2, MSH6 и PMS2, являются причиной синдрома Lynch (первоначально обозначаемого как hereditary non-polyposis colorectal cancer, HNPCC), и др. родственных наследуемых раковых состояний, включая синдром Muir-Torre и constitutional mismatch repair deficiency syndrome (CMMR-D) [1-3]. Идентификация семей с мутациями важна для определения риска для родственников, для пресиндромального скрининга и ведения, уменьшающего риск, и для осуществления кли нической стратегии по снижению риска вторичных раковых опухолей у пациентов [4].
Растет осознание, что значительная доля germline вариантов, обнаруживаемая в генах, ассоциированных с болезнью, включая MMR гены, вызывают аномалии сплайсинга [5]. Эти 'spliceogenic' варианты возникают в результате альтераций в цис-действующих сигналах, способствующих сплайсингу, а именно, в сайтах сплайсинга (напр. разрушение канонического сплайст-сайта или использование сайта de novo обусловленное созданием нового сайта сплайсинга и/или активации скрытых сайтов) или в элементах, регулирующих сплайсинг (напр. энхансеры и сайленсеры экзонного сплайсинга, ESEs и ESSs, соотв.) [6]. Как показано на Fig.1, такие отклонения часто приводят к событиям, таким как полная или частичная делеция экзонов (включая тотальный пропуск экзонов) и превращение в экзоны интронных последовательностей (intron retention, pseudoexon inclusion) [7, 8].



Figure 1. Structural types of alternative splicing. Black denotes exons from the example reference sequence. White are exonic regions that become intronic (relative to reference sequence) due to alternative splicing events. Grey indicates intronic/intergenic regions that become exonic (relative to reference sequence) due alternative transcription or/and splicing events. Solid lines between exon boundaries indicate splicing events also present in the example reference sequence, whereas dashed lines represent alternative splicing events.

Из-за их очень высокого сходства, чтобы изменить сплайсинг, варианты нуклеотидов, вызывающие отклонения конесенсуса интронных динуклеотидов в естественных 5'-donor (GT) и 3'-acceptor (AG) сайтах часто рассматриваются как патогенные мутации без необходимости в проверке мРНК и используются только для непосредсвенного ведения пациента [5]. Что касается оставшихся интронных и экзонных вариантов, это является рутинным для большинства клинических лабораторий для проведения проверки мРНК, чтобы оценить их клиническое значение [9], после предварительного выбора, базирующегося на биоинформационных предсказаниях альтераций вариантов, индуцирующих сплайсинг. Наиболее высоко используемыми подходами для детекции интересующих транскрипов являются reverse transcriptase polymerase chain reactions (RT-PCR) сопровождаемая: электрофорезом на агарозном геле и секвениованием очищенных от шеля продуктов [10]; электорофорезом в капиллярах с использоанием флюоресцентно меченных праймеров [11]; и/или молекулярное клонирование продуктов RT-PCR [12]. Базирующийся на PCR метод для enriching alternatively spliced isoforms (EASI) был также разработан для идентификации новых вариантов транскрипов [13]. Подход минигенов предоставляет ex vivo меод для оценки эффектов вариантов сплайсинга. Они особенно пригодны, когда доступна РНК пациентов или когда появляется индуцированный аберрантно вариант in vivo, но трудно определить из-за деградации с помощью nonsense-mediated decay (NMD) [14-16]. Более того, подход минигенов может непосредственно оценивать взаимоотношения причина-эффект, а именно между вариантом и неожиданным вариантом, вызывающим дефект сплайсинга. Измененные паттерны сплайсинга, идентифицированные с помощью упомянутых выше экспериментальных подходов могут быть использованы в помощь определения молекулярных последствий и тем самым для оценки клинического значения вариантов нуклеотидов [5].
Альтернативный сплайсинг является является широко распространенным явлением у эукариот и имеет важные биологические последствия, т.к. он вносит вклад в регуляцию экспрессии генов и увеличивает разнообразие белковых изоформ, продуцируемых каждым геном. Напр., альтернативный сплайсинг может регулировать тканеспецифическую экспрессию ряда генов [17, 18]. В дополнение к функциональным изоформам белка альтернативный сплайсинг может приводить к продукции транскрипов с преждевременными стоп-кодонами (PTCs), которые деградируют с помощью NMD. Было предположено, что многие из этих транскрипов не функциональны и в большинстве своем не законсервированы у млекопитающих, но представляют, скорее всего, биологические шумы, вызываемые ошибками сплайсинга, иногда заканчивающиеся незаконным сплайсингом, [19-21]. Однако некоторые PTC-содержащие транскрипты, как было установлено, возникают в результате регулируемого альтернативного сплайсинга, который вносит вклад в регуляцию экспрессии белка, также наз. regulated unproductive splicing and translation (RUST) [22, 23].
В случае MMR и др. раковых генов были описаны некоторые альтернативно сплайсированные мРНК транскрипты с неочевидной ассоциацией с мутациями [7, 10]. Эти альтернативные транскрипты могут маскировать присутствие сходного размера аберрантных транскрипов, ассоциированных с мутациями при RT-PCR подходе или могут даже ошибочно приняты за специфичные для пациента абберации сплайсинга. Доказательства из крупных полуколичественных подходов показали, что количество и уровень альтернативных транскрипов, потенциально несущих PTCs, может заметно варьировать между индивидами и также между тканями данного индивида [10, 11, 24, 25]. Поэтому очень важно установить базовый уровень количества и уровень экспрессии естественно возникаюших сплайс-транскриптов для данного гена, по сравнению с которыми могут быть интерпретированы получаемые данные.
Это первый систематический обзор, сфокусированный на естественно возникающих транскриптах после сплайсинга MMR генов MLH1, MSH2, MSH6 и PMS2. Целью обзора было идентифицировать все представленные в печати MMR транскрипты (открытые базы данных и/или литература), в попытке создать каталог для проектирования и интерпретации тестов сплайсинга. Кроме того, те же самые данные были использованы для интерпретации нуклеотидных вариантов MMR генов вариантов, описанных в ассоциации в измененной экспрессией любого естественно возникшего транскрипта после альтернативного сплайсинга. Эти нуклеотидные вариенты были также оценены биоинформационно для оценки, действительно ли описанные профили транскриптов согласуются с эффектом варианта сигнала к сплайсингу. Этот обзор показал важность занния прототипа естественно возникающих альтернативных сплайс-транскриптов, чтобы интерпретировать варианты и создать каталог естественно возникающих MMR транскриптов, который может быть использован в качестве основы , чтобы информировать замысео и интерпретацию клинических мРНК подходов.



Figure 2. Mismatch repair gene naturally occurring mRNA transcripts identified from the literature and public sequence database searches: MLH1, n=31 (a), MSH2, n?=?23 (b); MSH6, n?=?5 (c); and PMS2, n?=?10 (d). A full explanation of the symbols used to annotate the transcripts is presented in the Methods section. Asterisks denote transcripts identified in public databases only. Solid lines denote predicted open reading frame (coding sequence) derived from exonic sequence (grey shading) and/or intronic/intergenic sequence (black shading). Predicted coding sequences were based on GENCODE annotated transcripts or recommendations in Mudge et al. [8]. Light shading denotes predicted non-coding sequence, derived from exonic sequence (dashed lines) and/or intronic/intergenic sequence (dot-dash lines). FL, full-length reference transcript sequences (RefSeq): NM_ 000249.3 (MLH1), NM_000251.2 (MSH2), NM_000179.2 (MSH6) and NM_000535.5 (PMS2). Δ: partial or complete exon deletion; маленький слошной треугольник : inclusion of intronic sequence within the transcript's body or inclusion of non-coding or intronic sequence as an alternative first or final exon; p: acceptor-site shift; q: donor-site shift.
Discussion


Наши находки в результате всестороннего обследования независимо проверенных (peer-reviewed) публикаций и открытых баз данных показали, что MLH1 и MSH2 транскрипты подвергаются множественным событиям альтернативного сплайсинга, при этом описано в целом 30 MLH1 и 22 MSH2 транскрипов от альтернативного сплайсинга. Такой высокий уровень альтернативного сплайсинга осложняет интерпретацию данных РНК, получаемых от пациентов, несущих варианты нуклеотидов в этих генах, как было показано с помощью противоречивых сообщений о нарушениях регуляции сплайсинга по сравнению с множествеными исследованими, описывающими мРНК подходы для идентичных нуклеотидных вариантов (Table S4).
Описанные ассоциации между MMR альтернативными транскриптами и нуклеотидными вариантами не всегда подтверждаются биоинформационными предсказаниями. Для MLH1, ~20% исследований (Table S4) описывают альтерации на уровне естественно возникающих транскриптов в связи с вариациями экзонных последовательностей, которые не согласуются биоинформационными предсказаниями. Расзождение может быть частично обусловлено неточностью silicopredictions, в особенности тех, которые связаны с отклонениями в регуляторных элементах сплайсинга [62]. Однако вносят вклад и сообщения неправильных свелдений об альтернативных транскриптах как вариантах, вызывающих аберрации. Более того, 89% (66/74) опубликованных исследований, рассмотренных здесь не показывают, что определенные ассоциированные с пациентом транскрипты также описываются как естественно возникающие транскрипты от альтернативного сплайсинга у контрольных индивидов. Важно, что ни одно из исследований не использовало настоящие количественные методы для оценки уровней транскриптов. При отсутствии такой информации трудно сделать различия между флюктуациями естественной экспрессии и индуцированным мутациями аберрантным сплайсингом.Т.о., аллель-специфические количественые исследования д. быть проведены для каждого варианта, который располагается в реги оне, склонном к альтернативному сплайсингу. Мы отметили, что InSiGHT Variant Interpretation Committee сегодня рекомендует дополнительные клинические доказательства (напр. расхождение, опухолевую патологию) для подтверждения причинной связи с потенциальнмих мутацичми сплайсинга, если мРНК транскрипт не был оценен с использованием аллеь-специфического тестирования [5].
Биологическое значение альтернативных транскриптов MMR в основном неизвестно и возможно зависит от относительного уровня альтернативно сплайсированных транскрипов по сравнению с абсолютным уровнем одновременно подавляемых транскрипов полной длины. Ожидается, что альтернативно сплайсированные транскрипты, которые вносят кодоны преждевременной остановки, по-видимому, элиминируются, до некоторой степени, с помощью механизмов пост-транскрипционного надзора, такого как NMD [63]. Многие из in-frame кодируемые альтернативные транскрипты также могут быть 'не-функциональными'. Показно с использованием анализа in vitro, что экспрессия MLH1 белковых изоформ, несущих делеции in-frame (MLH1 δ9/10, δ16 и δ17) могут вызывать устранение функции репарации ДНК [39-41, 44, 45]. Однако необходимо отметить, что не все in-frame альтернативно сплайсированые транскрипты будут неизбежно вызывать потерю функции белка. Напр., в BRCA2, δ12 белковая изоформа, которая была идентифицирована у контрольных индивидов (James Fackenthal, personal communication) и нормальной ткани груди [64], обнаруживает полную функцию репарации ДНК [65]. Это подчеркивает важность понимания фенотипических последствий индуцированного мутациями усиления естествнно возникших событий альернативного сплайсинга.
Эти транскрипты возможно участвуют в регуляции генной экспрессии посредством непродуктивного сплайсинга и трансляции, которые были описаны для некот рых факторов сплайсинга [66, 67]. Транскрипты после альтернативного сплайсинга генов MMR человека, по-видимому, не законервированы у мышей (data not shown), это может указывать на биологичекое значение их отсутствия. Однако описана корреляция между частотой непродуктивных сплайс-вариантов для повсеместно экспрессируемой DNA polymerase B и продолжительностью жизни у приматов [68], так что она может иметь столь же приспособительное значение для повышения альтернативного сплайсинга, наблюдаемого в MLH1 и MSH2 человека. Необходимы дальнейшие исследования, чтобы определить, какие MMR альтернативные транскрипты могут возникать в результате регулируемых событий и какие могут представлять незаконный сплайсинг.
Некоторые из описанных MMR альтернативных сплайс-вариантов могут быть следсивем незаконного сплайсинга, выщзываемого с помощью индуцированной стрессом редукции точности аппарата сплайсинга [69, 70]. В этом случае присутствие некоторых альтернативно сплайсированных MMR транскриптов в потенциально 'старых' лимфоцитах периферической крови по сравнению с линиями лимфобластоидных клеток (LCLs -происходящих из EBV-иммортализованных B лимфоцитов) [12, 71] д. в конечном итоге объясниться потенциаль ным восстановлением точности сплайсинга посредством процесса иммортализации лимфоцитов [70, 72]. Высокие уровни экспрессии альтернативных транскриптов были измерены для РНК лимфоцитов из контрольных индивидов, используя полуколичественные методы [11, 24, 25], но взаимоотношение со 'старыми' подвергшихся процессингу клетками не описано.
Имеются сообщения о дифференциальной экспрессии некоторых MMR транскриптов между нормальными тканями [10, 71]. Имеется множество примеров ткане-специфической регуляции генной экспрессии с помощью альтернативного сплайсинга [73]. Отсутствие альтернативных транскриптов в ткани может быть обусловлено частично использованием технологий низкой чувствительности для поиска альтернативных транскриптов. Используя более чувствительную технику, недавние исследования по альтеранативному сплайсингу BRCA1 показали, что мРНК транскрипты все экспрессируются в базирующихся на крови источникахРНК и ткани молочных желез, но соотношение транскриптов разное [27]. Тестирование большого количества подобранных лимфоцитов и др. нормальных тканей, особенно тех, что уязвимы дефектами MMR, таких как толстая кишка и эндометрий, будет идеальным подходом для изучения ткане-специфичных паттернов альтернативного сплайсинга MMR. Итак, эти наблюдения подчеркивают важность анализа пимеров из одной и той же ткани при стардатизованных условиях, которые могут контролировать различия в экспрессии транскриптов, обусловенные нелегетимным сплайсингом или различиями, обусловленными типом ткани.
Данный обзор подчеркивает превалирование альтернативно сплайсированных MMR транскриптов и предоставляет каталог, помогающий проектированию и интерпретации подходов к слайсингу этих генов. Наши находки показывают, что идентификация и количественная оценка естественно возникших транскриптов во многих здоровых контрольных тканых (из соотв. образом приготовленных тканевых выборок) необходима для определения диапазона вариабельности, ассоцированного с нормальным паттерном сплайсинга MMR , и тем самым для дальнйшей помощи в интерпретации нарушений регуляции транскриптов у носителей вариантов MMR. Это потребует использования мощной техники. Капиллярный электрофорез чувствителен к методу детекции транскриптов [27, 74] , но он не достигает уровня разрешения нуклеотидов. В этом смысле недавно разработанный транскриптомный подход, RNAseq [75] и ещё более чувтительный RNA capture-seq [76] вселяют большие надежды в отношении глубокой характеризации паттерна альтернативного сплайсинга для многих генов, связанных с болезнями, таких как MLH1, MSH2, MSH6 и PMS2, как у здоровых контрольных индивидов, так и у носителей вариантов (пациентов и бессимптомных родственников).