Keith D. Robertson Nature Reviews Genetics6, No 8, P. 597-610 (2005); doi:10.1038/nrg1655
Метилирование ДНК является важной эпигенетической модификацией генома, которая связана с регуляцией многих клеточных процессов. В соответствии с её важной ролью растет количество заболеваний у человека, связанных с аберрантным метилированием ДНК. Изучение этих заболеваний предоставляет новую и фундаментальную информацию о роли, которую метилирование ДНК и др. эпигенетические модификации играют в развитии и нормальном клеточном гомеостазе.
Рис.2. | Regions involved in disease-associated genomic imprinting defects.
Рис.3. | DNA methylation and diseases associated with repeat instability.
Рис.4. | A model for the disruption of normal DNA methylation in cancer cells.
Boxes
Box 1 | A comparison of the CTCF and BORIS proteins
Contains an 11 zinc finger (ZF) DNA-binding region30.
Binds diverse DNA sequences, including most ICRs and many CpG
islands30,137.
Binding is methylation sensitive (if binding sites contain
CpGs)31.
Has insulator function (regulates access of enhancers to
promoters)30,70.
Has boundary element function (blocks the spread of
heterochromatin)30,70.
Protects regions from DNA methylation138,139.
Is ubiquitously expressed, except in spermatocytes126.
Overexpression inhibits cell proliferation140.
Gene is located at 16q22, a region of frequent loss of
heterozygosity in cancer, and is often mutated in cancer141.
BORIS
Contains an 11 ZF DNA-binding region that has high similarity
to the CTCF ZF region30.
Presumed to show significant overlap with CTCF binding sites.
Methylation sensitivity of binding unknown.
Insulator function unknown.
Boundary element function unknown
Methylation protection function unknown
Expression is normally restricted to testis (BORIS is a member
of the cancer–testis gene family), and is reactivated in
cancers126.
Overexpression promotes cell proliferation30.
Gene is located at 20q13, a region that is frequently
amplified in cancer.
Box 2 | DNA-methylation abnormalities and assisted reproductive technology
A link between assisted reproductive technology and
birth defects
It has been estimated that one in ten individuals of reproductive
age are infertile. The use of assisted reproductive technologies
(ARTs), such as intracytoplasmic sperm injection and in vitro
fertilization, has therefore been increasing, and children conceived
by ART now account for 1–3% of all births in some Western countries.
Although the vast majority of these children develop normally,
recent studies have raised concerns that these procedures might lead
to epigenetic defects. ART is associated with an increase in
multiple births and low birth weight, and this risk has been known
for some time142. Although the numbers are small and larger studies are needed, ARTs have been linked to a 3–6-fold increase in the occurrence of Beckwith–Wiedemann syndrome (BWS) and Angelman syndrome (AS)37,143,144
(see online supplementary information S3 (table)).
An epigenetic basis
Germ cell and embryonic development are two periods that are
characterized by profound changes in DNA methylation patterns, also
known as epigenetic reprogramming. Primordial germ cells are
globally demethylated as they mature (including at imprinted
regions), and then become methylated de novo during
gametogenesis, which is also the time at which most DNA methylation
imprints are established. The second period of pronounced change
occurs after fertilization, where the paternal genome is rapidly and
actively demethylated, followed by passive replication-dependent
demethylation of the maternal genome (here, imprinting marks seem to
resist demethylation). A wave of de novo methylation once
again establishes the somatic-cell pattern of DNA methylation
following implantation145,146.
The increased incidence of BWS and AS associated with ART all
arise from epigenetic, rather than genetic, defects. In most BWS
cases studied, loss of imprinting (LOI) at KCNQ1OT1 was
observed, and in AS cases the defect was found to be LOI at
SNRPN (loss of maternal methylation, see Fig. 2a,b)37,143. Epigenetic mechanisms and imprinted genes also seem to be involved in the regulation of birth weight in mouse models; therefore, the disruption of imprints at currently unknown loci following ART in humans might also contribute to the increased incidence of this problem147.
Low birth weight is a serious issue in its own right as it
contributes to long-term adverse health effects such as
cardiovascular disease148.
Causes of epigenetic defects
There has been a trend in fertility clinics towards extended
culture time of embryos and transfer of blastocysts, rather than
earlier cleavage-stage embryos. This allows selection of the most
robust embryos, proper temporal synchronization of the embryo and
the uterus, and the possibility of maintaining a high pregnancy rate
while reducing the risk of multiple pregnancy (because fewer embryos
need to be transferred)35.
However, several studies have demonstrated that in vitro
culture conditions have notable effects on imprinting marks, gene
expression and developmental potential in mouse models34,149.
Whether the culture conditions used for human embryos provide all of
the necessary factors for proper epigenetic control is unknown. It
is also possible that the epigenetic defects might be the cause of
the infertility itself and are present in the gametes of the mother
and/or father. Therefore, rather than ARTs causing epigenetic
defects directly, they might simply be unmasking an existing
defect.
C завершением Human Genome Project, мы почти закончили список генов, необходимых для создания человека. Однако, ситуация оказалась намного сложнее, чем простое создание каталога генов. Равной по значению является вторая система, которую клетки используют для детерминации когда и где определенный ген д. экспрессироваться во время развития. Эта система наложена на ДНК в форме эпигенетических меток, которые наследуются во время клеточных делений, но не меняет последовательностей ДНК
Единственной известной эпигенетической модификацией ДНК у млекопитающих является метилирование цитозина в позиции C5 в CpG динуклеотидах1. Напротив, др. основная группа эпигенетических модификаций - пост-трансляционные модификации гистонов - обнаруживает высокий уровень разнообразия и сложности2. Кухня (machinery) метилирования ДНК у млекопитающих состоит из двух компонентов, DNA methyltransferases (DNMTs), которые устанавливают и поддерживают паттерны метилирования ДНК, и methyl-CpG binding proteins (MBDs), которые вовлечены в процесс 'считывания' меток метилирования. Основные свофства этих белков может найти on line supplementary information S1 (table) (и в Refs 3,4).
Имеются также четкие доказательства, что DNA demethylase вносит вклад в регуляцию паттерна метилирования ДНК во время эмбрионального развития, хотя активность, отвечающая за это не была идентифицирована5.
В нормальных клетках метилирование ДНК происходит преимущественно в повторяющихся областях генома, включая сателлитную ДНК и паразитические элементы (такие как long interspersed transposable elements (LINES), short interspersed transposable elements (SINES) и эндогенные ретровирусы)6. CPG ISLANDS, особенно те, что ассоциированы с промоторами, обычно неметилированы, хотя выявлено всё растущее количество исключений7,8. Метилирование ДНК репрессирует транскрипцию непосредственно путем ингибирования связывания специфических транскрипционных факторов, и косвенно путем рекрутирования methyl-CpG-связывающих белков и ассоциированных с ними репрессивный хроматин ремоделирующих активностей (see online supplementary information S1 (table)). Мало известно о том, как метилирование ДНК находит специфические регионы; возможно это осуществляется благодаря взаимодействиям между DNMTs и одним или более белками, ассоциированными с хроматином3.
Собственно установление и поддержание паттерна метилирования ДНК важно для развития млекопитающих и для нормального функционирования взрослого организма. Метилирование ДНК является мощным механизмом замалчивания экспрессии генов и поддержания стабильности генома перед лицом огромного количества повторяющихся ДНК, которые кроме всего прочего обеспечивают события незаконной рекомбинации и вызывают дерегуляцию транскрипции соседних генов. Эмбриональные стволовые клетки, которые дефицитны по DNMTs, жизнеспособны, но погибают, когда они индуцируются к дифференцировке9. Исследования нокаута на мышах показали, что Dnmt1 и Dnmt3b существенны для эмбрионального развития и что мыши, лишенные Dnmt3a погибают в течение нескольких недель после рождения10,11. Кроме того, потеря нормального паттерна метилирования ДНК в соматических клетках приводи в результате к потере контроля за ростом.
Важность метилирования ДНК подчеркивается растущим количеством болезней у людей, которые, как известно, появляются, когда эта эпигенетическая информация, устанавливается и/или поддерживается несоответствующим образом, и растет интерес к разработке путей фармакологического устранения эпигенетических аномалий12. Дальнейший интерес к этой области вызван важными новыми доказательствами, связанными с регуляцией метилирования ДНК, указывающими на взаимодействия между метилированием ДНК и кухней модификации гистонов и на потенциальную роль малых РНК13. Здесь обсуждается разнородная группа заболеваний, ассоциированных с аномалиями метилирования ДНК, исследования, которые проливают свет на то, как регулируются паттерны метилирования ДНК и патологические следствия их нарушения. Предлагаются две родственные модели того, как одиночный общий дефект может давать разнообразные наборы дефектных паттернов метилирования ДНК при заболеваниях у людей. Внимание будет уделено только тем болезням, для которых дефектные паттерны метилирования ДНК продемонстрированы. Поэтому не будет рассматриваться Rett syndrome, который связан с дефектом кухни, которая отвечает за считывание маркеров метилирования14.
DNA methylation and cancer
Связь между метилированием ДНК и раком впервые продемонстрирована в 1983, когда было показано, что геномы раковых клеток гипометилированы по сравнению с нормальными клетками15. Гипометилирование в опухолевых клетках прежде всего обусловлено потерей метилирования повторяющимися регионами генома6 (Рис.1), а возникающая в результате геномная нестабильность является характерной особенностью опухолевых клеток. Перестройки, которые затрагивают большой блок перицентромерного гетерохроматина на хромосоме 1, напр., находятся среди наиболее частых геномных нестабильностей во многих типах опухолевых клеток16. Реактивация промоторов транспозонов вследствие деметилирования также может вносить вклад в аберрантную регуляцию генов при раке за счет TRANSCRIPTIONAL INTERFERENCE или генерации антисмысловых транскриптов17. Потеря геномного метилирования является частым и ранним событием при раке и коррелирует с тяжестью болезни и метастатическим потенциалом при многих типах опухолей18.
Ген-специфические эффекты гипометилирования также наблюдаются. Напр., семейство melanoma antigen (MAGE) из генов рака семенников, которые кодируют опухолевые антигены с неизвестной функцией, часто деметилированы и ре-экспрессируются при раке19. Деметилирование, сопровождаемое повышенной экспрессией, описано для гена S100 calcium binding protein A4 (S100A4) при раке толстой кишки20, для гена serine protease inhibitor SERPINB5 (известного также как maspin) при раке желудка21, и для предполагаемого онкогена γ-synuclein (SNCG) при раке груди и яичников22. Раннее глобальное деметилирование при туморогенезе может делать клетки предрасположенными к геномной нестабильности и к дальнейшим генетическим изменениями, тогда как ген-специфическое деметилирование может быть более поздним событием, которое позволяет опухолевым клеткам адаптироваться к их локальному окружению и способствует метастазированию.
Исследования деметилирования по всему геному в раковых клетках было в основном в тени исследований событий ген-специфическго гипометилирования, которые происходят параллельно с событиями гипометилирования, обсужденными выше. Аберрантное гипометилирование при раке обычно происходит в CpG островках (Рис. 1), большинство которых остаются не метилированными в нормальных соматических клетках8,23, и возникающие в результате изменения структуры хроматина (такие как гипоацетилирование гистонов) эффективно замалчивают транскрипцию. В самом деле, определенные наборы из многих типов опухолевых клеток обладают CpG-island-methylator фенотипом, который определяется как 3-5-кратное увеличение частоты аберрантных событий гипометилирования24.
Гены, участвующие в регуляции клеточного цикла, инвазии опухолевых клеток, репарации ДНК, ремоделировании хроматина, передаче сигналов, транскрипции и апоптозе, как известно становятся аберрантно гиперметилироваными и молчащими почти в каждом типе опухолей (see online supplementary information S2 и S3 (tables)). Это предоставляет опухолевым клеткам преимущества в росте, увеличивает их генетическую нестабильность (позволяя им приобретать дальнейшие преимущества от генетических изменений), и позволяя им метастазировать. В опухолях а с хорошо выраженным прогрессированием, в таких как рак толстой кишки, аберрантное гиперметилирование выявляется в самых ранних повреждениях предшественников, указывая тем самым на непосредственные вклады в трансформацию, а не в результате более поздних событий, которые возникают в результате генетических изменений25.
Используя RESTRICTION LANDMARK GENOMIC SCANNING для анализа состояния метилирования 1,184 CpG островков из 98 выборок опухолей, было показано, что метилирование de novo островков CpG широко распространено в опухолевых клетках. В этом исследовании степень метилирования варьирует между индивидуальными опухолями и типами опухолей и в среднем 608 CpG островков были аберрантно гиперметилированы26. Т.к. гиперметилирование CpG островков довольно редко в нормальных клетках, то это может быть хорошим мощным биомаркером для ранней детекции опухолей27. Лажащая в основе причина дефектов метилирования при раке остается неизвестной, но возможные механизмы будут обсуждены у конце. Метилирование ДНК и рак также связаны посредством потери паттернов импринтирующего во многих опухолях.
DNA methylation and imprinting disorders
Genomic imprinting - a brief overview. Геномный импринтинг определяется как эпигенетическая модификация специфических родительских хромосом в гаметах или зиготах, которая ведет к дифференциальной экспрессии двух аллелей гена в соматических клетках потомства28. Дифференциальная экспрессия может происходить во всех клетках или в специфических тканях или на определенных стадиях развития. Около 80 генов. как известно, импринтируются и это количество постоянно увеличивается.
Дифференциальное аллель-специфическое метилирование ДНК является одним их характерных признаков импринтируемых регионов и обычно располагается в областях, называемых differentially methylated regions (DMRs). DMRs включают imprinting control regions (ICRs), которые контролируют экспрессию генов внутри импринтируемых доменов, часто на большие расстояния. Т.к. DMRs могут быть репрограммированы во время развития, то дифференциальное метилирование в ICRs обычно устанавливается в зародышевых клетках и поддерживается в ходе всего развития29.
CCCTC-binding factor (CTCF), 11-zinc-finger белок, который связывает высоко дивергентные последовательности и использует различные комбинации цинковых пальчиков, является важным регулятором экспрессии импринтируемых генов (Box 1). CTCF является инсулятором (insulator) хроматина, который делит геном на независимые функциональные домены или, в случае импринтированных локусов, регулирует способность удаленных ENHANCERS достигать промоторов30. В нескольких исследованиях ICRs, in vitro и in vivo было показано, что CTCF связывается только с неметилированным родительским аллелем31,32, предоставляя элегантный способ для ICR-регулируемых генов быть экспрессированными аллель-специфическим образом. CTCF связывание может быть также существенным для защиты DMRs от метилирования de novo33.
Loss of imprinting (LOI) является разрушением эпигенетических меток импринтинга в результате происходит усиление или потеря метилирования ДНК или просто потеря нормальной экспрессии аллель-специфического гена28. Изучение LOI предоставило важную информацию о роли метилирования в импринтинге и подчеркнуло важность CTCF как регулятора как экспрессии импринтируемых генов, так и паттернов метилирования ДНК. Ниже будут рассмотрены болезни человека, для которых роль аберрантного геномного импринтинга установлена. Признаки этих болезней суммированы in the online supplementary information S3 (table). Важно, что паттерны импринтирующего метилирования ДНК часто разрушаются манипуляциями in vitro на эмбрионах животных и людей34-36, а использование вспомогательных репродуктивных технологий ассоциирует с повышенным риском некоторых болезней импринтинга37 (Box 2).
LOI in cancer. LOI способствующих росту импринтируемых генов, ведет к активации обычно молчащего аллеля, в результате наступает аномально высокая экспрессия генного продукта и данные клетки получают преимущества в росте. Импринтируемый IGF2/H19 локус (Рис. 2a) кодирует как IGF2, аутокринный фактор роста с важной ролью во многих типах рака, и H19, некодирующую РНК с неизвестной функцией и с рост супрессирующими свойствами38. IGF2 и H19 обычно экспрессируются с отцовского и материнского аллеля, соотв., и молчание материнского аллеля IGF2 приводит в результате к повышенной экспрессии IGF2 и понижению экспрессии H19. LOI локуса IGF2 является наиболее широко распространённым событием LOI среди широкого спектра типов опухолей, включая рак толстой кишки, печени, легких и оварий, а также Wilms' опухолей - рак эмбриональных почек, при котором был впервые обнаружен LOI39,40.
Дополнительные доказательства роли LOI IGF2/H19 при раке получены в недавнем исследовании на модельных мышах. Животные с LOI обнаруживали двухкратное увеличение кишечных опухолей, а нормальный кишечный эпителий, как было установлено, менее дифференцирован, чем у мышей дикого типа41. LOI дефекты в IGF2/H19 варьируют в зависимости от типа опухоли. Напр., при опухолях Wilms'42
и colorectal раке43, регуляторная область ICR1 на материнском аллеле оказывается метилированной de novo, это ингибирует связывание CTCF и тем самым позволяет энхансерам, стоящим выше H19 достигать промотора IGF2 на обоих аллелях (Рис. 2a). Предложен и альтернативный механизм, согласно которому DMRs , стоящие выше IGF2 оказываются деметилированными44.
LOI ингибирующих рост импринтируемых генов посредством молчания одного из обычно активных аллелей может приводить к дерегуляции клеточного роста. Напр., матерински экспрессируемый ген cyclin-dependent kinase inhibitor 1C (CDKN1C) (известный также как p57KIP2), который кодирует cyclin-зависимый киназный ингибитор, который обеспечивает арест G1/S-phase arrest. В опухолях Wilms' LOI CDKN1C происходит ~10% опухолей (LOI IGF2/H19 происходит в 70% таких опухолей)28,45. Др. импринтируемые гены, которые подвергаются LOI, включают RAS-related ген DIRAS3 (известный также как ARHI) при раке груди и яичников46
и специфичный для мезодермы транскрипт гомолог гена (MEST) при раке груди, легких, колона47. Хотя количество генов, которые обнаруживают LOI в раковых опухолях, довольно невелико, но частота таких альтераций, по-видимому, сходна со степенью аномалий метилирования ДНК неимпринтируемых генов. Примеры LOI, по-видимому, ограничены только из-за относительно небольшого общего количества импринтируемых генов идентифицированных и еще меньше охарактеризованных.
Beckwith-Wiedemann syndrome (BWS).BWS является преимущественно матерински передаваемым нарушением и характеризуется фетальным и постнатальным избыточным ростом и предрасположенностью к эмбриональным опухолям, таким как опухоли Wilms' (see online supplementary information S3 (table)). Локус BWS в позиции 11p15.5 занимает ~1 Mb и вклюает несколько импринтируемых генов (Рис. 2a). Эта крупная область состоит из двух независимо регулируемых импринтируемых доменов39,40,48.
Наиболее близкий к теломере домен содержит IGF2 и H19, сопровождаемый промежуточной областью с несколькими генами, которые , по-видимому, не импринтируются. Второй, более центромерный домен, содержит матерински экспрессируемый ген KCNQ1 (potassium voltage-gated channel, KQT-like subfamily, member 1; известный также как KvLQT1), отцовски экспрессируемый KCNQ1 антисмысловой транскрипт KCNQ1OT1 (KCNQ1 overlapping transcript 1; известный также как LIT1), и несколько др. матерински экспрессируемых генов, включая CDKN1C. ICR1, который располагается выше H19, контролирует дифференциальную экспрессию IGF2/H19 домена, и имеются также несколько DMRs стоящих выше IGF2; ICR2 расположен на 5'-конце KCNQ1OT1 (Refs 43,48,49). В нормальных клетках отцовские и материнские аллели ICR1 и ICR2, соотв., метилируются и оба содержат сайты связывания для CTCF31,50.
Некоторые пертурбации этой сложной геномной области ассоциируют с BWS. Сюда входят отцовская UNIPARENTAL DISOMY (UPD) (дающая в результате повышенную экспрессию IGF2 и пониженную CDKN1C), LOI KCNQ1OT1 встречается ~ в 50% случаев, которые не связаны с UPD, и LOI IGF2 ~ в 20% этих случаев (обе в результате биаллельной экспрессии соотв. генов). Мутации и транслокации, которые затрагивают материнский аллель объясняют остальные случаи. LOI по ICR2 вызывает потерю специфичного для материнского аллеля метилирования ДНК, тогда как дефект ICR1 обычно вызывает гиперметилирование материнского аллеля, как это наблюдается у большинства опухолей Wilms'49,51.
Дефекты в центромерном импринтируемом домене (молчание матерински экспрессируемых генов), как полагают, дают преимущественно BWS фенотип (анатомические уродства), тогда как дефекты в теломерном импринтируемом домена (активация матерински репрессируемого IGF2) д. б. главной движущей силой туморогенеза 52. Гипометилирование материнского ICR2 и активация KCNQ1OT1 вызывают заметное подавление генов, которые являются более центромерными по отношению к ним, таких как CDKN1C; однако, молекулярный механизм подобной регуляции непонятен53. Согласно одной из моделей ICR2 функционирует сходным с ICR1 образом - т.е., он может регулировать посредством связывания CTCF, а способность энхансера достигать промоторов CDKN1C и KCNQ1OT1 различна у этих двух аллелей49.
Prader-Willi syndrome (PWS). PWS возникает ~ 1 yf 20,000 рождений и характеризуется ненормально пышным ростом, гиперфагией и тучностью в детстве, умственной отсталостью и пробелемами в поведении (see online supplementary information S3 (table))54.
Молекулярный дефект сложен и затрагивает ~2 Mb импринтируемого домена в положении 15q11-q13, который содержит как отцовски, так и матерински экспрессируемые гены (Рис. 2b). Один матерински экспрессируемый ген, ubiquitin protein ligase E3A (UBE3A), импринтируется только в головном мозге.
PWS возникает в результате потери отцовски экспрессируемых генов в этой области, хотя не один ген, как известно, вызывает PWSЮ, когда его экспрессия теряется55. Анализ выборок от PWS пациентов с микроделециями позволил картировать PWS ICR в сегменте ~4 kb, который занимает первый экзон и промотор small nuclear ribonucleoprotein polypeptide N (SNRPN)/SNRPN вышестоящей рамки считывания (SNURF) локуса56. В нормальных клетках 5'-конец ICR, который необходим для экспрессии материнского гена и участвует в Angelman syndrome (см. ниже), метилируется на материнском аллеле55,57. 3' конец ICR необходим для экспрессии отцовски экспрессируемых генов (область PWS показана на Рис. 2b) и является также источником чрезвычайно длинного транскрипта SNURF/SNRPN. Матерински экспрессируемые гены не метилируются дифференциально и их молчание на отцовском аллеле, по-видимому, регулируется антисмысловой РНК, генерируемой с SNURF/SNRPN58.
Наиболее распространенным молекулярным дефектом при PWS являются отцовские делеции, захватывающие область 15q11-q13 (65-70% случаев) и материнская UPD (~20-30% случаев). Отцовского происхождения микроделеции ICR, LOI по ICR (de novo метилирование отцовского аллеля), и BALANCED TRANSLOCATIONS? которые разрывают SNURF/SNRPN, объясняют остальные случаи51. Исследования нокаутных мышей показали, что Ndn59 и область с Snurf/Snrpn по Ube3a60 вносят вклад в аспекты PWS, но необходимы др. модели, чтобы определить вклад всех отцовски экспрессируемых генов в этой области. Находки, что ингибитор метилирования ДНК восстанавливает экспрессию молчащей материнской копии гена SNURF/SNRPN являются интригующими и показывают, что такие ингибиторы могут быть использованы для лечения PWS61.
Angelman syndrome (AS). AS возникает ~1 на 15,000 родов и его основным признаками являются умственная задержка, нарушения речи и аномалии поведения (see online supplementary information S3 (table))55,62.
Дефект AS расположен внутри импринтируемого домена на 15q11-q13 и обусловлен потерей матерински экспрессируемых генов (Рис. 2b). В отличие от PWS, однако, AS возникает в результате потери одиночного гена -
матерински экспрессируемого UBE3A - который импринтируется только в головном мозге и кодирует E3 ubiquitin ligase, участвующую UBIQUITIN-PROTEASOME DEGRADATION PATHWAY.
Наиболее распространенными молекулярными дефектами, которые приводят к AS являются материнского происхождения делеции 15q11-q13 (~65-70% случаев), отцовская UPD (~5% случаев), материнские мутации UBE3A (~10% случаев и вплоть до ~40% в одном исследовании), и дефекты импринтинга (~5% случаев). Около 10% случаев возникает от неизвестных причин 62. Анализ выборок от пациентов с AS микроделеций позволил картировать AS ICR в области в 880 п.н. ~35 kb выше SNURF/SNRPN63. Дефекты импринтинга, вовлекаемые в AS, включают потерю материнского метилирования ДНК или материнскую делецию ICR, а пациенты с этими дефектами обнаруживают тенденцию к средней выраженности фенотипа AS62. Важные нерешенные вопросы связаны сбиологией AS, включая природу молекулярных дефектов в ~10% случаев, которые не имеют идентифицируемых мутаций UBE3A, и роль соседнего гена ATP10C (ATPase, class V, type 10A), который часто делетируется вместе с UBE3A, в модуляции фенотипа AS.
Albright hereditary osteodystrophy (AHO), pseudohypoparathyroidism type Ia (PHP-Ia) and PHP-Ib. Эти три заболевания связаны, т.к. они все возникают из дефектов в сложном импринтируемом локусе на хромосоме 20q13, называемом GNAS, который кодирует α субъединицу (Gsα) гетеротримерного GTP-связывающего белка Gs (Рис. 2c; и see on line supplementary information S3 (table)). AHO наследуемым от отцов нарушением, которое обнаруживается внутри PHP-Ia родословных, и связано с умственной отсталостью и подкожными оссификациями.
PHP-Ia передаваемое от матерей доминантным способом заболевание, пациенты обнаруживают все признаки AHO, плюс резистентность к периферическому действию некоторых гормонов, участвующих в активирующих путях, связанных с Gs. Индивиды с PHP-Ib, которое также наследуется матерински, обнаруживают нормальную Gsα активность и лишь почечную резистентность к parathyroid гормону без каких-либо иных эндокринных недостатков64.
Локус GNAS кодирует три белка и нетранслируемую РНК с четырех альтернативных первых экзонов, которые подвергаются сплайсингу в общие экзоны 2-13 (Рис. 2c). NESP55, генерируется с наиболее близкого к центромере первого экзона, кодирует CHROMOGRANIN-подобный белок, XLαs кодирует Golgi-специфичную Gsα изоформу, и exon 1 кодирует Gsα. Транскрипты, происходящие с экзона 1A , по-видимому, не транслируются. Каждый альтернативный первый экзон управляется с помощью своего собственного промотора, и первые три промотора дифференциально метилируются. NESP55 матерински экспрессируемый и его промоторная область метилируется на отцовском аллеле. Gsα (exon 1) преимущественно экспрессируется с материнского аллеля, хотя его промоторная область, по-видимому, не метилирована на обоих аллелях. Gsα импринтируется только в определенных чувствительных к гормону тканях, таких как почечные проксимальные канальцы, которые, возможно, обусловливают ткане-специфческие эффекты этих нарушений. Напротив, XLαs, антисмысловой транскрипт NESP55, и exon 1A все экспрессируются с отцовского аллеля и их промоторы метилированы на материнском аллеле64.
Молекулярные дефекты, которые лежат в основе AHO, PHP-Ia, и PHP-Ib, охарактеризованы хорошо. AHO и PHP-Ia возникают в результате отцовской и материнской передачи Gsα мутаций, соотв.64.
Напротив, PHP-Ib результат LOI по exon 1A (loss of maternal-specific
methylation), который происходит во всех случаях. Интересно, что недавно было продемонстрировано, что спорадические PHP-Ib (наиболее распространенная форма) также связаны с дефектами импринтинга вышестоящих DMRs, в форме биаллельного метилирования по NESP55 и гипометилирования по NESP antisense (NESPAS)/XLαs промоторной области. Напротив, семейная форма PHP-Ib ассоциирует с матерински передаваемыми делециями внутри соседнего гена syntaxin 16 (STX16) и LOI по exon 1A DMR только65. NESP55, XLαs и exon 1A возможно регулируются с помощью антисмысловой транскрипции и/или дифференциального метилирования промотора. Однако, всё ещё неясно, как Gsα exon 1 регулируется, т.к. он не метилируется дифференциально и не идентифицирован антисмысловой транскрипт. Делетируемая область в STX16 может содержать cis-элемент, который действует на большое расстояние, чтобы создать импринтинг по exon 1A DMR65.
LOI по exon 1A (и биаллельная экспрессия Gsα) также происходят в субнаборе аденом надпочечников, секретирующих гормон роста, это подтверждает идею, что импринтинг каждого GNAS промотора регулируется независимо66.
Transient neonatal diabetes mellitus (TNDM).TNDM является редкой формой диабета (появляется ~1 на 400,000 родов), которая присутствует во время первых нескольких недель после рождения. Ремиссия обычно появляется спустя 3-6 мес., но значительная пропорция пациентов дает диабет позднее67.
Локус TNDM на хромосоме 6q24 занимает ~400 kb и содержит три импринтируемых гена - отцовски экспрессируемые гены hydatidiform mole ассоциированы и импринтированы (HYMAI) и pleiomorphic adenoma gene-like 1 (PLAGL1; известный также как ZAC или LOT1), и матерински экспрессируемый антисмысловой PLAGL1 транскрипт (ZAC-AS) (Рис. 2d>). HYMAI дает, по-видимому, нетранслируемую РНК с неизвестной функцией, тогда как PLAGL1 кодирует белок с цинковыми пальчиками, который является предположительно опухолевым супрессором и транскрипционным регулятором, участвующим в модуляции клеточного цикла и апоптоза. Предполагаемый ICR внутри CpG островка на 5'-конце HYMAI метилируется по материнскому аллелю и действует как транскрипционный репрессор, когда метилирован68<.
ТРм механизма дают TNDM: отцовская UPD по хромосоме 6, отцовские дупликации 6q24, и LOI по TNDM CpG-island-ассоциированому ICR, что приводит к повышенной экспрессии PLAGL167.
TNDM пациенты, у которых отсутствуют хромосомные аномалии, демонстрируют LOI по ICR, специфическую потерю метилирования ДНК с материнского аллеля68. Т.к. метилированный ICR действует как репрессор транскрипции PLAGL1то, LOI имеет те же самые последствия, что и отцовская UPD и удвоение 6q24.
Локус TNDM имеет значительно более простую организацию, чем те, что связаны с BWS, PWS и AHO/PHP. Однако, это ещё больше подчеркивает, что большинство импринтированных генов обнаруживаются в кластерах под контролем регуляторных областей, которые часто расположены на расстоянии от самых генов и что контроль зависит от аллель-специфического метилирования ДНК.
A wider role of imprinting in disease. Эти примеры заболеваний, ассоциированных с аберрантным импринтингом, по-видимому, только верхушка айсберга. В отличие от глобального геномного гипометилирования и распространенной гиперметиляции CpG остравков, наблюдаемой при раке и ассоциированная с раком LOI, которая возможно затрагивает многие импринтированные области, дефекты метилирования ДНК в нарушениях импринтинга являются едва различимыми. Многочисленные др. патологии демонстрируют зависимые от родителей эффекты или являются результатом UPD, указывая тем самым, что могут участвовать импринтированные гены69. Накапливающиеся доказательства по болезням, описанным выше, указывают на то, что потеря нормальной функции CTCF играет важную роль в нарушениях, связанных с импринтингом. Изучение механизмов, с помощью которых CTCF регулирует паттерны метилирования ДНК в импринтируемых областях, также показало, что он может играть более широкую роль в регуляции паттернов метилирования ДНК по всему геному, чем сегодня представляется70.
Methylation and repeat-instability diseases
Дефекты метилирования ДНК связаны с членами большой группы заболеваний у людей, которые ассоциируют с нестабильностью повторов. Экспансия trinucleotide repeats (TNRs) во время гаметогенеза приводит к мутациям или молчанию ассоциированных генов с патологическими последствиями71. причина нестабильности TNR остается в основном неизвестной, хотя предполагаются: проскальзывание (slippage) ДНК полимеразы, нарушения механизмов репарации ДНК, транскрипции, позиционирования нуклосом и аберрантный процессинг OKAZAKI-FRAGMENT внутри повторов72. Некоторые из этих болезней затрагивают экспансию неспособных к метилированию посторов, таких как CAG при Huntington's disease (HD) и некоторых формахspinocerebellar ataxia (SCA1, 2, 3, 6, 7, and 17), CTG при myotonic dystrophy type 1 (DM1) и SCA8, и GAA при Friedreich's ataxia (FRDA)71. Экспансия способных к метилированию повторов CGG происходит в некоторых сайтах, которые, как известно, связаны с заболеваниями людей, а повышенное метилирование ДНК, как полагают, играет роль в патогенезе. В противоположность заболеваниям экспансии TNR, facioscapulohumeral muscular dystrophy (FSHD) обусловлена контракцией большинства крупных повторов, сопровождаемой гипометилированием. Эти болезни проливают свет на возможные механизмы таргетинга de novo метилирования ДНК.
Fragile X syndrome (FRAXA).FRAXA, Х-сцепленное заболевание, является наиболее распространенной причиной врожденной умственной отсталости и возникает ~1 на 4000 мужчин (see online supplementary information S3 (table))73,74.
Картирован ген заболевания fragile X mental retardation 1 (FMR1) в регионе Xq27.3, который также является FOLATE-SENSITIVE FRAGILE SITE. Белок FMR1 (FMRP) является РНК-связывающим белком, экспрессируемым многими плодными и взрослыми тканями, с особенно высокими уровнями в Головном мозге и семенниках. Он, по-видимому, участвует в регуляции трансляции и транспорте мРНК и, как полагают, регулирует синаптическую пластичность путем контроля трансляции в синапсах75.
Молекулярной основой FRAXA являются высоко полиморфные CGG повторы в 5'-нетранслируемой области FMR 1 (Рис. 3a). Обычно присутствуют 6-52 копий повтора, число которых увеличивается до 52-200 копий в предмутационном состоянии (сегодня считается отдельным заболеванием, называемым синдромом fragile X tremor/ataxia76), и более 200 повторов на индивид при FRAXA73,77. Больные обнаруживают de novo метилирование увеличенных CGG повторов и замалчивание транскрипции FMR177. Метилирование ДНК безусловно является важным медиатором молчания, т.к. ингибиторы DNMT реактивируют транскрипцию full-mutation аллеля, однако FMRP не продуцируется78.
Other folate-sensitive fragile sites. Локус FRAXA является одним из более чем 20 чувствительных к фолату ломких сайтов генома. Экспансия CGG повторов и гиперметилирование документированы и для некоторых др. сайтов, ассоциированных с генами (FRAXE, FRAXF, FRA10A, FRA11B и FRA16A), хотя только FRAXE было связано с болезню человека (nonspecific X-linked mental retardation)74,79. Разумно предположить, что все чувствительные к фолату ломкие сайты сходным образом возникают при экспансии CGG повторов, которое сопровождается метилированием ДНК. Все фрагильные сайты, охарактеризованные подробно, имеют геномную структуру, сходную с геном FMR1 (CGG повтор в нетранслируемой области и островок CpG по соседству), обнаруживают как гиперметилирование регионов с состоянием экспансии повторов, так и замалчивание транскрипции, ассоциированного гена74.
Facioscapulohumeral muscular dystrophy. FSHD является аутосомно доминантным заболеванием, затрагивающим ~1 из 20,000 индивидов (see online supplementary information S3 (table)). Локус FSHD картирован на 4q35 , а лежащий в основе молекулярный дефект был установлен как результат контракции полиморфного в 3.3 kb D4Z4 повтора. Незатронутые индивиды имеют 11-150 копий этого повтора, тогда как в большинстве случаев FSHD число повторов уменьшено до 1-10 копий, хотя некоторые пациенты (~5%) не обнаруживают сокращения повторов. Аномалия, общая для всех пациентов FSHD, это потеря метилирования ДНК с D4Z4, указывающая на то, что аномальное гипометилирование является главным причинным фактором 80. Однако, гены, затрагиваемые этим гипометилированием, неизвестны.
Большинство исследований было сконцентрировано на идее, что контракция и гипометилирование D4Z4 нарушают транскрипцию одного или нескольких генов, который фланкируют повтор. Гены вблизи D4Z4 (Рис. 3b) включают транслокатор нуклеотида аденина SLC25A4 (известный также как ANT1), избыточная экспрессия которого индуцирует апоптоз (характеристика дистрофичных мышц); FSHD region gene 1 (FRG1), который повсеместно экспрессируется и может участвовать в процессинге РНК; и FRG2 (который ближе всех к D4Z4), функция которого неизвестна. ко который, как было установлено, индуцирует морфологические изменения трансфицированных миобластов81. В разных лабораториях были получены противоречивые данные о степени избыточной экспрессии этих генов в FSHD мышцах, хотя FRG2, по-видимому, не является многообещающим кандидатом на роль гена болезни81-83.
Существуют также разнообразные модели того, как уменьшение повторов и гипометилирование меняют экспрессию генов и вызывают FSHD. Один из возможных механизмов обеспечение связывания репрессорного комплекса с D4Z4 повтором, который редуцируется в случае снижения размеров повторов, что приводит к повышенной экспрессии соседних генов (хотя в этом исследовании не изучалась роль метилирования)82. Предложена также looping модель, согласно которой повтор D4Z4 связывает транскрипционные регуляторные факторы и образует петли к удаленным генам, которые могут быть вне непосредственной близости к D4Z4. Уменьшение повторов и гипометилирование могут разрушать связывание критических регуляторных белков или негативно сказываться на способности повторов взаимодействовать с др. регуляторными областями83.
Is there a wider role for DNA methylation in diseases of repeat
instability? Исследование болезней нестабильности повторов показало, что повторяющаяся ДНК в форме как естественно возникших повторов, так и патологически увеличенных TNRs, эффективно находятся кухней метилирования. Почему же только некоторые увеличенные TNRs подвергаются de novo метилированию, остается неизвестным. Возможно просто доступность сайтов для метилирования внутри или вблизи увеличенных повторов, которые дают CGG скорее, чем CTG или CAG TNRs, более привлекательные для кухни метилирования. Однако, некоторые линии доказательств указывают на то, что silencing machinery может рекрутироваться на удлиненные TNRs, независимо от их последовательностей. Напр., CpG островок по соседству с CTG повтором вовлечен в DM1 (который также содержит сайты связывания для CTCF) становится гиперметилированным при некоторых врожденных формах болезни84,85. И при DM1 и FRDA, ассоциированные гены (DMPK и FRDA, соотв.) подавляются, а удлиненные повторы адоптируют структуру репрессивного хроматина86. Это указывает на то, что экспансии TNR могут чаще всего быть нацелены на замалчивание на уровне хроматина и что дополнительные факторы могут влиять на то, будет ли при этом происходить и метилирование ДНК. Кроме того, метилирование ДНК стабилизирует удлинненые повторы в модельных системах независимо от того, содержа ли они CpG сайт87,88.
Др. аспекты, которые могут влиять на трагетинг метилирования, включают или повторы, вовлеченные в транскрипцию, как это имеет местов при FRAXA и DM1, или транскрибируются и транслируются, как при HD, при которой отсутствуют доказательства ассоциированного с болезнью гиперметилирования89. Ещё один фактор может вызывать склонность повторов формировать шпильки ДНК, которые, как было показано, являются предпочтительным субстратом для DNMT190. Находка, что FMR1 мРНК также образует структуру шпилек и открытие, что они являются субстратом для RNAI-ассоциированной DICER ribonuclease создает возможность альтернативного объяснения. Компоненты кухни модификации гистонов, которые вызывают репрессию транскрипции и рекрутируются на повторы с помощью RNAi пути, это возможно рекрутирует также кухню метилирования ДНК, хотя напрямую этого не было продемонстрировано13,91. В подтверждение этой модели, затронутые повторы и/или соседние последовательности принимают структуру плотно упакованного хроматина при FRAXA, DM1 и FRDA78,86. Напротив, уменьшение количества повторов D4Z4 при FSHD может редуцировать эффективность RNAi targeting, приводя в конечном итоге к гипометилированию. Молекулярные дефекты, которые лажат в основе этих заболеваний, следовательно, согласуются с все растущим числом доказательств, что insulator фактор CTCF и/или RNAi участвуют в регуляции паттернов метилирования ДНК.
Specific defects of the methylation machinery
Болезни человека, которые возникают в результате мутаций в кухне метилирования ДНК, предоставляют важную информацию о функциональной специализации DNMTs. Они показали также, что несоответствующая регуляция метилирования ДНК может происходить в специфических типах клеток, вызывая патологические последствия.
Systemic lupus erythematosus (SLE). SLE является аутоиммунным заболеванием с различными клиническими проявлениями, которое в 8-10 раз чаще у женщин, чем у мужчин (~1 на 2000 во всей популяции) (see online supplementary information S3 (table)). Общим признаком во всех случаях является продукция аутоантител и присутствие антител против ядерных компонентов, таких как ДНК, факторы хроматина и небольшие частицы ядерных рибонуклеиновых белков92. Имеются также доказательства дефектов функционирования Т клеток, это указывает на связь с метилированием ДНК93.
T клетки, как полагают, управляют ответом в виде аутоантител при SLE, и это, как полагают, является результатом потери метилирования ДНК в этих клетках. Геномы SLE T клеток глобально гипометилированы (15-20% снижение) а уровни DNMT1 редуцированы94. Обработка нормальных CD4+ T CELLS ингибитором метилирования ДНК 5-aza-2'-deoxycytidine заставляет их аутореактивироваться, а ADOPTIVE TRANSFER этих клеток вызывает SLE-подобную болезнь у мышей95. Гипометилированные Т клетки способны также к беспорядочному убийству SYNGENEIC MACROPHAGES; это увеличивает апоптоз, что сопровождается снижением удаления апоптического материала, и это скорее всего играет роль в индукции анти-ДНК антител, которое характеризует SLE. Кроме того, некоторые гены, имеющие отношение к SLE фенотипу, метилированы в нормальных Т клетках, но деметилируются с помощью 5-aza-2'-deoxycytidine и у SLE пациентов96,97. Согласно альтернативной гипотезе роли метилирования ДНК при SLE происходит гипометилирование эндогенных ретровирусов (HERV) и ре-экспрессия вирусных белков. Антитела к HERV-кодируемым белкам были выявлены у SLE пациентов, а пептиды, производные этих белков, вызывают аберрантные ответы CD4+ T клеток98.
Воздействие некоторыми ингибиторами метилирования ДНК также индуцирует волчанка-подобное заболевание у людей, что ещё более подтверждает роль аберрантного метилирования ДНК при SLE93,99.
Активность DNMT1 усиливается в нормальных Т клетках в резулдьтате стимуляции с помощью сигналов, передаваемых через extracellular signal-regulated kinase (ERK) путь, который нарушен в Т клетках при волчанке. Лекарство hydralazine, как полагают, вызывает гипометилирование Т клеток и SLE-подобную болезнь у людей путем ингибирования этого пути. Нарушение передачи сигналов ERK, по-видимому, вносит вклад в редукцию уровней DNMT1 и гипометилирование SLE T клеток100. SLE, следовательно, демонстрирует не только то, что дефекты метилирования ДНК могут быть ограничены только одним или немногими тиапами клеток, но и также то, что метилирование ДНК регулируется дифференциально или отвечает на разные стимулы в зависимости от тапа клеток.
Immunodeficiency, centromeric instability and facial anomalies
(ICF) syndrome.ICF syndrome является чрезвычайно редким аутосомно рецессивным заболеванием, которое характеризуется выраженным иммунодефицитом и которое является результатом отсутствия или существенной редукции, по крайней мере, двух изотипов immunoglobulin. Др. более вариабельный признак включает нарушение клеточного иммунитета и необычные лицевые проявления101,102. Все ICF пациенты обнаруживают заметное гипометилирование и деконденсацию перицентромерного гетерохроматина хромосом 1 и 16 и в меньшей степени хромосомы 9 (see online supplementary information S3 (table)). Эта аномалия наблюдается почти исключительно в ICF B клетках или в LYMPHOBLASTOID CELL LINES, которые были простимулированы с помощью митогена101,103,104.
Молекулярный дефект у 60-70% ICF пациентов обусловлен мутацией гена DNMT3B в 20q11.2, приводящей к дефектному метилированию11,105,106. Пациенты без обнаружимых мутаций DNMT3B могут иметь аномалии в др. регионах гена, которые еще не изучены (таких как промотор и 5' и 3' UTRs), или могут возникать в результате мутаций в гене, который регулирует DNMT3B. Мутации в DNMT3B обычно гетерозиготны и затрагивают каталитический домен. Полная потеря функции кодируемого энзима, по-видимому, эмбрионально летальна у людей, как это имеет место у мышей11, а некоторые из этих мутаций каталитического домена, изученные более детально, не являются результатом полной потери активности энзима105,107. Клиническая вариабельность болезни может быть, следовательно, связана с уровнем остаточной активности DNMT3B. Недавно было предположено, что разные дефекты метилирования присутствуют у ICF пациентов с и без DNMT3B мутаций, но молекулярная основа этих отличий неизвестна108.
Нестабильность богатого повторами перицентромерного гетерохроматина при данном заболевании вероятно обусловлена его гипометилированием в ICF клетках, Потеря метилирования ДНК при ICF синдроме является регион-специфичной и затрагивает в основном перицентромерные satellite 2 и 3 повторы и не-перицентромерные регионы, которые включают неактивную Х хромосому, гены рака семенников и др. спорадические повторы (такие как NBL2 и мишени при FSHD, D4Z4)109-111. Это указывает на то, что эти регионы являются bona-fide мишенями для DNMT3B. Гипометилирование satellite 2 и 3 широко распространено в раковых клетках и хотя не отмечается увеличения показателей рака у пациентов ICF, но небольшое число этих пациентов и их короткая продолжительность жизни делают возможным, что легкое увеличение показателя не улавливается112.
Роль мутаций DNMT3B в обязательном иммунном дефекте при синдроме ICF далеко неясно. Анализ микромассивов выявил, что многие гены, участвующие в иммунной функции и в продукции В клетками immunoglobulin, дерегулированы в ICF lymphoblastoid клеточной линии, указывая тем самым на дефект в дифференциации или активации. Однако, эти эксперименты не выявили очевидных генов кандидатов, которые могли бы объяснить онтогенетические и нейрологические аспекты синдрома ICF. Интересно, что гены с измененной экспрессией в ICF клетках не гипометилированы. Это говорит о том, что или DNMT3B регулирует экспрессию генов независимо от своей способности метилировать ДНК, или что затронутые гены обнаруживают измененную экспрессию благодаря нижестоящим эффектам др. генов, таких как транскрипционные факторы, которые могут быть активированы благодаря гипометилированию113. Первая идея подтверждается недавними находками, что DNMT3B взаимодействует с histone deacetylases (HDACs), histone methylases и и энзимами, ремоделирующими хроматин114,115. Кроме того, DNMT3B может существенно влиять на нейрональную дифференцировку мультипотентных клеток способом, который зависит от его способности взаимодействовать с HDACs, но не от его способности метилировать ДНК116. Как связанные, так и не связанные с метилированием дефекты могут быть, следовательно, важными для синтдрома ICF
ATRX: a connection with chromatin remodelling
Alpha-thalassemia/mental retardation syndrome, X-linked
(ATRX) очень редкая X-сцепленная болезнь, которая возникает у <1 на 100,000 лиц мужского пола. Она характеризуется тяжелой умственной отсталостью и аномалиями гениталий с alpha-thalassemia у большинства, но не у всех пациентов. Заинтересованный ген, ATRX, расположен на Xq13 (see online supplementary information S3 (table)) и кодирует АТФ- зависимый, хроматин ремоделирующий белок из chromodomain и helicase-like domains (CHD) субкласса SNF2-LIKE PROTEINS117.
Функциональные домены ATRX включают PHD zinc finger-like мотив на его N-конце (гомолог PHD мотивов у DNMT3A и DNMT3B), и helicase домен на С конце. Мутации в ATRX образуют кластеры в этих двух доменах и как полагают нарушают его ядерную локализацию, межбелковые взаимодействия или функцию ремоделирования хроматина118-120. ATRX локализуется в перицентромерном гетерохроматине и PROMYELOCYTIC LEUKEMIA (PML) NUCLEAR BODIES зависимым от клеточного цикла образом и существует в комплексе с регулирующим транскрипцию death-associated protein 6 (DAXX)120-122. Он, следовательно, как полагают, регулирует транскрипцию, хотя его гены мишени и способ регуляции ( позитивный или негативный) неизвестны.
Интересно, что ATRX пациенты также имеют дефекты метилирования ДНК. Они разнообразны и включают как аномальное гиперметилирование (повторов DYZ2 Y-хромосомы) , так и гипометилирование (повторов рибосомальной ДНК), но при этом не меняется общий уровень 5-methylcytosine123. Остается неясным ,однако, вносят ли аномалии метилирования вклад непосредственно в ATRX фенотип. Достигнуты важные успехи в последнее время в понимании прямых и опосредованных связей между метилированием ДНК и хроматин ремоделирующей кухней и в идентификации дефектов матилирования ДНК у пациентов ATRX позволят в дальнейшем исследовать эту связь в клетках человека 124.
Future perspectives: towards a unified model
A fundamental question in the DNA-methylation field (and perhaps epigenetics as a whole) is whether a common mechanism underlies diseases that arise from DNA methylation defects. If so, can this mechanism also explain how DNA methylation patterns are established during normal development and accurately maintained in somatic cells? Exciting recent findings from the imprinting and RNAi fields have provided glimpses of such putative mechanisms. For example, there is growing evidence that CTCF not only reads DNA-methylation marks and ensures allele-specific gene expression, but also has a role in determining DNA methylation patterns30,33,125 (Box 1). If the default state of the genome is full methylation, CTCF binding could demarcate methylation-free zones, making it a sort of DNA methylation insulator, in addition to its other known properties.
A recent twist in the CTCF story is the discovery of a paralogous gene, BORIS (also called CCCTC-binding factor-like, CTCFL), which is highly homologous to CTCF within the zinc finger region (Box 1)30,126.
The exact role of BORIS remains unclear, but it is tempting to speculate
that it might antagonize the function of CTCF and disrupt methylation
boundaries, because the expression of the two seems to be mutually
exclusive in normal cells, although BORIS is upregulated in cancer
cells126. Competition between CTCF and BORIS for specific binding sites might explain the aberrant hypermethylation events that occur in cancer (Рис. 4) and the LOI defects in imprinting disorders (although, for LOI, aberrant BORIS expression might be only transiently dysregulated during a crucial developmental period). A breakdown of the barrier between unmethylated and methylated regions could also result in hypomethylation events by 'diluting out' the repression machinery and causing it to move away from heterochromatin. Given the functionally haploid nature of imprinted genes, they might be very sensitive to the levels of these two proteins.
The propensity of a particular region to undergo aberrant DNA
methylation in disease could be governed by a combination of the
CpG-richness of the CTCF binding sites (determining the degree to which
CTCF binding can be inhibited by DNA methylation) and the affinity of
BORIS for the site that is normally occupied by CTCF. CTCF would only need
to be transiently displaced from its binding site, or sites, to allow
access to DNMTs and subsequent methylation, which would then prevent CTCF
from re-binding. Such ideas are experimentally testable, and important
progress in this area is likely to emerge in the next few years.
Another interesting model relates to the RNAi pathway13.
Recent evidence, primarily from fission yeast, indicates that the RNAi
machinery (the RNA-induced initiation of transcriptional gene silencing
(RITS) complex) directs elements of the repressive histone modification
apparatus to regions destined for silencing127. This machinery is guided to heterochromatin through the transcription of repetitive DNA elements, which, owing to their heterogeneous nature, can
be transcribed from either DNA strand and consequently give rise to
double-stranded RNA (dsRNA)128-130. Much of the RNAi pathway is conserved in mammalian cells, and recent data
indicate that dsRNA can silence genes through de novo methylation
and that centromeric and pericentromeric heterochromatic repeats are
transcribed in mammals131-133. Therefore, low-level transcription from repetitive elements might be the
means for targeting repressive histone modifications and DNA methylation
throughout the genome.
In cancer, the low-level hypomethylation of repetitive DNA near
promoter regions early in transformation could generate antisense
transcripts that result in the formation of dsRNA homologous to the gene
and/or its promoter (Рис. 4). Recruitment of the RNAi machinery would lead to the establishment of repressive epigenetic marks, including DNA methylation, at these sites. A recent report that describes a human disease arising from a gene rearrangement that results in the generation of an aberrant antisense transcript to one of the α-globin genes illustrates how aberrant dsRNA production might lead to DNA methylation defects. The gene, although fully intact, was silenced by DNA methylation at its CpG-island promoter134. Indeed, studies have shown that antisense transcription is increased overall in tumour cells, and this could be due to DNA hypomethylation and spurious transcription from repeats135.
Similar mechanisms could be used as part of normal regulation of
allele-specific transcription in imprinted regions, as antisense
transcripts of differentially expressed genes are a common feature of
imprinted regions136.
Diseases associated with repeat instability might potentially result from
an affinity of the RNAi machinery for the aberrantly expanded
TNR-containing mRNAs that form hairpins. Conversely, repeat contraction
could reduce the efficiency of targeting of the RNAi machinery, for
example, resulting in the hypomethylation of D4Z4 observed in FSHD
(assuming D4Z4 is transcribed at some point).
These models for regulating DNA methylation patterns — involving
CTCF/BORIS activity or RNAi — are not mutually exclusive. The former can
be viewed as a system for protecting regions from methylation, whereas the
latter represents a means for directing it to specific loci. One mechanism
might predominate in certain regions of the genome, or in certain cell
types and developmental stages. In the next few years, intensive research
efforts will be devoted to studying these and other systems involved in
epigenetic gene regulation. These initiatives will undoubtedly advance our
understanding of gene regulation, epigenetic reprogramming and the
epigenetic aetiology of a wide range of diseases with a known or suspected
epigenetic component. It should also fuel the development of new therapies
aimed at reversing aberrant epigenetic alterations in disease and
development.