Посещений:
АРХИТЕКТУРНЫЕ БЕЛКИ

Регуляторы организации генома

Architectural proteins: regulators of 3D genome organization in cell fate
Elena Gomez-Diaz, Victor G. Corces
Trends in Cell Biol. Volume 24, Issue 11, November 2014, Pages 703-711

The relation between alterations in chromatin structure and changes in gene expression during cell differentiation has served as a paradigm to understand the link between genome organization and function. Yet, the factors involved and the mechanisms by which the 3D organization of the nucleus is established remain poorly understood. The use of Chromosome Conformation-Capture (3C)-based approaches has resulted in a new appreciation of the role of architectural proteins in the establishment of 3D genome organization. Architectural proteins orchestrate higher-order chromatin organization through the establishment of interactions between regulatory elements across multiple spatial scales. The regulation of these proteins, their interaction with DNA, and their co-occurrence in the genome, may be responsible for the plasticity of 3D chromatin architecture that dictates cell and time-specific blueprints of gene expression.

Nuclear organization


Хромосомы плотно упакованы в ядре внутри хромосомных территорий 1-4. 3D расположение хроматиновых волокон в этих территориях во время интерфазы неслучайно и, в принципе, может быть или следствием функции генома или предварительно установленным эффектором ядерной активности [5]. Ядерные процессы, такие как транскрипция и репликация, нуждаются в сборке крупных мультибелковых комплексов на промоторах, энхансерах и источниках репликации 5-7. Эти белки часто содержат множественные взаимодействующие домены и поэтому могут управлять образованием внутри- и межхромосомных контактов, которые вносят вклад в становление специфического 3D расположения хроматиновых волокон. Принимая во внимание, что подобное расположение может быть следствием функции генома, оно должно, по крайней мере, частично быть специфичным для типа клеток, коррелируя с состоянием транскрипции в клетке. Помимо этой управляемой транскрипцией организации, клетки, по-видимому, также используют специфические белковые комплексы, чьей основной ролью является устанавливание контактов между удаленными сайтами в геноме для облегчения его 3D организации и обеспечение специфических функциональных исходов. Эти белки в целом обозначают как инсуляторные белки, благодаря тому, что первоначально были охарактеризованы благодаря своей способности вмешиваться во взаимодействия энхансера с промотором и защиты экспрессии трансгенов от эффектов соседних последовательностей [8]. Недавние результаты подтвердили, что инсуляторные последовательности и ассоциированные с ними белки не только ингибируют, но и также облегчают взаимодействия энхансер-промотор, а также регулируют др. эффекты транскрипции помимо более общей роли в организации хромосом [9]. Учитывая варьирующие и иногда противоречивые функции, обеспечиваемые этими белками, мы обозначим их здесь как архитектурные вместо инсуляторных белков.
Начнем с предпосылки, что архитектурные белки могут обеспечивать взаимодействия между разными последовательностями, чтобы регулировать функцию генома.

Architectural proteins: structure and organization


Архитектурные белки были описаны в организмах от дрожжей до человека [10]. У Saccharomyces cerevisiae and Saccharomyces pombe, основной архитектурный белок охарактеризованный, кстати, является с RNA polymerase III-ассоциированным фактором TFIIIC, который представлен в генах, транскрибируемых с помощью этой полимеразы, таких как tRNA гены, также как и многие не транскрибируемые регионы генома, известные как extra TFIIIC (ETC) локусы 11 and 12. TFIIIC локализуется совместно с cohesin и condensin, которые, как было установлено, необходимы для его функции по защите против распространения гистоновых ковалентных модификаций, ассоциированных с замалчиванием транскрипции [13]. Наиболее охарактеризованным архитектурным белком у позвоночных является CCCTC-binding factor (белок цинковые пальчики) (CTCF), который также нуждается в ассоциации с cohesin для своей функции блокирования энхансера [10]. Недавние эксперименты показали, что tRNA гены могут блокировать функцию энхансера и что TFIIIC локализуется совместно с CTCF на многих ETC локусах генома мыши и человека, подтверждая консервацию функции TFIIIC как структурного белка от дрожжей до человека [14]. Др. белки, обнаруживающие совместную локализацию непосредственно взаимодействовали с CTCF у позвоночных, включая Yin Yang 1 (YY1), Kaiso, chromodomain helicase DNA-binding protein 8 (CHD8), poly(ADP-ribose) polymerase 1 (PARP1), MYC-associated zinc-finger protein (MAZ), JUND, zinc-finger protein 143 (ZNF143), PR domain zinc-finger protein 5 (PRDM5) и nucleophosmin 15-17. Drosophila также является богатым источником информации в смысле понимания структуры и организации этого класса белков. Некоторые ДНК-связывающие архитектурные белки, включая CTCF, Suppressor of Hairy-wing [Su(Hw)], Boundary Element Associated Factor 32 (BEAF-32), DNA Replication Related Element Binding Factor (DREF) и TFIIIC, взаимодействуют непосредственно с ДНК 18 and 19. "mn LYR-связывающие белки рекрутируют др. дополнительные архитектурные белки, которые не соединяются непосредственно с ДНК, включая cohesin (Rad21), condensins (Cap-H2 and Barren), Modifier of mdg4 [Mod(mdg4)], Centrosomal Protein 190 (CP190), L(3)mbt, Female sterile homeotic [Fs(1)h-L], Chromator, Zeste-white 5 (Zw5) и GAGA factor (GAF) 18 and 19.
Эти белки представлены в геноме в разных комбинациях и наз. как 'architectural protein binding sites' (APBSs) [20]. Некоторые сайты в геноме содержат один ДНК-связывающий архитектурный белок и несколько дополнительных белков и наз. как APBSs с низкой оккупацией. Др. содержат ДНК-связывающие белки внутри короткого региона генома, который рекрутирует все или большинство дополнительных белков и наз. APBSs с высокой оккупацией. Эти два типа сайтов играют разные роли в организации и функции генома [20]. Архитектурные белки у Drosophila и млекопитающих, как было установлено, взаимодействуют с РНК 21-25, вообще-то для стабилизации этих крупных мультибелковых комплексов, но механистическая роль этих транскриптов в отношении их функции не была изучена детально.

The role of architectural proteins in 3D genome organization


Недавно использованные 3C-derived подходы, такие как 5C и Hi-C, чтобы измерить частоты взаимодействий позволили установить карты всеобъемлющего взаимодействия в пределах крупных регионов или по всему геному 3, 19,26-29. Результаты этих экспериментов подтвердили, что геномы Drosophila и млекопитающих компартментализованы на дискретные регионы, наз. 'topologically associating domains' (TADs) 27 and 30. TADs являются регионами генома, которые обнаруживают высокую частоту взаимодействий внутри домена, в то время как частота взаимодействий с др. TADs низкая. Следовательно, базирующееся на взаимодействиях деление генома на TAD, которые часто взаимодействуют со своими соседями поскольку, в противовес, др. последовательности и ассоциированные белки формируют границы TAD, которые предотвращают взаимодействия между соседними TADs. У Drosophila и млекопитающих границы TAD содержат высоко транскрибируемые гены, включая гены домашнего хозяйства и архитектурные белки 19, 30 and 31. В целом только 15% CTCF сайтов присутствуют на границах TAD в клетках мыши и человека. Вместо этого большинство сайтов связывания CTCF (85%) располагаются в TADs, где они обеспечивают взаимодействия, предназначенные регулировать различные ступени процесса транскрипции 27 and 32. Эти находки подтвердили существование различных функциональных подклассов, ассоциированных не ассоциированных с границами, APBSs. Очевидно, что функциональные различия между двумя типами APBSs базируются на количестве присутствующих архитектурных белков. У млекопитающих существует строгая ассоциация между границами TAD и присутствием CTCF, TFIIIC, cohesin и PRDM5. Сходным образом, у Drosophila, CTCF кластеры на границах TAD содержат condensins, cohesin, TFIIIC, BEAF-32, Su(Hw), CP190, Mod(mdg4), DREF, Chromator и L(3)mbt [20] ( Figure 1 and Figure 2).

Figure 1. Structure and organization of architectural protein binding sites (APBS) in yeast, Drosophila, and mammals. Each DNA-binding architectural protein interacts with a particular sequence motif in the genome. For example, the TFIIIC protein interacts with the B-box sequence in tRNA genes or ETC sites. DNA-binding architectural proteins require interaction with accessory proteins to accomplish their function. For example, CTCF often interacts with Cohesin, whereas in Drosophila dCTCF, BEAF and Su(Hw) interact with Mod(mdg4) and CP190. High-occupancy binding sites are dense clusters of architectural proteins present at specific genomic regions and have been found in both Drosophila and mammals. See text for abbreviations of protein names.

Figure 2. Model for how architectural proteins influence genome organization at various length scales [topologically associating domains (TADs) and sub-TADs] via long-range interactions. TADs are defined as regions of the genome undergoing high frequency of local interactions. They are separated by borders that preclude interactions between adjacent TADs. Highly occupied architectural protein binding sites (APBSs), containing multiple architectural proteins, are enriched at TAD borders, whereas low-occupancy APBSs are enriched inside TADs. Dynamic changes in the number and colocalization of architectural proteins may modulate TAD border strength across different cell types, allowing or restricting inter-TAD interactions to establish new patterns of gene expression during cell type specification.

Работы с клетками мыши и человека подтвердили, что 60-70% TADs законсервированы как в эмбриональных стволовых клетках (ESCs), так и в дифференцированных клетках [27]. Одним из объяснений этих наблюдений является то, что TADs являются статическими доменами организации генома, которые делают возможными взаимодействия между генами и регуляторными последовательностями, расположенными в тем же самом TAD, но предупреждают взаимодействия между последовательностями из разных TADs 1, 2 and 33. Однако важно учитывать, что концепция границ TAD условна. Границы определяются путе вычислений с использованием алгоритмов, которые косвенным образом или в точности определяют пороги относительных частот взаимодействий внутри и между TADs, фланкированных границами. Базируясь на различиях в частотах взаимодействий между и внутри TAD, возможно установить концепцию прочности границ 20, 34 and 35. Строгие TAD границы это такие, для которых матрицы Hi-C взаимодействий не выявляют взаимодействий между последовательностями в двух соседних TADs, тогда как слабые границы разделяют TADs с всокйо частотой взаимодействий между TAD. Если рассматривать границы TAD как условные структуры, чья сила может модулироваться, напр., во время клеточной дифференцировки, тогда можно предполагать, что кажущаяся консервация TADs между разными типами клеток не препятствует существующим взаимодействиям между генами и регуляторными последовательностями, присутствующими в разных TADs. Это наблюдается для некоторых энхансеров, участвующих в контроле экспрессии генов во время дифференцировки мезодермы у Drosophila. В этом случае некоторые энхансеры, присутствующие в TAD, были способны контактировать с промоторами, расположенными в др. TAD [32].
Что же отвечает за различия в силе границ, отделяющих разные TADs? Недавние результаты подтвердили, что у Drosophila и млекопитающих, прочность границ TAD прямо коррелирует с количеством архитектурных белков, присутствующих на границе 20 and 34. У Drosophila, high-occupancy APBSs содержат 8-12 архитектурных белков, образуя строгие границы TAD и обнаруживая активность по блокированию энхансеров, тогда как APBSs с 5-8 белками имели слабые границы и слабую активность по блокированию энхансеров. Интересно, что APBSs с 2-5 архитектурными белками обогащают внутренность TADs и не мешают взаимодействиям энхансеров с промоторами [20]. Эти результаты согласуются с мнением, что архитектурные белки, располагающиеся внутри TADs, могут облегчать взаимодействия между промоторами генов и их регуляторными последовательностями, тогда как те, что присутствуют на границах TAD могут препятствовать взаимодействиям между генами и регуляторными последовательностями, расположенными в др. TADs. Роль архитектурных белков в контроле организации TAD и прочности границ TAD была четко продемонстрирована в нескольких недавних исследованиях, анализировавших последствия истощения CTCF и cohesin на 3D организацию генома 35-37. Клетки эмбриональных почек, истощенные по cohesin, обнаруживают общую потерю внутрихромосомных взаимодействий без нарушения организации TAD, тогда как истощение CTCF вызывало сходное снижение частоты взаимодействий внутри TAD одновременно с увеличением частоты взаимодействий между соседними TADs. Cohesin-дефицитные астроциты мыши также обнаруживают снижение количества CTCF- и cohesin-обусловленных дальнодействующих взаимодействий вместе с ослаблением организации TAD. Такое ослабление TAD может быть следствием снижения силы границ TAD, обусловленного отсутствием cohesin связывания или усилением частоты взаимодействий между TAD, как это наблюдается в клетках, истощенных по CTCF. Следовательно, возможно, что клетки способны регулировать силу границ путем контроля количества архитектурных белков, присутствующих га специфических границах, позволяя тем самым или ограничивая взаимодействия между TAD, чтобы выявит новые паттерны экспрессии генов во время клеточной дифференцировки ( Figure 2).

Regulation of architectural protein localization


CTCF располагаются в 55 000-65 000 сайтах генома клеток млекопитающих [38]. Из них приблизительно 45% располагаются внутри межгенных регионов, приблизительно 15% располагаются вблизи промоторов и приблизительно 40% присутствуют в интронах и экзонах 38 and 39. У Drosophila, CTCF и дрю. архитектурные белки присутствуют в геноме приблизительно в 20 раз меньшем количестве сайтов в соответствии с различиями в размере генома и их распределение в отношении геномных характеристик, таких как промоторы, интроны и экзоны, сходно с распределением CTCF у млекопитающих [30]. Такое консервативное распределение в межгенных регионах, 5' транскрибируемых untranslated regions (UTRs) и интронах подтверждает, что помимо своей роли в границах TADs, архитектурные белки также играют роль в регуляции взаимодействий энхансер-промотор, остановке транскрипции или элонгации и в сплайсинге.
Хотя 60-70% TADs законсервировано среди стволовых и дифференцированных клеток в соответствии с разными клонами [27], остальные нет, это предполагает, что клетки обладают способностью менять локализацию архитектурных белков во время клеточной дифференцировки, чтобы регулировать силу границ TAD, а также различные аспекты процесса транскрипции. Важно понять, как распределение архитектурных белков влияет на разные функциональные исходы во время спецификации клеток. Недавние результаты подтвердили, что локализация различных архитектурных белков модулируется путем контроля из взаимодействия с ДНК или с др. белками посредством пост-трансляционных модификаций [40]. Ковалентные модификации CTCF у млекопитающих с помощью poly(ADP-ribosyl)ation влияют на их способность связывать ДНК [41], в то время как те же самые модификации Drosophila CTCF влияют на их способность взаимодействовать с CP190 [40]. Взаимодействие CTCF с ДНК также может быть модулировано с помощью изменений статуса метилирования сайтов их связывания [42]. Недавние исследования, по комбинированию ChIP-seq и bisulfite секвенирования во многих типах клеток человека показало, что 41% клеточно специфичных связываний CTCF сцеплен с дифференциальным метилированием ДНК [42]. Др. исследования также сообщили о негативной корреляции между CTCF связыванием ДНК и статусом метилирования ДНК по CpGs внутри сайтов связывания CTCF [43], хотя картина, по-видимому, более сложная. CTCF сайты, связываемые этим белком обнаруживают тот же самый уровень метилирования, что и в др. сайтах генома и сродство связывания CTCF коррелирует с уровнем неметилированности, подтверждая, что CTCF соединяется с низким сродством с сайтами генома, которые частично метилированы [44]. Столь же интригующим является факт, что CTCF может активно ингибировать метилирование ДНК в сайтах связывания CTCF путем взаимодействия с PARylated PARP1, которое в свою очередь ингибирует активность DNA methyl-transferase 1 (DNMT1) [45]. Поэтому из этих данных остается неясным, играет ли метилирование ДНК причинную роль в связывании CTCF или это является следствием этого процесса.
Итак, эти исследования подчеркивают сложность и возможное значение метилирования ДНК и ковалентных модификаций белка в модулировании расположения и взаимодействий архитектурных белков [46]. Возможно, что путем контроля взаимодействий архитектурных белков с ДНК и др. белками, клетка может регулировать их расположение в геноме и, следовательно, контролировать разные ступени процессов транскрипции, чтобы установить или поддержать паттерны генной экспрессии во время клеточной дифференцировки.

Architectural proteins mediate functional chromatin interactions during cell fate specification


Механизмы, с помощью которых возникают межклеточные различия в архитектуре хроматина т как эти различные топологии могут приводить к разным функциональным исходам, остаются главным пробелом в нашем понимании процессов спецификации клеточных судеб. Ниже мы рассмотрим примеры, иллюстрирующие, как архитектурные белки ответственны за становление клеточно специфичных 3D структур хроматина, которые могут вносить вклад в пространственно-временную регуляцию транскрипции во время плюрипотентности и на разных путях дифференцировки.

Architectural proteins, types, and co-occurrence drive the transcriptional plasticity of ESCs


Данные, полученные из независимых источников с использованием 5C, Hi-C и ChIA-PET, по сравнению 3D организации хроматина в ESCs человека и мыши, показывают, что плюрипотентный геном обладает уникальными топологическими и функциональными свойствами. Сюда входят глобальные низкие уровни транскрипции, отсутствие дальнодействующих контактов на глобальной шкале и дезорганизация гетерохроматина в ядрах 47-49. Когда ESCs дифференцируются, то происходит динамическая реорганизация сети взаимодействий по всему геному. Это использует компартментализацию генома на домены взаимодействий высокой частоты, связанные очень тесно с пространственно-временной регуляцией транскрипции 50-54 (Figure 2). Интересно, что ESC-специфические TADs главным образом формируются вокруг факторов плюрипотентности Octamer 4 (Oct4), Sex-determining region Y (SRY) Box 2 (Sox2) и Nanog, а взаимодействия осуществляются между регионами генома, которые богаты супер-энхансерами и генами, контролирующими плюрипотентное состояние 48 and 55.
Возникает важный вопрос, как карты этих дальнодействующих взаимодействий меняют свою конфигурацию при переходе от ESCs к дифференцированным клеткам, и играют ли архитектурные белки ключевую роль в плюрипотентности. Предыдущие исследования с использованием ChIA-PET и ChIP-секвенирования подтвердили роль CTCF, Mediator и cohesin как организаторов хроматина в ESCs, продемонстрировав, что они участвуют в функциональных взаимодействиях с плюрипотентными генами и транскрипционными факторами 56 and 57. Это подтверждается результатами, полученными во время дифференцировки ESCs в энтодермальный клон, при этом CTCF, как было установлено, непосредственно рекрутирует TAF3, TBP-ассоциированный фактор стержневого промотора, на дистальные регуляторные последовательности. TAF3 присутствует в сайтах CTCF/cohesin, кооперируясь с этими двумя белками в обеспечении взаимодействий между этими энхансерами и промоторами во время дифференцировки ESCs в энтодерму 58 and 59. Изменения в расположении CTCF во время дифференцировки из ESCs связаны с альтерациями в позиционировании нуклеосом и деметилировании ДНК 60 and 61.
Всесторонний анализ паттернов расположения APBS в контексте дифференцировки ESC был проведен путем сравнения карт взаимодействий 5C в ESCs и neural progenitor cells (NPCs). Исследование выявило два класса взаимодействий: ESC-специфические коротко действующие контакты энхансер-промотор, использующие cohesin и Mediator, но не CTCF, и крупные петли совпадающие с CTCF и связыванием cohesin. Петли на sub-megabase шкале четко обнаруживаются во время дифференцировки, тогда как CTCF-обусловленные megabase петли остаются неизменными и, как полагают, играют роль в образовании складок хромосом [62]. Эти наблюдения могут быть интерпретированы в контексте модели, в которой регуляция расположения различных подклассов архитектурных белков приводит к изменениям в организаци хроматина, позволяя клеткам переключаться между разными программами транскрипции. В соответствии с этой гипотезой, два независимых исследования на ESCs с использованием условных нокдаунов в cohesin и Mediator, обнаружили или искусственную индукцию дифференцировки ESCs или нарушение репрограммирования в induced pluripotent stem cells (iPSCs) 50 and 63. Может ли связывание только архитектурных белков определять плюрипотентность и может ли плюрипотентность вместо этого управлять с помощью state-specific транскрипционных факторов и энхансеров, остается неизвестным.
Итак, эти находки поддерживают ключевую роль архитектурных белков в динамике упаковки (folding) генома во время спецификации клеточных судеб. Пока остаются нерешенные вопросы. Напр., как возникают взаимоотношения между архитектурными белками, транскрипционными факторами плюрипотентности и/или энхансерами? Являются ли архитектурные белки причиной изменений в плюрипотентном состоянии или следствием связывания транскрипционных факторов плюрипотентности? Играют ли TADs и границы TAD регуляторную роль в переходе от плюрипотентного к дифференцированному состоянию хроматина?

CTCF and cohesin regulate lymphocyte differentiation


Дифференцировка лимфоцитов представляет исчерпывающий пример роли архитектурных белков и архитектуры 3D хроматина в генерации клеточного разнообразия. B и T лимфоциты обладают уникальным рецептором антигена, который чрезвычайно изменчив и клеточно специфичен и является основой адаптивного иммунитета. Вариабельная часть локусов. B клеточного иммуноглобулина (Ig) и T клеточного рецептора (Tcr) кодируется во многих копиях сегментов гена: variable (V), diversity (D) и joining (J), которые располагаются вдоль крупных геномных регионов. Разнообразие антигенов в B и T лимфоцитах генерируется с помощью генных перестроек этих V, D и J сегментов генов, катализируемых с помощью RAG1/2 рекомбиназы. Растут доказательства, подтверждающие, что изменения в архитектуре 3D хроматина являются ключевыми в генерации разнообразия рецепторов B и T лимфоцитов [64]. Локусы антигенных рецепторов особенно многочисленны в сайтах связывания для CTCF и cohesin 65-68, это привело к предположению, что эти два белка функционируют вместе участвуя в модулировании дифференцировки лимфоцитов, по крайней мере, с помощью двух механизмов. Во-первых, путем образования похожих на розетки структур, которые облегчают клон-специфические коммуникации между энхансером и промотором и дифференциально активируют транскрипцию. Tcr-/- локус в CD4+ CD8+ дважды позитивных тимоцитах, связывает CTCF и cohesin в местах, фланкирующих промотор TEA, а Eα энхансер необходим для дальнодействующих взаимодействий промотора с энхансером, которые контролируются транскрипцией Tcrκ (Figure 3A) 65 and 66. Это подтверждено с помощью функциональных исследований на мышах, где Rad21-дефицитные тимоциты обнаруживали снижение взаимодействий между Tcrα энхансером Eα и промотором TEA, и снижение транскрипции TEA, тогда как снабжение pre-rearranged TCR трансгенами в основном восстанавливает дифференцировку тимоцитов [65]. Второй механизм, помощью которого CTCF вносит вклад в развитие B и T клеток это связано с альтернативным облегчением и репрессией V(D)J перестроек во время модуляции доступности хроматина к локусам рецепторов антигенов 66, 69 and 70. Это было продемонстрировано с использованием базирующегося на 3C анализа в pre-pro-B клеток, который выявил дальнодействующие взаимодействия между CTCF-связывающими сайтами вблизи Silencer intervening sequence (SIS), сегментами гена Vκ и границами Igκ локуса. Эти взаимодействия физически ограничивают коммуникации между Jκ -Cκ-энхансером и проксимальной частью промотора Vκ , способствуя тем самым перестройкам в дистальных Vκ сегментах, тогда как условный нокаут CTCF приводит к большему количеству взаимодействий между интронным Igκ энхансером и проксимальными Vκ сегментами и склоняет к рекомбинации в проксимальной части Vκ [71]. Сходным образом, в IgH локусе, ChIP секвенирование и 3C данные показали совместную локализацию CTCF и Rad21 приблизительно в 60 сайтах по всему VH региону и в двух сайтах связывания CTCF внутри Intergenic control region 1 (IGCR1). Эти сайты формируют основу структур розетки из многих петель, которые обеспечивают упорядоченную и клон-специфичную VH-to-DJH рекомбинацию путем обеспечения предпочтения к дистальным в противовес проксимальным VH перестройкам 68 and 72. Следовательно, IGCR1, который располагается между VH и DH кластерами, супрессирует перестройку проксимальных VH сегментов путем образования CTCF-обеспечиваемых петель, которые изолируют проксимальную часть VH промотора от влияния нижестоящего Eµ энхансера ( Figure 3B). Сходным образом, в CD4+ CD8+ дважды позитивных тимоцитах Tcrα энхансер Eα активирует 3' Vα промоторы и TEA промотор на 5' конце Jα массива, чтобы инициировать перестройку Vα -to-Jα . Было показано, что истощение cohesin в CD4+ CD8+ дважды позитивных мышиных тимоцитах нарушает функциональное разделение между Tcrκ и соседним геном домашнего хозяйства Dad1 [65]. Более недавние 3C данные также подчеркнули роль CTCF как важного регулятора рекомендации локуса Tcrα . Vα -to-Jα рекомбинация происходит внутри ступицы (hub), она зависит от дальнодействующих взаимодействий между сайтами связывания CTCF и Tcrα энхансером. Локус CTCF в DP тимоцитах нарушает регуляцию образования петель хроматином и контракции локусов, нарушающих перестройки Vα -to-Jα [66].

Figure 3. CCCTC-binding factor (zinc finger protein) (CTCF) and cohesin regulate antigen receptor diversity in T and B lymphocytes. Antigen receptor diversity of B and T cells is generated by the rearrangement of different variable (V), diversity (D), and joining (J) gene segments in individual lymphocytes. CTCF influences the outcome of V(D)J recombination by regulating enhancer-promoter interactions and locus compaction. The general organization of the T cell receptor (TCR?) and immunoglobulin (Ig)H loci are shown. (A) In the TCR? locus of thymocytes, cobinding of the CTCF/cohesin complex at the TEA promoter and the E? enhancer results in a DNA loop that is required to activate transcription of the nearby housekeeping gene Dad1. (B) In the IgH locus of pre-pro-B cells, CTCF-mediated looping between the E? enhancer and 3? regulatory region (3?RR) with distinct DH-JH-CH gene segments is required for ordered (DH-JH) recombination. CTCF binding at intergenic control region 1 (IGCR1) blocks the influence of the E? enhancer on proximal variable (VH) regions.

CTCF/cohesin mediate monoallelic gene expression in neuronal differentiation


Дифференцировки сотен специализированных типов нейронов, наблюдаемая в головном мозге, нуждается в установлении специфических паттернов экспрессии генов. Среди многих генов, которые транскрибируются нейрон-специфическим образом, механизмы, лежащие в основе экспрессии протокадгеринов, были изучены детально. Protocadherins (Pcd) являются частью большого семейства кальций-зависимых молекул клеточной адгезии в ЦНС. У млекопитающих имеется более 50 протокадгериновых изоформ, сгруппированных в три кластера генов, наз. α , β , и γ . Интересно, что геномная организация кластеров генов Pcd напоминает таковую, имеющуюся в генах иммуноглобулинов и T клеточных рецепторов, хотя механизм регуляции слегка отличается тем, что он не исползует соматические перестройки. В нейронах разнообразие одиночных клеток возникает в результате моноаллельной экспрессии гоенов кластера генов протокадгеринов, так что только одна изоформа транскрибируется в данный момент. Это достигается с помощью стохастического выбра промотора из 15-вариабельных первых экзонов, что сопровождается альтернативным цис-сплайсингом пре-мРНК выбранных альтернативных экзонов, относительно трех нижестоящих константных экзонов [73]. два независимых исследования на клеточных линиях человека и мыши предоставили доказательства, что CTCF и cohesin-обусловленные взаимодействия в конечном счета ответственны за моноаллельную экспрессию кластера α протокадгеринов 74 and 75. В первом из этих исследований, Maniatis с колл. использовали диплоидную линию клеток нейробластомы человека SK-N-SH, экспрессирующую избраное количество альтернативных изоформ Pcdh. В случае Pcdhα , кластер представлен набором из 14-15 варьирующих экзонов, каждый содержит свой собственный промотор и два 2цис-регуляторныхъ элемента с энхансерной активностью (HS7 и HS5-1). Сайты совместного связывания CTCF/cohesin взаимодействуют с TSS и первым экзоном из α 4, α 8 и α 12 изоформ и активируют специфическую транскрипцию этих изоформ. Во втором исследовании те же авт. показали, что образование петель ДНК по Pcdhα нуждается в специфической комбинации CTCF/cohesin комплекса с двумя симметрично расположенными сайтами связывания на обоих транскрипционно активных промоторах и HS5-1 энхансере. Кроме того, это исследование идентифицировало уникальную регуляторную роль для cohesin, который соединяется с др. энхансером (HS7) независимо от CTCF. Функциональный анализ продемонстрировал, что делеция CTCF или cohesin и/или делеция CTCF-связанного HS5-1 энхансера, нарушает регуляцию архитектуры хроматина в этом локусе и приводит к неспецифической экспрессии изоформ Pcdhα 76 and 77. Эти находки подтверждают первичную роль CTCF/cohesin в становлении взаимодействий между двумя нижестоящими энхансерами и индивидуальными экзонными промоторами, управляющими Pcdhα специфическими энхансер-промотор коммуникациями ( Figure 4).

Figure 4. CCCTC-binding factor (zinc finger protein) (CTCF) and cohesin mediate monoallelic gene expression in neurons. The human protocadherin A (PCDH?) gene cluster contains 13 variable exons (1-13) and two c-type first exons (c1 and c2), which are expressed ubiquitously in neurons. Monoallelic gene expression of alternative isoforms occurs stochastically via a promoter choice mechanism that determines the splice site and, as such, which variable exon is included in a Pcdh mRNA. Promoter choice requires the formation of a chromatin hub that is mediated by the cobinding of the CTCF/cohesin complex to the distal HS5-1 enhancer and two symmetrically aligned binding sites (yellow, cohesin; orange, CTCF) in the active promoters (α 4, α 8, and α 12). An additional binding site for cohesin exists in the HS-7 enhancer.

Вопрос, который возникает в результате этих исследований, функционирует ли CTCF/cohesin с помощью дополнительных механизмов, напр., путем регуляции доступности хроматина и компактности в этом локусе. Кроме того, механизмы, лежащие в основе исключения гомологичных аллелей остаются неясными.

Architectural proteins, 3D organization, and Hox gene regulation during limb development


У позвоночных Hox гены, представленные 4 кластерами A-D, активируются последовательно в соответствии с их позицией в геномных локусах, приводя к формированию передне-заднего паттерна экспрессии генов вдоль оси тела. Недавние исследования с использованием различных 3C техник, подтвердили, что динамические изменения в архитектуре хроматина являются ключевыми для регуляции транскрипции кластеров Hox генов и лежат в основе колинеарности в транскрипции во время развития конечностей и туловища 78-80. В конечностях мышей локус HoxD расположен на выступе (cusp) соседних TADs [81]. Ранние HoxD1-9 гены экспрессируются в проксимальных частях конечностей и регулируются с помощью энхансеров, расположенных на 3' теломере, беднло генами (desert), тогда как поздние гены HoxD12-10 экспрессируются в дистальной части конечностей и регулируются энхансерами, расположенными в 5' центромерном участке, бедном генами (desert) [81]. Транскрипция с ранних к поздним генам во время развития конечностей использует топологическое и функциональное переключения между регуляторными архипелагами, расположенными с каждой стороны кластера Hox генов. Вследствие такого переключения прогрессивно устанавливаются новые наборы взаимодействий и колинеарность развивается с помощью двух последующих волн транскрипции [79]. До сих пор, однако, регуляторные последовательности и механизмы, лежащие в основе конформационного и функционального сдвигов между доменами, остаются неясными. Было предположено, что сайты связывания CTCF, расположенные на границах TAD, действуют как барьеры, блокирующие энхансеры, которые изолируют ранние и поздние HoxD гены. В соответствии с участием CTCF в регуляции HoxD, ChIP-chip анализ выявил сайты связывания CTCF, фланкирующие 7 из 9 HoxD генов, также как CTCF сайты в центромерах и теломерах, бедных генами (deserts). Условная инактивация CTCF у мышей приводит к массивному апоптозу, приводя тем самым к почти полной потере структур конечностей [82]. Ситуация более сложная в случае кластера HoxA, где исследования на линиях клеток человека и мышиных эмбрионах выявили разную архитектуру HoxA 80 and 83. Однако, общей темой этих исследований является избирательная активация посредством образования петель хроматина, которое, по-видимому, зависит от CTCF. Подтверждающие доказательства этому заключению получены недавно в исследовании с использованием 5C в линии клеток лейкемии человека, показавшем, что активация гена HoxA совпадает с прогрессивной потерей контактов по всему региону и изменением конфигурации CTCF-обусловленных взаимодействий между двумя границами TAD 83 and 84. Однако, CTCF-зависимое образование петель хроматина в кластерах HoxA/D генов всё ещё недостаточно, чтобы объяснить топологические и функциональные изменения, которые предваряют передачу между ранней и поздней регуляцией во время развития конечностей. Более того, тот факт, что кластеры Hox генов обнаруживают различную топологию и, по-видимому, разные регуляторные механизмы транскрипции в разных типах клеток и онтогенетических процессах 78, 80,81 and 84, ставит под вопрос роль CTCF как единственного игрока в этом процессе. Фактически комплексы Polycomb,как было установлено, непосредственно участвуют в регуляции изменений в топологии локусов Hox в разных онтогенетических параметрах [85]. Следовательно, очень возможно, что присутствие как Pc-G, так и архитектурных белков на границах TAD и внутри TADs может быть ответственным за оформление 3D организации кластеров Hox генов.

Concluding remarks


By mediating communication between distant DNA sequences, architectural proteins contribute to the organization of the genome into topological and functional domains. However, the particulars of the different classes of architectural proteins associated with these domains, and how they facilitate or preclude interactions, remain obscure. In the context of cell differentiation, an emerging theme from recent studies is that the dynamic regulation of the localization of architectural proteins, and their interactions with DNA and other proteins, modulate the network of contacts that result in cell specific chromatin configurations. This provides a novel mechanism for cell state-specific regulation of transcription in pluripotency and cell fate specification. During the transition from ESC to differentiated cells, genome-wide interaction maps are reshaped around cell type-specific enhancers and master transcription factors, at the same time that the binding landscapes of various architectural proteins are disrupted. However, whether architectural proteins are directly responsible for these changes is unclear. Filling this gap will require understanding the dynamics of architectural protein co-occupancy and their integration with TFs throughout the genome. Meanwhile, locus-specific studies, such as those in lymphocytes and neurons, have provided compelling and direct evidence of the importance of chromatin looping mediated by architectural proteins (CTCF/cohesin) in regulating differentiation. Much of our current knowledge is based on data obtained in different cell lines or tissue types that primarily lack functional validation. Thus, whether architectural protein binding is sufficient and necessary to engage in functional chromatin loops, remains unclear. Future research should investigate the mechanisms regulating architectural protein localization and cooperative binding, as well as the dynamics of 3D landscapes across various cell types and differentiation stages. Answers to these questions are key to our understanding of the regulation of differentiation and developmental processes.