1. Hox genes and development
Один из важнейших вопросов в биологии развития связан с регуляторными механизмами, определяющими качественные особенности (идентичность) сегментов - станут ли конкретные области развивающихся эмбрионов головами или хвостами. Гомеотические гены (Hox-гены) - это гомеодоменовые транскрипционные факторы, которые обеспечивают идентичность сегментов вдоль первичной оси тела (обзор McGinnis and Krumlauf, 1992) и они вовлечены в регионализацию общего плана тела всех двусторонне симметричных животных. Описанные на сегодняшний день мутации в гомеотических генах, связанные с избыточной экспрессией, избыточной активацией или инактивацией, часто приводят к резким изменениям качественных особенностей сегментов, что приводит к формированию структур тела неправильно или не в том месте, как это наблюдается у дрозофилы и мышей (Lewis, 1978, 1982, 1992; Vinagre et al., 2010; Wellik and Capecchi, 2003; Zhao and Potter, 2001, 2002). Гены Hox высококонсервативны в группах метазоа, и гены в кластере Hox в основном сохраняют свою хромосомную организацию, от 5' до 3', параллельно с их пространственными и временными паттернами экспрессии в организме (McGinnis and Krumlauf, 1992). Селективное давление, которое привело к такому сохранению, отражает ключевую роль, которую Hox-гены играют в процессах развития.
Hox-гены функционируют как гены переключатели (гены, наделяющие качественными особенностями сегменты) у позвоночных и беспозвоночных, но у них есть широкий спектр дополнительных ролей в морфогенезе и формировании паттерна. Семейство генов Hox эволюционировало через два-три раунда дупликаций и дивергенций, что привело к появлению множества паралогов генов с перекрывающимися доменами экспрессии и функциональной избыточностью, в зависимости от группы метазоа. Комплекс Hox дрозофилы разделен на два региона, расположенных на расстоянии 700 Кб друг от друга на одной хромосоме (HOM-C). Эти два комплекса известны как Bithorax (BX-C) и Antennapedia (ANT-C). Комплекс Antennapedia состоит из labial (lab), Proboscipedia (Pb), Sex-combs reduced (Scr) и Deformed (Dfd). Комплекс Bithorax состоит из трех генов, Ultrabithorax (Ubx), abdominal A (abdA) и Abdominal B (AbdB) (Carroll, 1995; Lewis, 1978; Powers et al., 2000). Геномы млекопитающих содержат 39 генов Hox, организованных в четыре комплекса (HoxA, HoxB, HoxC и HoxD) на гаплоидный набор, расположенных на четырех разных хромосомах, которые вместе составляют группу паралогов, поскольку возникли в результате дупликации генов (Boncinelli et al., 1988; Hoegg and Meyer, 2005; Krumlauf, 1994, 2018; Scott, 1992; Duboule, 2007).
Многие гены парологи Hox демонстрируют функциональную избыточность, то есть они могут функционально компенсировать друг друга (Tvrdik and Capecchi, 2006). В результате, комбинированные мутации генов группы паралогов могут выявить функциональную компенсацию и синергизм между генами одной группы. Кроме того, паралоги часто имеют перекрывающиеся паттерны экспрессии (Kiecker and Lumsden, 2005), а их мутации с потерей функции частично напоминают друг друга (Barrow and Capecchi, 1996; Ramirez-Solis et al., 1993). Уточнение последовательностей между участком хромосомы дрозофилы, несущим Hox-код, и Hox-комплексами позвоночных позволяет предположить, что четыре Hox-комплекса млекопитающих возникли из одного предкового кластера путем дупликации генов и хромосом в ходе эволюции (Duboule and Dolle, 1989; Graham et al., 1989). Существуют доказательства того, что различия в строении тела членистоногих обусловлены различиями в экспрессии и регуляции генов Hox (Hughes and Kaufman, 2002; Ronshaugen et al., 2002). Вариации последовательности гомеодоменных белков также способствуют изменению специфичности мишени и подвержены эволюционным изменениям (Ekker et al., 1994; Li et al., 1999; Ronshaugen et al., 2002). Действительно, влияние генов Hox на эволюцию было подробно рассмотрено и обсуждено (Alexander et al., 2009; Carroll, 1995, 2005, 2005; Mallo et al., 2010; Wellik, 2009). Из консервативной организации этих генов Hox на хромосомном уровне в сочетании с влиянием белков HOX на сегментарную структуру легко понять, что семейство генов Hox кодирует важнейшие регуляторы развития.
2. Hox gene function determined through the window of mutation analysis
Анализ различных мышиных мутантов поддерживает идею о существовании уникальной функции для отдельных генов Hox, которая может быть приписана некоторым прирожденным, скрытым свойствам белков HOX. Интерпретация этих исследований затруднена из-за потенциальной функциональной избыточности, связанной с паралогами у мышей. Greer и коллеги поменяли местами полные кодирующие регионы между Hoxa3 и Hoxd3 (Greer et al., 2000). Их анализ подтвердил идеи о том, что гены Hox функционально эквивалентны и что различные функции возникают из-за различий во временных и пространственных областях экспрессии (Greer et al., 2000). Это было интерпретировано как "модель эквивалентности", предполагающая, что именно количество Hox-белков важно для определения функций, а не вариации самих белков (Duboule, 2000). Однако в аналогичных экспериментах Zhao and Potter сообщили, что замена гомеобокса между Hoxa11 и Hoxa13, в результате которой образуются химерные аллели Hoxa11 (A1113hd), приводит к появлению мышей, которые нормально развиваются и дают нормальные скелеты, почки и мужские репродуктивные пути (Zhao and Potter, 2001). И наоборот, при развитии конечностей и женского репродуктивного тракта Hoxa1113hd действует как доминантно-негативный аллель, значительно нарушая нормальное развитие (Zhao and Potter, 2001). У самок мышей матка трансформируется в шейку/влагалище. Этот последний результат, вероятно, обусловлен тем, что домен экспрессии Hoxa13 перекрывает эти структуры в нормальном женском репродуктивном тракте (Zhao and Potter, 2001).
Замена гомеодомена Hoxa10 на Hoxa11 (Hoxa1110hd) приводит к гипоморфному фенотипу в аппендикулярном скелете, почках и репродуктивных путях, но мутантные животные не обнаруживают дефектов в развитии осевого скелета. Замена гомеодомена Hoxa4 на Hoxa11 (Hoxa114hd) приводит к появлению животных, сходных по фенотипу с нулевым Hoxa11 (Zhao and Potter, 2002), с удивительно нормальным осевым скелетом.
Результаты этих экспериментов по обмену доменами предполагают тканененезависимую и тканеспецифическую роль различных гомеодоменов. Эти результаты также подтверждают идею о том, что определение сегментарной идентичности могло быть общей или примитивной функцией гомеодомена, приобретенной до функциональной дивергенции между различными паралогичными группами, и контекст играл более значительную роль в сегментной идентичности после дупликации хромосом на филогенетическом древе. Несмотря на эту очевидную избыточность, существуют также убедительные доказательства в пользу различия функций разных паралогов Hox, особенно во времени и в пространстве развития (Vinagre et al., 2010; Wellik, 2007; Wellik and Capecchi, 2003). Это подразумевает, что каждый белок HOX имеет определенный уровень уникальной функции, хотя многие белки HOX могут иметь общие мишени и функционировать в сходных путях развития (Minoux et al., 2009; Vieux-Rochas et al., 2013). Недавний обзор Luo и коллег подчеркивает контраст между аспектами Hox-кода, которые ясны, и теми, которые остаются неполными или без ответа (Luo et al., 2019).
Осталось выяснить, в какой степени эти уникальные функциональные роли связаны с различиями в доменах экспрессии между генами или с тонкими вариациями в самих белках HOX и их последующих локусах-мишенях. Это различие приводит к ряду фундаментальных вопросов: Как разные белки HOX регулируют общие и уникальные мишени? Что является источником специфичности белков HOX? Существуют ли определенные цис-последовательности, которые являются ключом к дифференциальной специфичности HOX? Как связанные модули, способствующие соединению , например, HOX, HOX:кофактор и/или кофакторные мотивы, разделенные спейсером, и лежащие в их основе сайты связывания диктуют правила специфического присоединения различных белков HOX? Как различия в последовательности на уровне аминокислот способствуют связыванию белков HOX и функциональной специфичности? Эти вопросы, в целом, весьма актуальны не только для белков HOX, но и для многих других семейств транскрипционных факторов, особенно с точки зрения характерных последовательностей для распознавания (последовательностей мишеней), связанных с группами транскрипционных факторов. Следовательно, общие правила и знания, полученные при анализе белков HOX, должны быть актуальны для других типов факторов или, по крайней мере, обеспечивать основу для сравнения.
3. The Hox protein family: commonalities and differences
Учитывая уровень сходства последовательностей и функциональную избыточность, как различные белки HOX регулируют общие и уникальные мишени и каков источник этой специфичности? Среди генов
Hox есть общие структурные домены, включая гомеодомен, которые являются критическими для функции (Alexander et al., 2009; Mann et al., 2009). Все гомеотические гены имеют характерный мотив, называемый гомеодоменом, кодирующий 61 аминокислоту, который распознает специфическую последовательность ДНК и необходим для активации или репрессии нижележащих генов мишеней (рис. 1A). Белки HOX имеют характерную размерность и складываются в 3 спирали, причем спирали 2 и 3 образуют конформацию спираль-поворот-спираль, которая является отличительной чертой транскрипционных факторов, связывающихся с основной бороздкой в ДНК. В то время как N-концевая область белка HOX, предшествующая спирали 1, связывается с нуклеотидами минорной бороздки ДНК мишени, третья спираль (спираль распознавания) распознает из четырех оснований мотив TAAT, который консервативен почти во всех сайтах, распознаваемых гомеодоменом (Gehring et al., 1990; обзор Mann and Chan, 1996; Otting et al., 1990). Последовательности, фланкирующие гомеодомен и находящиеся внутри него, также способствуют специфичности мишени и подвержены эволюционным изменениям (Ekker et al., 1994).
Fig. 1.
Current Models for HOX-cofactor interactions on DNA. HOX proteins have characteristic domains that interact with DNA directly and with cofactors. The image shown (A) is rendered based on X-ray diffraction data of the ternary complex formed when the HOXB1-PBX1 complex (Protein Database ID# 1B72) interacts with DNA (Piper et al., 1999). The red arrow indicates the homeodomain of HOXB1, and the green arrow indicates the binding domain for PBX1. The Widespread model proposed by Biggin and McGinnis (1997) is shown (B) in comparison with a more comprehensive model that builds on the Co-Selective model and incorporates a broader range of regulatory components in a Cooperative Binding model for HOX interactions with DNA. In the Widespread Binding model there are numerous low affinity HOX-response elements and binding sites to which Hox proteins can bind in a clustered fashion. The preponderance of clustering, rather than high affinity interactions at these DNA domains, determine specificity and outcome. In contrast, the Cooperative Binding model reflects high affinity, bipartite sites to which HOX proteins, in combination with varying cofactors (i.e. TALE proteins) are able to bind to discrete DNA domains to determine HOX protein binding specificity and affect gene expression outcome. Note that these models are not mutually exclusive, but rather describe potential interaction mechanisms that may lead to fine-tuning HOX protein binding specificity and tightly regulated gene expression outcomes. Images generated with BioRender.com.
В целом, 39 белков HOX млекопитающих распознают AT-богатые сайты связывания, в то время как ~60 белков с основной петлей спирали (bHLH) распознают 5'-CACGTG-3' или E-box домен (Berger et al., 2008; Conlon et al., 2001; Jones, 2004). У дрозофилы более 50 гомеодомен-содержащих белков связываются с последовательностью мишени из шести пар оснований, таких как 5'-TAATTG-3' и 5'-AATTA-3' (Noyes et al., 2008). Все белки HOX беспозвоночных и позвоночных демонстрируют сродство к таким АТ-богатым последовательностям в анализах мономерного связывания in vitro. Однако вопрос о сродстве связывания осложняется различиями в свойствах этих белков in vitro и in vivo. У дрозофилы Antennapedia (Antp) распознает 5'-[C/T][C/A] ATTA-3' и связывает ДНК с высоким сродством, в то время как Labial (Lab) и Proboscipedia (Pb) связываются с 5'-nTGATTGATnnn-3' Deformed (Dfd) and Sex combs reduced (Scr) преимущественно связываются с 5'-TGATTAATnn-3' (Slattery et al., 2011). Такие последовательности в изобилии присутствуют в геноме, и одна такая последовательность может быть найдена примерно через 500 пар оснований на уровне всего генома. Однако при тестировании в исследованиях in vitro свойства связывания Ultrabithorax (UBX) и Antp неотличимы (Berger et al., 2008; Mann et al., 2009; Noyes et al., 2008). In vivo Antp участвует в контроле спецификации ног (Casares and Mann, 1998; Mann and Hogness, 1990; Schneuwly et al., 1987a, 1987b) в противовес спецификации сегментов антенны, в то время как UBX участвует в спецификации гальтер в противовес спецификации крыльев (Castelli-Gair and Akam, 1995; Konopova and Akam, 2014; Roch and Akam, 2000). Эти общие черты порождают следующие вопросы. Играет ли лежащая в основе последовательность связывания роль в специфичности связывания, которая приводит к этим различным функциональным ролям? Изменяют ли кофакторы связывающие свойства белков HOX и приводят ли они к специфическим взаимодействиям, маскируемым при анализах связывания in vitro? Насколько актуальны эти "правила" связывания и регуляции в разных группах транскрипционных факторов? Цель данного обзора - рассмотреть некоторые из этих важнейших вопросов в контексте мутагенеза и исследований связывания, выделив ключевые элементы, которые интегрируются для точной настройки специфичности связывания HOX в процессе развития и построения "кооперативной" модели связывания для белков HOX.
4. Hox proteins and cofactors
В свете их общего происхождения и эволюционного сохранения белки HOX имеют очень похожие гомеодомены и общую структуру, которые связываются с простыми последовательностями с относительно похожими предпочтениями к последовательности (Berger et al., 2008). Следовательно, их индивидуальная специфичность для сайтов-мишеней in vivo, вероятно, модулируется за счет участия кофакторов или взаимодействующих белков. Подтверждением этому служат исследования двух основных классов кофакторов HOX, которые являются членами семейства белков с удлинением трех аминокислотных петель (TALE). К ним относятся Pre-B-Cell Leukemia Transcription Factor (PBC) and Myeloid Ecotropic Viral Integration Site (MEIS) , которые имеют три дополнительные аминокислоты между спиралью 1 и 2, тем самым изменяя трехмерную конформацию сайта связывания. PBC и MEIS - это классы TALE-гомеодоменсодержащих белков, которые могут выполнять HOX-зависимые и HOX-независимые функции (Longobardi et al., 2014; Penkov et al., 2013; Stanney et al., 2020). Наиболее часто характеризуемые белки PBC у мышей относятся к семейству Pbx, эволюция которого предшествовала Hox-генам (Bobola and Merabet, 2017; Merabet and Mann, 2016). Наиболее изученными членами класса MEIS являются белки MEIS и PREP (Penkov et al., 2013). Многие сайты связывания HOX или элементы реакции на HOX, идентифицированные in vivo в генах усилителях и промоторах , находятся в ассоциации с соседними сайтами связывания PBX и/или MEIS/PREP (Manzanares et al., 2001). Мутирование сайтов связывания PBX и MEIS в нижележащих мишенях для HOX, которые также могут включать гены Hox, может предотвратить их экспрессию (Ferretti et al., 2000; Gould et al., 1997; Maconochie et al., 1997; Manzanares et al., 2001).
Семейство белков TALE также эволюционно консервативно, что поддерживает идею о том, что они играют древнюю роль в потенцировании специфичности связывания белков HOX даже у бесчелюстных позвоночных, таких как минога, и у беспозвоночных (Hudry et al., 2012; Parker et al., 2019; Slattery et al., 2011). Мутация в EXD (Extradenticle; гомолог Pbx) приводит к гомеотической трансформации у дрозофилы без изменения экспрессии Hox, а у мышей и рыбок данио мутанты Pbx могут повторять фенотип мутанта с потерей функции Hox в заднем мозге и других тканях (Moens and Selleri, 2006; Peifer and Wieschaus, 1990; Popperl et al, 2000; Rauskolb et al., 1993, 1995; Selleri et al., 2004; Vitobello et al., 2011; Waskiewicz et al., 2001, 2002). Кроме того, было генетически доказано взаимодействие генов Pbx и Hox, так как частичный нокдаун Hoxb1a у гетерозигот Pbx4 показывает синергетический эффект в контроле миграции моторных нейронов, а паралогичные гены Hox группы1 показывают синергетическое взаимодействие с зиготическим Pbx4 в спецификации ромбомеров (Cooper et al., 2003; Waskiewicz et al., 2002). Эти результаты позволяют предположить, что белки семейства TALE могут действовать как кофакторы для придания специфичности связывания ДНК с белкам HOX через эволюционно консервативный механизм.
Каковы консервативные связывающие домены в белках HOX? Было установлено, что гексапептидная область, прилегающая к гомеодомену белков HOX, является важным сайтом взаимодействия для ДНК-связывающих партнеров PBC. Действительно, направленные мутации в гексапептидных доменах белков HOX предотвращают их связывание с PBX (Chan et al., 1996; Hudry et al., 2012; Medina-Martinez and Ramirez-Solis, 2003). Изменения гексапептидного домена Hoxb8 приводят к доминантным гомеотическим преобразованиям, подобным тем, которые наблюдаются у мышей с нулевыми Hox7 и Hox9 (Medina-Martinez and Ramirez-Solis, 2003). Для интерпретации этих результатов важно то, что экспрессия генов Hox7 и Hox9 не была затронута, несмотря на резкий сдвиг в качественной особенности (идентичности) сегментов, связанный с изменениями гексапептидного домена в Hoxb8. Это также позволяет предположить, что в отсутствие связывания HOXB8/PBX гены-мишени, не относящиеся к HOX, транскрипционно неправильно регулируются сегмент-специфическим образом. Есть также основания предполагать, что белки класса PBC действуют как пионерские факторы, способствующие открытию плохо доступного хроматина и рекрутированию кофакторов, включая сами белки HOX (Grebbin and Schulte, 2017). В совокупности эти исследования подчеркивают важность кофакторов, таких как PBX и MEIS, в направлении белков HOX к соответствующим и тканеспецифичным мишеням, необходимым для их функций in vivo. Однако они также иллюстрируют критические пробелы в понимании глубинных механизмов, контролирующих дифференциальную специфичность HOX in vivo, указывают на альтернативные роли кофакторов HOX и оказывают поддержку в построении более комплексной модели связывания и функционирования белков HOX.
5. How do the Hox proteins and cofactors come together?
Biggin и McGinnis (1997) предложили две модели для объяснения взаимодействия HOX-кофакторов на ДНК. Они назвали их "моделью широкого связывания" (рис. 1B) и "ко-селективной моделью". Эти две модели различаются в плане требования к белкам TALE для облегчения связывания HOX и не учитывают никаких других кофакторов, облегчающих рекрутирование HOX на геномных мишенях. Интересно, что в случаях, когда кофакторы TALE не требуются для связывания HOX, как в модели широкого распространения, они все равно могут играть контекстно-зависимую роль в регуляции генов-мишеней. В модели широко распространенного связывания белки HOX связываются с кластерными элементами HOX-ответа без помощи кофакторов. Многие из этих сайтов связывания могут быть не связаны с функциональными результатами. Однако связывание кофакторов может изменить способность белков HOX регулировать гены-мишени. После активации они могут служить для активации или репрессии транскрипции в зависимости от контекста и влияния других рекрутированных белков. Доказательством в пользу этой модели служит тот факт, что белки EXD/PBX необходимы наряду с белками HOX (например, Dfd) для активации генов мишеней (Casares and Mann, 2000; DiMartino et al., 2001; Gonzalez-Crespo et al., 1998; Gonzalez-Crespo and Morata, 1995, 1996). Hox-контроль развития гальтер у дрозофилы и дистальных придатков у членистоногих и других позвоночных (конечности), не нуждается в Pbx/Exd или Hth (Homothorax)/Meis для правильного развития (Biggin and McGinnis, 1997; Peifer and Wieschaus, 1990; Pinsonneault et al., 1997; Vinagre et al., 2010; Wellik, 2007; Wellik and Capecchi, 2003). У дрозофилы сайты связывания UBX в цис-регуляторной области sal определяют общую силу репрессии независимым от EXD образом (Galant and Carroll, 2002). Однако эти исследования не исключают возможности того, что в этот процесс может быть вовлечен другой кофактор(ы), помимо EXD/PBX или HTH/MEIS (Galant et al., 2002). Таким образом, возникает проблема, как вычленить общие темы из доказательств по видам и различным белкам HOX, чтобы изменить наше представление о специфичности связывания HOX.
В "ко-селективной модели", предложенной Biggin и McGinnis (1997), белки HOX не связываются с высоким сродством ни с одним элементом ответа, если не присутствуют кофакторы, такие как EXD/PBX и HTH/MEIS. В этой модели используется состоящий из двух частей сайт для HOX-связывания и EXD/PBX-связывания, так что специфичность обеспечивается комплексным влиянием нескольких сайтов связывания, которые пространственно разделены и все же присутствуют по соседству. В этом случае состоящий из двух частей сайт HOX-PBX относится к сайту связывания, где половина оснований привлекает один фактор, а остальные нуклеотиды привлекают другой фактор. В этом случае связывание PBX с мотивом может быть необходимо для связывания HOX с другой половиной. Известно, что в таких участках также находятся троичные комплексы PBX-HOX-MEIS (Ferretti et al., 1999, 2000, 2005). Весомая поддержка этой модели возникла в результате геномных исследований по выявлению мишеней связывания белков Hox и их регуляторных функций у дрозофилы и позвоночных. Например, когда Hoxa1 экспрессируется в эмбриональных стволовых (ES) клетках, где отсутствуют кофакторы, то HOXA1 связывается с доменами-мишенями с низким сродством и надежностью (De Kumar et al., 2017b). Следует отметить, что сайты HOX-PBX недостаточно представлены в связываемой области. При обработке ретиноевой кислотой (РА) экспрессируются такие кофакторы, как PBX, MEIS, TGIF и PREP, что приводит к связыванию с высоким сродством HOXA1 с последовательностями, обогащенными HOX-PBX (De Kumar et al., 2017b). Этот тип разнообразной способности к связыванию также проявляется у рыбок данио, где сайты связывания HOX:PBX концентрируются вблизи сайтов MEIS/PREP, особенно в эмбрионе на стадии сегментации (Ladam et al., 2018). Идентификация и характеристика реагирующих на HOX элементов, связанных с ауто-, пара- и кросс-регуляторными взаимодействиями между HOX-белками, показали, что двухсторонние сайты HOX-PBX обычно используются для связывания и функциональной активности HOX (Alexander et al., 2009; Gould et al., 1998; Mann and Chan, 1996; Mann et al., 2009; Manzanares et al., 2001; Slattery et al., 2011; T?mpel et al., 2009).
Cостоящий из двух частей сайт HOX-PBX также является неотъемлемой частью отвечающих на HOXB1- энхансеров Hoxb1, Hoxb2, Hoxa2, Hoxa3 и Hoxb4 у мышей и labial у Drosophila melanogaster. Распространенность этих двухсторонних сайтов в таком большом количестве элементов реакции на HOX у разных видов и глубокое использование белков PBX и MEIS TALE в качестве кофакторов с белками HOX у билатеральных животных (Hudry et al., 2011, 2012; Slattery et al., 2011) подтверждает ко-селективную модель (Biggin and McGinnis, 1997). Интересно, что взаимодействие PBX/EXD-HOX было показано как при репрессии, так и при активации генов мишеней (Rauskolb and Wieschaus, 1994), это указывает на то, что множество белков совместно регулируют нюансы экспрессии. Ярким примером такого типа кооперативного связывания является спецификация заднего мозга. В кластере HoxB позвоночных имеется хорошо охарактеризованная авторегуляторная область ромбомера (r) 4, участвующая в поддержании Hoxb1 в r4, которая содержит состоящие из двух частей сайты HOX-PBX 5'T/A]GAT[T/A]GA[T/A]G-3'. Удаление этих консервативных блоков приводит к выраженному дефекту сегментации и отменяет экспрессию r4. Было показано, что эта авторегуляция зависит от группы генов Labial (например, Labial, Hoxa1 и Hoxb1) как у мышей, так и у дрозофилы (P?pperl et al., 1995; Studer et al., 1998). Это взаимодействие происходит через кооперативное связывание HOXB1 с PBX (Marshall et al., 1994; P?pperl et al., 1995; P?pperl and Featherstone, 1992) и приводит к экспрессии Hoxb1 в r4 развивающегося заднего мозга у мышей, предоставляя четкие доказательства in vivo сложных белковых взаимодействий, влияющих на специфичность связывания сайта.
На межбелковые взаимодействия в ДНК-мишенях наслаивается специфичность, присущая нуклеотидным последовательностям мишеней. Например, при опосредованной лабиальной авторегуляции у дрозофилы изменение всего двух пар оснований в сайте HOX-PBX изменяет его специфичность с Lab на Dfd (Chan et al., 1994a, 1997) с драматическими последствиями для экспрессии генов. Изменение центрального основания двухсоставного сайта HOX-PBX с GG на TA привело к тому, что экспрессия у мышей и дрозофилы стала похожа на ту, которая наблюдается у мутантов Deformed или Hoxb4 у обоих видов. Интересно, что аналогичные сайты связывания с GG в качестве центральной пары оснований можно найти в гене Dfd дрозофилы и в ортологе Dfd мыши, Hoxb-4. Эти результаты показывают, что последовательность ДНК является центральной для специфичности связывания HOX и, вероятно, обеспечивает основу для контекст-специфического взаимодействия белков HOX с его кофакторами EXD/PBX и HTH/MEIS (Joshi et al., 2007; Mann et al., 2009; Ryoo et al., 1999; Sanchez-Higueras et al., 2019; Slattery et al., 2011), тем самым определяя региональные регуляторные домены. Manzanares et al. (2001) идентифицировали два двухсоставных сайта HOX-PBX и сайт связывания PREP-MEIS в консервативном блоке рядом с геном HoxA3. Используя анализы связывания in vitro, они показали, что сайт Hoxa3 PBC-B может связывать HOXB3, HOXD3 и HOXA3 с возрастающей эффективностью. Конкуренция с сайтом HOXA3/PBC-A/B эффективно блокировала другие известные сайты HOX/PBC из HOXB1 и HOXB2, подавляя активность связывания. Более того, мультимеризованные сайты HOX/PBC-B (пять копий) были способны направлять экспрессию репортера в r6/7 и r5. Сайт HOX/PBC в Hoxa3 несколько отличается от других известных состоящих из двух частей сайтов HOX-PBX и содержит TA или TT в центре вместо GG (Manzanares et al., 2001). Сопоставление результатов анализа связывания и трансгенных анализов с информацией о последовательности показывает, что тонкие изменения в сайтах связывания могут привести к изменению характера связывания через тот же набор HOX белков и кофакторов с критическим результатом в виде измененных доменов экспрессии, регулируемых специфическим для гена образом.
Доказательства участия других кофакторов в специфичности связывания были продемонстрированы на примере UBX и ABDA, которые, как было показано, взаимодействуют с другими кофакторами, такими как Motif1 binding protein (M1BP) путем приостановки транскрипции (Zouaz et al., 2017). Далее было продемонстрировано, что Abdominal-B (Abd-B) регулирует апоптоз и пролиферацию серотонинергических нейронов, важных для взрослого брачного поведения, в зависимости от пола, используя в качестве кофактора специфическую для поперечнополосатых мышц изоформу Dsx (Ghosh et al., 2019). Недавно было показано, что HOXA1 может регулировать экспрессию генов, вовлеченных в баланс между плюрипотентностью и дифференцировкой, посредством взаимодействия с NANOG-связанными геномными локусами (De Kumar et al., 2017a). Кроме того, TALE-белки, такие как TGIF, также могут функционировать как кофактор HOXA1 (De Kumar et al., 2017b). Интересно, что нет никаких доказательств в пользу того, что белки HOX абсолютно нуждаются в белках TGIF или PREP для рекрутирования в геномные мишени, что оставляет этот вопрос открытым для изучения. В элегантном исследовании Sanchez-Higueras et al. (2019) авторы определили, что связывание различных HOX-белков Drosophila с критическим цис-регуляторным модулем зависит не только от способности HOX-белков связываться в одиночку, но и от кофакторов и других "сотрудничающих" белков. Основываясь на последних исследованиях, в которых гены Hox, по-видимому, сотрудничают за пределами канонических сайтов HOX-TALE, мы предлагаем разработать "Ко-селективную модель" за пределами парадигмы HOX-TALE. Вместо этого мы предлагаем "модель кооперативного связывания" (рис. 1B), где кооперативность связывания между различными кофакторами и белками HOX приводит к вариативности и специфичности, связанной с регуляцией с помощью Hox нижележащих мишеней.
6. Clustering and synergy between tethered binding sites
Кластеризация сайтов с низким сродством, наличие пространственно разделенных взаимосвязанных сайтов связывания могут обеспечить альтернативные механизмы для достижения специфичности связывания. Мы определяем связываемый сайт как пространственно разделенную конфигурацию соседних сайтов для связывания HOX и кофактора. Структурная близость связываемых сайтов диктуется взаимодействием кофакторов, связанных на этих пространственно разделенных сайтах, и вносит дополнительный уровень регуляции. Цис-регуляторный элемент Antp P2 содержит 41 сайт связывания Ultrabithorax (UBX), а авторегуляторная область Dfd содержит четыре сайта связывания белка Dfd с умеренным и высоким сродством (Regulski et al., 1991). Два самых высокоаффинных сайта имеют общую консенсусную последовательность 5'-ATCATTA-3' (Appel and Sakonju, 1993). Недавно было показано, что HOXA1-связанные регионы содержат кластер сайтов связывания HOX, MEIS и HOX-PBX (De Kumar et al., 2017a; De Kumar et al., 2017b), что подтверждает идею о существовании комбинации перекрестных и авторегуляторных механизмов, которые контролируют экспрессию генов в зависимости от ландшафта транскрипционных факторов/кофакторов. По-видимому, белки HOX могут использовать ряд слабых сайтов связывания аддитивным образом для достижения присоединения, необходимого для регуляторной активности. В таких случаях несколько сайтов могут увеличивать общую силу связывания за счет кооперативности или увеличения шансов заселенности. Это также повышает вероятность того, что белки HOX могут регулировать свои мишени посредством мономерного связывания на кластере сайтов связывания без использования кофакторов, таких как EXD/PBX или HTH/MEIS. Похоже, что кластеризация сайтов связывания HOX является важным механизмом для достижения высокоэффективного связывания с низкоаффинными сайтами и, следовательно, специфичности связывания (Kuziora and McGinnis, 1988; Regulski et al., 1991; Sanchez-Higueras et al., 2019; Zeng et al., 1994). Связывающая активность белков HOX и кофакторов сильно зависит от доступности хроматина. Desanlis и соавт. показали, что HOXA11 занимает сайты связывания, предназначенные для паралогов HOX13 при эктопической экспрессии в дистальной части зачатка конечности - области, формирование паттерна сегментов которой регулируется генами Hox13 (Desanlis et al., 2020). Интересно, что эти сайты присутствуют в регионе, который, как было показано ранее, имеет HOX13-зависимую доступность хроматина (Desanlis et al., 2020). В подтверждение этой идеи HOXA1 может занимать открытые участки хроматина с сайтами связывания HOX с низким сродством и надежностью (De Kumar et al., 2017b). Эти результаты показывают, что доступность открытого хроматина является важным аспектом в эктопическом связывании белков HOX и ключевым аспектом для специфичности связывания белков HOX (Porcelli et al., 2019).
Хотя изучение специфичности связывания белков HOX потребует рассмотрения ландшафта хроматина, также важно учитывать полный контекст и важность множества потенциальных кофакторов и их сайтов связывания, присутствующих в этом ландшафте. В поддержку комбинаторного подхода к регуляции экспрессии генов говорят сайты связывания гетеродимеров PBX-MEIS, расположенные рядом со многими состоящими из двух частей сайтами HOX-PBX в элементах, реагирующих на HOX (Ferretti et al., 2000, 2005). Например, HOX, PBX и MEIS могут связываться и образовывать тройные комплексы, используя эти соседние сайты связывания. В частности, MEIS можно иммунопреципитировать с HOX и PBX у мышей. MEIS также может быть обнаружен как компонент комплекса HOX-PBX или MEIS может действовать в отсутствие PBX с продуктами задних по порядку генов Hox через механизм кооперативного связывания (Chang et al., 1997; Ferretti et al., 2000; Jacobs et al., 1999). Ferretti и коллеги картировали по меньшей мере три сайта PREP-MEIS вблизи двухсоставного сайта HOX-PBX у мышей и показали, что они необходимы для функциональной активности энхансера (Ferretti et al., 2005). Berthelsen и соавторы показали сборку тримерного комплекса PBX1, PREP1 и HOXB1 на R3-элементе Hoxb1 (Berthelsen et al., 1998). Интересно, что большинство выявленных комплексов также содержат комбинацию сайтов PBX/PREP-MEIS (PM) и PBX-HOX bipartite (PH), что позволяет предположить, что тройные комплексы HOX-PBX и MEIS могут быть общей чертой на элементах ответной реакции HOX (Ferretti et al., 2000; Gould et al., 1997; Manzanares et al., 2002; Ryoo et al., 1999). Хотя энхансеры Hoxb1, Hoxa2 и Hoxb2 генерируют ограниченный r4 паттерн экспрессии в анализах трансгенных особей, конкретная организация и количество двухсоставных сайтов PM и PH различаются между ними, а также могут различаться в пределах одного гена у разных видов (Ferretti et al., 2000, 2005).
Многочисленные данные подтверждают идею о том, что существует синергия между сайтами PM и PH в энхансере Hoxb2, которая в конечном итоге определяет его пространственно-временную активность. Ferretti и коллеги утверждали, что дифференциальное сродство сайтов PM1, PM2 и R2PM3 определяет образование тройного комплекса на R3. Повышение уровня PBX1 при индукции RA (ретиноевая кислота) может изменить сродство связывания комплексов PBX/PREP-MEIS на сайтах PM через увеличение доступности PBX для взаимодействия на R3. В результате эти изменения могут модифицировать конфигурацию от репрессии к активации. Тонкий баланс в этом механизме достигается за счет добавления связанных сайтов PREP-MEIS (Ferretti et al., 2000, 2005). Также утверждается, что PBX и MEIS могут взаимодействовать с этим энхансером Hoxb1 r4, сначала открывая хроматин, а затем доступность Hoxb1 изменяет характер взаимодействий и переводит его в активное состояние (Choe et al., 2009). В другом примере T?mpel и коллеги идентифицировали консервативную область в интроне Hoxa2, содержащую три двухсторонних сайта (PH-1-PH3) и один сайт PBX-PREP (PM1) (Tümpel et al., 2007). Эта область служила в качестве энхансера r4 в анализах электропорации у цыплят. Следовательно, эти пространственно ограниченные, но разделенные сайты формируют основу для рекрутирования отдельных комплексов HOX:кофактор, кофактор:кофактор, которые, в свою очередь, образуют троичную структуру для регуляции экспрессии нижележащих мишеней.
Еще один критический механизм, который необходимо учитывать в отношении сложности сайтов связывания факторов в регуляции генов, - это возможность прямой конкуренции за сайты или связывание кофакторов. Jacobs и коллеги представили анализ, согласно которому сайты-мишени передних по порядку белков HOX (HOXB1 и B2) для PBX и MEIS могут конкурировать друг с другом для создания иерархии гетеродимеров (Jacobs et al., 1999). Они также предложили альтернативную интерпретацию, согласно которой факторы могут кооперативно взаимодействовать для создания ДНК-связывающих комплексов более высокого порядка и иерархии (Jacobs et al., 1999). Авторы подтвердили, что HOXB1 связывается с энхансером Hoxb2 вместе с MEIS и PBX. MEIS, по-видимому, важен для специфичности связывания троичного комплекса с ДНК. Они утверждали, что пара PBX-MEIS способна связывать ДНК без жесткого требования к половине сайта, предполагая, что N-терминальный домен белков TALE может быть достаточным для образования гетеродимеров между белками TALE. В результате этого их гомеодомены могут свободно взаимодействовать с ДНК в различных конфигурациях. Последняя модель позволяет собирать на ДНК состоящий из трех частей комплексы, состоящие из сайта для HOX и PBX с отдельным фланкирующим сайтом MEIS. Несмотря на различия в моделях, их работа подтверждает идею о том, что включение MEIS в комплексы взаимодействия HOX-PBX способствует повышению специфичности (Jacobs et al., 1999). Интересно, что недавние результаты с использованием геномного связывания HOXA1 указывают на другой механизм, при котором белок TGIF может оказывать независимый импульс на HOXA1-зависимый энхансер без физического взаимодействия (De Kumar et al., 2017c). Этот последний результат оставляет открытой возможность пока еще не идентифицированных кофакторов в качестве посредников в этом взаимодействии или другого механизма взаимодействия, полностью, который может быть включен в постоянно развивающуюся модель кооперативного связывания.
7. Hox proteins--Determinants of their own specificity
Аминокислотные последовательности в гомеодомене HOX добавляют еще один уровень сложности в определение специфичности связывания белка HOX. Шесть аминокислотных мотивов, называемых гексапептидными мотивами и расположенных рядом с гомеодоменом, играют важную роль в определении специфичности HOX. Многие белки HOX содержат консервативный гексапептидный мотив, содержащий последовательно тирозин (Y)-пролин (P)-триптофан (W)-метионин (M) (YPWM). Важность этого мотива варьирует в различных белках HOX и контекстах (Mann et al., 2009). HOXA1 и DFD требуют мотив YPWM для взаимодействия с EXD/PBX (Green et al., 1998; Joshi et al., 2010). В отличие от них, для UBX и ABDA не требуется мотив YPWM, скорее эти гомеотические белки взаимодействуют с отдельным мотивом из шести аминокислот, известным как UbdA, который расположен на С-конце гомеодомена (Galant et al., 2002; Hueber et al., 2013; Merabet et al., 2003, 2007; Saadaoui et al., 2011; Tour et al., 2005). Кроме того, UBX и ABDA имеют консервативные С-концевые остатки, которые важны для их функции in vivo (Chan et al., 1994b). Phalen и Featherstone показали, что N-концевой остаток имеет решающее значение для специфичности мономерного и гетродимерного связывания белков HOX (Phelan and Featherstone, 1997). Они подтвердили, что эта позиция контактирует с N-концевыми остатками HOX и различается у белков HOX. Важно отметить, что N-концевые различия оказывают умеренное или полное отсутствие влияния на сродство (аффинность) связывания на основании исследований in vitro (LaRonde-LeBlanc and Wolberger, 2003; Phelan and Featherstone, 1997). В случае HOXA1, Arg5 в N-концевом плече контактирует с минорной бороздкой, и гексапептид играет важную роль во взаимодействии с Pbx. Во многих задних по порядку генах Hox разных видов гексапептид отклонился от консенсуса (LaRonde-LeBlanc and Wolberger, 2003). В отличие от белков HOXA1 и HOXD4, HOXD9 и HOXD10 связываются с мотивами 5'-TTAT-3' и 5'-TAAT-3' в анализах мономерного связывания они могут связываться с 5'-TTAT-3' при гетеродимерном связывании (Phelan and Featherstone, 1997). Остатки, ответственные за гетеродимерное связывание, могут быть сопоставлены с лизином (Lys)-3, Lys-6 и Lys-7. Это еще раз подтверждает идею о том, что N-концевые остатки могут изменять специфичность мономерного и гетеродимерного связывания белков HOX из разных групп паралогов. Еще один интригующий аспект этого исследования связан с неожиданным наблюдением, что R3-labial сайт связывания не является сайтом с самым высоким сродством гетродимерного связывания. Это поднимает вопрос об относительном балансе между специфичностью и сродством. Выбор сайта в условиях in vivo может быть скорее направлен на специфичность, чем на сродство (Phelan and Featherstone, 1997). Neuteboom и Murre отобрали сходные по аффинности сайты связывания для HOXC6, HOXB7, HOXB8 и HOX-PBX, используя метод отбора ПЦР у мышей (Neuteboom и Murre, 1997). Этот анализ обеспечил дальнейшую поддержку идеи о том, что специфичность, а не сродство, может играть более важную роль в исходе связывания комплексов при регуляции экспрессии генов.
Были выявлены дополнительные мотивы, которые помогают регулировать специфичность связывания. Lelli и коллеги сообщили, что мотив на основе триптофана важен для взаимодействия с EXD (Lelli et al., 2011). В случае ABDA дополнительный триптофан-содержащий мотив с Y, за которым следует аспаргиновая кислота (D) (YDWM), отличается от классического гексапептидного мотива HOX (Lelli et al., 2011). Помимо этих консервативных доменов, С-концевые последовательности важны для специфического взаимодействия с EXD-зависимыми мишенями. В отличие от этого, UBX, по-видимому, не зависит от С- или N-концевых областей для контекст-специфической регуляции генов-мишеней. Изменение домена UbdA сильно влияет на свойство связывания гомеодомена при мономерных или гетеромерных (HOX-PBX) связываниях. Lelli и коллеги утверждали, что наличие дополнительного триптофан-содержащего мотива в задних по порядку белках HOX может быть основой доминирования задних генов над передними (Lelli et al., 2011; Noro et al., 2011). Интересно, что многие белки, помимо белков HOX, такие как Engrailed и MyoD, также используют триптофан для взаимодействия с EXD и PBX. В случае Scr, одного остатка триптофана в мотиве YPWM достаточно для взаимодействия с EXD-зависимым функциональным доменом (Knoepfler et al., 1999; Peltenburg and Murre, 1996). В недавней работе Singh и соавторы продемонстрировали, что даже шестиаминокислотная высококонсервативная ДНК-связывающая область способна придать достаточную специфичность и функцию, тем самым предопределяя родоначальную роль паралогичных генов группы 1 у мышей (Singh et al., 2020).
HOX-белки и ассоциация кофакторов вместе способны придать новую специфичность и распознавание сайта мишени, которые не проявляются ни одним из них при мономерном связывании. Другими словами, хотя белки HOX могут проявлять сопоставимые свойства мономерного связывания на аналогичных AT-богатых последовательностях, их "скрытая специфичность" раскрывается при ассоциации с кофактором (Slattery et al., 2011). Slattery и соавторы продемонстрировали, что белки HOX приобретают новую специфичность связывания, когда они соединяются вместе с кофакторами. Авторы указали, что "скрытая специфичность" возникает, когда "различия в аминокислотных последовательностях транскрипционных факторов в рамках одного структурного семейства могут влиять на распознавание ДНК только тогда, когда эти факторы связываются с кофакторами". Они утверждали, что этот механизм отличается от кооперативности, где важна кинетика связывания, а ассоциация кофакторов мешает энергетике связывания (Slattery et al., 2011).
Источником скрытой специфичности вполне могут быть N-концевые и линкерные последовательности белков HOX. Совместное связывание EXD с белком HOX обеспечивает взаимодействие YPWM или гексапептидной области белков HOX с ДНК. В случае гомеодомена Scr два аргинина (Arg, R) в 3-м и 5-м положениях локализуются в минорной бороздке благодаря взаимодействию YPWM и EXD (Joshi et al., 2010). Для этого взаимодействия необходим глицин (Gly, G), примыкающий к 3-му положению Arg, который уникален для паралогичных генов Hox группы 2. Мотив аргинин (R)-глутамин (Q)-R (RQR) с R в 3-м положении является уникальной особенностью белков группы 2 и может благоприятствовать конформации, позволяющей вставлять обе боковые цепи R в минорную канавку (Joshi et al., 2007). В случае генов класса 3b (а именно Ubx, abdA и AbdB) гомеодомен содержит R во 2-м положении. Кристаллические структуры комплексов HOXA9-PBX показывают, что этот критический R контактирует с минорной бороздкой посредством водородных связей (LaRonde-LeBlanc and Wolberger, 2003; Mann et al., 2009). Два паралог-специфических остатка в гомеодомене HOXA9 определяют взаимодействие HOXA9-TALE (Dard et al., 2019). Это позволяет предположить, что небольшие изменения в одной или нескольких аминокислотах в гомеодоменах используются кофакторами для изменения специфичности связывания ДНК с целью уточнения общего ландшафта транскрипционных факторов в конкретных сайтах-мишенях. Все предпочтительные последовательности связывания образуют узкую канавку, и Arg5 контактирует с этой областью или находится рядом с ней, судя по имеющимся кристаллическим структурам (Rohs et al., 2009). Интересно, что топология минорных канавок демонстрирует различные особенности, основанные на взаимодействии с белками HOX. Передние белки HOX (группа 1 и группа 2) предпочитают узкие минорные канавки, в то время как задние белки достигают специфичности за счет взаимодействия с более широкой минорной канавкой. Различные белки HOX связываются с различными последовательностями ДНК, но, по-видимому, имеют сходную общую топологию и структуру ДНК (Slattery et al., 2011). Slattery и соавторы утверждали, что наличие мотива TpR расширяет минорную канавку в центре сайта связывания для размещения Arg3 и Arg5, в то время как TpA в белках группы 3 предотвращает вставку Arg3.
Последовательность ДНК-мишени, кофакторы PBX и MEIS, а также сами белки HOX совместно вносят вклад в модуляцию специфичности связывания, тем самым влияя на результат экспрессии генов. Небольшие вариации в выборе аминокислоты в гексапептиде или гомеодомене, в свою очередь, могут привести к распознаванию несколько иных последовательностей ДНК или ассоциаций кофакторов. В этом контексте последовательность ДНК сама по себе представляется менее важной, чем топология, создаваемая определенной последовательностью или комбинацией факторов и последовательностей, для создания ландшафта транскрипционных факторов на одном гене-мишени или на скоординированно регулируемых генах-мишенях. Белки HOX могут связываться с различными последовательностями ДНК, если они способны генерировать сходную общую топологию. Многие исследования связывания и структурные исследования, похоже, согласуются с такой возможностью. Также верно, что кофакторы TALE играют очень важную роль в предопределении функционального результата связывания HOX. Эти кофакторы определяют стабильность связывающего комплекса (комплексов) в дополнение к рекрутированию коактиваторов и корепрессоров, которые могут повлиять на конечный результат связывания (рис. 2).
Fig. 2.
Integrative Model for Hox protein binding specificity. The power and potency of HOX proteins in regulating gene expression is founded on a complex integrative weave of regulation that contributes to the transcription factor landscape regulating cell fate decisions and segment identity. From the smallest amino acid changes in critical binding motifs to the recruitment of a wide range of co-activators/repressors, the collective modulation impacts the ability of HOX proteins to bind DNA targets at critical spatial and temporal points during development. The hexapeptide domain adjacent to homeodomain of the HOX protein is required for interaction with HOX-specific DNA sequences, but the specificity could be modified via clusters of low affinity sites, latent specificity revealed by binding partners, or protein-protein interactions with TALE proteins, for example. This multi-level perspective linked to HOX protein function may not be restricted to this pleiotropic family of gene expression regulators. It is certainly feasible to consider that mechanisms of this type may be explored in other transcription factor families in terms of laying the groundwork for an integrative and modular approach to gene expression regulation. Image generated with BioRender.com.
Мономерные сайты связывания, негативные и позитивные регуляторные взаимодействия, влияние кофакторного взаимодействия, доступность хроматина, тонкие аминокислотные различия и пространственно-временной профиль экспрессии генов Hox в совокупности определяют специфичность связывания ДНК. Конечным результатом сложной регуляции является чрезвычайно тонко настроенная система, устанавливающая региональную идентичность с невероятным временным и пространственным разрешением, которая характерна для элементов как широко распространенной, так и ко-селективной моделей. Мы предлагаем назвать эту модель "модель кооперативного связывания", которая включает в себя больше, чем просто дифференциальный совместный отбор связанных факторов на сайтах-мишенях. Хотя нюансы специфичности связывания и регуляции для белков HOX являются областью активного исследования, важно рассмотреть, могут ли эти типы контекстно-зависимых моделей регуляции быть применимы за пределами парадигмы HOX. Если это так, то крайне важно пересмотреть некоторые из наших текущих моделей взаимодействия транскрипционных факторов с ДНК с точки зрения включения компонентов более сложных, мультибелковых взаимодействий в сочетании с незначительными изменениями мотивов связывания, которые могут оказывать значительное влияние на специфичность связывания с ДНК и изменения в экспрессии генов. Независимо от этого, очевидно, что специфичность связывания и правила функционирования, связанные с генами Hox, нигде не являются столь же четкими, как идентичность сегментов, которую они помогают определить.