In the world of membrane proteins, topology defines an important halfway house between the amino-acid sequence and the fully folded three-dimensional structure. Although the concept of membrane-protein topology dates back at least 30 years, recent advances in the field of translocon-mediated membrane-protein assembly, proteome-wide studies of membrane-protein topology and an exponentially growing number of high-resolution membrane-protein structures have given us a deeper understanding of how topology is determined and of how it evolves
В 2000 г. всем казалось простым: мембранные белки из helix-bundle типа строятся из длинных, гидрофобных α-спиралей, которые ориентируются более или менее перпендикулярно плоскости мембраны1. Topology мембранных белков была описана, составлен список сегментов из полипептидной цепи, которые формируют трансмембранные спирали, и установлена их ориентация относительно мембраны.
Но сегодня после получения с 60 кратным разрешением структур мембранных белков, картина стала не столь простой. Пронизывающие мембрану спирали могут быть короткими, длинными, изогнутыми или прерывистыми в средине мембраны, они могут пересекать мембрану под косыми углами, лежать плашмя (flat) на поверхности мембраны или даже занимать только частично мембрану и затем возвращаться назад, формируя т.наз. re-entrant петли. Следовательно, в зависимости от точки зрения, необходимо более или менее сложное определение топологии. Даже концепция трансмембранной спирали не полностью очерчена - как в точности д. спираль достигать границы водо-раздела на обеих сторонах мембраны, чтобы её квалифицировать как трансмембранную?
Индивидуальные трансмембранные спирали белков могут варьировать в отношении своей способности эффективно вставляться в мембрану, что приводит к статистическому распределению топологий с разными количествами трансмембранных спиралей. Белки двойной топологии вставляются в мембрану в двух противоположных направлениях приблизительно в 1:1 stoichiometry. К тому же гомологичные белки могут разворачиваться, чтобы вставляться в противоположных ориентациях или гомологичные белки могут сливаться, чтобы сформировать структуры с двумя анти-параллельными доменами, пронизывающими мембрану. Было даже показано, что трансмембранные спирали могут динамически переориентироваться относительно мембраны в ответ на внезапные изменения в составе липидов. Однако, является ли подобный феномен переориентации также частью нормального функционирования мембранных белков, менее известно.
What the structures say
Ко времени написания обзора Protein Data Bank содержал более 100 высокого разрешения структур интегральных мембранных белков helix-bundle типа. Количество известных структур мембранных белков растет экспоненциально и удваивается каждые ~ 3 года, исходя из статистики водо-растворимых белков приблизительно на 15 лет2.
Всё же, не смотря на эту отрадную тенденцию, мы всё ещё только царапаем поверхность fold space мембранных белков и каждая новая структура приносит новые сюрпризы. Т.к. внимание кристаллографов сместилось с rock-solid electron- и proton-проводящих комплексов мембранных белков, которые участвуют в фотосинтезе и дыхании, к более от природы гибким каналам и транспортным белкам, поэтому мы начинаем оценивать крупные динамические изменения в межспиральных упаковочных взаимодействиях и даже в локальных структурных переходах helical-non-helical, которые возникают в мембранных белках. Нет больше гарантий, что все трансмембранные спирали прямые, ориентированы приблизительно перпендикулярно к мембране или, что они упаковываются с любой др. в соотвествие с простой 'knobs-into-holes' геометрией.
Fig. 1 (см. также Supplementary information (movies) S1,S2,S3) показывает сравнение трех заметно отличающихся структур: bacteriorhodopsin, бактериальный хлорный канал ClC и телячья Ca2+-ATPase. Bacteriorhodopsin (Fig. 1a) является классическим семи-спиральным пучком с ковалентно связанным retinal в средине. Он функционирует как управляемый светом протонный насос: небольшие, индуцированные светом движения в его трансмембранных спиралях способствуют транслокации протонов через мембрану против electrochemical gradient3. Спирали располагаются почти прямо в мембране и упакованы с типичными knobs-into-holes упаковочными углами4,5.
Хлорный канал ClC (Fig. 1b) является гомодимером и каждый мономер содержит Cl--специфический каналl6,7. В дополнение содержит несколько стандартных трансмембранных спиралей, структура содержит как длинные, наклоненные под большим углом спирали и короткие, тесно расположенные пары спиралей, которые проникают только наполовину в мембрану (re-entrant петли). Имеются также участки не-спиральных структур глубоко внутри мембраны, которые в основном располагаются между трансмембранными спиралями.
Ca2+-ATPase (Fig. 1c и Supplementary information S3 (movie)) отвечает за переключение межэду драматически отличающимися конформациями во время её ATФ-управляемых циклов подкачки8-11. Внемембранные ATФ-связывающие домены и домены фосфорилирования перемещаются относительно др. др. в ответ на активности в ATФ-связывающем сайте и связывание катионов с мембране и относительную ротацию т.наз. actuator (силовой привод) домена более, чем на 110°. Связанные с этими изменениями индивидуальные трансмембранные спирали перемещаются около 8 Å перпендикулярно к мембране и целиком повернутые спирали могут складываться и разворачиваться. Низко-молекулярные транспортеры, такие как lactose permease и glycerol-3-phosphate транспортеры также, как полагают, подвергаются экстенсивным переупаковкам своих трансмембранных спиралей во время транспорта субстрата12,13. Сходным образом S4 transmembrane helix в voltage-сенсором домене зависимого от эл. напряжения ионного канала, как было предположено, перемещается не менее чем на 15-20 Å поперек мембраны в ответ на изменения мембранного потенциала14.
Несмотря на этот постоянно растущий список структурной изменчивости и динамики, одно раннее обобщение, которое было сделано, заключается в том, что существуют самостоятельные профили распределения разных аминокислот вдоль трансмембранных спиралей (Fig. 2). Частота гидрофобных остатков (Ala, Ile, Val и Leu) достигает пика в средине мембраны, ароматические остатки Tyr и Trp (но не Phe) достигают пика в областях раздела липиды-вода, а заряженные и полярные остатки в основном отсутствуют в интерьере мембран15. Более того, позитивно заряженные остатки имееют несимметричное распределение и чаще всего обнаруживаются в цитоплазматических, по сравнению с не-цитоплазматическими частями белков - правило positive-inside16,17.
Итак, мембранные белки могут быть динамическими единицами со своими трансмембранными спиралями, меняющими положение в мембране, частично сворачиваясь и разворачиваясь, и переупаковывающимися во время реакционного цикла. Однако, неясно в какую базовую топологию меняется белок во время циклов белка между разными конформационными состояниями. От сюда следует, по большей части, Я буду использовать классическую концепцию топологии мембранных белков, т.е., helix-bundle мембранные белки могут быть описаны как ансамбли трансмембранных спиралей, которые соединены петлями, которые достигают, по крайней мере области lipid-headgroup мембраны.
Membrane-protein assembly
Топология мембранного белка в большинстве случаев предопределяется во время инициальной инсерции полипептидной цепи в мембрану. За небольшими исключениями инсерция обеспечивается translocon - молекулярным привратником (gate-keeper), который позволяет зарождающейся полипептидной цепи проходить через или интегрироваться в липидные мембраны. Наиболее изученными translocons являются Sec61 translocon в грубом endoplasmic reticulum (ER) и его бактериальный гомолог, SecYEG translocon.
Транслокон Sec61 формирует белок-проводящий канал через ER мембрану и используется всеми секреторными белками для вступления на секреторный путь. Он используется также мембранными белками, но с интерсным вкручиванием их трансмембранных спиралей, которые не транслоцируются целиком путем поперек мембраны, а скорее направляются по боковому пути в липидный бислой, преимущественно посредством 'lateral gate' в стенке транслокона18,19 (Fig. 3a). Основной характеристикой всех трансмембранных спиралей является, следовательно, их способность использовать боковые проходы и тем самым гарантируют их собственную интеграцию в мембрану.
Высокого разрешения рентгеновская структура очищенного archaeal Sec61 транслокона20 и низкого разрешения электронно-микроскопическая структура связанных с рибосомами транслоконов млекопитающих и бактерий21,22 дали мучительную, но еще не полную, картину транслокона в действии. Рентгеновская структура транслокона показала канал с узким центральным сужением, который закрыт с периплазматического конца с помощью 'plug helix' (Fig. 3b). Общая структура похожа на раковину моллюска (clam-shell) и было предположено, что латеральный проход м. открываться в направлении липидного бислоя в устье clam-shell20. Трансмембранные спирали в транслоцирующемся зарождающемся полипептиде, как полагают, покидает транслокон посредством этого прохода, когда они вставляются в мембрану. Сколько каналов открыто в их активном, связанном с рибосомами состоянии неясно и поэтому также невозможно сказать, сколько трансмембранных спиралей может быть секвестрировано в канале в одно и то же время. Стоихометрия активного, связанного с рибосомами транслокона горячо обсуждается и предлагаются разные модели структуры активного Sec61 комплекса20-22. Согласно одной модели активный транслокон представляет собой одиночный Sec61 комплекс с зарождающейся полипептидной цепью, транслоцирующейся через узкий канал, тогда как согласно др. предполагается существование front-to-front Sec61 димера с двумя боковыми проходами частично открытыми и обращенные лицом др. к др. и с со значительно более широким центральным каналом.
Химическое поперечное связывание ribosome-bound зарождающейся цепи с Sec61 транслоконом активно использовалось для характеристики непосредственной среды, с которой сталкивается проходящий полипептид18. Путем помещения фото-активируемых зондов в определенные позиции в разных трансмембранных спиралях, процесс инсерции может быть отслежен в существенных деталях. Для aquaporin-4, белка с 6 трансмембранными спиралями, недавно было показано, что спирали контактируют с субъединицей Sec61α ER транслокона в строгой N-to-C-терминальной последовательностью: сначала helix-1, затем helix-2, и т. д.23. Более того, любая данная спираль обнаруживается только, когда покидает траслокон и вставляется в липидный бислой при этом следующая спираль вступает в транслокон. Сходные данные были получены для трансмембранных спиралей-1-3 телячьего opsin24. Пока ещё неизвестно как в целом такой упорядоченный путь N-to-C-терминальной инсерции осуществляется, но это прекрасно согласуется с идеей, что трансмембранные спирали покидают транслокон через боковой выход одна за другой или возможно парами. Роли, выполняемые белками, которые ассоциированы с Sec61 транслоконом, такими как translocation-associated membrane protein (TRAM) в ER и YidC у Escherichia coli, всё ещё неясны, но скорее всего они могут обладать функциями хаперонов, вообще-то как мест временных хранилищ трансмембранных спиралей, которые необходимы для сборки с партнерскими спиралями прежде чем они эффективно вставятся в липидную мембрану19,25.
Др. мнение о том, как транслокон Sec61 руководит трансмембранными сегментами, возникло в исследованиях, в которых транслокон наделялся специально предназначенными пептидными сегментами, которые были в разной степени гидрофобными и которые вносились в крупный модельный белок, который служил в качестве груза для транслокона. Такие исследования были проведены в моей Лаб. и показали неожиданную тесную корреляцию между статистическим распределением различных аминокислот в трансмембранных спиралях известных рентгеновских структур15, распределением свободной энергии аминокислот в полярных и не-полярных растворителях26 и способностью разных аминокислот содействовать или уменьшать инсерцию модельных гидрофобных сегментов в ER мембрану27,28. Это указывает на модель, согласно которой боковые выходы из транслокона позволяют проходить зарождающейся цепи, чтобы проникнуть в окружающих липидный бислой, а последующая мембранная инсерция управляется с помощью термодинамического распределения гидрофобных полипептидных сегментов в липидах27,29. Если эта модель будет подтверждена, она сможет обеспечить популярную физическую поддержку для базирующихся на гидрофобности алгоритмов предсказания топологии, которые сегодня используются.
Механизмы действия др. транслоконов, таких как translocator inner membrane (TIM) комплексы, которые проводят белки или поперек или внутрь внутренней мембраны митохондрий30, менее понятны. Все же базовые структурные характеристики мембранных белков, которые используют транслоконы, не отличаются каким-нибудь явным образом от тех белков, которые пользуются Sec61 или SecYEG транслоконами, Возможно, что транслоконом-обеспечиваемое распознание трансмембранных спиралей всегда базируется на сходных принципах.
Membrane proteomes
С тех пор как разумные заслуживающие доверия схемы предсказания топологии появились на рынке, были проделаны попытки идентифицировать мембранный протеом и с помощью компьютера предсказывать топологии мембранных белков. Сегодняшние подсчеты показывают, что 20-30% из всех предсказанных открытых рамок считывания в типичном геноме, кодируют мембранные белки с одной или более трансмембранной спиралью31. Из таких белков, большинство было предсказано. как владеющие своими N и C концами в цитоплазме и это недавно было подтверждено экспериментально для мембранных протеомов E. coli и Saccharomyces cerevisiae32,33. Это может отражать предпочтительный механизм мембранной инсерции с независимо вставляемыми helical hairpins в качестве базового элемента структуры мембранных белков.
Не удивительно, что имеется строгая корреляция между топологией и функцией (Fig. 4). Энергией управляемые низко-молекулярные транспортные белки с приблизительно 6 или приблизительно 12 трансмембранными спиралями доминируют в мембранных протеомах E. coli и S. cerevisiae. Двух-компонентные сигнальные рецепторы (chemoreceptors) с 2 трансмембранными спиралями многочисленны у E. coli и оба E. coli и S. cerevisiae обладают большим колчеством белков с 2-7 спираями, функция которых неизвестна. У животных (но не у растений), сверхсемейство G-protein-coupled-рецепторов - члены которого имеют 7 трансмембранных спиралей и Nout-Cin ориентацию (т.е. с экстрацитоплазматическим N-концом и цитоплазматическим C концом) - подвержены массивной экспансии. У млекопитающих это сверхсемейство единственное объясняет почти 5% всех белок-кодирующих генов34.
Современные методы предсказания топологии базируются на классическом представлении о топологии мембранных белков, которое описано выше, они счастливо избегают сложных вопросов, таких как re-entrant петли, короткие разрывы в спирали и спирали, которые распластываются на поверхности мембраны. Некоторый прогресс в направлении более полных алгоритмов предсказания описан недавно35-37.
Opposite and dual topologies
Проведены крупно-массштабные исследования по топологии-картированию, E. coli и S. cerevisiae, топология-репортерные белки были слиты с С концами приблизительно α600 мембранных белков от каждого организма, это сделало возможным сделать вывод о локализации каждого из белковых С концов (цитоплазматическое или экстрацитоплазматическое)32,33. Последующий поиск по гомологичным белкам из данного набора данных показал, что большинство гомологичных мембранных белков имеют ту же самую локализацию С конца. Однако, гомологичные белки с оппозитной ориентацией С конца были найдены в немногих интересных случаях, которые ставят вопрос о том, как такие белки могут использоваться.
Имеются два возможных способа, чтобы гомологичные белки имели противоположно ориентированные С концы: может существовать добавочная С-терминальная трансмембранная спираль в одном белке, но не др. или два белка могут быть противоположно ориентированы в мембране. Примеры обоих случаев могут быть найдены у E. coli, предполагаемый Arg и ornithine antiporter YdgI имеет добавочную C-теримнальную трансмембранную спираль по сравнению со своим ближайшим гомологами, PotE и YjdE. С др. стороны, YdgQ и YdgL, оба с 6 трансмембранными спиралями ориентированы противоположно, противоположно ориентированы как и белки с 4 спиралями YdgE и YdgF. У S. cerevisiae, четырех-спиральный белок Ygl263w противоположно ориентирован по сравнению с 8 др. членами того же семейства белков. Во всех случаях эти противоположно ориентированные гомологичные белки следуют правилу positive-inside - т.е. каждый белок ориентируется так, что сторона, содержащая высокие количества положительно заряженных Arg и Lys остатков, обращена к цитоплазме.
Наиболее удивительная вариация топологии, которая была открыта, это dual топология. Дуальная топология приписывается белкам, которые 'undecided' в терминах или их общей ориентации в мембране и может вставляться в двух противоположных ориентациях с приблизительно 1:1 stoichiometry. Хотя существование белков дуальной топологии всё ещё под вопросом38, недавние данные экспериментальной и сравнительной геномики предоставили четкие подтверждения для, по крайней мере, 5 случаев dual-topology белков у E. coli39. Существуют camphor-резистентный белок (CrcB), small multidrug resistance (SMR) белки EmrE и SugE и YdgC и YnfA, два белка с неизвестной функцией. Все 5 являются малыми белками с 4 трансмембранными спиралями и каждый имеет только одно небольшое отличие в количестве позитивно заряженных остатков между своими двумя сторонами. Как и ожидалось для dual-topology белков, все 5 белков могут выдвигаться в направлении или Nin-Cin или Nout-Cout ориентации путем внесения или удаления одиночного позитивно заряженного остатка в петлях, которые соединяют трансмембранные спирали. Высокого рентгеновского разрешения структура EmrE демонстрируется как гомодимер, состоящий из двух противоположно ориентированных молекул40 (Fig. 5; см. также Supplementary information S4 (movie)). Это снова согласуется со структурой dual-topology, хотя всё ещё неясно, насколько хорошо эта рентгеновская структура согласуется со структурой низкого разрешения, которая определена с помощью электронной кристаллографии41,42.
Др. примером белка с dual-топологией является ductin, белок с 4 трансмембранными спиралями, которые обнаружены как в V-type ATPases так и в компоненте connexin channel в gap junctions. Эти две формы белка имеют противоположные ориентации в мембране, хотя неясно, до какой степени распределение позитивно заряженных остатков влияет на топологию43.
Multiple topologies
Будучи тестированы индивидуально не все трансмембранные спирали в многократно пронизывающих мембранных белках вставляются эффективно в мембрану44. Если, как предположено выше, мембранная инсерция является фундаментальным термодинамическим расчленяющим (partitioning) процессом, тогда существование таких не-вставившихся спиралей в натуральных белках указывает на то, что спирали уже могут взаимодействовать др. с др. во время ступени инсерции в мембрану, возможно формируя спиральные шпильки (hairpins), которые проникают в мембрану en bloc45. Др. возможность заключается в том, что слабо вставляющиеся спирали сохраняют свои характеристики в своем естественном контексте, так что это дает белок с множественной топологией.
Интригующим случаем множественной топологии является то, что scrapie prion protein (PrP), который обладает как неэффективным N-терминальным signal peptide так и неэффективно вставляемой трансмембранной спиралью46-48. Эта комбинация может давать, по крайней мере, 4 разные топологии - цитоплазматическую форму, полностью секретируемую. форму и две оппозитно ориентированные мембрану пронизывающие формы - которые могут быть наделены разными болезнь-вызывающими потенциалами49,50.
Др. пример множественных топологий предоставлен транспортером множественных соединений P-glycoprotein44. Было сообщено, что разные сегменты этого белка могут пронизывать мембрану, которая приводит к 2 разным топологическим формам, обе с 12 трансмембранными спиралями.
В этом случае топологическое разнообразие вызывается одним или более маргинальными гидрофобными и, следовательно, неэффективно вставляемыми, трансмембранными сегментами. Др. путем индуцировать множественные топологические формы белков являются манипуляции, базирующиеся на правиле positive-inside. 'Несостоявшиеся' мембранные белки являются составной частью, у которых наиболее высоко позитивно заряженные петли только и могут оставаться в цитоплазме, если один из гидрофобных сегментов принужден не проходить через мембрану51. Напротив, было показано, что слабый гидрофобный сегмент может быть вынужден становиться трансмембранным сегментом, путем помещения его между двумя трансмембранными спиралями, которые имеют одни и те же предпочтения в ориентации52. Др. факторы, которые, как было показано, затрагивают топологию, включают длину N-терминального гидрофобного signal-anchor сегмента53 (более длинные сегменты предпочитают Nout-Cin ориентацию), быстрое складывание N-терминального глобулярного домена54 и N-сцепленное гликозилирование петель, которые становятся временно незащищенными в ER просвете во время сборки мембранных белков53,55.
Dynamic topologies
Во время обсуждения было сделано неявное допущение, что топология, однажды сформировавшись, остается стабильной. Др. словами, трансмембранные спирали не могут кувыркаться туда сюда в мембране и они не меняют своей ориентации относительно липдного бислоя. Рассматривая низкую скорость спонтанных lipid flip-flop в чистых липидных бислоях, может наблюдать даже менее вероятное, что трансмембранные спирали могут предпринимать сходные гимнастические упражнения. Однако, имеется мало сообщений, что это действительно происходит.
Наиболее драматическим сценарием могут быть белки, которые совершают переходы между разными топологиями как часть реакционного цикла. SecG, компонент бактериального транслокона SecYEG, как полагают, осуществляет это во время транслокации предбелка56,57, хотя это недавно было поставлено под сомнение58.в
Относительно менее крайнего замечания, некоторые мембранные белки, по-видимому, реориентируют одну или более своих трансмембранных спиралей пост-трансляционно, чтобы достичь свой финальной (стабильной) топологии. В aquaporin-1, белке с 6 трансмембранными спиралями две re-entrant петли, вторая и четвертая спирали не адоптируют трансмембранной ориентации во время ко-трансляционной стадии мембранной интеграции. Вместо этого. третья спираль реориентируется пост-трансляционно, приводя вторую и четвертую спирали в их соотв. трансмембранные позиции59 (Fig. 6a). Имеются также четкие указания на то, что существует критическое временное окно, в течние которого N-терминальная трансмембранная спираль может реориентироваться ко-трансляционно, будучи всё ещё в транслоконе53.
Вирусные белки также дают примеры необычного топологического поведения. Довольно впечатляющим случаем является крупный оболочечный гликопротеин вируса hepatitis B, который первоначально вставляется в ER мембрану своим N-терминальным, т. наз. pre-S доменом, локализованным в цитоплазме. Во время затяжного хаперон-зависимого процесса пост-трансляционного созревания pre-S домен затем транслоцируется поперек мембраны примерно на 50% молекулы, вызывая смешанную топологию или с тремя или 4 трансмембранными спиралями этого белка60-62 (Fig. 6b). Сходная пост-трансляционная транслокация позитивно заряженного N-терминального хвоста белка холина у фага lambda S107, управляется с помощью уменьшения мембранного потенциала, как было подтверждено, лежит в основании 'lysis clock' функции, которая кодируется этим фагом63.
Оболочечный гликопротеин вируса гепатита С представляет пример др. феномена переориентации, который также наблюдается и в др. вирусных белках64. Этот вирусный оболочечный гликопротеин является polyprotein, который состоит из белков E1, E2 и p7. E1 обладает способным к отщеплению N-терминальным сигнальным пептидом и гидрофобным C-терминальным мембранным якорем, который также функционирует как сигнальный пептид для E2, a E2 обладает C-терминальным якорем, который складывается вдвое в качестве сигнального пептида для белка p7. E1 и E2 C-терминальные якоря и сегменты сигнальных пептидов, по-видимому, первоначально вставляются как короткие 'инвертированные' спиральные шпильки с напряженными цитоплазматическими петлями, которые отделяют сигнальные пептиды от предшествующего гидрофобного участка. Вследствие отщепления сигнального пептида с помощью локализованной в просвете сигнальной peptidase, С-терминальный конец отщепляет сигнальный пептид поворачивает обратно через мембрану, приводя к образованию одиночной трансмембранной спирали на С-концах E1 и E2 (Fig. 6c).
Наконец, транспортер лактозы E. coli, белок с 12 трансмембранными спиралями, меняет драматически топологию, когда он экспрессируется в клетках, генетически преобразованных, в результате чего они лишены липида phosphatidylethanolamine в своей внутренней мембране. Ещё более удивительно, этот белок возвращается к своей нормальной топологии, когда повторно вносится phosphatidylethanolamine или чужеродный липид monoglucosyldiacylglycerol65-69. Возможна ли такая индуцированная липидом переориентация и в нормальных физиологических условиях, неизвестно. Как раз меньше всего эти наблюдения указывают на то, что взаимодействия между заряженными остатками в белке и поверхностным зарядом мембраны могут частично объяснить правило positive-inside69,70, даже если др. факторы, такие как мембранный потенциал и специфические остатки в Sec61 translocon могут также вносить свой вклад71,72.
Существуют также ещё неясные случаи мембранных белков, которые совершают динамическое сальто-мортале (flip-flop) трансмембранных спиралей как часть функционального цикла. Однако, пост-трансляционная переориентация одной или более спиралей, как часть процесса укладки или созревания, была продемонстрирована для ряда белков.
Topology evolution
По сравнению с водо-растворимыми белками топология предоставляет добавочное измерение, которое может быть использовано мембранными белками. Топология может использоваться , напр., путём добавления или удаления терминальных или внутренних трансмембранных спиралей, путем слияния или расщепления генов и путем оптовой инверсии мембранной ориентации. Пока только немногие исследования были адресованы эволюции топлогии per se, но некоторые интересные тенденции уже выявляются.
Основным механизмом эволюции топологии являются внутренние генные дупликации73, дающие внутренние двухскладчатые симметричные 3D структуры6,12,20,74,75. Дупликации могут быть или полными, которые ведут к удвоениям количества трансмембранных спиралей, или частичными, так что могут добавляться трансмембранные спирали к N или C концу белка. Особенно интересными являются нечто вроде внутренних дупликаций, возникающих, когда белок с нечетным числом трансмембранных спиралей полностью удваивается, в результате создается белок, в котором два гомологичных домена не могут оба сохранять свою оригинальную общую ориентацию в мембране и в то же самое время не могут протащить все свои трансмембранные спирали через мембрану.
Хотя мембранные белки часто используют внутренние генные дупликации, они редко используют domain recombination с вовлечением негомологичных мембранных доменов76. Вместо этого мембранные белки часто используют нековалентные взаимодействия с др. мембранными белками, чтобы сформировать мультидоменовые белковые комплексы. Однако, рекомбинация доменов между membrane-integral доменом и одним или более водо-растворимыми доменами широко распространена76, a качественные особенности растворимых доменов могут иногда помогать в предсказании топологии мембранного домена77.
Топологическая инверсия - т.е. эволюция гомологичных белков с одним и тем же количеством трансмембранных спиралей, но с противоположной ориентацией в мембране - выявлена в немногих случаях. Наиболее распространенным способом для достижения этого, по-видимому, является перераспределение позитивно заряженных остатков с одной стороны белка на др. Это может достигаться за счет перестройки белка78,79, и сегодня открыто в натуральных белках у бактерий39 и S. cerevisiae33.
Иллюстративным примером является семейство SMR-белков, которое представлено у E. coli белком кандидатом dual-topology EmrE (see above) , а также белками E. coli YdgE и YdgF, и большим количеством SMR белков у др. бактерий. EmrE является активным в виде гомодимера80, в то время как YdgE и YdgF д. ко-экспрессироваться, чтобы обеспечить резистентность к лекарствам81. EmrE, YdgE и YdgF имеют по 4 предсказанных трансмембранных спиралей, но в то время как EmrE, по-видимому, имеет дуальную топологию, YdgE и YdgF противоположно ориентированы в мембране39, по сравнению с распределением позитивно заряженных остатков в двух белках. Более того, EmrE кодируется с помощью изолированного гена на хромосоме E. coli, тогда как YdgE и YdgF кодируются парами соседних генов. Возможным сценарием может быть, следовательно, то, что YdgE-YdgF пара возникла в результате удвоения гена, в которой родоначальный, EmrE-подобный, dual-topology белок был использован в двух противоположно ориентированных гомологах (Fig. 7a). Открыто семейство белков (Pfam инвентарный номер DUF606) с 5 предсказуемыми трансмембранными спиралями. Это семейство включает: кандидаты белков с dual-topology, которые кодируются 'singleton' генами; противоположно ориентированные гомологи, которые кодируются соседними генами; и внутренне удвоенные с 10 трансмембранными спиралями белки, у которых первая и вторая половины, как предполагается, имеют противоположную ориентацию39.
Второй способ реориентации белка это добавление отщепляемого сигнального пептида к N концу мембранного белка, который первоначально имел цитоплазматический N конец. Это может вызывать транслокацию N-терминальной части белка на экстрацитоплазматическую сторону с одновременной инверсией ориентации трансмембранной области. Прекрасным примером этого является рецептор glutamate прокариот - K+ канал, который обладает своим N-терминальным лиганд-связывающим доменом, локализованным вне клетки скорее, чем в цитоплазме и в котором домен канала имеет противоположную мембранную ориентацию по сравнению с большинством др. K+ каналов82 (Fig. 7b).
Добавление N-терминального сигнального пептида д.б., по-видимому, простым эволюционным механизмом для топологической инверсии, но в большинстве случаев, правило positive-inside д., по-видимому, предупреждать инверсию трансмембранных спиралей, приводя к 'topological frustration'51. Топологически несостоятельные мембранные белки имеют конфликтующую топлогическую информацию в разных частях полипептида, а компромиссное решение заключается или в исчезновении одного или более гидрофобных сегментов из мембраны51 или в форсировании не-гидрофобного сегмента, чтобы вставиться поперек мембраны52. Топологическая инверсия за счет добавления (удаления) N-терминального сигнального пептида, следовательно, ограничена белками только с небольшим количеством трансмембранных спиралей и даже теми из них, которые могут приобретать последующие последовательности оптимизации в соответствии с правилом positive-inside, чтобы достичь уникальной ориентации.
Conclusions
Even if some of the recently determined membrane-protein structures have to some extent 'muddied the waters', it is remarkable how far two simple concepts — the hydrophobic character of transmembrane helices and the positive-inside rule — go in providing an explanatory framework for membrane-protein topology. However, it is also slightly discouraging (or encouraging, depending on your view of life) to realize how little we know about the molecular details of how transmembrane helices are recognized and of how they are orientated in the correct way across the membrane by the different translocons in the cell. Another unattained goal, for which progress promises to be rapid, is to reach a quantitative understanding of the energetics of membrane-protein insertion and folding in vivo. It would, at the least, be intellectually satisfying if our topology-prediction methods and helix-packing algorithms could be based on direct measurements of interaction energies rather than on statistically-derived parameters, even if their performances weren't dramatically improved. After all, life is all physical chemistry, right?