Посещений:
Protein Kinase Superfamily

Genomic analysis of the eukaryotic protein kinase superfamily: a perspective
Steven K Hanks (steve.hanks@vanderbilt.edu)
Genome Biology 2003 4(5):111
http://genomebiology.com/2003/4/5/111



(Рис.1.)
 |  The ePK catalytic domain


(Рис.2.)
 |  Conserved residues implicated in peptide-substrate recognition


(Табл.1.)
 |  Putative ePKs identified by SPRI but not SUGEN


(Табл.2.)
 |  The 428 human ePKs with known or likely kinase catalytic function

Additional data file 1
The 474 protein kinases in common between the SPRI-510 and the SUGEN-518 lists

Протеин киназы с законсервированным каталитическим доменом составляют одно из наиболее крупных 'сверхсемейств' эукариотических белков и выполняют множество ключевых ролей в биологии и болезнях.
Фосфорилирование с помощью протеин киназ считается одним из основных механизмов, с помощью которого действительно регулируется любая активность эукариотической клетки, включая пролиферацию, экспрессиию генов, метаболизм, подвижность, транспорт мембран и апоптоз.
В сотрудничестве с Salk's resident protein kinase guru Tony Hunter и biocomputing специалистом Anne Marie Quinn, авт. 16 лет тому назад предпринял попытку определить гомологию каталитических доменов из 65 различных протеин киназ от разных эукариот (включая 45 nonorthologous энзимов позвоночных) в результат было сконструировано филогенетическое древо для визуализации их взаимоотношений. Выявление четких границ каталитического домена eukaryotic protein kinase (ePK) выявило законсервированные субдомены, которые никогда не прерывались вставками аминокислот и мотивов (Рис. 1).
Филогенетическое древо выявило большие кластеры, включая тирозин киназы (TK группа), cyclic nucleotide- и calcium-phospholipid-зависимые киназы (AGC группа; включающая семейства PKA, PKG, и PKC) и calmodulin-dependent kinases (CAMK группа). Эти группировки указывают на то, что филогения домена ePK отражает субстратную специфичность и/или способ регуляции и м. , следовательно, служить как инструмент для классификации. Последующие 7 лет авт. продолжал добавлять новые последовательности. В начале 1994, группировка доменов ePK выросла до 390 последовательностей, включая 205 non-orthologous ePKs позвоночных и четвертая большая группа ePK group (CMGC, представленная семействами CDK, MAPK, GSK, и CLK) была добавлена благодрая филогенетическому анализу. Группировка из 390 ePK доменов доступна публике на Protein Kinase Resource website [4].

Tony Hunter продолжал работать с bioinformaticians в SUGEN, Inc. (вместе с Greg Plowman, Gerard Manning, и Sucha Sudarsanam), чтобы охарактеризовать полные комплементы ePK complements модельных эукариот по данным геномных последовательностей. Их усилия привели к идентификации и классификации 115 отдельных ePKs из почкующихся дрожжей (около 2% от всех генов), 434 из Caenorhabditis elegans (примерно 2.5% от всех генов) и 223 у Drosophila. Кроме того они описали набор 'atypical protein kinases' (aPKs) у этих же видов: 15 у дрожжей, 20 у C. elegans и 16 у Drosophila. (aPKs являются вариантами протеин киназ, у которых отсутствует строгое сходство последовательностей с классическим доменом ePK, но экспериментально установлена протеин киназная активность; хорошо известными примерами являются 'lipid kinases' из семейства phosphatidylinositol 3'-kinase (PI3K), некоторые из которых, каа было показано экспериментально обладают протеин киназной активностью.)
В результате их обстоятельного анализа 'kinomes', исследователи SUGEN оказались способными выявить три новые большие группы внутри широкой ePK схемы классификации: во-первых, группа STE, которая включает ePKs, которые функционируют в MAPK киназных каскадах, которые впервые были описаны как мутации sterile у дрожжей; во-вторых, группа CK1, включающая casein kinase 1 семейство и родственные энзимы,которые главным образом распространены у червей; в в-третьих, TKL ('tyrosine-kinase like') группа, которая включает семейство STKR TGFbeta serine/threonine kinase рецепторов и филогенетически близко к tyrosine kinases (TKs). Многие отдельные семейства киназ внутри AGC, CAMK, CMGC, STE и CK1 имеют своих предстваителей от всех трех видов, подтверждаая тем самым идею раннего эволюционного происхождения и критической функции их в основных клеточных процессах. Члены групп TK и TKL, очевидно отсутствуют у дррожжей, это согласуется с известными функциями этих ePKs во внутриклеточной передаче сигналов, связанных с усложнением metazoan. Более дискуссионны эволюционные взаимоотношения между ePKs, идентифицированными SUGEN genome-mining усилиями. SUGEN kinase.com website [8] содержит ссылки на все опубликованные ими работы по анализу протеин киназ, а также на 'KinBase', очень удобную базу данных с информацией по всем генами протеин киназ у дрожжей, червей и мух, а также человека

Human protein kinases


Теперь имеется возможность определить полный набор протеин киназ у человека. Первый анализ был проведен группой Mitch Kostich в Schering-Plough Research Institute (SPRI). Группа произвела в GenBank records (available before December, 2001) BLAST поиск последовательностей eRKs используя уже известные домены ePK. В результате ими собрана коллекция в 510 потенциально уникальных ePKs у человека.
Группа SUGEN, руководимая Gerard Manning и Sucha Sudarsanam,получила более исчерпывающие данные для описания и классификации всех ePKs у человека. Они использовали помимо общедоступных баз данных, геномные данные от Celera, которые недоступны публике, и недоступные expressed sequence tags (ESTs) из Incyte и SUGEN, и они осуществляли поиск, используя hidden Markov модель ePK домена, это позволяло обнаруживать очень дивергентных членов семейств. Данные по последовательностям затем проверяли в отношении членов различных известных атипичных семейств aPK. Используя строгие критерии для удаления ложно позитивных результатов (включая верификацию новых последовательностей с помощью клонирования кДНК) они получили список из 478 членов ePK сверхсемейства у человека и дополнительно 40 aPKs, т.е. kinome человека в целом состоит из 518 (приблизительно 1.7% от всех предполагаемых генов у человека). Они идентифицировали также 106 ePK или aPK псевдогенов.
Сравнение списков SPRI-510 и SUGEN-518 выявило 474 общих протеин киназ (см. additional file). Из 44 SUGEN-специфических киназ, 32 были aPKs; др. 8 aPKs идентифицированы SUGEN, из ABC1 и RIO семейств, были включены в SPRI список как имеющие слабое сходство с ePK доменом. Из оставшихся 12 SUGEN-специфических ePKs, 5 (TAK1, MLKL, NEK5, SgK307 и TBCK) не были доступны публике и не были использованы в SPRI анализе; др. 5 (SgK196, SgK223, SgK424, SgK493, and Slob) имели довольно отличающиеся ePK домены и вряд ли обладали каталитической активностью, поэтому легко м.б. пропущены; две оставшиеся были SgK110 и NEK10. SgK110 была действительно выявлена при SPRI поиске, но ошибочно отнесена к родственным последовательностям AC008735_EPK1 (SgK069) в том же самом геномном contig; и неясно, почему группа SPRI пропустила NEK10. Большинство, если не все, из 36 SPRI-специфических ePKs были ложно положительными включениями (Табл.1): 14 соответствовали последовательностям, определенным как псевдогены в группе SUGEN group; 19 были скорее всего плохого качества дупликатами др. ePKs или межвидовыми загрязнениями; три др. были дупликатами неперекрывающихся частичных последовательностей.
Т.о., SUGEN компиляция 478 генов ePK сверхсемейства у человека представляет собой аккуратный подсчет, базирующийся на современных данных по последовательностям. represents the accurate count based on current sequence data. If one subtracts those that lack key conserved residues, we are left with 428 human ePKs with known or likely kinase function (Табл.2), 99% из которых включены в список SPRI; 365 из них распадаются на 7 больших групп: TK, 84 в целом; CAMK, 66; AGC, 61; CMGC, 61; STE, 45; TKL, 37; and CK1, 11. Остальные 63 отнесены к категории 'Other'. Krupa and Srinivasan также недавно исследовали общедоступные геномные данные; в результате они выявили 448 отдельных последовательностей ePK в геноме человека, но около 90 из них, по-видимому, представляют собой дупликаты и инми не обнаружено новых протеин киназ по сравнению со списком SUGEN.

Usefulness of the kinome data


И SUGEN и Krupa and Srinivasan распространили свой анализ, чтобы описать и др. домены, присутствующие в разных человеческих ePKs, которые скорее всего участвуют в направлении энзимов к соответ. субстратам или в модуляции киназной активности. На Рис. 2 показаны консенсусные последовательности для области каталитической петли в субдомене VIB (который включает инвариантный аспартат, и как полагают, функционирует как каталитическая база) aи области активационной петли в субдомене VIII (который включает высоко законсервированный глютамин в 'APE' мотив) - две области, которые, как считают, участвуют прежде всего в распознавании пептидного субстрата. Ряд специфичных для групп различий очевиден (подчеркнуты на Рис. 2), они коррелируют с уникальными тенденциями по распозанаванию пептидов. Помимо анализа последовательностей, kinome данные позволяют использовать современные инструменты (такие как full-length cDNAs, microarrays, антитела, а также слитые белки и RNAi конструкции), чтобы понять , как происходит передача сигналов в клетке. В качестве примера такого протеомного подхода для изучения протеин киназ, м. привести, что все дрожжевые протеин киназы были экспрессированы в бактериях и проанализированы в отношении их способности фосфорилировать ряд белковых или пептидных субстратов, используя технологтю белковых чипов. Наконец, данные kinome у человека способствуют пониманию и лечению болезней человека. Гены ePK, которые картируются внутри "болезненных" локусов, являются привлекательными этиологическими кандидатами и знание полного репертуара протеин киназ человека является важной целью в деле разработки лекарств, которые будут направлены против специфических протеин киназ или протеин киназных семейств, чья функция вносит вклад в клеточные дефекты, связанные с заболеваниями.
Сайт создан в системе uCoz