|
|
---|---|
The sequence of human chromosome 21 and implications for research into Down syndromeKatheleen Gardiner, Muriel Davisson http://genomebiology.com/2000/1/2/reviews/0002/ Genome Biology 2000 1(2): reviews0002.1-0002.9 | |
Down syndrome (DS), встречается 1 раз на
700 родов, и является наиболее частой
генетической причиной умственной
отсталости. Фенотип DS сложный и
варьиабельный, он включает умственную
отсталость и снижение познавательной
способности, дефекты сердца, гипотонию,
моторную дисфункцию, недостаточность
иммунной системы и повышенный риск
лейкемии и развития патологии болезни Alzheimer's.
Наиболее часто, DS обусловливается
добавочной копией хромосомы 21 и как
полагают фенотипические признаки DS
являются прямым следствием избыточной
экспрессии некоторых генов, содержащихся
в 21q (21p в основном содержит гены
рибосомальной РНК и др. повторяющиеся
последовательности). Выявлена полная
последовательность участка 21q - в 33.5 т.п.н. -
и идентифицировано 225 генов
(Рис.1.) | Gene number225 генов это примерно 1% от генома человека. Это существенно меньше, чем 545 генов, идентифицировнных в хромосоме 22 в том же самом количестве ДНК. Раньше картировали expressed sequence tags (ESTs) и гены, а попытки селекции кДНК указывали на то, что хромосома 21 довольно бедна генами и особенно в некоторых регионах. Предполагалось, что хромосома 21 будет иметь меньше генов, чем хромосома 22. Примерно половина хромосомы 21 является большим темным диском при окраске Giemsa, а такие диски, как известно, небогаты генами. Кроме того трисомия 21 совместима с жизнью, тогда как трисомия 22 - нет.Ранее было идентифицировано 107 генов, ассоциированных с полной кДНК, картированной в 21 хромосоме (список Swiss-PROT in March 2000). Кроме того внутри, 21q, 52 были классифицированы как псевдогены на базе отсутствия интронов, и что более важно, присутствия множественных in-frame стоп кодонов. Учитывая неспособность этих генов давать полные белки вряд ли м. полагать, что псевдогены были классифицированы неправильно. Затем с случае EST использовались только те, которые обнаруживали доказательства сплайсинга - те, что были non-contiguous с геномными последовательностями, обнаруживали consensus сплайс-сайтов и представляли существенную, более 95% идентичности, долю геномных последовательностей. Это устраняло многие артефакты, характерные для бибилиотек кДНК. EST база данных для 50 генов в хромосоме 21 содержала: 43 как spliced ESTs, 6 как unspliced ESTs (5 из них intronless гены), и один не присутствовал в dbEST. За исключением одного все 107 известных
генов были идентифицированы и с
помощью предсказания экзонов. Сюда
входят очень большие гены, такие как DSCAM,
более 800 kb, и GRIK1, более 400 kb.
Важно, что каждый из 107 уже известных генов, картированных в хромосоме 21 был идентифицирован в отсутствие белкового сходства с помощью критериев EST matches и exon prediction. Эти критерии в большинстве случаев не способны определить полную структуру генов, но указывают на присутствие генов. М. ожидать, что используя эти критерии будут идентифицированы и вновь установленные 118 генов. Гены, которые не были идентифицированы
ранее обладают следующими признаками: они
не имеют сходства с уже известными белками;
имеют очень большие интроны (>30-60 kb); и
длинные intronless 3' untranslated regions (UTRs) или с
ограниченным и/или низким уровнем
экспрессии, так что сплайсированные их EST
отсутствуют dbEST. Возможно, что
определенное количество таких генов
существует, но что они составляют
существенную пропорцию генов в хромосоме
21 мало вероятно. Дистальная треть 21q
наиболее богата генами (и GC-rich); но
межгенные расстояния здесь недостаточно
велики, чтобы содержать дополнительные
гены с большими интронами. Проксимальные две трети, нарпотив,
униформно богаты AT и имеют большие
сегменты, лишенные признаков генов; в
самом деле, имеется например сегмент в 7 Mb ,
который содержит только 7 генов. Здесь
могут располагаться гены с большими
интронами и ограниченной экспрессией.
Один аргумент говорит против - биологический: индивиды с моносомией по этой области д. иметь средней степени фенотипичские аномалии.
Почему же эти гены не обнаруживаются?
Гены с полными белками или кДНК
последовательностями идентичны или очень
сходные с известными генами (те, что
являются class 1 и class 2 генами) однозначны.
Модели генов (classes 3 and 4), однако, все еще
открыты для дальнейшего исследования и интерпретации.
The nature of chromosome 21 genesDS м. рассматривать как contiguous gene
синдром, при котором почти вся 21q область
задействована. Сегмент 21q22.2 , который
обозначается как Down syndrome chromosomal region (DSCR),
содержит гены, имеющие отношение к
аспектам DS фенотипа на базе фенотипов
некоторых случаев частичных трисомий.
Данные по частичным трисомиям показывают,
что только большая часть центромерной
области 21q м.б. исключена из рассмотрения,
особенно в отношении умственной отсталости.
Таблица 1 содержит список из 122 генов, для которых
известны некоторые функциональные
ассоциации. Функциональные заключения
базируются на частичнм или полном
сходстве генов хромосомы 21 или генных
моделей с белками или белковыми доменами,
для которых экспреиментально выявлена
специфическая функция. Напр., ZNF295
является моделью гена с открытой рамкой
считывания, которая содердит домены
цинковые пальчики. Некоторые белки с цинковыми пальчиками являются
транскрипционными факторами, так что ZBF295
м.б. отнесен к ним. В целом, гены
класифицированы настолько широко,
насколько это возможно, Так, ITGB2,
классифицируется как молекула клеточной
адгезии, хотя из-за того, что он изучен
только в лимфоцитах, он м. рассматриваться
как ген иммуной системы.
Транскрипционные факторы наиболее привлекатеьные кандидаты, т.к. дисбаланс одного из компонентов комплекса транскрипционных факторов м. нарушать эффективность активации или репрессии транскрипции генов-мишеней. Гены внутри ubiquitin пути м. нарушать скорости направления генов на деградацию. Клеточная адгезия м. играть роль в изменении скорости и степени миграции клеток во время развития. Избыточная экспрессия одного из генов калиевых каналов дисрегулирует экспрессию генов др . каналов, повреждая возбудимость нейрональной сети. Если рассмтривать умственную отсталость или cognitive нарушения, то почти любой из генов (Табл. 1) м.б. причастен. Expression dataЛишь около половины из 225 хромосомы 21 имеет какие-либо
функциональные ассоциации, а некоторые их
них довольно слабые - напр., присутствие
трансмембранного домена не является очень
определяющим. В некоторых случаях
отсутствие белка или функционального
домена м.б. обусловлено отсутствием полной
информации кодирующих последовательностей. Поэтому анализ
полных кДНК с отсутствием функциональных
ассоциаций, паттерна экспресси сможет
помочь в дальнейшем в обнаружении таких
генов. Из новых генов с неполной кДНК, 38
представлены ESTs из Soares или CGAP кДНК
библиотек . Из них только 7 классифицированы как распространенные
повсеместно - так что они присутствуют
в dbEST в более чем 30 выборках из разных
тканей. 26 ESTs ассоциированы не более, чем с 5
выборками тканей в dbEST. 5 из этих ESTs
обнаружены только в семенриках/простате, а
3 только от плодов. Эти данные указывают на
то, что новые гены внутри 21q м. иметь в
основном ограниченную экспрессию.
Относительно умственной отсталости и cognitive нарушений, гены с экспрессий специфической для головного мозга, такие как PCP4, представляют интерес. Столь же интересными являются примеры мозг специфичных alternative processing, выявляемых Intersectin и DSCAM . При анализе ряда новых gene models, alternative processing, некоторых из них оказался специфичным для головного мозга, как это обнаруживается для большинства случаев. Маловероятно, что даже большинство хорошо изученных генов проверены детельно в отношении множественности транскриптов. Т.к. они м. менять белковые последовательности и функцию, то они м. иметь отношение к DS. Evolutionary conservationГеномы Saccharomyces cerevisiae, Caenorhabditis elegans и Drosophilaполностью секвенированы и
полный набор белков для каждого из этих
организмов известен. В геноме Drosophila
идентифицировано примерно 13,500 генов. У Drosophila
идентифицировано 23 продукта, сходных с
продуктами генов хромосомы 21. Большая
часть сходств затрагивает базовые
биохимические/биологические функции и
включает такие белки как SOD1 (superoxide dismutase), GART (a purine biosynthesis enzyme), CBS (cys-tathionine beta-synthetase),
и те, что вовлечены в РНК сплайсинги
убиквитиновый путь. Далее набор из 31
гена обнаруживает информативное соответствие,
но олько для доменов или субрегионов
белков человека. Ранее известные гомологи,
включают MNB (minibrain) и SIM2 (single-minded).
Интересными в обоих наборах этих генов
являются те, о которых нет или мало
функциональных данных. Таблица 2
содержит список известных и новых генов 21
хромосомы с частичным или полным
сходством с Drosophila. Среди новых генов,
идентичность на аминокислотном уровне до 64% (c21orf19)
и более 1,600 остатков (c21orf5). В некоторых
случаях длины человеческого и Drosophila
белков существенно различны. Выявление
мутантных фенотипов у Drosophila сможет
пролисть свет на функцию генов,
гомологичных у человека.
Mouse modelsОбласти хромосомы 21 человека законсервированы в сегментах трех
хромосом мыши. Проксимальная к центромере
область хромосомы 21 с MX генами
гомологична теломерной области мышиной
хромосмы 16 (Рис. 1). Следующий примерно в 2 Mb сегмент
хромосомы 21 гомологичен проксимальной к
центромере области мышиной хромосомы 17, и
теломернаые 2 Mb хромосомы 21 iгомологичны
внутреннему сегменту мышиной хромосомы 10.
Гомологи 21 хромосомы в сегментах
мышиных хромосом 16 и 10 по-видимому,
полностью законсервированы. Напр.,
наиболее близким к центромере геном на
хромосоме 21, выявленным на карте мышиной
хромосомы 16 является STCH. Имеется 7
генов проксимальнее его, которые еще
необходимо картировать у мыши. Сходным
образом, хотя и известно, что Mx
картируется в мышиной хромосоме 16 , а Tff3, Cbs
и Crya в хромосоме 17, однако имеется 11
между и среди них, расположение которых у
мыши неизвестно. Наконец, PDXK является
наиболее проксимальным геном хромосомы 21,
картированным в мышиной хромосоме 10. Гены
этой области досольно малы, однако,
дополнительные гены хромосомы 21 м.б.
локализованы на мышиной хромосоме 10 между Pdxk
и соседней областью гомологии с
хромосомой 19 человека.
Лучшей мышиной моделью DS являются мыши с сегментной трисомией по хромосоме 16 , Ts65Dn и Ts1Cje. Ts65Dn трисомны по области, заспространяющейся на неизвестное расстояние проксимальнее App через Mx и, по-видимому, до теломеры 16. Фенотип Ts65Dn включает нарушения работы памяти и дефицит долговременной памяти; задержка развития и малый вес тела; моторная дисфункция; пониженная чувствительность к боли; гиперактивность; и пониженная способность to inhibit behavior. Особенно интересны наблюдения связанной с возрастом потери холинергических нейронов, уменьшение числа асимметрических синапсов в temporal cortex, аномальные количества нейронов в областях гиппокампа и недостаточность beta-noradrenergic трансмиссии в гиппокаме и коре головного мозга. Некоторые из этих дефектов наблюдаются и при DS. Таблица 3a содержит список из 32 генов, найденных ближе к центромере по отношению Alzheimer's-ассоциированному гену APP хромосомы 21. Большинство из них м. присутствовать только в двух копиях у Ts65Dn и, следовательно, не вносят вклада в фенотипические свойства. Ts1Cje мыши трисомны по обасти мышиной хромосомы 16 от Sod1 через Mx (и снова до telomere). В отличие от Ts65Dn, Ts1Cje обнаруживают гипоактивность, не обнаруживают потери холинергических нейронов и не обнаруживают дефектов в части видимой платформы в тесте water maze (который тестирует только память, а не способность пространственных корреляций) . Таблица 3b содердит список из 27 генов, которые как полагают трисомны у Ts65Dn , но дисомны у Ts1Cje. Пока м. заключить, что эти гены отвечать за фенотипические различия, но следует помнить о генетических отличиях их генетического фона. Сегментные трисомии по областям хромосомы 21 гомологичным мышиным хромосомам 17 и 10 не существуют. ЕслиMx является наиболее теломерным геном хромосомы 16 мыши, а Pdxk наиболее центромерный в мышиной хромосоме 10, то имеется 33 генов внутри примерно 2.2 Mb области мышиной хромосомы 17 region (Табл. 4) и 50 генов внутри примерно 2.9 Mb области мышыной хромосомы 10. Добавим максимум 32гена не трисомных у Ts65Dn, половину генов, гомологичных генам хромосомы 21, которые нетрисомны у Ts65Dn. Фенотипческие следствия этих генов д.б. как-то выявляться, т.к. Ts65Dn не содержат некоторые признаки DS. Конструируя трансгенных мышей по одиночному гену и затем комбинируя их с Ts65Dn будет тяжелой работой с ограниченны успехом. Альтернативой м.б. получение дополнительных сегментных трисомий с использованием Cre-lox системы . Бр4 class=my>From genes to functions Анализ полных последовательностей хромосомы 21 это первый взгляд на всех кандидатов в DS гены. Необходима верификация и переопределение предсказанных incomplete gene models, определение new models и выделение полной кДНК для каждого гена. Зная полные кодирующие последовательности белки м.б. исследованы по мотивам, доменам и биохимическим характеристикам, которые м. указывать на функцию. Более 100 генов распределены по хромосоме, чья функция неизвестна. Для этих и др. генов 21q детальный анализ экспрессии м.б. информативным.
Наиболее прямым определением функции будут мутации или избыточная экспрессиия индивидуальных генов или наборов генов. Изучение их гомологов в модельных системах м. помочь в интерпретации их функцииНаиболее пригодным модельным организмом остается мышь. Многие гены м.б. 'добавлены' к Ts65Dn, используя трансгенетику носителей bacterial chromosomes (BACs),чтобы выявить фенотипические изменения. Использование для этого человечестких последовательностей будет гарантировать, что клоны содержат соотвествующие регулятоные области. Нокаут одиночных генов 'subtracted' из Ts65Dn мышиных моделей, также пригоден для поиска улучшений фенотипов.
|