Ползователи:
ОБРАТНАЯ МЕТАБОЛОМИКА



Обнаружение химических структур у человека

Reverse metabolomics for the discovery of chemical structures from humans
Emily C. Gentry, Stephanie L. Collins, Morgan Panitchpakdi, et al.
Nature volume 626, pages419–426 (2024)

Determining the structure and phenotypic context of molecules detected in untargeted metabolomics experiments remains challenging. Here we present reverse metabolomics as a discovery strategy, whereby tandem mass spectrometry spectra acquired from newly synthesized compounds are searched for in public metabolomics datasets to uncover phenotypic associations. To demonstrate the concept, we broadly synthesized and explored multiple classes of metabolites in humans, including N-acyl amides, fatty acid esters of hydroxy fatty acids, bile acid esters and conjugated bile acids. Using repository-scale analysis1,2, we discovered that some conjugated bile acids are associated with inflammatory bowel disease (IBD). Validation using four distinct human IBD cohorts showed that cholic acids conjugated to Glu, Ile/Leu, Phe, Thr, Trp or Tyr are increased in Crohn’s disease. Several of these compounds and related structures affected pathways associated with IBD, such as interferon-? production in CD4+ T cells3 and agonism of the pregnane X receptor4. Culture of bacteria belonging to the Bifidobacterium, Clostridium and Enterococcus genera produced these bile amidates. Because searching repositories with tandem mass spectrometry spectra has only recently become possible, this reverse metabolomics approach can now be used as a general strategy to discover other molecules from human and animal ecosystems.
Аннотирование метаболома человека еще далеко не завершено. Типичное нецелевое метаболомическое исследование образцов, полученных от человека, может сопоставить около 10 % данных со структурой5-9. Поэтому необходимы стратегии для структурной оценки того, какие молекулы встречаются в организме человека. Структурные знания необходимы научному сообществу для того, чтобы предположить, как образуются молекулы и какова их функциональная роль в биохимических путях, а также для определения их участия в развитии и прогрессировании заболеваний. В течение последних двух столетий выделение соединений с последующей структурной характеристикой было краеугольным камнем открытия малых молекул, но это непрактично для образцов человека. В последнее время было разработано несколько методов выяснения структуры биологических молекул, включая атомно-силовую микроскопию с использованием одной молекулы10, совместную кристаллизацию малых молекул в кристаллических решетках11,12 и методы с использованием кристаллических порошков13. Тем не менее, ни один из этих подходов не достигает той пропускной способности, которая необходима для получения структурных данных для тысяч молекул, регистрируемых масс-спектрометрами высокого разрешения. Существует множество вычислительных стратегий для сопоставления структур с данными масс-спектрометрии (MS), но прогнозы не имеют простого пути для проверки того, какие из возможных сопоставлений структур являются правильными14-16.
Reverse metabolomics


Чтобы дополнить существующие стратегии выяснения структуры и обогатить биологическую информацию, доступную для известных или недавно открытых молекул, мы представляем обратную метаболомику. Обратная метаболомика оценивает, можно ли найти определенный спектр тандемного MS (MS/MS) в открытых нецелевых наборах данных метаболомики. Обратная метаболомика позволяет нам получить представление о фенотипах (например, здоровье и болезни), видах и типах образцов, связанных с определенным спектром MS/MS, путем поиска метаданных, связанных с каждым публичным набором данных.
Чтобы продемонстрировать эффективность обратной метаболомики в данной работе, мы сначала использовали комбинаторный синтез для создания сложных смесей потенциальных метаболитов. Затем были получены данные MS/MS для соединений, входящих в состав синтетических смесей17. Чтобы оценить возможности нашей стратегии обратной метаболомики, мы создали MS/MS-спектры для четырех классов метаболитов, представляющих интерес: N-ацил-амидов, эфиров жирных кислот, эфиров желчных кислот и амидатов желчи. Присутствие этих молекул искали в публичных наборах данных не-целевой метаболомики18 с помощью mass spectrometry search tool (MASST)1 и суммировали информацию об образцах из доступного пользовательского интерфейса reanalysis of data user interface (ReDU)2 (рис. 1a-d). MASST осуществляет поиск спектров фрагментации MS/MS по 1,2 млрд общедоступных спектров MS/MS. ReDU позволяет анализировать и фильтровать публичные данные по организму, состоянию заболевания, фенотипу, биообразцу и другим метаданным или описаниям образца. Были получены MS/MS-спектры для 2 430 молекул, и 31 % этих спектров были найдены в человеческих данных (уровень аннотации 2 или 3)19. На основании анализа обратной метаболомики можно было предположить, что существует сильная ассоциация между микробными амидатами желчи и IBD. Затем эта связь была подтверждена в нескольких когортах больных IBD.

Fig. 1: Overview of reverse metabolomics and the synthetic strategies used to obtain standards for MS/MS in this work.

The reverse metabolomics portion starts with MS/MS to associate with sample information (phenotype, species and sample type), whereas the synthesis portion is an approach to obtain the MS/MS spectra. a, Workflow for the reverse metabolomics strategy using LC–MS/MS and MASST and ReDU data analyses tools and platforms. b, Synthesis scheme for acyl amides and esters. FAHFA, fatty acid ester of hydroxy fatty acid. c, Combinatorial bile acid conjugation reaction performed for the discovery of bile amidates. d, Representative mirror plots of example MS/MS matches of one of the synthesized standards for each class of molecule with MS/MS data in the public domain.


Обратная метаболомика предлагает особый подход к исследованию биологических фенотипов в рамках определенного класса соединений. После подтверждения новой структуры она интегрируется в существующую базу знаний о биохимических и метаболических моделях, что позволяет научному сообществу формулировать гипотезы о биологических ролях и выявлять потенциальные диагностические биомаркеры.
Acyl amide and ester searches
...

... Fig. 2: Repository-scale analysis of public MS data…
Далее мы использовали ReDU, чтобы выяснить, где эти соединения встречаются в открытых данных и как они связаны с фенотипами здоровья. Большинство спектральных совпадений с синтетическими амидами и эфирами было получено из образцов животных, в основном людей и мышей (расширенные данные рис. 2a и 3b). Синтезированные амиды чаще всего наблюдались в образцах фекалий, слепой кишки и кожи, тогда как сложные эфиры - в различных типах тканей (рис. 2b и расширенные данные рис. 2c и 3b). Некоторые из них были относительно распространены в определенных типах образцов. Например, 48 % образцов человеческого грудного молока, помещенных в ReDU, содержали по крайней мере один синтезированный эфир, и наиболее часто наблюдался эфир олеиновой кислоты гидрокси стеариновой кислоты (OAHSA). N-ацил-амиды были широко обнаружены в культурах микроорганизмов (расширенные данные, рис. 2b), но только два эфира были найдены в наборах данных микроорганизмов. MS/MS совпадения с OAHSA были обнаружены в культурах Vibrio mediterranei. Еще одно MS/MS совпадение, с пальмитолеиновым эфиром гидроксипальмитиновой кислоты, было обнаружено в наборе данных Leucoagaricus. N-ацил-амиды чаще обнаруживались в образцах, помеченных как IBD, но набор данных, в котором они были обнаружены, был получен из образцов, собранных у одного человека, за которым велось наблюдение в течение нескольких лет (расширенные данные, рис. 2c). Эти ассоциации не наблюдались ни для категории Crohn’s disease (CD), ни для категории язвенного колита (UC), которые содержат данные из других когорт больных IBD. Этот результат подчеркивает важность возможности подтвердить наблюдение во многих наборах данных и больших популяциях. Таким образом, важным преимуществом нашего метода является то, что он позволяет с большей уверенностью предлагать потенциальные биомаркеры. Это связано с тем, что поиск ведется по всем открытым данным, а ассоциации возникают на основе множества наборов данных с похожим или идентичным фенотипом.
Analysis of bile amidates...


Структурная характеристика желчных кислот, впервые описанная в 1848 году (ссылка 26), имеет долгую историю. Первоначально желчные кислоты были открыты благодаря их роли эмульгаторов при переваривании жиров. Сейчас известно, что они регулируют иммунный ответ хозяина и сигнальные пути, а также играют важную роль во взаимодействии хозяина с микробами27. Они существуют в различных формах - свободные карбоновые кислоты, конъюгаты гидроксильных групп и амидные конъюгаты (так называемые амидаты желчи) - и все они жизненно важны для поддержания здоровья хозяина28.
Здесь мы сосредоточились на амидатах желчи, наиболее часто встречающимися из которых являются конъюгаты с Gly и таурином (Tau), хотя описаны и некоторые редкие аналоги...29-32.
В общей сложности 1 742 файла, или около четверти файлов со спектральными соответствиями этим новым желчным кислотам, также находились в ReDU, где содержится информация об образцах, использующая стандартизированные онтологии и словари, которые мы использовали для обратной метаболомики. Из них 21 % были получены из образцов человека. Синтезированные конъюгированные желчные кислоты были обнаружены в фекалиях и тканях кишечника, но в крови и печени они обнаруживались реже или не обнаруживались вовсе, что позволяет предположить, что эти молекулы не попадают в энтерогепатическую циркуляцию, разбавляются ниже уровня обнаружения или модифицируются до попадания в циркуляцию (рис. 2c). Двенадцать, в основном ароматические или заряженные конъюгаты аминокислот, были обнаружены в образцах желчного пузыря различных видов позвоночных, кроме человека, мышей и крыс. Далее мы изучили, как различные структуры конъюгированных желчных кислот связаны со статусом здоровья в публичных данных. Определенные конъюгации, в частности с Glu, Ile/Leu, Phe и Trp, наблюдались чаще во всех типах образцов с IBD (описанных как IBD, CD и UC) по сравнению с образцами от здоровых людей, у которых не было зарегистрировано никаких заболеваний (рис. 2d). Образцы также были разделены в ordination space (Jaccard) по состоянию здоровья исключительно на основании различий в составе этих синтезированных желчных кислот (расширенные данные, рис. 4c). Учитывая, что эти ассоциации основаны на данных о присутствии-отсутствии, полученных в результате MS/MS-сопоставления, мы предположили, что эти желчные кислоты чаще встречаются у пациентов с IBD по сравнению со здоровыми людьми, что приведет к тому, что MS/MS-сканирование этих молекул будет чаще срабатывать в образцах IBD. Чтобы проверить эту гипотезу, мы изучили относительное содержание новых желчных амидатов в наборе данных, полученных от пациентов с IBD и от людей без IBD37. Относительные площади пиков нескольких желчных кислот были выше в образцах от пациентов с IBD, чем в образцах от здоровых людей. Этот результат согласуется с наблюдениями спектрального подсчета, проведенного с использованием всех совместимых открытых данных (рис. 2е). Используя когорту педиатрических пациентов с IBD, мы также изучили, как изменяется содержание этих желчных кислот в ответ на прием антибиотиков. У младенцев, получавших антибиотики, уровень микробных желчных кислот был ниже, чем уровень конъюгатов Gly и Tau, производимых хозяином, который был выше у пациентов, не получавших антибиотики (рис. 2f). Поскольку речь идет о предполагаемых ассоциациях, мы решили подтвердить наши выводы в двух отдельных когортах больных IBD, используя совершенно другую метаболомическую платформу. Этот эксперимент также послужил независимым подтверждением существования этих желчных кислот в организме человека с использованием данных, которые не являются частью экосистемы Global Natural Product Social Molecular Networking (GNPS), MASST или ReDU.
Validation of the IBD association


Независимая оценка ассоциации этих желчных кислот с IBD была достигнута с помощью данных и образцов из продольного интегративного проекта Human Microbiome Project 2 (iHMP2) и поперечных когорт PRISM IBD38,39. В этих исследованиях образцы кала собирались у участников без IBD, с UC или с CD. Затем фекальные экстракты объединяли и анализировали со смешанными стандартами желчных кислот, чтобы сопоставить время удерживания и MS/MS-спектры в одном и том же эксперименте (рис. 3а и расширенные данные рис. 6а). В большинстве примеров время удерживания и данные MS/MS совпадали с одним единственным стандартом из четырех возможных изомеров с одинаковым временем удерживания. Однако мы не можем исключить возможность совпадения с другими изомерами, которые еще не известны (и поэтому не тестировались), что является общим ограничением экспериментов по метаболомике на основе MS. Большинство изомеров, таких как Glu-CDCA и Glu-конъюгированная дезоксихолевая кислота (DCA), можно было разрешить с помощью хроматографического разделения (рис. 3а). Однако в некоторых случаях изомеры не удавалось разделить с помощью хроматографии, например Met-CDCA или DCA и Tyr-конъюгированная гидеодезоксихолевая кислота (HDCA) или урсодезоксихолевая кислота (UDCA). В таких случаях указываются оба названия (рис. 3а,б). Всего в наборе данных iHMP2 IBD мы наблюдали 63 конъюгата желчных кислот, 45 из которых имеют данные относительного количественного определения (рис. 3а и расширенные данные рис. 6а) и 19 из которых также были обнаружены в когорте PRISM (расширенные данные рис. 5). В соответствии с нашими предыдущими результатами, желчные кислоты, конъюгированные с Cit, Glu, His, Ile/Leu, Phe, Thr, Trp и Tyr, были обнаружены в большем количестве у пациентов, страдающих CD, по сравнению с лицами без IBD (рис. 3а и расширенные данные рис. 6а). В частности, амидаты первичных желчных кислот (например, амидаты холевой и хенодезоксихолевой) были выше при CD, в то время как амидаты дезоксихолевой и связанных с ней вторичных изомеров желчных кислот оставались неизменными по сравнению с образцами, полученными от лиц без IBD. Используя дополнительную отдельную когорту больных IBD, мы количественно проанализировали, как обилие конъюгированных желчных кислот связано с активностью симптомов при CD по сравнению с UC (рис. 3б и расширенные данные рис. 6б). В целом, 11 из 19 желчных кислот, которые были определены количественно, были значительно повышены у лиц с активными симптомами, но только в группе CD. Аналогичная тенденция не наблюдалась при UC. Поскольку обнаруженные желчные кислоты могут играть важную роль в IBD, мы задались целью оценить, обладают ли они биологической активностью. Поэтому мы индивидуально синтезировали конъюгаты желчных кислот, которые имели наибольшее количество в когорте iHMP2 IBD, и проверили их на активность в путях, связанных с IBD.

Fig. 3: IBD association of new conjugated bile acids...

Поскольку желчные кислоты могут оказывать иммуномодулирующее действие, один из путей, представляющих интерес, - это опосредованная желчными кислотами иммунная дисфункция. В ряде недавних исследований было обнаружено, что CA, CDCA и два вторичных метаболита литохолевой кислоты могут влиять на гомеостаз Т-клеток40,41. Мы предположили, что некоторые из наших ведущих желчных кислот также могут дисрегулировать иммунные реакции хозяина, поэтому мы проверили синтезированные нами желчные кислоты на иммуномодулирующую активность. Пять из конъюгированных желчных кислот (Met-CDCA, Met-DCA, Phe-CDCA, Trp-CDCA и Tyr-CDCA) повышали уровень интерферона-γ (IFNγ), но оказывали ограниченное влияние на интерлейкин-17 (IL-17) (рис. 3c). Примечательно, что Trp-CDCA приводил к шестикратному увеличению уровня IFNγ, ключевого цитокина, участвующего в патогенезе CD3.
Считается, что рецептор прегнан X (PXR), ядерный рецептор желчных кислот, участвующий в транспорте и метаболизме ксенобиотиков, также играет ключевую роль в развитии IBD. В частности, агонисты PXR, являющиеся полусинтетическими производными рифамицина (например, рифаксимин и рифампицин), были изучены для лечения IBD в клинических испытаниях, а снижение экспрессии PXR было связано с IBD и CD4,38,39,42-46. Поэтому, поскольку желчные кислоты также являются известными агонистами PXR, мы протестировали наиболее распространенные желчные кислоты в наборе данных iHMP2 против человеческого PXR и обнаружили, что Thr-CA, Glu-DCA и Glu-CDCA действуют как агонисты (расширенные данные рис. 7a,b). Затем эти соединения-кандидаты были добавлены в органоидную ткань тонкого кишечника для проверки их влияния на активность PXR. Добавление Glu-CA и Glu-CDCA усиливало активацию PXR и значительно повышало экспрессию гена-мишени Cyp3a11, расположенного ниже по течению от PXR, даже при концентрации 10 µМ (расширенные данные рис. 7c). В совокупности эти результаты подтверждают гипотезу о том, что некоторые из недавно открытых желчных кислот могут играть важную роль в развитии IBD через PXR и/или иммуноопосредованные процессы. Мы предполагаем, что полученные результаты могут также объяснить, почему не все пациенты отвечают на лечение рифаксимином в клинических исследованиях, поскольку у некоторых пациентов микробиота может уже вырабатывать большое количество агонистов PXR. Для полного понимания физиологической роли этих желчных кислот в биологии IBD необходимо провести дополнительную работу. Однако эти результаты показывают, что обратная метаболомика может открывать новые молекулы, которые биологически активны в организме человека.
Microbial production of bile amides


Бактерии участвуют в превращении желчных кислот, полученных от хозяина, во вторичные желчные кислоты. Предыдущие сообщения нашей группы показали, что бактерии способны производить некоторые конъюгированные желчные кислоты ex vivo33,35. Кроме того, результаты, полученные у педиатрических пациентов с IBD, получавших лечение антибиотиками, подтверждают гипотезу о том, что эти желчные кислоты могут продуцироваться микробиотой кишечника (рис. 2f). Для дальнейшего изучения масштабов этой микробной конъюгационной химии мы проверили 202 изолята из первого проекта "Микробиом человека "47 на способность к конъюгации желчных кислот. Бактерии, выделенные из микробиома кожи, кишечника и влагалища, были разнообразны и включали 36 различных родов, в том числе Bacteroides, Bifidobacterium, Clostridium и Lactobacillus. Каждый штамм культивировали в двух экземплярах в течение 72 часов в богатой аминокислотами среде, включающей муцин и 500 мг л-1 дополнительной смеси желчных кислот, включающей CA, DCA, CDCA и их конъюгаты Tau и Gly (расширенные данные рис. 8a,b).
Liquid chromatography (LC)–MS/MS анализ экстрактов из этих культур показали, что основными бактериальными продуцентами были представители родов Actinobacterium, Bacillus, Clostridium и Fusobacterium, хотя некоторое количество конъюгированных желчных кислот также было обнаружено в культурах видов Bacteroidia. (рис. 4a-c и дополнительная таблица 4). В целом, большинство бактерий были способны производить несколько различных конъюгаций аминокислот. Мы обнаружили холевые и дезоксихолевые амидаты для 15 аминокислот, которые не были обнаружены в контрольных образцах (контроль среды и контроль экстракции) или образцах культуры в начале эксперимента (t = 0 ч; рис. 4c). Было обнаружено больше дезоксихолевых конъюгатов, чем СА-конъюгатов. Кроме того, ионы-предшественники других желчных кислот, а именно конъюгатов Asp, Trp и Val, были обнаружены в культурах с правильным временем удерживания, но их количество было слишком мало, чтобы вызвать фрагментацию MS/MS, и их можно было только предположительно идентифицировать без спектрального сопоставления MS/MS.

Fig. 4: Bile acid conjugations observed in HMP isolates cultured in fecal growth medium containing CA and DCA...

...Благодаря дополнительной специфичности разделения ионной подвижностью, все синтезированные изомеры в наших восьми синтетических смесях, за исключением конъюгатов Ile и Leu, могли быть разделены. Аналогично результатам LC-MS/MS в режиме положительной ионизации, в культуральных экстрактах мы наблюдали разнообразные конъюгаты аминокислот, всего 18, которые соответствовали CA и DCA. Также присутствовали амидаты CDCA, в частности, конъюгированные с полярными аминокислотами Arg, Asp и Glu. Примечательно, что конъюгаты Arg были сопоставлены исключительно с формой CDCA35 (рис. 4e и расширенные данные рис. 8a). Ни один из новых конъюгатов желчных кислот не наблюдался в контрольной среде или в момент инкубации t = 0. Грамположительные бактерии, принадлежащие к родам Bifidobacterium, Enterococcus, Clostridium, Cellulosilyticum и Catabacter (недавно переименованный в Christensenella)48, большинство из которых являются представителями филума Firmicutes, продуцировали наибольшее количество и разнообразие конъюгированных желчных кислот. Эти наблюдения согласуются с результатами предыдущего исследования35, в котором 72 микроба были обследованы на предмет конъюгации желчных кислот и предложены структуры конъюгированных желчных кислот, однако ни одна из них не была подтверждена с помощью стандартов. Мы также обнаружили, что грамотрицательные Fusobacterium могут продуцировать конъюгированные желчные кислоты. В совокупности эти результаты показывают, что бактерии участвуют в большем количестве модификаций желчных кислот, чем считалось ранее, и многие из них сейчас также открыты в других исследованиях36,49,50.
Conclusion


Метод обратной метаболомики позволил расширить знания о метаболизме с помощью простых химических превращений. Здесь мы выбрали три класса метаболитов, представляющих интерес, провели поиск около 2 000 уникальных соединений в открытых данных и обнаружили несколько соответствующих ассоциаций с заболеваниями. Этот метод может быть распространен на любой синтетически доступный класс соединений, способных ионизироваться и фрагментироваться в масс-спектрометре. Наше исследование показало ценность публичных данных метаболомики - растущего ресурса, объем которого стал удваиваться каждые 2 года. По мере того как все больше данных будет становиться общедоступными с помощью сообщества, обратная метаболомика станет еще более информативной. Мы продемонстрировали, что можем связать вновь обнаруженные желчные кислоты с фенотипами заболеваний, что в конечном итоге может иметь диагностическое значение для точного и неинвазивного выявления CD. Мы также обнаружили, что эти желчные кислоты могут опосредовать процессы IBD через регуляцию иммунной функции хозяина и PXR-сигнализации. В конечном итоге, чтобы полностью понять метаболизм человека (и других животных) и предложить функциональную роль метаболитов, мы должны быть в состоянии обнаружить и аннотировать большинство молекул. Как только структура молекул будет установлена и появятся химические стандарты, эти молекулы станут частью традиционного направления "вперед" метаболомики и количественного анализа. Для молекул, которые хорошо ионизируются и фрагментируются в MS, обратная метаболомика станет одним из ключевых инструментов в инструментарии для выяснения структуры и открытия новых метаболитов, полученных от хозяев и микробиомов.
Помимо общих ограничений MS, уже рассмотренных в тексте и Дополнительных методах, метаболиты должны присутствовать в достаточном количестве или хорошо ионизироваться, чтобы быть обнаруженными и отобранными для получения MS/MS, поскольку обратная метаболомика требует MS/MS спектра. Здесь мы рассмотрели это ограничение с помощью комбинаторного синтеза; однако, чтобы использовать эту стратегию, исследователь должен иметь некоторую гипотезу в отношении структур, представляющих интерес. Основные биологические строительные блоки и простые метаболические трансформации могут привести к миллионам молекул-кандидатов, но более сложные молекулы более труднодоступны, что приводит к значительному снижению пропускной способности. Существуют и другие стратегии получения спектров MS/MS кандидатов, такие как вычислительное предсказание или непосредственно из не-целевого метаболомического эксперимента LC-MS/MS, которые могут быть использованы для MASST-поиска в экспериментах по обратной метаболомике. Мы проверили наши эксперименты, используя биологические образцы (фекалии человека и/или культивированные микроорганизмы), чтобы сопоставить хроматографическое время удерживания, MS/MS и время дрейфа (если доступно) стандартов для поддержки вывода структурной аннотации. Однако без выделения и ЯМР- или рентгеноструктурных анализов нельзя исключить возможность того, что в данных представлены различные изомеры. Наконец, 1,2 миллиарда спектров, которые в настоящее время входят в поиск MASST, не охватывают всех молекул. Это ограничивает повторные анализы публичных данных на этапе открытия в рамках данного подхода. Один из подходов к решению этой проблемы - поощрение размещения открытых данных, особенно с метаданными2,18.