Хотя функции тысяч вариантов были определены, используя подходы функционального скрининга1-6, базирующиеся на нокаутах генов и активации, скрининге др. генетических свойств, таких как single nucleotide variants (SNVs) и структурные варианты, однако, исследовать родственные фенотипы затруднительно из-за трудностей внесения и анализа этих генетических признаков для объединенного скрининга. Среди этих генетических признаков SNVs встречаются наиболее часто и они ассоциируют со многими болезнями у людей7. Напр., мутации, связанные с резистентностью к лекарствам и чувствительностью к раку, влияют как на прогноз терапии, так и прогрессирование болезни. В связи с функцией SNVs, oligo-mediated насыщающее редактирование, базирующееся на репарации, направляемой гомологией, делает возможным мутагенез, затрагивающий одиночные основания8, но такой подход ограничен одиночным локусом из-за трудностей приготовления и ограничений в размере oligos, состоящих из разного типа SNVs. Альтернативный подход базируется на CRISPR RNA-guided деаминазе9, который делает возможным специфический и эффективный мутагенез за счет множественных переходов от C к T в в регионе связывания гид РНК (guide RNA) без необходимости присутствия матричной ДНК . Даже при небольшом количестве непреднамеренных мутаций, таких как indels и множественные варианты нуклеотидов, они могут быть внесены одновременно, так обусловливающие болезнь missense мутации могут быть генерированы и проанализированы с использованием этой техники. Однако, такой подход, обычно использующийся только для мультигенных нокаутов10 и множественных точечных мутаций во многих генах, остается трудным из-за трудностей анализа множественных внесенных мутаций, поскольку все мутации д. быть проанализированы индивидуально с помощью амплификации и глубокого секвенирования каждого локуса.
Т.к. методы, описанные выше, базируются на анализе популяций и поэтому зависят от количества клонов, данные относительно только доминантных клонов получаются при использовании RIGER12 и др. сходных статистических алгоритмов13. Однако, недавно разработанные техники, такие как CRISP-seq14, Perturb-seq15 и CROP-seq16, которые действуют подобно рычажной передаче от RNA-seq одиночных клеток, делая возможным анализ разных фенотипов и пертурбаций внутри каждой клетки путем интеграции как считывания экспрессии генов, так и базирующихся на CRISPR пертурбаций. Для выявления пертурбаций, CROP-seq использует вектор, которые добавляет poly(A) хвост к sgRNA транскрипту, тогда как Perturb-seq и CRISP-seq генерируют "perturbation barcode", сцепленный с sgRNA. Кстати, использование данных методов довольно ограничено в исследованиях пертурбаций, ассоциированных с нокаутными мутациями и мутациями регуляции транскрипции17, генерируемых при использовании CRISPR библиотеки на уровне одиночных клеток, при этом остаются затруднения при исследовании пертурбаций точковых мутаций. Однако, недавнее сообщение продемонстрировало спектр субклональных точковых мутаций в одной и той же опухоли, что важно для прецизионной медицины и иммунотерапии18. Это сообщение подчеркивает необходимость в атласе профилей транскрипции, ассоциированных с SNVs.
Чтобы исследовать мириады SNVs, которые затрагивают биологические функции, необходим высоко-производительный, объединяющий скрининги метод замены мутаций, который позволяет анализировать сгенерированные мутации путем отслеживания sgRNAs. Здесь мы продемонстрировали ранее неописанный метод комбинирования CRISPR RNA-guided deaminase и технологии CROP-Seq , который позволил вносить SNVs во многие гены и отслеживать их влияние на на функцию помимо анализа пертурбаций в одиночных клетках. Чтобы подчеркнуть пригодность нашей платформы, мы генерировали мутации замен в каждом экзоне трех генов человека (MAP2K1, KRAS, NRAS), ассоциированных с резистентностью к vemurafenib
19,20, который является противораковым лекарством, нацеленным на BRAF V600E мутации у пациентов с меланомой. Затем мы скринировали точечные мутации, которые наделяли резистентностью к vemurafenib, анализировали пертурбации в индивидуальных устойчивых клонах и оценивали показатели экспрессии генов в индивидуальных клонах. Наконец, мы отбирали финальные sgRNAs кандидаты и подтверждали присутствие мутационной последовательности путем амплификации регионов кандидатов генома, которые были экстрагированы из отредактированного пула клеток.
Discussion
В данном исследовании мы создали платформу, скомбинированную из CRISPR RNA-guided deaminase и технологии scRNA-seq, которая позволила вносить мутации замен во многие гены и облегчить их функциональный скрининг и измерять пертурбации в одиночных клетках. Мы продемонстрировали появление мутаций замен в каждом экзоне трех генов, а скрининг на мутации замен, обеспечивающих устойчивость к vemurafenib при использовании популяционного анализа.
Мы впервые наблюдали увеличение количества #176 sgRNA при количественном анализе sgRNA и обратили внимание на #56, #126 и #217 sgRNAs как дополнительные sgRNA кандидаты в результате транскриптомного анализа. Из этих отобранных sgRNAs, чье целенаправленное воздействие происходит вблизи последовательности, кодирующей последовательность E203 гена MAP2K1 и Q61 гена KRAS (#176, #56) , генерирующих соотв. мутации и индуцирующие разные изменения транскрипции.
Результаты популяционного анализа продемонстрировали увеличение E203K мутаций замен в MAP2K1, что согласовалось с предыдущим исследованием19. Даже если паттерн мутаций замен (c.607 G > A, c.609 G > A) отличается от естественно возникающих замен (c.607 G > A), варианты, которые дают ту же самую замену аминокислот (E203K), были многочисленны при отборе с vemurafenib. This resultЭи результаты подчеркивают, что наша платформа может быть пригодна для скрининга клинически значимых SNVs. Следовательно, наша платформа обладает теми же самыми преимуществами, что и др. методы объединенного (pooled) скрининга36. Кроме того, путем использования scRNA-seq технологии, мы идентифицировали также сигнатуры SNVs на транскрипционном уровне. Мы наблюдали активацию генов, ассоциированных с иммунными реакциями вместе с внесением E203K мутации в клетки и активацию передачи сигналов chemokine в клетках с внесенными indel. Indels были особенно сконцентрированы в локусе Q61 гена KRAS , а in-frame indels доминировали над frame-shift indels.
Мы полагаем, что механизм проверки допустимости процедуры очень важен для избежания неправильной интерпретации, поскольку непредусмотренные мутации также могут быть обогащены при отборе, такие как indels, внесенные с помощью sgRNA #56 в ген KRAS. Недавнее исследование с использованием целенаправленного AID описало внесение множественных SNVs и оценку эффекта внесенных SNVs на механизм резистентности к imatinib11. Внесенные SNVs были подтверждены и оценены с помощью амплификации подвергшихся целевому воздействию экзонов, используя геномную ДНК. Однако, эта технология оказалась трудной для экспансии на множественные гены или множественные экзоны, поскольку технология требовала амплификации индивидуальных регионов для подтверждения. Множественные PCR реакции необходимы для подтверждения индивидуальных локусов. С др. стороны, наша платформа использует лентивирусом экспрессируемые sgRNA, которые могут быть отслежены с помощью одной амплификации интегрированной sgRNA, так что мы можем распространить нашу технологию, чтобы она включала все экзоны трех генов. Комбинация этого подхода sgRNA с анализом транскриптома позволяет сузить пределы с помощью отфильтровывания маргинальных sgRNAs. Т.о. необходимо только небольшое число PCR реакций, которые целенаправленно отберут кандидатов, чтобы подтвердить, какие мутации были внесены.
Улучшение эффективности преобразований может предоставить более аккуратную оценку пертурбаций, ассоциированных с индивидуальными sgRNAs. Базирующееся на нокауте исследование сообщает, что примерно 70% клеток. несущих sgRNA может быть отредактировано с использованием sgRNA4. Напротив, эксперименты с использованием BE3 показывают, что 5-20% клеток, несущих sgRNA, может быть отредактировано с использованием sgRNAs9. Эти данные подтверждают возможность дискордантных транскриптомных изменений, возникающих в результате использования одной и той же sgRNA, это может приводить к смущениями при анализе. Оптимизация эффективности искусственных преобразований может быть достигнута с использованием BE437 или BE4max38. С помощью достижения высокой эффективности в редактировании оснований (i.e., increasing the likelihood that sgRNA-bearing cells will be engineered), пертурбации в большом количестве клеток могут быть охарактеризованы. Кроме того, мы ожидаем, что использование высоко производительных устройств, таких как 10x Genomics Chromium, сможет помочь более аккуратно оценивать пертурбации после отфильтровывания маргинальных клеток.
Мы наблюдали переход C в T вне 'activity window' для #176 в мультиплексном эксперименте. Это превращение происходит в такой же степени, что для 'C' внутри 'activity window', но клетки с конверсией вне оказывались обогащенными во время отбора с vemurafenib. Такое превращение возникало, по-видимому, потому, что 'TC' мотив преимущественно редактируется с помощью BE39. Поэтому мы должны учитывать конверсии C в T вне 'activity window' при проектировании скрининг-экспериментов. Мы предвидели, что наш подход будет оптимизирован в дальнейшем использованием альтернативы белку BE3. Недавно разработанный вариант BE39 и др. эффекторные белки40 предоставляют более широкие пределы мишеней, увеличивая тем самым аналитическое покрытие связанных с болезнью SNVs. Редактирование вне мишени, связанное с CRISPR или неспецифической активностью deaminase, также следует учитывать. Недавние сообщения41,42 показали, что BE3 индуцирует вне мишени SNVs на ДНК и РНК, даже если локусы не обладают потенциалом индукции вне мишени в guide последовательности. Эти эффекты вне мишени могут препятствовать интерпретации мутаций, связанных с интересующей функцией. Замещение BE3 вариантом deaminase может снижать активность вне мишени39,43. Кроме того, мы наблюдали гетерогенные популяции отредактированных клеток посредством processive деаминирования (Supplementary Fig. 2b, Supplementary Fig. 26). Хотя клетки со специфическими мутациями, которые затрагивают функцию белка, как ожидается, будут обогащаться во время скрининга, использование другого редактора оснований39,44 будет способствовать снижению processivity и нежелательных превращений C в T в нити мишени, генерируя менее гетерогенную популяцию отредактированных клеток. Мы полагаем, что более тщательный анализ мутаций станет возможным после оптимизации отбора белка.
Мы использовали oligo-dT последовательно сцепленные кусочки (beads), чтобы отлавливать полиаденилированные мРНК в эксперименте с scRNA-seq. С помощью синтеза мишени из sequence-linked beads, последовательности, испытавшие целенаправленное воздействие, могут быть отловлены непосредственно без лаб. PCR амплификации из каждой последовательности, подвергшейся целенаправленному воздействию45. Напротив, соединение последовательности мишени с обычными beads, также может быть использовано46. Др. подход использует комбинацию методов целенаправленного воздействия на индивидуальные клетки, используя штрих-кодирование47. cDNA клеток мишеней может быть амплифицирована с использованием этого метода с целью анализа транскриптома и этот метод пригоден для изучения клеток с известными мутациями и для оценки клеток, обогащенных специфическими sgRNAs. Более того, хотя мы и продемонстрировали эффект SNVs, внесенных в экзоны трех генов, дальнейшее исследование др. экзонов генов, связанных с раком7, как полагают, ускорит идентификацию мутаций, управляющих раковыми клетками, и мутаций резистентности к лекарствам. В отличие от случаев скрининга нокаутов, приводящего к сходным фенотипам, независимо от остатков мишени вдоль кодирующей последовательности проявления мутаций замен очень разнообразны, в зависимости от остатков и типа мутации, даже если ген мишень тот же самый.
Когда проводится скрининг целенаправленно подвергшихся множественных локусов для каждого гена, то глубокие размышления над организацией списка мишеней и стратегий выбора фенотипов необходимы, чтобы избежать нежелательных мутаций, таких как indels и редактирование вне необходимого окна. Поскольку количество мишеней увеличивается, то воспроизводимость и точность становятся критическими для отличия настоящих воздействий от ложно положительных. Однако, непреднамеренные мутации приводят к гетерогенности профиля и делают оценку мутаций сложной.
Согласно нашему моделированию, наша система сможет покрыть 36211 missense мутаций и 3491 nonsense мутаций среди мутаций, описанных в CGC7. Это указывает на о, что большая пропорция известных связанных с раком мутаций может быть сгенерирована и исследована с использованием нашей системы. Если рассматривать только возможные типы missense мутаций, которые могут возникать из-за конверсии 13 канонических аминокислот, то наша система покрывает 56% мутаций, приведенных в CGC (Supplementary Fig. 1b). Мы ожидаем, что наша платформа будет расширена для проверки мутаций замен, связанных с разнообразными биологическими реакциями.
Итак, базирующиеся на CRISPR методы скрининга с использованием технологии scRNA-seq делают возможным тщательное профилирование пертурбаций генов в результате нокаутных мутаций. Однако, оценка мутаций замен с помощью scRNA-seq сегодня ограничена. Мы скомбинировали CRISPR RNA-guided deaminase и технологию scRNA-seq, чтобы разработать платформу для индукции мутаций во многих генах и оценки связанных с мутациями сигнатур. Мы создали библиотеку, состоящую из 420 sgRNAs, осуществили анализ отслеживания sgRNA и оценили влияние размера на реакцию на vemurafenib в линии клеток меланомы человека. Однако, скрининг библиотеки мутаций замен не был использован и не была оценена транскрипционная информация о механизмах действия. Наша платформа позволяет различать между несколькими мутациями кандидатами, чья функция отличается от мутаций, с помощью интеграции sgRNA кандидатов и считывания экспрессии генов.