Посещений:
БАЗА ДАННЫХ crisprSQL



Платформа для выявления CRISPR/Cas эффектов вне мишени

crisprSQL: a novel database platform for CRISPR/Cas off-target cleavage assays
Florian Stortz, Peter Minary
Nucleic Acids Research, Volume 49, Issue D1, 8 January 2021, Pages D855–D861, https://doi.org/10.1093/nar/gkaa885

Graphical Abstract Overview of the crisprSQL database. Cleavage and epigenetics data (left) are joined together and supplemented by attributes calculated from their properties (top). This forms the crisprSQL database, which has an online user interface supporting data browsing, export and upload of new studies (right). Open in new tabDownload slide
Некоторые клинические походы по использованию технологии CRISPR/Cas редактирования генов были реализованы, такие как персонализованная терапия рака с помощью базирующейся на Т клетках терапии генетически модифицированных chimeric antigen receptor (CAR) (1). Разные возможные терапевтичесие подходы к генетическим заболеваниям, инфекционным болезням и раковым опухолям были тщательно изучены (2), напр., 38 клинических исследований CRISPR сегодня зарегистрированы на http://clinicaltrials.gov (accessed 7 August 2020). Согласно Dai et al. , 'одним из важных узких мест для переноса в клинику CRISPR/Cas9 являются эффекты вне мишени' (3), означающие нежелательные нуклеотидные инсерции или делеции, вызываемые CRISPR вне геномных локусов мишеней. Выбор подходящей guide RNA (gRNA) для желательной последовательности ДНК мишени DNA рассматривается как 'критическая первая ступень в избегании эффектов не мишени' (4). Чтобы уменьшить эффекты вне мишени, необходима оценка 'ряда известных сайтов вне мишени и испольвание их для создания ряда реагентов, чтобы количественно оценить эффекты вне мишени посредством NGS методов' (5). Это остается утомительной и требующей времени целью.
Неоходима база данных широкого назначения для взаимодействий вне мишени для оценки новых методов детекции эффектов вне мишени (6) и нового исполнения существующих методов в лабораторных условиях.
Разработка компьютерных алгоритмов для предсказания сайтов вне мишени (7,8) также базируется на присутствии исчерпывающей базы данных, количественно оценивающих эффекты вне мишени для gRNAs на ДНК из определенной клеточной линии, которая обычно описана с выбором эпигенетических маркеров заслуживающими уважения авторами. Разнообразный выбор аннотаций, данных проверки и тестовых процедур может привести к вопросу о воспроизводимости (9).
Мы предлагаем online базу данных, которая обещает улучшить клинические, лабораторные и компьютерные исследования путем предоставления первого универсально (one-stop) источника сайтов вне мишени, позволяющего осуществлять выбор данных по CRISPR/Cas разрезанию, в сопровождении эпигенетических аннотаций и визуализаций. Чтобы предоставить максимум значений для ряда областей, включая транскриптомику, эксперименты с нокаутом генов, редактированием ориентированного на безопасность дизайна руководства и прогноза эффективности расщепления, crisprSQL предлагает данные по распознаванию последовательности, а также устраняет пробел в последовательности генов, добавляя имена генов из GENCODE к мишеням воздействия.




Figure 2. Overview of the included studies, together with metadata such as assay type, the total number of guides and guide-target pairs observed as well as the predominantly cleaved gene names. Studies have been split up according to cell lines.





Figure 3.

Web interface of the database, showing a list of all included gRNA sequences and which, if any, GENCODE gene name they target. Their respective target distributions across the genome are visualised as a barcode-type histogram, allowing a first assessment of their reported specificity. Upon clicking on or searching for a specific guide (inset), the website shows its full reported off-target profile, i.e. gene names of target loci, cleavage rates and epigenetic markers at the target site, hyperlinked to the respective source. Clicking on a gene name opens the vicinity of the respective cut site in a genome browser.

RESULTS AND DISCUSSION


Мы создали конвейер обработки данных и инструмент для базы данных, который заполняет нишу из тщательно отобранной и аннотированной коллекции данных с разрешением в пару оснований разрезов с помощью CRISPR / Cas9 вне мишени. Помимо предоставления комплексного инструмента поиска для дизайна гид РНК как на уровне пар оснований, так и на уровне генов, он может выступать в качестве источника данных как для экспериментальной проверки обнаружения эффектов вне цели, так и для вычислительных алгоритмов прогнозирования расщеплений вне мишени. Это поможет экспериментальным исследованиям по разработке гид РНК для множества приложений в более широких областях редактирования генов и транскриптомики, а также повысит прозрачность и воспроизводимость компьютерных исследований.
Как отмечалось выше, экспериментальные протоколы для различных анализов значительно различаются по соотношению концентраций плазмид, кодирующих Cas9 и gRNA, а также по времени между трансфекцией клеток и сбором. GUIDE-seq (6), Digenome-seq (13) и CIRCLE-seq (20) требуют значительно более сложного вычислительного аппарата, чем другие методы, для извлечения расширенных геномных интервалов после выравнивания с эталонным геномом и проверки сайтов редактирования нуклеазами . Они представляют собой конкретные допущения и шаги нормализации, создавая необходимость в дальнейшем исследовании, когда значения абсолютной частоты разрезов сравниваются между исследованиями, и, по крайней мере, нормализовать распределение частоты разрезов для каждого отдельного исследования с монотонной нелинейной функцией, когда необходимы относительные ранжировки частот. Пример такой нормализации показан на дополнительном рисунке S1. Итак, здесь мы представили crisprSQL (http://www.crisprsql.com), интерактивную и биоинформационно улучшенную коллекцию CRISPR/Cas9 разрезов вне мишени в исследовании, имеющем целью обогащение области профилирования реазрезов, аназиза безопасности редактирования генов и транскриптомики. Настоящая версия crisprSQL содержит данные по разрезам от 144 guide RNAs по 25632 guide-target парам из клеточных линий грызунов и людей, со специфическими для взаимодействий ссылками на эпигенетические маркеры и названия генов. The first curated database of this standard, it promises to enhance safety quantification research, inform experiment design and fuel development of computational off-target prediction algorithms.