Посещений:
dbGuide: a database of functionally validated guide RNAs for genome editing in human and mouse cells | |
---|---|
With the technology's accessibility and ease of use, CRISPR has been employed widely in many different organisms and experimental settings. As a result, thousands of publications have used CRISPR to make specific genetic perturbations, establishing in itself a resource of validated guide RNA sequences. While numerous computational tools to assist in the design and identification of candidate guide RNAs exist, these are still just at best predictions and generally, researchers inevitably will test multiple sequences for functional activity. Here, we present dbGuide (https://sgrnascorer.cancer.gov/dbguide), a database of functionally validated guide RNA sequences for CRISPR/Cas9-based knockout in human and mouse. Our database not only contains computationally determined candidate guide RNA sequences, but of even greater value, over 4000 sequences which have been functionally validated either through direct amplicon sequencing or manual curation of literature from over 1000 publications. Finally, our established framework will allow for continual addition of newly published and experimentally validated guide RNA sequences for CRISPR/Cas9-based knockout as well as incorporation of sequences from different gene editing systems, additional species and other types of site-specific functionalities such as base editing, gene activation, repression and epigenetic modification.
|
Базирующееся на CRISPR/Cas9 редактирование генома становится обязательной технологией для понимания биологии живых организмов (1,2). Приложены огромные усилия для изучения и использования CRISPR, которые позволяют исследователям быстро идентифицировать последовательность гид (guide) RNA со специфическими предсказуемыми характеристиками действия на мишень и вне мишени (3–18) (Table 1). Однако, для этого часто необходмио оценить многие кандидаты на роль guide RNAs.
Table 1. List of sgRNA design tools Name URL Species Design Validated guides CCTop (12) https://crispr.cos.uni-heidelberg.de/ Many Yes No CHOPCHOP (6) http://chopchop.cbu.uib.no/ Many Yes No CRISPOR (3) http://crispor.tefor.net/ Many Yes No CRISPRseek (16) http://bioconductor.org/packages/release/bioc/html/CRISPRseek.html Many Yes No CRISPRz (13) https://research.nhgri.nih.gov/CRISPRz/ Zebrafish No Yes CRISPR-ERA (7) http://crispr-era.stanford.edu/index.jsp Many Yes No CRISPR MultiTargeter (11) http://www.multicrispr.net/ Many No No Cas-Designer (8) http://www.rgenome.net/cas-designer/ Many Yes No DeepHF (14) http://www.deephf.com/index/#/Predict Human No No E-CRISP (4) http://www.e-crisp.org/E-CRISP/ Many Yes No EuPaGDT (9) http://grna.ctegd.uga.edu/ Many Yes No inDelphi (18) https://indelphi.giffordlab.mit.edu/ Human, Mouse Yes No sgRNAcas9 (15) http://www.biootools.com/software.html Many Yes No sgRNA Designer (17) https://portals.broadinstitute.org/gpp/public/analysis-tools/sgrna-design Many No No sgRNA Scorer 2.0 (32) https://sgrnascorer.cancer.gov/ Many Yes No WU-CRISPR (5) http://crispr.wustl.edu/ Many Yes No COMMERCIAL Addgene https://www.addgene.org/crispr/reference/grna-sequence/ Many No Yes CRISPR gRNA Design Tool (Atum) https://www.atum.bio/eCommerce/cas9/input Many Yes No Benchling www.benchling.com Many Yes No CRISPR Design Tool (Horizon Discovery) https://horizondiscovery.com/en/products/tools/CRISPR-Design-Tool Many No No CRISPR sgRNA Design Tool (GenScript) https://www.genscript.com/gRNA-design-tool.html Many No No CRISPR Cas9 Guide RNA Checker (IDT DNA) https://www.idtdna.com/site/order/designtool/index/CRISPR_SEQUENCE Many Yes No True Designer Genome Editior (ThermoFisher Scientific) https://www.thermofisher.com/us/en/home/life-science/genome-editing/geneart-crispr/geneart-crispr-search-and-design-tool.html Many Yes No В течение последних 7 лет, наблюдается взрыв литературы по использованию CRISPR/Cas9 нокаута специфических геномных регионов у людей и в мышиных модельных системах. Кульминацией всех этих работ стало появление возможности добывать эту информацию о последовательности guide RNA, демонстрирующей её функционирование на генетическом и/или фенотипическом уровне. Вариации описанных стандартов, типографские ошибки и перевод (relegation) последовательностей в дополнительные материалы находятся среди тех немногих причин, почему исправление (curation) этой информации оказалась не тривиальной.
Мы представили dbGuide, базу данных функционально оценённых последовательностей guide RNA для CRISPR/Cas9 осуществляемых нокаутных экспериментов в клетках человека и мышей (http://sgrnascorer.cancer.gov/dbguide). Мы вручную проверяли (curated) последовательности guide RNA из более 1000 прошедших экспертизу (peer-reviewed) статей при этом каждая последовательность имела прямое описание из оригинальной публикации. Мы также получили результаты целенаправленного секвенирования amplicon для ~2000 уникальных последовательностей sgRNA, протестированных индивидуально у людей (293T) или мышей (NIH-3T3 или P19) в культивируемых клетках, которые можно найти в нашей базе данных. В целом, эти усилия предоставили почти 6000 уникальных последовательностей guide RNA, для которых существует некоторый уровень оценки активности. Это самая большая база данных функционально оцененных последовательностей guide RNA. Мы ожидаем, что это будет постоянно растущий ресурс благодаря многим механизмам. Мы предлагаем доступные для загрузки матрицы, чтобы поощрять исследователей предоставлять ими вновь опубликовнные и оцененные последовательности, а наше компьютерное обеспечение также позволит включать последовательности для CRISPR систем иные, чем Streptococcus pyogenes, предоставит возможности такие как редактировени оснований, активация и репрессия генов и эпигенетические модификации и последовательности от др. видов.
RESULTS AND DISCUSSION Figure 1.
Structure of the dbGuide database. (A) Components of the dbGuide database. The user interface was developed using html and javascript and the application is managed on an Apache web server using django. All underlying data is stored in a MariaDB (MySQL) database. (B) Schema of the MySQL database. Each species, currently limited to human and mouse, has a table of sgRNA sequences with pre-computed metrics and a table with gene annotation information. sgRNA sequences obtained from publications are stored in a single table and the ‘species’ field is used to determine which species the guide RNA was used. Similarly, sequences from targeted amplicon sequencing data also have the ‘species’ field for this purpose. Figure 2. Screen shots of the key user interfaces. (A) Opening window of the dbGuide database. The user must first select whether to search within the human/mouse genome and then can specify a HGNC gene symbol, chromosomal coordinate in BED format, or ENSEMBL gene/transcript ID. (B) Window depicting results of a search by gene symbol. Selectable rows of sgRNA sequences are returned with various pre-computed metrics and PubMed identifiers, if the sequence had been used in a peer-reviewed publication. (C) Graphical representation of sgRNA sequences for which targeted amplicon sequencing data were generated. Stacked bar plots display the percentage of NHEJ mutation events that results in an ‘in-frame’ (black) or ‘out of frame’ (blue) amino acid change. Downloading sequences for use in experiments Upon identifying guide RNA sequences of interest, the user can export the sequences in a ‘ready to order’ format by clicking on the ‘Design’. A tab-delimited text file is generated listing oligonucleotides needed for either ligation into a plasmid or in vitro transcription as well as a PDF protocol describing what compatible vectors can be used and how they can be obtained. It is highly recommended to select and download multiple guide RNA sequences when performing knockout experiments to ensure any functional consequences observed may not be due to spurious off-target activity from a single guide RNA.
|