毒力因子注释——ABRicate

Published at 2023-05-29 11:23

Author:liujr

View:555


ABRicate 毒力因子注释

1.简介

abricate 是 tseemann 开发的注释工具,可以对细菌基因组数据进行扫描,获得其基因组携带那些毒力基因和耐药基因结果。软件包含数据库,也可自建数据库进行比对。

2.安装

conda install abricate

安装完成后,运行

abricate --check
Checking dependencies are installed:
Found 'blastn' => /opt/miniconda3/envs/annotations/bin/blastn
Found 'blastx' => /opt/miniconda3/envs/annotations/bin/blastx
Found 'makeblastdb' => /opt/miniconda3/envs/annotations/bin/makeblastdb
Found 'blastdbcmd' => /opt/miniconda3/envs/annotations/bin/blastdbcmd
Found 'any2fasta' => /opt/miniconda3/envs/annotations/bin/any2fasta
Found 'gzip' => /usr/bin/gzip
Found 'unzip' => /opt/miniconda3/envs/annotations/bin/unzip
OK.

更多安装信息可以查询

https://github.com/tseemann/abricate

3.数据库

查看现有数据库

abricate --list

目前 ABRicate 内置了部分数据库

DATABASE        SEQUENCES       DBTYPE  DATE
resfinder       3077    nucl    2021-Mar-27   #resfinder耐药数据库
argannot        2223    nucl    2021-Mar-27   #argannot耐药数据库
ecoh    597     nucl    2021-Mar-27           #大肠杆菌O/H抗原分析
vfdb_setB       32439   nucl    2023-Feb-15   #vfdb毒力基因数据库
ecoli_vf        2701    nucl    2021-Mar-27   #大肠杆菌毒力基因      
megares 6635    nucl    2021-Mar-27           #megares耐药数据库
ncbi    5386    nucl    2021-Mar-27           #NCBI的耐药数据库
card    2631    nucl    2021-Mar-27           #加拿大CARD耐药数据库
plasmidfinder   460     nucl    2021-Mar-27   #质粒扫描

ABRicate 自带的数据库如果没有合适的,或者自己找到更好的数据库,我们可以自建数据库用于比对。我们需要找到 ABRicate 的数据库文件路径,以 vfdb 最新毒力因子预测文件为例,新建一个数据库:

[user@server ~] cd /opt/miniconda3/envs/annotations/db
[user@server ~] mkdir database #新建目录用于存放数据库文件
[user@server ~] cd database
[user@server ~] cp VFDB_setB_pro_1.fas database  #将 VFDB_setB_pro_1.fa 复制到database里并且改名为sequences
[user@server ~] makeblastdb -in sequences -title listeria -dbtype prot  #利用blast自带的makeblastdb命令进行建库

4.运行示例

对基因组进行毒力因子注释:

[user@server ~] abricate --db vfdb --mincov 90 --minid 95 --csv GCF_000671295.1.fna > vfdb.result.csv

其中

--mincov 覆盖度
--minid 相似度
--csv 以csv文件输出结果,若后续有分析要求,也可直接输出.tab文件

如果我们要对多个基因组进行注释,也可以批量进行

[user@server ~] abricate ./*.fna  --threads 10 --db vfdb --mincov 90 --minid 95 > results.tab
[user@server ~] abricate --summary results.tab > summary.tab

5.结果

通过毒力因子数据库进行注释,可显示基因组找到了20个符合条件的毒力因子

Using nucl database vfdb:  2597 sequences -  2021-Mar-27
Processing: ./GCA_910593775.1.fna
Found 20 genes in ./GCA_910593775.1.fna
Tip: it's important to realise abricate uses DNA matching, not AA.
Done.

具体毒力因子可查看 results.tab 文件,如果想查看耐药因子,只需改变所用数据库就可以。