Published at 2021-05-08 12:10
Author:zhixy
View:4018
在研究生物组织或者肠道微生物宏基因组时,常常需要去除源自宿主的DNA序列,以防止宿主序列干扰研究。去宿主序列的主要研究方法是通过将质控后的reads序列与宿主基因组进行比对,然后比对上的序列进行去除。比对软件通常有bowtie2、bwa、SOAPaligner等短序列比对工具。
Bowtie2是一个超快和内存效率高的工具,用于短序列比对到长参考序列。擅长比对大约50bp到100bp或1000bp的短序列,并且特别适合比对到相对较长的基因组 (例如哺乳动物) 。Bowtie2用FM索引索引基因组,以保持其内存占用较小 (对于人类基因组来说,它的内存占用通常在3.2GB左右)。
用法:bowtie2-build [options]* <reference_in> <bt2_index_base>
必要参数:
其他可用的参数项:
用法:bowtie2 [options]* -x <bt2-idx> {-1 <m1> -2 <m2> | -U <r> | --interleaved <i>} [-S <sam>]
参数:
关键输出参数:
所以直接用bowtie2去宿主序列的实例:
# bowtie2 -x human -1 reads_R1.fastq -2 reads_R2.fastq -p 64 -S mapping.sam --un-conc reads_host_removed
输出结果中reads_host_removed.1.fq
和reads_host_removed.2.fq
即为去除宿主序列的reads。