跳到内容

下一代测序 (NGS)/SOAPdenovo

来自维客教科书,面向开放世界的开放书籍

我们从 SRR001665 获得了 E coli 数据,你可以键入

 wget ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR001/SRR001665/SRR001665_1.fastq.gz
 wget ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR001/SRR001665/SRR001665_2.fastq.gz

解压这两个文件

 gunzip SRR001665_1.fastq.gz
 gunzip SRR001665_2.fastq.gz

你需要获取 SOAPdenovo 和数据准备模块

 wget http://soap.genomics.org.cn/down/x86_64.linux/SOAPdenovo31mer.tgz
 tar xvzf SOAPdenovo31mer.tgz
 

我们还必须制作一个配置文件。我们将此命名为 cont.config

 #maximal read length
 max_rd_len=36
 [LIB]
 #average insert size
 avg_ins=200
 #if sequence needs to be reversed 
 reverse_seq=0
 #use for contig building only
 asm_flags=1
 #in which order the reads are used while scaffolding
 rank=1
 #fastq files
 q1=./SRR001665_1.fastq
 q2=./SRR001665_2.fastq


然后,我们使用 31 的 Kmer 大小进行支架构建(读取长度为 36)。我们通过指定“all”参数使用整个 SOAP 管道,通过将 asm_flags 设置为 3,同一个库也将用于支架构建。在这种情况下,SOAP 将因无浮点异常而终止于支架构建步骤。然而,仍然可以在 EC.contigs 中找到重叠群。

 ./SOAPdenovo31mer all -K 31 -s cont.config -o EC
华夏公益教科书