下一代测序 (NGS)/SOAPdenovo
外观
我们从 SRR001665 获得了 E coli 数据,你可以键入
wget ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR001/SRR001665/SRR001665_1.fastq.gz wget ftp://ftp.sra.ebi.ac.uk/vol1/fastq/SRR001/SRR001665/SRR001665_2.fastq.gz
解压这两个文件
gunzip SRR001665_1.fastq.gz gunzip SRR001665_2.fastq.gz
你需要获取 SOAPdenovo 和数据准备模块
wget http://soap.genomics.org.cn/down/x86_64.linux/SOAPdenovo31mer.tgz tar xvzf SOAPdenovo31mer.tgz
我们还必须制作一个配置文件。我们将此命名为 cont.config
#maximal read length max_rd_len=36 [LIB] #average insert size avg_ins=200 #if sequence needs to be reversed reverse_seq=0 #use for contig building only asm_flags=1 #in which order the reads are used while scaffolding rank=1 #fastq files q1=./SRR001665_1.fastq q2=./SRR001665_2.fastq
然后,我们使用 31 的 Kmer 大小进行支架构建(读取长度为 36)。我们通过指定“all”参数使用整个 SOAP 管道,通过将 asm_flags 设置为 3,同一个库也将用于支架构建。在这种情况下,SOAP 将因无浮点异常而终止于支架构建步骤。然而,仍然可以在 EC.contigs 中找到重叠群。
./SOAPdenovo31mer all -K 31 -s cont.config -o EC