利用转录组或重测序数据原始reads匹配到目的序列,以验证序列的准确性

以RNA-Seq of Hippopotamus amphibius: adult male skin——SRR8270566为例

下载相关软件及工具:bwa、samtools、fastq

1
2
3
4
5
6
7
8
9
10
11
prefetch SRR8270566  #下载SRA数据库的reads数据,另:wget -c https://sra-downloadb.be-md.ncbi.nlm.nih.gov/sos1/sra-pub-run-2/SRR8270566/SRR8270566.1 也可

fastq --split-3 SRR8270566.1 #转换为fastq格式

bwa index -a bwtsw hamp.fas #目的序列建立索引

bwa mem -t 20 -M -R "@RG\tID:hamp\t" hamp.fas SRR8270566.1_1.fastq SRR8270566.1_2.fastq > hamp.sam #比对,生成sam文件

samtools sort -@ 30 -m 10G -O bam -o hamp.bam hamp.sam #生成二进制bam文件

samtools index hamp.bam #生成bam.bai文件

最后利用IGV或Tablet等可视化软件将hamp.fas、hamp.bam、hamp.bam.bai可视化即可看到query片段所匹配的reads

There’s More Than One Way To Do It!仅供参考!