一、IGV软件介绍
IGV(Integrative Genomics Viewer)是一款强大的基因组数据可视化工具
二、准备IGV的输入文件
IGV可输入文件格式:bw、bam文件
(1)假设有Cleandata的fastq文件,生存bam文件和bw
##构建STAR的索引
STAR --runThreadN 8 --runMode genomeGenerate --genomeDir STARindex --genomeFastaFiles reference.fa --sjdbGTFfile reference.gtf --limitGenomeGenerateRAM 150000000000 --genomeSAindexNbases 7
##备注构建索引时没有gtf,可去除--sjdbGTFfile reference.gtf参数
##利用STAR比对软件生存bam文件,STARindex/文件下即为构建好的索引
STAR --runThreadN 6 STARindex --readFilesIn sample_1.fq.gz sample_2.fq.gz --outSAMattributes All --outFilterType BySJout --outSAMunmapped Within --outSAMtype BAM SortedByCoordinate --outSAMattrIHstart 0 --outWigType bedGraph --outWigStrand Unstranded --outFileNamePrefix /home/sample/ --readFilesCommand zcat --limitBAMsortRAM 50000000000 --outReadsUnmapped Fastx --genomeDir STARindex/
##bw文件转换, 利用deeptools
bamCoverage -b Aligned.sortedByCoord.out.bam -o sample.bw --normalizeUsing RPKM -p 8
(2)由于IGV需要排序后的bam文件,因此对生成的bam进行排序,可以在集群中排序,也可以在IGV软件中实现
第一种:在集群中实现
##1.对bam文件进行排序,IGV需要输入排序后的bam文件
inpath="/home/bamdir/"
outpath="/home/resultdir"
inputbam="${inpath}${i}/Aligned.sortedByCoord.out.bam"
sorted_bam="${outpath}${i}.sorted.bam"
##排序bam
samtools sort "$inputbam" -o "$sorted_bam"
##构建bam索引
samtools index "$sorted_bam"
##获取指定基因的bam文件
samtools view -h -b "$sorted_bam" "chr4:139085251-139163503" -o "${outpath}${i}.gene_region.bam"
#若有多个样本可批量
for i in sample1 sample2;do
inputbam="${inpath}${i}/Aligned.sortedByCoord.out.bam"
sorted_bam="${outpath}${i}.sorted.bam"
samtools sort "$inputbam" -o "$sorted_bam" &&
samtools index "$sorted_bam" &&
samtools view -h -b "$sorted_bam" "chr4:139085251-139163503" -o "${outpath}${i}.gene_region.bam"
done
第二种:直接在IGV中排序和构建索引
导入参考基因组
-
准备文件:参考基因组的FASTA文件(通常是
.fa
或.fasta
格式)。 -
打开IGV:启动IGV软件。
-
导入基因组文件:
-
点击菜单栏中的
Genomes
→Load Genome from File
。 -
在弹出的文件选择对话框中,找到并选择你的参考基因组FASTA文件。
-
-
生成索引(可选):
-
如果你的FASTA文件没有索引文件(
.fai
),IGV会提示你生成索引。 -
点击
Tools
→Run igvtools
,在弹出的界面中选择Command
为Index
,然后选择你的FASTA文件并点击Run
。
-
导入GTF文件
-
准备GTF文件:参考基因组对应的GTF注释文件。
-
对GTF文件排序:
-
如果你的GTF文件未排序,建议先进行排序。点击
Tools
→Run igvtools
,选择Command
为Sort
,输入GTF文件并点击Run
,生成排序后的文件(如sorted.gtf
)。
-
-
导入GTF文件:
-
点击
File
→Load from File
。 -
在文件选择对话框中,找到并选择排序后的GTF文件(或未排序的原始GTF文件,IGV会自动处理)。
-
-
生成GTF索引:
-
如果需要,可以对GTF文件生成索引。点击
Tools
→Run igvtools
,选择Command
为Index
,输入排序后的GTF文件并点击Run
-
选择想要的操作,构建索引或者排序
(3)导入bam文件,或者bw文件
点击File
→ Load from File,上传bam或者bw文件。bam排序也是iGVtools,和上面一样