- 博客(18)
- 收藏
- 关注
转载 Cufflinks的使用
一. 简介Cufflinks下主要包含cufflinks,cuffmerge,cuffcompare和cuffdiff等几支主要的程序。主要用于基因表达量的计算和差异表达基因的寻找。二. 安装Cufflinks下载网页。1. 为了安装Cufflinks,必须有Boost C++ libraries。下载Boost并安装。默认安装在/usr/local。$ tar jxvf bo
2015-04-01 21:51:24
31491
原创 可以下载genome数据的几个网站
Ensembl-plantftp://ftp.ensemblgenomes.org/pub/Ensembl-animalftp://ftp.ensembl.org/pub/NCBI:ftp://ftp.ncbi.nih.gov/genomesUCSC:http://hgdownload.soe.ucsc.edu/downloads.html植
2015-03-26 09:32:35
3501
转载 文件格式之gff3
GFF3是GFF注释文件的新标准。文件中每一行为基因组的一个属性,分为9列,以TAB分开。依次是:1. reference sequence:参照序列指出注释的对象。如一个染色体,克隆或片段。可以有多个参照序列。该id的取名不能以’>’开头,不能包含空格。 2. source :来源注释的来源。如果未知,则用点(.)代替。 3. type :类型属性
2015-03-16 10:34:20
13784
原创 在命令行获取标准输入序列的反互序列,pep序列和长度信息
最近对序列文件处理的比较多,时常要看一些核酸序列的反向互补序列,长度,可能的翻译序列。以前我常常使用seqBuider 来查看,如果能在命令行直接查看,想必是极好的。这是一个perl脚本,不过我把它的执行路径写入环境变量后,就可以当linux命令直接使用了,很方便的。这个脚本有四个参数。【-i -r -p -l 】其中-i 是必要的参数,用来接收标准输入;-r 是获得一段序列的
2014-09-30 10:21:46
1595
原创 从cds到pep
鉴于有几位同学在问如何批量转化cds为pep序列,那么本人就把自己的一段代码从另一个脚本中抽取出来。故意写成两个子函数是方面单独使用,比如输入序列不是单纯的fasta格式而是phy格式的,可以对cds2pep函数做一下调整,code子函数则无需改动。这段代码要求的输入文件格式是fasta。用法:perl cds2pep.pl input.cds.fa out.pep.fa #!
2014-08-29 21:39:52
5251
1
原创 用一个简单的perl包轻松管理脚本中的软件调用
在用perl写的流程中,有人喜欢直接在脚本定义软件的路径,比如:my $blastall="/opt/blc/genome/bin/blastall";这样做,看着好像很省事的样子,但是当一个流程层次关系比较复杂时,而且当其中的路径失效时,麻烦来了:我们需要翻复杂的脚本,重新找到标量的定义,然后修改之。可是,当你把所有调用的软件路径写到配置文件中,并用perl package func
2014-08-17 23:22:32
2501
原创 KAAS(KEGG Automatic Annotation Server):一个非常好用的在线注释工具
在基因组学研究中,我们常常需要知道一些基因在整个代谢通路中扮演的角色。日本的KEGG数据库,提供了很全面的基因通路,大大方便了研究者。与此同时,KEGG数据库自身提供了一个方便的在线注释工具,方便又精准,甚至能提供带标注的map通路图,比在本地做blast,然后解析blast结果,再写脚本画map方面了很多。KASS :http://www.genome.jp/tools/kaas/KAS
2014-08-10 23:04:33
18632
原创 perl一次读取多行文本的策略
在处理文本时,常常遇到这样的情况:就是我们需要把两行文本做一个比较,然后选择性输出。而在while(){do something}程序块中默认只能一次读取一行。笔者在这里,举一个简单的例子来说明怎么处理这种情况。有一个这样一段文本:a 1 2 3 4a 5 6 7 8a 6 7 8 9a 7 8 9 11a 7 8 9 12a 13 12 14 15a 18 14
2014-08-09 23:38:38
5491
原创 从NCBI基因组数据中获得cds,pep和geneID对应表
A perl script deal with ncbi raw data,and from which get cds ,pep and gene,mRNA and protein ID list.
2014-08-08 16:52:34
15939
原创 利用施瓦茨排序获得范围数据的并集
有一个文件gi.txt是这样的:abc 38449 25480-25548 25189-25245abc 24548 6408-6446abc 209928 28985-29312 29715-29736abc 396277 205294-205311 394789-394806abc 290118 77
2014-08-08 14:54:11
643
原创 利用perl或者R实现不规则文本的行列转置
如下是一个不规则的文本(行列中有空缺位),将其行列转置,求新的文本。Array.lst:1 aa bb cc dd2 re uy oo jj3 uh njk kjh jll4 bgjkh klllj hhgj k
2014-08-08 14:34:44
2778
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人