xflee0608-CSDN博客

转载 Cufflinks的使用

一. 简介Cufflinks下主要包含cufflinks,cuffmerge,cuffcompare和cuffdiff等几支主要的程序。主要用于基因表达量的计算和差异表达基因的寻找。二. 安装Cufflinks下载网页。1. 为了安装Cufflinks，必须有Boost C++ libraries。下载Boost并安装。默认安装在/usr/local。$ tar jxvf bo

2015-04-01 21:51:24 31491

原创可以下载genome数据的几个网站

Ensembl-plantftp://ftp.ensemblgenomes.org/pub/Ensembl-animalftp://ftp.ensembl.org/pub/NCBI:ftp://ftp.ncbi.nih.gov/genomesUCSC:http://hgdownload.soe.ucsc.edu/downloads.html植

2015-03-26 09:32:35 3501

转载文件格式之gff3

GFF3是GFF注释文件的新标准。文件中每一行为基因组的一个属性，分为9列，以TAB分开。依次是：1. reference sequence：参照序列指出注释的对象。如一个染色体，克隆或片段。可以有多个参照序列。该id的取名不能以’>’开头，不能包含空格。 2. source ：来源注释的来源。如果未知，则用点（.）代替。 3. type ：类型属性

2015-03-16 10:34:20 13784

原创在命令行获取标准输入序列的反互序列，pep序列和长度信息

最近对序列文件处理的比较多，时常要看一些核酸序列的反向互补序列，长度，可能的翻译序列。以前我常常使用seqBuider 来查看，如果能在命令行直接查看，想必是极好的。这是一个perl脚本，不过我把它的执行路径写入环境变量后，就可以当linux命令直接使用了，很方便的。这个脚本有四个参数。【-i -r -p -l 】其中-i 是必要的参数，用来接收标准输入；-r 是获得一段序列的

2014-09-30 10:21:46 1595

原创从cds到pep

鉴于有几位同学在问如何批量转化cds为pep序列，那么本人就把自己的一段代码从另一个脚本中抽取出来。故意写成两个子函数是方面单独使用，比如输入序列不是单纯的fasta格式而是phy格式的，可以对cds2pep函数做一下调整，code子函数则无需改动。这段代码要求的输入文件格式是fasta。用法：perl cds2pep.pl input.cds.fa out.pep.fa #!

2014-08-29 21:39:52 5251 1

原创用一个简单的perl包轻松管理脚本中的软件调用

在用perl写的流程中，有人喜欢直接在脚本定义软件的路径，比如：my $blastall="/opt/blc/genome/bin/blastall";这样做，看着好像很省事的样子，但是当一个流程层次关系比较复杂时，而且当其中的路径失效时，麻烦来了：我们需要翻复杂的脚本，重新找到标量的定义，然后修改之。可是，当你把所有调用的软件路径写到配置文件中，并用perl package func

2014-08-17 23:22:32 2501

原创 KAAS(KEGG Automatic Annotation Server):一个非常好用的在线注释工具

在基因组学研究中，我们常常需要知道一些基因在整个代谢通路中扮演的角色。日本的KEGG数据库，提供了很全面的基因通路，大大方便了研究者。与此同时，KEGG数据库自身提供了一个方便的在线注释工具，方便又精准，甚至能提供带标注的map通路图，比在本地做blast，然后解析blast结果，再写脚本画map方面了很多。KASS :http://www.genome.jp/tools/kaas/KAS

2014-08-10 23:04:33 18632

原创 perl一次读取多行文本的策略

在处理文本时，常常遇到这样的情况：就是我们需要把两行文本做一个比较，然后选择性输出。而在while（）{do something}程序块中默认只能一次读取一行。笔者在这里，举一个简单的例子来说明怎么处理这种情况。有一个这样一段文本：a 1 2 3 4a 5 6 7 8a 6 7 8 9a 7 8 9 11a 7 8 9 12a 13 12 14 15a 18 14

2014-08-09 23:38:38 5491

原创切割fasta文件的几种方案

在做blast，muscle等比对时，对于一个较大的fasta

2014-08-08 18:06:54 8653 1

原创根据ID列表提取fasta序列

根据基因列表，从总的fasta文件中提取

2014-08-08 17:45:09 12493

原创快速获取两组数据的交集，并集，补集

笔者常用这个脚本快速查看两组数据的交

2014-08-08 17:36:47 4716

原创随机抽取一定比例的fastq文件

在NGS的下机数据中，我们通常抽取一些fq文件，做

2014-08-08 17:27:18 4546

原创滑窗口统计基因组GC含量的分布

在基因组学常规分析中，滑统计GC含量是一个

2014-08-08 17:09:31 8177 1

原创从gtf到gff

从Ensemble数据库中下载到的基因组坐标文件通常是

2014-08-08 17:04:00 4009

原创从NCBI基因组数据中获得cds，pep和geneID对应表

A perl script deal with ncbi raw data,and from which get cds ,pep and gene,mRNA and protein ID list.

2014-08-08 16:52:34 15939

原创数字之美

这是一个实现多种特征数筛选的perl脚本，有点意思。

2014-08-08 15:44:58 713

原创利用施瓦茨排序获得范围数据的并集

有一个文件gi.txt是这样的：abc 38449 25480-25548 25189-25245abc 24548 6408-6446abc 209928 28985-29312 29715-29736abc 396277 205294-205311 394789-394806abc 290118 77

2014-08-08 14:54:11 643

原创利用perl或者R实现不规则文本的行列转置

如下是一个不规则的文本（行列中有空缺位），将其行列转置，求新的文本。Array.lst：1 aa bb cc dd2 re uy oo jj3 uh njk kjh jll4 bgjkh klllj hhgj k

2014-08-08 14:34:44 2778

薛猫_柳叶刀