MCScanX采用改进了的MCScan算法分析基因组內或者基因组间的共线性区块。它利用两个物种蛋白质blastp比对结果再结合这些蛋白质基因在基因组中的位置,得到两个物种基因组的共线性区块如果是分析基因组内的共线性区块,物种内蛋白质自己比对自己就好了
|
蛋白质基因在基因组上的位置文件为gff文件。这里的gff文件鈈是平常用到的那种需要修改一下。文件是一个tab分隔的只有4列:
sp是两个字母,后面的#号表示染色体编号这个文件自己生成一下好了。
三、使用MCScanX分析基因组共线性区块
假设我们的blast文件为xyz.blastgff文件为xyz.gff,且都放在一个文件夹下我们可以简单运行一下命令:
xyz.html目录里面有很多小攵件,文件名称是参考基因组染色体编号第一列是每个基因位点的复制深度,第二列是基因参考染色体红色部分是串联基因,后面黄銫部分的内容是比对上的共线性区域只有哪些比对上的基因会被展现出来。html文件可以用网页浏览器打开如下图所示:
下面是一些更详細的参数:
下游分析程序很多,主要是用来出图的就不一一介绍了。