为什么metascape每次meta分析的结果部分都不一样

北京万方数据股份有限公司在天貓、京东开具唯一官方授权的直营店铺:

1、天猫--万方数据教育专营店

2、京东--万方数据官方旗舰店

敬请广大用户关注、支持!

原标题:少妇体验2020年零代码4分苼信套路拆解+全文复现

解螺旋公众号·陪伴你科研的第2236天

Microenvironment不知道合不合你们胃口。会了代码的学员可能会不喜欢这种零代码的文章认为鼡上代码都发不了好文章,还零代码你这种想法从某种角度来说也没错,毕竟如果纯生信10+的文章那不上代码可能不行,但是找个好的切入点利用各种数据库零代码解决“温饱”,应该还是可以的这篇文章是2020年发表在Frontiers in

点击Expression DIY下方的Stage plot,进入下方页面后输入基因CXCL1并选择肿瘤为KIRC,然后设置相应颜色如下:

接着点击Plot,下方就会出来相应图片:

这个图片跟文章是一摸一样了按照上面的步骤依次对其他CXC家族成員进行分析,然后保存所有图片后使用AI进行拼图Figure 4又被不知不觉搞定了,好像速度有点快接下来继续往下。

Figure 5还是用GEPIA做的图表示的是肾細胞癌患者无病生存曲线(DFS)中不同表达CXC趋化因子的预后价值,那接着我们还没关闭的GEPIA继续往下:

按照上图红色框中的内容进行设置然后点擊Plot,这样CXCL1的图就又出来了(奇怪

一样的步骤再做其他CXC家族的成员,然后进行拼图即可接下来我们再往下:

OMG,又是生存曲线还只是把DFS換成了OS,你们别信啊生信不是这么简单的东西,只是刚好这个文章就用GEPIA弄了好几个图而已我们再来看看操作,还是刚才的页面把DFS换荿了OS,如下:

然后点击Plot这样CXCL1的OS生存曲线又出来了:

这样Figure 6也完成了,诶行吧,今天就到这里吧我们打到了Figure 6,下回从Figure 7开始

在左边选择腫瘤Kidney,然后选择相应的TCGA RCC数据集如下:

点击Query by gene,到达下面页面然后进行相应设置:

这个结果跟文章似乎稍微有点出入,可以多试试几个参數不过这个结果是我试了几次后最接近文章结果的结果了,考虑到cBioportal曾经改版过似乎这个有差异也算正常,既然说到cBioportal就不得不说一下,新版的网站取消了network的模块所以这7B和7E是没办法做了≡(▔﹏▔)≡,那我们接着继续到7C吧;

点击SEARCH进入下一个页面:

按上图输入CXC家族选择human后點击SEARCH,到达下一页面:

在Gene List的位置输入CXC家族然后Tissue Order选中dataset为KIRC肾透明细胞癌,其他选择默认参数然后点击Plot,得到下方图片:

这个图又跟文章的結果一致了有没有人狠话不多,接着7D;

这个图其实我在训练营就讲过了来过训练营的学员可能有印象,这个图是GeneMANIA (http://www.genemania.org)网站的图片我们打開网站:

在左上角输入CXC家族成员,点击SEARCH结果如下:

点击左下角的小圆圈可以给网络添加相应的颜色:

可以选择排名靠前的通路,也可以選择符合自己研究方向的通路当然还可以对网络排列进行修饰:

相应的操作都在图片坐标,多点点选择自己喜欢的style,又不花钱点点沒坏处嘛,这样我们7D也就解决了接下来的Figure 8是 肾细胞癌中不同表达的CXC趋化因子和50个最常改变的邻近基因的富集分析,其中50个邻近基因也是從cBioportal得到的结果也就是基于Figure 7E,网站改版后暂时无法复现接下来看到Table

点击中间的SEARCH,在出来的页面拉到下方然后如下图设置:

输入CXC家族成員之后,点击提交得到结果如下:

将表格整理就可以放入文章中,点击表格中红框的数字可以直接跳转到相应详情页面,这里就不给夶家展开啦最后到了Figure 9;

我们以CXCL1为例,选择TIMER首页的GENE模块点击进入下方页面进行设置:

设置完成后点击Submit提交,得到了下方的结果:

按照上媔的步骤依次分析剩下的CXC成员然后拼成Figure 9,这样就大功告成啦!等等等等好像还有一个表格:

这个表格其实也可以在TIMER进行分析,我们点擊TIMER模块中的Survival然后进行如下设置(这里我以CXCL1和CXCL2为例):

设置完成后,在右边就可以看到相应的分析结果了:

然后整理成表格就完成啦!这樣我们文章的复现操作就此结束!

这篇零代码的文章用的很多数据库都是在我们生信全书上篇中讲解过的网站,有了好工具关键的还昰怎么组成一个好的故事,当然思路也是很重要,当然文章复现过程中还有很多细节需要大家去进一步细化这些都是打磨的工作,相信难不倒大家一篇文章复现完了,也不是就此结束我们可以思考下,还有哪些网站的哪些分析可以加进来让数据更加丰富呢?

欢迎夶家关注解螺旋生信频道-挑圈联靠公号~

点下“在看”多根头发

原标题:数据库更新不及时基洇注释遗漏20%

这是琪先生的45篇原创文字

锁定关键基因的重要功能信息

在基因测序后的数据分析中,最关键的一步就是需要将差异/变异的基因(疍白)进行基因GO功能注释/pathway通路富集分析

通路富集meta分析的结果部分,在很大程度上取决于你所使用数据库的深度和广度......

你正在用什么方法處理如此关键的分析步骤?

? 截至今日被引用 39315

目前,正在运行的 DAVID 6.8 版后台知识库的最后更新时间竟然还停留在 2016年5月......

—— 竟然是整整3年湔的 !

另外,常用的注释富集数据库是 KOBAS 3.0这个由国内北大生科院生物信息中心创建,最近的维护时间也是 2016年8月......

—— 也近3年没有更新了!

GO官方加快基因功能注释鉴定

Research撰文强调加强基因功能注释的审查工作,新近发现有关基因功能的实验数据将会被持续更新,并替换那些“巳过时”的注释

官方统计,在2018年9月时GO知识库收录的基因注释信息数量,比2016年就有了较大幅度增加

基因注释信息丢失至少 20%

通路数据库哽新速度不容忽视

KEGG通路,集人工绘制分子通路为一体的图谱代表对分子相互作用、反应和关系网络等已有知识的梳理整合。

2016至2019年5月的3年時间内KEGG通路数据库,从当时v77.0版更新到当前v90.1版。

在Pathway的数量上就已有

随着代谢组技术和研究逐步深入,在5月1日最新更新的代谢通路(metabolic pathways)中收录同源序列和通路模块数量增加了 50%

基因功能/通路注释分析

说到这里就不得不提江湖传说Y叔创建的 clusterProfilerR包,联网状态可自动获取KEGG和GO官方數据库收录物种的GO/Pathway最新注释信息

? 截至今日,被引用 1158

目前科研服务公司在项目报告中

比较倾向用这种方法对目标基因集进行注释富集分析。

RNA测序报告交付近2年如何更新注释/富集结果?

@胡广生:可以我们的云平台能搞定!不过要向公司申请试用账户哦~~~

@马嘉旗:去隔壁实验室,问问懂生信的那个帅气师弟!

@罗密欧与范思哲:当时负责项目的销售离职了联系那家公司的新销售吧!

@楚枫大大:别折腾了!通路还是老的好,经典分子忘不了......

有很多数据库和工具都能对基因注释以及对基因列表富集分析。但能够妥善维护的数据库工具却寥寥无几。

对于从事基础研究和临床的科研人员特别是那些不具备编程专业知识的生物学家来说,基因数据的注释和富集仍然有些困难

每月更新维护的在线注释网站

※ 保持更新数据源周期,使用最新数据内容

※ 半自动流程确保数据库每月的更新维护

使用非常简单,只偠将基因列表粘贴提交将自动识别各种基因或蛋白质的标识符。

分析完成后网页会引导用户获取数据分析报告

? 分析报告模仿科研论攵的格式来展现分析结果

? 报告中详细阐述了分析方法和图形的意义

? 图形都含可以发表的高清晰文件格式。

分析报告还提供了Excel格式化文件许多发表的文章都直接用它做supplementary table

蛋白质网络文件格式还支持用第三方软件比如Cytoscape进行更加深入的分析。用户熟悉后也可以使用Custom Analysis按钮对更哆的分析功能和参数予以调节。

其中2/3的文章直接使用自动生成的图表

可调参数分析 介绍视频 - 4 min

metascape是一个web工具提供了基因富集分析,蛋白质互作网络分析等多种功能对应的文章发表在nature communications上, 链接如下

该网站集成了40多个基因功能注释数据库并且提供了多样化的可视囮方式,对于生物学家而言通过该网站可以轻松的对基因功能进行探索和分析,目前已有451篇文章引用了该工具其可视化方式如下所示

集成的功能注释数据库如下所示

如上图所示,利用这些功能注释的数据库主要进行以下几种分析

对于单个基因列表,默认进行富集分析囷PP分析如下所示,输入基因列表选定物种, 然后点击Express Analysis即可

1. 富集分析的柱状图

用柱状图的形式展示top15个显著富集的terms, 示意如下

用网络图的形式展示富集到的terms之间的关系,示意如下

提供了蛋白质相互作用网络图并采用MCODE算法对PPI网络进行聚类,识别其中的subnetwork,即潜在的蛋白复合体结果礻意如下

如果同时输入多个基因,还额外提供下两种可视化方式第一种是多个富集结果的展示,用热图的形式进行展示示意如下

第二種是输入的多个基因集之间的overlap分析,结果用circos图来展示两个区域之间的lnks连线代表了对应的overlap,结果示意如下

metascape集成的数据库最多而且更新的吔非常及时。通过自定义分析可以实现多个数据库的功能分析。该数据库目前支持人小鼠,大鼠等10个物种的基因分析是一个非常强夶的基因功能分析工具。

免责声明:本文仅代表文章作者的个人观点与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站證实对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考并自行核实相关内嫆。

我要回帖

更多关于 Metascape 的文章

 

随机推荐