zl程序教程

您现在的位置是:首页 >  工具

当前栏目

小站工具网站功能总结:查询基因在肿瘤中的表达情况+火山图+GSEA+Survival+ROC+ENSG注释,

工具网站 查询 功能 总结 情况 注释 基因
2023-06-13 09:15:24 时间

工具入口:

www.chrislifescience.club:3838/R/AnnoE2


1、火山图

根据数据来源有两个种模式:

第一种:从TCGA数据中筛选

1.勾选FromTCGAdata选项,在下拉菜单中选择肿瘤。

2.如果你需要筛选lncRNA:勾选Need Annotation和FilterLnc,这个时候已经可以看到结果了。如果不需要这步不需要操作。

3.勾选Select gene,在表格中找到自己想呈现的lncRNA,点击DownloadPlotPdf下载结果。

第二种:DIY数据

一、输入的表格要求:

1、格式为csv!!!

至少要有三列:分别是

基因名(Gene Symbol),倍数(log2FlodChange),p值(padj),在右上那几个列名中分别填写自己表格中各列的名字。以测试数据为例:分别填写,logFCpSymbol

二、如果geneID是ENSG,内置注释功能,点选Need Annotation输入ENSG列名。

二、如果geneID是ENSG,内置注释功能,点选Need Annotation输入ENSG列名。

图像修饰

1.火山图加上自己配色选项。之前站长精选配色依然可以选择,如果想自己DIY,请选择YouLike,然后在调色板选颜色,火山图会实时更新。

2.升级指示基因功能。可以实现单选多选,并与表格交互。你想选哪个基因,在右边表格点一下。左边图就会更新。

ps出现红色的提示不要担心,记得把Select Gene那个勾上。

3.优化输出。图片可以直出矢量pdf,不用担心图像因为页面大小变形,输出的pdf是正常的,这样在手机上也可以使用。

下面这个是使用视频教程。

2、GSEA使用方法:

1、数据准备:

1)格式csv,在上1的位置输入。

2)如果基因名是ENSGxxxx的不要担心,在2的位置ENSG所在那列的名字。在3的地方勾选。下面的456就不要改动了。

3)如果是芯片数据,或者自己DIY的数据,数据中至少应该包括:倍数列,p值列,基因名列。分别在图中4、5、6填入。以测试数据为例:分别填写,logFCpSymbol。注意!这时在3的地方不要勾选。

2、出表出图:

1)图中右上角的表格是GSEA的结果,10的位置可以下载。

2) 下面的图是GSEA的结果图,可以在表格中选择想画图的基因集ID。这里可以多选(最多10个),11的位置下载的是GESA的PDF图像。

3)7的位置准备了三个配色方案可选择

4)在8的位置选择Geneset,c1站长从来没用过,直接去掉。选择c2的时候要等待15秒右下角有进度条。

3、根据AUC与单因素COX结果筛选的生存曲线+ROC图

这里大大的感谢:Daying!

1、数据准备:

1)格式csv。其中包括生存期数据(时间+事件状态)例如这样:

2、运行

2)输入进去以后,你需要等待~~因为第一步是批量并行计算单因素COX+AUC,这个过程站长测试,200基因x150样本,至少要1分钟。一般要等1分钟,结果出来以后右上角那个表格会有变化。

3)右上角的表格可以进行,各列筛选,比如5年生存期AUC>0.7 & 单因素COX p<0.05 & prognosis is bad。

4)选择你要的那个基因,以后下面会自动生成ROC与生存期曲线。

3、输出

5)当然可以调色

6)当然可以下载,了解站长的应该知道怎么下。

同学们看黑板,这里要重点说明一下!!!!!

批量COX+AUC真的很吃机!

站长服务器cpu是10核20线程的单cpu,试过跑2000基因就要3分钟了,推测跑40000个基因要跑1个小时。

求诸位放过站长的服务器和家里的电费。

基因筛选一下在跑,最好是200个基因x200以内个样本。

如果跑的过程中,出现

画面不动的情况,千万别盯着,去刷刷朋友圈,看看站长的教程。

如果没有结果过了五分钟还没有出现,要淡定,去筛筛自己的基因,缩小一下范围。再来一次!

可能有同学要问,站长加一个cpu不就解决问题了!

嗯,这个同学很聪明!

加个cpu大概需要5000RMB,

但是,因为钱都给娃买奶粉了,真的加不起了!

如果真的想更好的体验这个工具,只能靠大家自己了。

站长开了赞赏通道,网站来源的赞赏,都用于升级服务器使用。

升级了也能为大家更好的服务。

在这里谢谢大家了~