GSEA(Gene Set Enrichment Analysis)即基因集富集分析,该方法最早于2005年由Broad Institute研究所发表在PNAS杂志上,并提供了对应的分析软件GSEA和一个基因集数据库,截止到当前已被引用3万多次。
通过KEGG、GO富集分析,我们能够获取差异基因显著富集的通路和功能,及其对表型变化的潜在作用。但无法帮助我们知晓某条通路下差异基因的总体变化趋势,以及对应通路的状态:到底是激活还是抑制状态?此外,设置差异基因筛选阈值可能会漏掉一些在统计学意义上无显著差异但实际有着重要生物学意义的基因。而GSEA则弥补了传统富集分析的这些问题。GSEA使用所有基因而非仅差异基因进行分析,找到那些差异不显著但基因差异表达趋势趋于一致的功能基因集,同时还能够判断对应通路是处于被激活或抑制状态。
GSEA分析分为三个步骤,分别为计算富集分数、估计富集分数显著性水平和矫正多重假设验证(如下图所示)。
GSEA富集分析得分曲线图(左)和核心基因热图(右)
那么这个图怎么解读和在文章中描述呢?
接下来跟着小编学习3篇项目案例,一起增加GSEA的知识吧!
#项目案例1
文献题目:Kir2.1-mediated membrane potential promotes nutrient acquisition and inflammation through regulation of nutrient transporters
发表期刊:Nature communications IF:17.694
合作单位:浙江大学
技术手段:转录组+代谢组
结果描述:GSEA分析显示,在Gramicidin和KCl升高的情况下,自噬反应功能显著富集。
#项目案例2
文献题目:A small molecule targeting ALOX12-ACC1 ameliorates nonalcoholic steatohepatitis in mice and macaques
发表期刊:Science Translational Medicine IF:19.319
合作单位:武汉大学
技术手段:转录组+蛋白质组+代谢组
结果描述:GSEA分析显示了与不同程度敲降ACC1的肝细胞中脂肪酸合成和分泌相关的途径和基因的激活或抑制。①ACC1(#5)的轻微敲降对参与脂肪酸合成的基因表达的影响可忽略不计。②ACC1(#4)的部分敲降有效地抑制了参与脂肪生成和脂质分泌的基因的mRNA和蛋白质表达。③保留完整的ACC1(#8)时这些功能则实质性激活。
#项目案例3
文献题目:Multiple omics study identifies an interspecies conserved driver for nonalcoholic steatohepatitis
发表期刊:Science Translational Medicine IF:19.319
合作单位:武汉大学
技术手段:转录组+蛋白质组+代谢组
结果描述:为了进一步探索脂肪毒性诱导的NASH的分子机制,作者通过基因集富集分析(GSEA)研究了四个物种的NASH和对照肝脏之间的花生四烯酸(AA)途径的核心基因。结果发现,ALOX12是AA代谢途径中的核心酶,是在所有物种中对NASH中AA途径的激活贡献最大的保守基因。
基于上述3篇案例,对GSEA分析结果的使用可总结如下:
首先看FDR(P-adjust)或者P-value是否显著(<0.05),表示在该功能基因集显著富集;
其次看NES(Normalized ES)值,为正值时表示在左侧分组中激活、右侧分组中抑制,为负值时表示在左侧分组中抑制、右侧分组中激活。
GSEA分析的使用的方法可参考更多文章哟~
开学季,中科新生命真核生物转录组奉献双重豪礼!
一重豪礼:
T7平台转录组测序,6G数据量,6个样本起 一口价598元/样本。
二重豪礼:
分析报告全面升级!
针对不同物种来源交付不同分析版本(医学版、农学版)报告,服务内容更细致
医学版(左)和农学版(右)生信分析流程
分析呈图美化,发表级Figure唾手可得
样本间相关性热图(左)、GO富集分析气泡图(中)和PPI(右)
免费赠送GSEA高级分析,并提供多阈值筛选差异基因的分析结果,服务更贴心
GSEA富集分析(左)和以Pvalue筛选差异基因分析结果(右)