为帮助受疫情影响的广大科研工作者假期科研不中断,我们从本周一 (3月2日) 起,打造了全新的线上讲座单元 — 40分钟最新顶刊精读系列,帮助大家在家也能掌握最新研究动态。
第一期讲座中,徐恪讲师利用40分钟对CELL上的最新一篇关于肝癌分子分型文章“Integrated Proteogenomic Characterization of HBV- Related Hepatocellular Carcinoma”,从课题设计、文章结构、数据结果及创新点做了精彩的解析(如上图所示),课后老师们踊跃提问,特别是组学数据分析、文章思路解析以及样本问题等。小编将问题及回答做了分类汇总,希望对老师们的科研工作有所帮助。
数据分析类
问题1:转录组和蛋白组数据的分型结果完全一致吗?不完全一致的话,作者是如何解决的?
从上图清晰的看到,对于本文来说,蛋白转录层面的分型结果大体一致,但仍然有个别差异。但这并不影响结果的呈现和后续的分析,原因如下:
1). 作者的分子分型最终是按照蛋白组学数据进行的,转录(包括TCGA数据库内公共数据)和磷酸化层面的分型更多为了佐证作者的蛋白层面分型(代谢驱动型、增殖驱动型、微环境失调型)的合理性;
2). 作者直接中根据WES数据库建立的mRNA-protein对,虽然98.6%呈现正相关,但仍然有部分相关性不高、甚至相反,其中包括的蛋白复合物(RNA聚合酶、呼吸链复合物蛋白等)的组装及其蛋白水解(泛素蛋白酶体激活),所以分型不完全一致也正常,只要解释合理就好。
问题2:作者为什么分了3型,而不是4型或者更多?
对于分型来说,作者依靠共识聚类策略进行非监督聚类实现。具体到如何确定具体分几组,一般有两方面的考量:
1)考虑实际意义:分析分成n个亚组后,是否每一亚组有其特征性的病理机制,其亚组间的预后(或者其他临床指征)是否有显著性差异
2)聚类结果分析:主要是这三个图进行判断(第一个和第三个图更重要):
l 小图1:聚类效果最好最稳定的K值是图中X轴μ值0.1至0.9之间下降坡度最小的曲线
l 小图3:看轮廓宽度,越接近1,说明组内聚的越好。
样本问题类
问题1:请问蛋白组学对癌组织或癌旁组织有需要要求吗,有些癌组织含血量比较丰富,怎么排除刚才徐老师所说的血液干扰?
如果样本来源于动物模型,我们可以在收样前进行如下操作,排除血液的干扰:小鼠麻醉固定→横隔处打开胸廓(暴露胸腔)→保证心脏跳动、迅速剪开右心耳,用注射器从左心室灌注含肝素生理盐水→灌注到肝肾发白停止灌注。
对于较为珍贵的临床样本而言,我们力求在收样时清洗干净,去除表面的血污和一些脂肪、结缔组织。由于我们所有样本基本上都是含有血的(组内和组间差异不明显) 所以对结果不会有特别大的干扰。
问题2:蛋白组学样本数量最低有要求吗,做亚型?
目前没有看到明确的要求规定分子分型的最低样本数量,但是目前从实际文章看,多数文章的样本数量>100对(即超过100个病人的癌+癌旁对照)。
在这里,我要跟大家说一个可能的误区。
比如我们有100对样本(100个癌组织,100个癌旁组织)。那么,我们在筛选差异蛋白的时候,是用这200个样本,进行的差异分析。但当我们真正进行分型的时候,是筛选出来的差异蛋白(或变异度 top 50%蛋白),对100个癌组织样本进行的分型。
所以假如我们样本数量过少时,就意味着我们可用于分型的样本会再次减半、影响分型结果。如果需要前期小规模预实验,建议采取DIA策略,用小样本评估分型趋势,后期加大样本量整合后分析。
PS:只要两批的QC和实验条件等保持一致,后期是可以通过生信手段消除批次效应。
研究思路(技术选择)类
问题1:在翻译后组学方面,本文为什么选择磷酸化蛋白组而不是糖基化或者酰化修饰?对肿瘤分型,更建议做磷酸化组学吗?
在本文中,我们可以看到,对于分子分型来说,作者选择的还是蛋白组学,而不是磷酸化,结果里的转录和磷酸化层面的分型,更多的时候是为了佐证蛋白分型的价值。
至于为什么绝大多数顶级期刊选择磷酸化而不是其他层面,主要是针对潜在药靶筛选这一后期研究的,其主要原因:1)在所有已知修饰中,磷酸化更常见,涉及的机制更多;2)现在大多数靶向药物都是磷酸激酶的抑制剂,所以从这个层面也更容易找到合理的现成用药,提升文章的价值和转化潜能。
但是,假如我们所关注的疾病,跟其他的修饰关系更大,那么可以将磷酸化换成其他对应的修饰。
问题2:您讲得很好。想请教一下,代谢组学可以用于肿瘤分子分型研究吗?比如从血液样本筛选特异代谢产物?或者肠道宏基因组学呢?可以用于消化道肿瘤,或者某种上皮癌症的分子分型吗?
理论上来说,只要是原位组织样本,蛋白、修饰、代谢等层面均可进行疾病分型的(Altered metabolism distinguishes high-risk from stable carotid atherosclerotic plaques. European Heart Journal (2018) 39, 2301–2310doi:10.1093/eurheartj/ehy124. 利用代谢组学对颈动脉斑块进行分型)。
对于血液样本,不太推荐做疾病分型,对于大多数疾病而言,血液内物质的来源太过复杂 (包括原位组织病理机制下关键物质和疾病继发全身反应导致入血的物质),会对刻画疾病表型造成干扰。至于肠道微生物样本,我觉得和血液样本类似。这两种样本能适合进行做标志物类研究,对疾病进行早期预警\预后风险评估。