近日,复旦大学附属肿瘤医院头颈外科联合西湖大学等科研机构成功绘制了国际上首个甲状腺髓样癌蛋白基因组学全景图谱,并通过多组学联合分析对甲状腺髓样癌中的新致病基因进行了鉴定,研究成果在线发表于 Cell Discovery。该研究首次提出的甲状腺髓样癌三类分子分型也为该肿瘤的精准治疗提供了参考依据。
多组学分析看似简单,实际上在数据处理和挖掘中困难重重,而蛋白基因组作为涉及组学更多、样本量更大的存在,从数据分析到文章成形则面临着更大的挑战。那么在进行组学分析的时候,究竟要如何合理的进行数据挖掘、数据整合和生物信息分析呢?
为了帮助广大科研人员更深入了解多组学与蛋白基因组「如何从数据到文章」,深化多组学数据在科学研究中的实际应用,11 月 26 日 14:00~15:00,欧易生物邀请到复旦大学附属肿瘤医院头颈外科主治医师史潇为大家带来「整合视角下的甲状腺髓样癌蛋白基因组学景观:驱动基因谱,分子分型与精准治疗策略」的课程直播,本次直播也将对发表在 Cell Discovery 的文章进行深度解读。

扫码立即报名直播
参与直播互动还有机会获得精美礼品


直播开始前,我们简单梳理了多组学和蛋白基因组学的数据分析整合和文章发表难点,方便大家带着思考进行后续的直播学习:
1、组学数据分析个性化太强
不是下载已有报道的数据,分析出来的结果和文章不完全吻合,就是同一套数据自己分析和别人分析结果不是 100% 匹配,这种差异到底是什么原因导致的?
其实不同的算法、软件、参数还有阈值得出的结果就会不完全一致。任何一个组学,哪怕是现在最常见的转录组测序也是如此,并且几个组学之间整合分析的个性化是 1 + 1 > 2 的,这也是目前对生物信息学文章分析方法要求越来越细化的原因——一切分析都需要可重复才可信。
2、组学联合的分析结果太多
在搞定了不同组学和组学联合的软件、算法或流程之后,得到分析结果后又会面临:单一组学、不同组学和不同角度的联合分析,结果一大堆,如何整合?哪些结论比较重要?文章中又需要呈现哪些?
数据的利用是需要明确一个原则的:学会做减法比学会做加法更重要。无重点的展示所有数据和图片会造成文章逻辑线混乱,只需呈现与自己研究方向直接相关的部分,而重中之重是要将分析中的硬指标与研究方向有效结合。
3、不同组学之间结果不完全吻合
终于从庞杂的多组学数据中筛出自己要的结果,然而以自己的认知无法将不同组学之间的结果很好关联,有些结果之间甚至相悖,这些结果该如何取舍?
遇到这种情况需要先做几个判断:
1)每个组学的数据是否都是可信与真实的?
2)数据都真实的情况下,几个不同组学之间是什么关系?组学间吻合度是多少?关联是否在正常范围?
3)如果一切都正常,哪组数据和研究方向有更直接的联系?通过判断更合理去解决不同组学之间结果吻合度和数据使用的问题。
带着这些问题,通过直播以具体文章为案例的讲解,相信大家可以更直观地了解如何对庞大的数据进行整合分析和结果展示,不想错过的话就赶快识别下方海报二维码报名参与吧~

内容策划:王丹琦
内容审核:周育红
题图来源:图虫创意
点击「阅读原文」,免费报名直播课~
