CoMutDB数据库

作者:DoubleHelix

微信公众号:生物信息云

数据库地址:http: //www.innovebioinfo.com/Database/CoMutDB/Home.php

体细胞突变是肿瘤发生中最重要的因素之一,也是大多数癌症测序工作的重点。在一个肿瘤中同时发生多个突变,作为一种识别协同突变或导致癌症的途径的手段,已经得到了越来越多的关注。CoMutDB利用来自29559名癌症受试者和1747个涵盖78种不同癌症类型的癌细胞系的多组学、表型和临床数据,可用于分析共突变与预后、药物敏感性和性别、年龄和种族差异相关。

CoMutDB 包含从三个大型联盟(TCGA、ICGC 和 DepMap)挖掘的体细胞共突变数据。热图对针对不同表型(生存、年龄、性别、种族和药物敏感性)的分析的每个方面预先计算的、可下载的显着共突变的数量进行了颜色编码,其中符合条件的共突变基因对必须是在超过 10% 的样本中同时发生突变。在 CoMutDB 的查询服务中,取消了 10% 的频率限制,用户给定的基因集中的任何一对都被视为候选共突变。顶部的三个栏使用不同的颜色来区分源数据联盟(TCGA、ICGC 和 DepMap)。在热图中,每个细胞的颜色强度与具有统计学意义的表型相关共突变对的数量成正比。

此外,CoMutDB 通过实时计算响应用户查询。由于 CoMutDB 从三个不同的来源吸收了多组学数据,我们为每个数据源实现了一个单独的查询页面,用户需要在其中选择一个或多个数据集(癌症类型、队列或细胞系)来执行查询。在基因水平而不是位置水平启用共突变查询。查询服务最重要的输入是一组基因,从中形成共突变对,并检查与表型变量、生存和药物敏感性的可能关联。CoMutDB 可以通过参数查询,包括癌症类型、组织部位、基因名称、共突变基因的数量(最多 4 个)、突变类型(沉默、非沉默和全部)。

CoMutDB 计算的关键步骤是将一个数据集中的样本划分为共突变突变体和野生型组。虽然共同突变通常涉及两个单独的基因,但我们的查询服务允许共同突变实体最多包含四个基因。虽然共同突变通常是指单个基因的“并发”突变,但只要任何组成基因发生突变,我们也可以断言共同突变。对于特定的共同突变,可以指定逻辑运算符(“和”、“或”)来定义共同突变基因之间的关系。例如,如果指定了“ TP53和KRAS ”,则突变组中的样本必须同时在TP53和KRAS基因中表现出突变。如果 ' TP53或KRAS ' 被指定,突变组中的样本必须在TP53或KRAS中至少包含一个突变。根据共突变状态对样本进行划分后,CoMutDB 将生存数据、药物敏感性和其他临床特征(年龄、性别和分期)与共突变状态变量相结合,并推断出共突变之间关联的统计显着性-突变和各种临床特征。CoMutDB 的输出为表格格式,可以浏览或下载。

体细胞突变的同时发生反映了上位性的概念,它描述了两个或多个基因之间的非加性相互作用在它们对表型的综合影响中的任何关系。在癌症中,如果随机突变具有优于现有基因组景观的适应性优势,则它们会被联合选择。具有正上位性的共突变导致比单个突变的累加效应更强的适应性。因此,此类突变更有可能在同一肿瘤内一起发生。相反,负上位性表明共突变的适应性弱于个体效应。以前的研究表明,压倒性的证据表明同时获得多个体细胞突变会导致重大的生物学影响。在很多场景中,生物学影响可以转化为对预后和不同药物敏感性的更强预测。CoMutDB 是第一个致力于管理和描述癌症突变共现情况的数据库。

引用

Limin Jiang, Hui Yu, Jijun Tang, Yan Guo, CoMutDB: the landscape of somatic mutation co-occurrence in cancers, Bioinformatics, 2022;, btac725, https://doi.org/10.1093/bioinformatics/btac725