Genome Biology | 药物基因组学数据库

简介: Genome Biology | 药物基因组学数据库

近日来自Genome Biology的一项研究中提出了一个综合数据库:My Personal Mutanome (MPM),用于加速精准癌症医学方案的开发。MPM提供了基于网络的诊断和药物基因组学方法,用来了解临床环境中复杂的基因型-表型关系和治疗反应,有望促进肿瘤发生的可操作突变的鉴定和人类相互作用组水平的个体化治疗。


image.png

image.png大量的基因组测序数据激发了个性化治疗的新挑战,并促进了肿瘤药物的发现。My Personal Mutanome (MPM)数据库包含了来自The Cancer Genome Atlas的33种癌症类型中超过10,800个肿瘤外显子组的490,245个突变,映射至94,563个结构分辨/预测的蛋白-蛋白相互作用界面(“网络边扰动”)和311,022个功能位点(“网络节点扰动”),包括配体蛋白结合位点和8种类型的蛋白质翻译后修饰。对于这些作图的相互作用,总共获得了8,844个存活结果和1,271,132个药物反应。


随着高通量测序不断发展,已经有数十万个外显子组和基因组发布。癌症基因组图谱(TCGA,https://www.cancer.gov/tcga)计划已对33种癌症类型中超过11,000名患者的基因组/外显子组进行了表征。癌症的体细胞突变目录(COSMIC)和cBioPortal等这些数据和网络资源极大地促进了癌症的研究和药物发现,但对于精准医学发展至关重要的变异体致病性仍没有更好解释。典型的计算方法也只能以临床决策所需的高置信度来识别一小部分致病变体。对因果和临床上可行的突变进行鉴定和优先排序对于了解其在肿瘤发生和疾病进展中的作用、发现新的生物标记并提供生物学相关的药物靶标方面至关重要。


论文小组的所有先前的观察和其他研究提供了人类癌症体细胞突变的节点和边缘效应的功能验证。这些结果激励作者开发一个系统生物学工具,用于查询人类相互作用体中的此类节点突变和边缘突变,这将有助于识别用于精确癌症药物的新的功能突变/基因、药物靶点和药物基因组学生物标志物。


image.png

image.png

图1数据库的总体设计


论文研究小组收集并处理了包括21,759种蛋白质,490,245个体细胞突变和544,692个突变病例的121,172个PPI,在1074个癌细胞系中测试的251种药物的药物反应,41,843种 PDB和535,182个蛋白质功能位点,用于蛋白质-配体结合并跨越7种类型的蛋白质翻译后修饰(PTMs):乙酰化,丙二酸化,甲基化,邻位糖基化,磷酸化,琥珀酰化,泛素化。


以上所有的数据及其结果都已经集成到了关系数据库MPM中。此外,作者的网站利用的几个主要实体(如药物、蛋白质)和各实体之间的关系如下图所示,用户可依据此体系结构找到需要搜索的信息。


image.png

image.png

图2.数据库的信息体系结构


作者表示,将继续把人类相互作用组更新到数据库中,特别是包括更无偏的系统PPIs数据。此外,将为功能站点提供选择较小窗口的功能。MPM的未来更新将侧重于提供更完整、更高质量的人类相互作用体(包括蛋白质-DNA/RNA相互作用)、功能位点和来自CPTAC的蛋白质基因组学数据。作者将整合更多的人类基因组测序数据,包括跨组学精准医疗(TOPMed)计划,阿尔茨海默症测序项目(ADSP),以及国际癌症基因组联盟(ICGC),通过添加更加个性化的基因组分析来改善MPM的实用性。MPM将每年更新一次。



目录
相关文章
|
8月前
|
编解码 人工智能 数据库
世界土壤数据库(HWSD)土壤数据集
世界土壤数据库(HWSD)土壤数据集
466 0
|
8月前
|
存储 缓存 算法
ICDE2024 |VDTuner:向量数据库自动调优技术
在CodeFuse接入实际业务的过程中,大模型的推理成本以及生成内容的准确性是产品规模落地的两个核心考量因素。为了降低推理成本,我们研发了CodeFuse-ModelCache语义缓存加速功能,通过引入Cache机制,缓存已经计算的结果,当接收到类似请求后直接提取缓存结果返回给用户。另一方面,为了提升代码生成的准确度,我们引入了few shot机制,在输入大模型之前拼接一些类似的代码片段,帮助大模型更好的理解希望生成的目标代码。上述两个核心功能的实现都依赖于向量数据库(Vector Data Management Systems, VDMS)存储并检索相似的请求或者代码片段。
220 1
|
8月前
|
存储 SQL 弹性计算
西电数据库实验三:XDSQL数据库优化
姓名:贾瑞 学号:21009201172
|
存储 Cloud Native Oracle
甲骨文:让数据库“回归”简单
甲骨文:让数据库“回归”简单
|
存储 关系型数据库 分布式数据库
PolarDB 开源版 通过rdkit 支撑生物、化学分子结构数据存储与计算、分析
PolarDB 的云原生存算分离架构, 具备低廉的数据存储、高效扩展弹性、高速多机并行计算能力、高速数据搜索和处理; PolarDB与计算算法结合, 将实现双剑合璧, 推动业务数据的价值产出, 将数据变成生产力. 本文将介绍PolarDB 开源版 通过rdkit 支撑生物、化学分子结构数据存储与计算、分析
660 0
|
算法 关系型数据库 数据库
数据库优化器原理 - 如何治疗选择综合症
标签 PostgreSQL , 单列索引 , 复合索引 , 优化器 , 成本因子 背景 RBO -> CBO -> 动态优化 经常听到这样的声音:“查询慢?加个索引吧。”,虽然话不专业,但是体现了早期基于RBO(基于规则)的优化器思维。
5412 0
|
8月前
|
存储 关系型数据库 分布式数据库
PolarDB 开源版 通过rdkit 支撑生物、化学分子结构数据存储与计算、分析
背景PolarDB 的云原生存算分离架构, 具备低廉的数据存储、高效扩展弹性、高速多机并行计算能力、高速数据搜索和处理; PolarDB与计算算法结合, 将实现双剑合璧, 推动业务数据的价值产出, 将数据变成生产力.本文将介绍PolarDB 开源版 通过rdkit 支撑生物、化学分子结构数据存储与计...
236 0
|
存储 达摩院 Cloud Native
数据库数字孪生技术获突破,Ganos两项研究成果入选VLDB
Ganos率先借助云原生能力研究大规模3D场景和移动对象轨迹的In-database空间计算,研发成果在VLDB的发表,揭开了数据库基础软件在数字孪生3D空间计算方向上的崭新篇章。
数据库数字孪生技术获突破,Ganos两项研究成果入选VLDB
|
SQL 存储 缓存
数据库小技能:Oracle基础【中篇】
提高数据库运行效率的方法:从数据库系统级优化、数据库设计级优化和程序实现级优化。
170 0
|
存储 自动驾驶 物联网
数据库风向标第十三期:孪生全空间数据库Ganos V5.0解读
简介: 从室外空间到室内外一体化空间,从地上空间到地上下一体化空间,以全空间为载体的位置服务将随时在、随地在、随身在。为迎接全空间位置智能时代的到来,数据库需要原生存储、查询与分析处理大规模全空间多模多态数据,应对来自数字孪生、自动驾驶/车联网、5G空间计算等前沿位置相关技术领域新数据新场景挑战。今天就来聊一聊Ganos V5.0面向孪生全空间能力的重磅升级,是如何解决全空间位置大数据使用流程复杂、使用门槛高、应用效率低等问题。

热门文章

最新文章