Whole-Genome Expression Microarray Combined with Machine Learning to Identify Prognostic Biomarke...

简介: 摘要本研究的目的是建立一个框架,以更好地了解高级别胶质瘤(HGG)预后相关的生物标志物。进行全基因组基因表达微阵列以鉴定HGG和低级弥漫性神经胶质瘤之间的差异表达基因。

摘要

本研究的目的是建立一个框架,以更好地了解高级别胶质瘤(HGG)预后相关的生物标志物。进行全基因组基因表达微阵列以鉴定HGG和低级弥漫性神经胶质瘤之间的差异表达基因。几种机器学习算法用于过滤预后相关基因。选择手术切除后的一千九百名HGG患者进行生存分析。对这些肿瘤样品进行免疫组织化学分析,以分析WEE1的IDH1突变状态和蛋白表达。进行qRT-PCR,蛋白质印迹,transwell测定和划痕伤口愈合测定以评估WEE1敲低或在HGG细胞中过表达的效果。三种预后相关基因(WEE1,IGF2PB3和EMP3)被证明可将HGG患者分成两个不同的存活亚组。ROC曲线WEE1下的面积高于IGF2BP3,EMP3,年龄,IDH状态,1p / 19q状态和MGMT启动子状态。与IDH状态,年龄和WHO等级相比,WEE1是一个独立的协变量。敲除或过表达WEE1可抑制或促进U251和U87细胞系的迁移和侵袭。 WEE1,EMP3和IGF2BP3是mRNA水平上可靠的预后相关基因。 WEE1是生存分析中独立的预后生物标志物,对HGG患者具有潜在的诊断价值。 WEE1可在体外诱导HGG细胞迁移和侵袭。

患者和方法患者

从7个低级弥漫性神经胶质瘤和7个HHG(4个WHO III弥漫性神经胶质瘤和3个GBM)患者中收集的14个肿瘤样品被包括在全基因组基因表达微阵列分析中。用于定量逆转录聚合酶链反应(qRT-PCR)的六个正常成人脑样品来自于接受过原发性癫痫手术的患者。用于RNA分离的所有样品均于2012年1月至2012年2月期间通过天津环湖医院手术切除获得。 2013年3月至2015年12月,在天津环湖医院的存档患者中,共有93个符合条件的HGG样本用于免疫组织化学(IHC)和生存分析。生存信息随访时间超过2年。术后选择的治疗方案与中国胶质瘤合作组(CGCG)临床实践指南相似(Jiang等,2016)。本研究中使用的所有手术切除肿瘤样本在患者接受放射和/或化疗之前是原发性肿瘤。 如果根据2016年WHO弥漫性胶质瘤分类标准三名神经病理学家在组织学上确定了他们的诊断,则患者符合研究资格。
本回顾性研究方案和收购的肿瘤样本经环境委员会和环湖医院机构审查委员会批准。 根据赫尔辛基宣言,从患者获得书面知情同意书。
RNA提取和全基因组表达分析

用于RNA提取的肿瘤组织在手术切除后立即在液氮中快速冷冻。 根据制造商的方案提取总RNA。 使用Agilent SurePrint G3 Human GE Microarray 18×60K(Design ID-028804,Shanghai,China)分别对所有样品进行微阵列分析。 微阵列杂交过程在Senichip Company(中国上海)进行。 在R版本3.3.2完成原始数据预处理后获得基因表达数据集。 使用R语言limma包,选择差异表达的基因(DEG)作为|FC|≥2并且矫正P值<0.05。 HGG中的高表达DEG用于生物信息学分析(图1a)。 原始数据上传至NCBI的Gene Expression Omnibus(GEO)GSE106784。

对已发布数据集的再分析

本研究重新分析了公开数据库中的六个数据集(补充表1)。 CGGA RNA-seq用于进行WGCNA分析和LASSO回归模型。 我们使用pamr,sva,affy和impute包去合并TCGA LGG RNA-seq和TCGA GBM RNA-seq数据。 在合并两个数据集后,我们得到了一个批次校正的mRNA表达矩阵去建立 LASSO回归模型,仅包含HGGs。 CGGA数据和GSE16011用于验证候选预后相关基因的预后意义。 TCGA全胶质瘤RNA-seq含有全级弥漫性胶质瘤,用于诊断WEE1与其他胶质瘤相关危险因素之间的相关性。 在本研究中排除了从没有预后信息的所有数据集中选择的样本

机器学习和统计分析

WGCNA由BWGCNA ^ R包进行(Cut-Height = 0.9,minSize = 10)。 确切的算法显示在https://cran.r-project.org/web/packages/ WGCNA / index.html。 LASSO回归模型由Bglmnet ^ R包进行。 通过LASSO溶液中的交叉验证选择最佳收缩参数(λ)的值。 具有非零系数的基因被认为是最具潜在预后相关的基因。 确切的算法显示在https://cran.r-project.org/web/packages/glmnet/ glmnet.pdf。 Kaplan-Meier曲线和对数秩检验用于分析预后功能的存活率验证。 使用单变量和多变量Cox比例风险(PH)回归模型来评估WEE1是否是独立的预后生物标志物。 Schoenfeld残差(Kasal等人,2004)和偏差残差(Jain等人,2012)方法被用来评估Cox PH回归模型假设的有效性。 总体存活率(OS)和无进展生存期(PFS)在之前的文献中被定义(Rossietal,2012)。 如果没有另外提及,对于所有测试,显着性水平设定为P <0.05。
免疫组化

免疫组化
我们使用IHC分析福尔马林固定和石蜡包埋(FFPE)组织的IDH状态(Capper等人2010; Capper等人2009)和WEE1蛋白质表达(Music等人2016)。 用初级抗IDH1-R132H(1:100,克隆H09,Dianova,汉堡,德国)和初级抗WEE1(1:100,SC-5285,Santa Cruz Biotechnology,Shanghai)进行IDH1-R132H和WEE1的IHC染色。 ,中国)抗体。 IHC协议先前已详细描述(Zhang et al.2012)。 IDH1-R132H的细胞质阳性被认为是突变的证据(Capper等人,2009)。 WEE1阳性表达被分级为超过50%的细胞核被染色。 IHC染色的切片由三位独立的病理学家进行评估和评估

质粒载体和细胞培养
所有质粒均获自OriGene Technologies(Rockville,MD,USA)。 质粒载体pRFP-C-RS shWEE含有两种不同的WEE1特异性序列(shWEE1-1和shWEE1-2),其选自四种不同的WEE1序列以减少脱靶效应。 含有WEE1变体序列的表达载体pCMV6-WEE1-GFP用于过表达。 用Lipofectamine 3000(Invitrogen,Shanghai,China)介导的质粒载体转染HGG细胞系U251和U87。 细胞培养方案与我们之前的研究中使用的相同(Zhang et al.2012)

qRT-PCR和Western Blotting
qRT-PCR和蛋白质印迹的过程与我们之前的研究相同(Zhang等人,2012)。 对于qRT-PCR,引物序列列于补充表2中。对于蛋白质印迹,我们使用针对WEE1的一抗(1:1000;目录号ab203236,Abcam,中国上海)和GAPDH(1:5000;目录号。 ab181603,Abcam,上海,中国)。

目录
相关文章
|
机器学习/深度学习 自然语言处理 算法
TASLP21-Reinforcement Learning-based Dialogue Guided Event Extraction to Exploit Argument Relations
事件抽取是自然语言处理的一项基本任务。找到事件论元(如事件参与者)的角色对于事件抽取至关重要。
102 0
|
算法 计算机视觉 知识图谱
ACL2022:A Simple yet Effective Relation Information Guided Approach for Few-Shot Relation Extraction
少样本关系提取旨在通过在每个关系中使用几个标记的例子进行训练来预测句子中一对实体的关系。最近的一些工作引入了关系信息
130 0
|
算法 Linux Shell
SGAT丨Single Gene Analysis Tool
SGAT丨Single Gene Analysis Tool
|
机器学习/深度学习 算法 Shell
Paper:《A Few Useful Things to Know About Machine Learning》翻译与解读(二)
Paper:《A Few Useful Things to Know About Machine Learning》翻译与解读(二)
|
机器学习/深度学习 存储 传感器
Automated defect inspection system for metal surfaces based on deep learning and data augmentation
简述:卷积变分自动编码器(CVAE)生成特定的图像,再使用基于深度CNN的缺陷分类算法进行分类。在生成足够的数据来训练基于深度学习的分类模型之后,使用生成的数据来训练分类模型。
157 0
|
机器学习/深度学习 自然语言处理 PyTorch
Re6:读论文 LeSICiN: A Heterogeneous Graph-based Approach for Automatic Legal Statute Identification fro
Re6:读论文 LeSICiN: A Heterogeneous Graph-based Approach for Automatic Legal Statute Identification fro
Re6:读论文 LeSICiN: A Heterogeneous Graph-based Approach for Automatic Legal Statute Identification fro
Re8:读论文 Hier-SPCNet: A Legal Statute Hierarchy-based Heterogeneous Network for Computing Legal Case
Re8:读论文 Hier-SPCNet: A Legal Statute Hierarchy-based Heterogeneous Network for Computing Legal Case
Re8:读论文 Hier-SPCNet: A Legal Statute Hierarchy-based Heterogeneous Network for Computing Legal Case
|
SQL 编译器 API
Efficiently Compiling Efficient Query Plans for Modern Hardware 论文解读
这应该是SQL查询编译的一篇经典文章了,作者是著名的Thomas Neumann,主要讲解了TUM的HyPer数据库中对于CodeGen的应用。 在morsel-driven那篇paper 中,介绍了HyPer的整个执行框架,会以task为单位处理一个morsel的数据,而执行的处理逻辑(一个pipeline job)就被编译为一个函数。这篇paper则具体讲如何实现动态编译。
449 0
Efficiently Compiling Efficient Query Plans for Modern Hardware 论文解读
|
机器学习/深度学习 算法 搜索推荐
Paper:《A Few Useful Things to Know About Machine Learning》翻译与解读(三)
Paper:《A Few Useful Things to Know About Machine Learning》翻译与解读(三)