R语言关联规则Apriori对抗肿瘤中药数据库知识发现研究(上)

简介: R语言关联规则Apriori对抗肿瘤中药数据库知识发现研究

全文链接:http://tecdat.cn/?p=32660


肿瘤是近年来严重威胁人类的健康的疾病,据统计,目前大部分种类的肿瘤都呈现不同程度的上升趋势,中国因患肿瘤而死亡的人数约占全球肿瘤死亡总人数的1/4左右,人类正面临着肿瘤防治的新挑战点击文末“阅读原文”获取完整代码数据


现代医学治疗肿瘤的手段和方式已经日臻完善,主要为手术配合放、化疗联合治疗。

但传统西医治疗在提高缓解率的同时易产生较强的毒副作用与耐药性。作为传统医学主体的中医药与西医相结合辨证施治,在提高疗效、缓解不良反应等方面有其独特的优势。

本研究帮助客户在收集数据建立抗肿瘤中药数据库的基础上,运用数学模型探寻抗肿瘤中药性效关系及现代药理学研究,为抗肿瘤中医及中西医综合治疗的临证用药提供理论依据。


读取数据


image.png

siqi=read.xlsx("性效挖掘一列0616 2.xlsx",sheet=1 )  
wuwei=read.xlsx("性效挖掘一列0616 2.xlsx",sheet=2 )  
guijing=read.xlsx("性效挖掘一列0616 2.xlsx",sheet=3 )  
duxing=read.xlsx("性效挖掘一列0616 2.xlsx",sheet=4 )  
gongneng =read.xlsx("性效挖掘一列0616 2.xlsx",sheet=5 )


(一)频数统计


四气、五味、归经、有(无)毒、药理功能基础分析

(1)抗肿瘤中药四气、五味、归经、有无毒性、功能、药理作用→频数统计( or 数据分布)

(四气、五味、归经、有毒无毒考虑数字、直方图、饼图表示)

绘制直方图

barplot(table(unlist(x[,2])))  
  tab1=table(unlist(x[,2]))  
  tab2=table(unlist(x[,2]))/sum(table(unlist(x[,2])))  
   
  res=cbind(tab1,tab2)  
  colnames(res)=c("频数","频率")

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

a_df3=merge(siqi,wuwei,by="流水号" )  
a_df3=merge(a_df3,guijing,by="流水号" )

交叉表

药味和四气那两列要和功效分别做两张这种图

tab=table(a_df$功能,a_df$四气)  
for(i in 1:ncol(tab)){

导出为excel文件:

image.png

image.png

image.png

(二)关联规则


对经典的 Apriori 算法进行改进,编程实现双向强关联规则挖掘方法,采用此方法分析药 - 药性 - 功效之间的联系

将数据转换成事务类型

for(i in 2:ncol(a_df3))a_df3[,i]=as.factor(a_df3[,i])
rulesmodel=function(X){
  rules <- sort(rules, by="support")
  arules::inspect(head(rules, n=20))
  #查看最高置信度样本规则
  rules <- sort(rules, by="confidence")

(1)药性 功效关联性分析

1)药性关联性分析

①四气、五味  

rulesmodel(c("四气","五味"))

image.png

image.png

点击标题查阅往期内容


PYTHON在线零售数据关联规则挖掘APRIORI算法数据可视化


01

02

03

04


image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

②四气、归经

image.png

点击标题查阅往期内容


R语言APRIORI关联规则、K-MEANS均值聚类分析中药专利复方治疗用药规律网络可视化


01

02

03

04


image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

image.png

R语言关联规则Apriori对抗肿瘤中药数据库知识发现研究(下):https://developer.aliyun.com/article/1496808

相关文章
|
1月前
|
存储 NoSQL 物联网
MongoDB:改变游戏规则的数据库,看它如何统治数据世界的每一个角落
【8月更文挑战第7天】MongoDB是一款高性能、开源的NoSQL数据库,采用文档数据模型,支持丰富查询语言及二级索引。其灵活的数据模型和扩展性使其在大数据应用、实时分析、物联网、内容管理系统及电子商务平台等多种现代场景中广泛应用。例如,在大数据应用中,它可以高效存储社交媒体的非结构化数据;在实时分析中,能快速处理新数据并即时更新结果;在物联网应用中,则适用于存储大量非结构化传感器数据;而在内容管理和电子商务平台中,能提供灵活的内容存储和高效的商品搜索功能。
51 2
|
2月前
|
运维 数据管理 关系型数据库
数据管理DMS使用问题之DMS在创建数据库时遵循什么规则
阿里云数据管理DMS提供了全面的数据管理、数据库运维、数据安全、数据迁移与同步等功能,助力企业高效、安全地进行数据库管理和运维工作。以下是DMS产品使用合集的详细介绍。
|
3月前
|
运维 安全 数据管理
数据管理DMS产品使用合集之是否可以为同一个实例下的不同数据库设置不同的审批规则
阿里云数据管理DMS提供了全面的数据管理、数据库运维、数据安全、数据迁移与同步等功能,助力企业高效、安全地进行数据库管理和运维工作。以下是DMS产品使用合集的详细介绍。
48 5
|
3月前
|
SQL 存储 关系型数据库
MySQL数据库进阶第二篇(索引,SQL性能分析,使用规则)
MySQL数据库进阶第二篇(索引,SQL性能分析,使用规则)
|
3月前
|
SQL 关系型数据库 Java
有大批量的数据导入到数据库,规则是数据库有相应主键的就update没有就insert怎么做效率快
有大批量的数据导入到数据库,规则是数据库有相应主键的就update没有就insert怎么做效率快
87 1
|
4月前
|
机器学习/深度学习 数据采集 算法
R语言、WEKA关联规则、决策树、聚类、回归分析工业企业创新情况影响因素数据
R语言、WEKA关联规则、决策树、聚类、回归分析工业企业创新情况影响因素数据
|
4月前
|
数据采集 数据可视化
R语言关联规则Apriori对杭州空气质量与气象因子数据研究可视化
R语言关联规则Apriori对杭州空气质量与气象因子数据研究可视化
|
4月前
|
机器学习/深度学习 算法 数据可视化
R语言改进关联规则挖掘Apriori在超市销售数据可视化
R语言改进关联规则挖掘Apriori在超市销售数据可视化
|
18天前
|
数据采集 机器学习/深度学习 数据可视化
R语言从数据到决策:R语言在商业分析中的实践
【9月更文挑战第1天】R语言在商业分析中的应用广泛而深入,从数据收集、预处理、分析到预测模型构建和决策支持,R语言都提供了强大的工具和功能。通过学习和掌握R语言在商业分析中的实践应用,我们可以更好地利用数据驱动企业决策,提升企业的竞争力和盈利能力。未来,随着大数据和人工智能技术的不断发展,R语言在商业分析领域的应用将更加广泛和深入,为企业带来更多的机遇和挑战。
|
4月前
|
数据可视化 数据挖掘 API
【R语言实战】聚类分析及可视化
【R语言实战】聚类分析及可视化