python逻辑回归模型预测癌症

本文涉及的产品
模型训练 PAI-DLC,100CU*H 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
交互式建模 PAI-DSW,每月250计算时 3个月
简介: python逻辑回归模型预测癌症

数据准备

使用sklearn.datasets导入癌症数据load_breast_cancer

# 获取数据对象

data=load_breast_cancer()

获取目标变量与特征变量

1. # 导入数据
2. from sklearn.datasets import load_breast_cancer
3. # 获取数据对象
4. data=load_breast_cancer()
5. # 获取目标变量 
6. # 获取特征变量
7. x=data.data 
8. y=data.target
9. 
10. print(len(data.data)) 
11. # print(len(data.target))

数据处理

将导入的数据转化为DataFrame格式,便于后期的数据建模

1. import pandas as pd 
2. data_x=pd.DataFrame(x)
3. data_y=pd.DataFrame(y)
4. data_x
5. data_y

 

数据划分

将导入的数据划分为测试集与训练集两部分

并取80%的数据作为训练集,20%作为测试集

1. # 划分数据集
2. from sklearn.model_selection import train_test_split
3. X_train,X_test,y_train,y_test=train_test_split(data_x,data_y,test_size=0.2)
4. X_train

数据建模

接下来选取逻辑回归模型进行数据建模工作

1. # 模型构建
2. from sklearn.linear_model import LogisticRegression
3. model=LogisticRegression()
4. model.fit(X_train,y_train)
5. model

 

模型评估

使用R的平方(可决系数也称决定系数)来评估模型的好坏,可以看到有94%的结果预测成功的,使用该模型最大的好处就是利用决策树二分类的机制,对数据进行有效的分类,提高预测的准确度

1. y_pred=model.predict(X_test)
2. # 预测结果
3. y_pred
1. # 准确率
2. from sklearn.metrics import accuracy_score
3. score=accuracy_score(y_pred,y_test)
4. score

 

结果预测

讲实际值与预测值进行对比可以发现也存在部分数据预测错误的情况,但从数据的整体预测结果来看可以发现模型的评分是达到了94%的准确率。

1. y_te=[]
2. for i in y_test.values:
3.     y_te.append(i[0])
4. # y_te
5. result={
6. "预测值":list(y_pred),
7. "实际值":list(y_te)
8. }
9. 
10. result=pd.DataFrame(result)
11. result

 

通过该模型能够准确的对癌症的结果进行分类,并达到94% 的准确度。


相关文章
|
17天前
|
数据采集 数据可视化 数据挖掘
金融波动率的多模型建模研究:GARCH族与HAR模型的Python实现与对比分析
本文探讨了金融资产波动率建模中的三种主流方法:GARCH、GJR-GARCH和HAR模型,基于SPY的实际交易数据进行实证分析。GARCH模型捕捉波动率聚类特征,GJR-GARCH引入杠杆效应,HAR整合多时间尺度波动率信息。通过Python实现模型估计与性能比较,展示了各模型在风险管理、衍生品定价等领域的应用优势。
166 66
金融波动率的多模型建模研究:GARCH族与HAR模型的Python实现与对比分析
|
2月前
|
机器学习/深度学习 数据可视化 TensorFlow
使用Python实现深度学习模型的分布式训练
使用Python实现深度学习模型的分布式训练
187 73
|
2月前
|
机器学习/深度学习 数据采集 数据挖掘
使用Python实现智能食品消费市场分析的深度学习模型
使用Python实现智能食品消费市场分析的深度学习模型
144 36
|
2月前
|
机器学习/深度学习 数据采集 供应链
使用Python实现智能食品消费需求分析的深度学习模型
使用Python实现智能食品消费需求分析的深度学习模型
92 21
|
2月前
|
机器学习/深度学习 数据采集 搜索推荐
使用Python实现智能食品消费偏好预测的深度学习模型
使用Python实现智能食品消费偏好预测的深度学习模型
105 23
|
2月前
|
机器学习/深度学习 数据采集 数据挖掘
使用Python实现智能食品消费习惯预测的深度学习模型
使用Python实现智能食品消费习惯预测的深度学习模型
142 19
|
2月前
|
机器学习/深度学习 数据采集 数据挖掘
使用Python实现智能食品消费趋势分析的深度学习模型
使用Python实现智能食品消费趋势分析的深度学习模型
148 18
|
2月前
|
机器学习/深度学习 数据采集 供应链
使用Python实现智能食品消费需求预测的深度学习模型
使用Python实现智能食品消费需求预测的深度学习模型
90 10
|
2月前
|
机器学习/深度学习 数据采集 搜索推荐
使用Python实现深度学习模型:智能食品消费行为预测
使用Python实现深度学习模型:智能食品消费行为预测
99 8
|
2月前
|
机器学习/深度学习 数据采集 数据挖掘
使用Python实现智能食品消费模式预测的深度学习模型
使用Python实现智能食品消费模式预测的深度学习模型
72 2

热门文章

最新文章