python 数据分析机器学习sklearn包快速上手

简介: python 数据分析机器学习sklearn包快速上手

1 sklearn自带数据集

sklearn中带有很多数据集

from sklearn import datasets
diabetes=datasets.load_diabetes()
X=diabetes.data
y=diabetes.target

X.shape
X[:5]

在这里插入图片描述
y[:10]

在这里插入图片描述

2 使用sklearn包中的模型

from sklearn.linear_model import Lasso #L1正则化线性回归
import numpy as np
from sklearn.model_selection import GridSearchCV
X_train=diabetes.data[:310]
y_train=diabetes.target[:310]

X_test=diabetes.data[310:]
y_test=diabetes.data[310:]

lasso=Lasso(random_state=0)
alphas=np.logspace(-4,-0.5,30)

estimator=GridSearchCV(lasso,dict(alpha=alphas))#估计器,里面是lasso这个模型,超参dict(alphas)
estimator.fit(X_train,y_train)#30个lasso模型比较,返回最好的模型

在这里插入图片描述
最高的评分
estimator.best_score_

0.46170948106181964

最好的模型
estimator.best_estimator_

Lasso(alpha=0.07880462815669913, random_state=0)

3 预测数据

estimator.predict(X_test)

在这里插入图片描述

目录
相关文章
WK
|
22天前
|
Python
如何在Python中导入包
在 Python 中,包是一种组织代码的方式,通过包含 `__init__.py` 文件(在 Python 3.3 及以上版本可选)的目录实现。包内可以包含多个模块(`.py` 文件)和其他子包。导入包有多种方式:整体导入包、导入特定模块、导入特定函数或类、导入子包等。推荐的做法是明确指定导入内容以提高代码的可读性和可维护性。此外,确保包目录结构正确,并将其添加到 Python 的搜索路径中。对于分发包,使用 setuptools 和 pip 等工具更为便捷。
WK
113 66
WK
|
22天前
|
Python
如何在Python中创建包
在Python中创建包十分简便,主要涉及目录结构的设置及`__init__.py`文件的配置。虽然Python 3.3后空`__init__.py`文件不再强制要求,但在特定场景下保留它有助于保持兼容性或执行包初始化代码。创建包的具体步骤包括:构建目录结构、编写模块代码、(可选)编写初始化代码等。例如,可以创建一个名为`mypackage`的目录,其中包含`__init__.py`及多个模块文件如
WK
109 62
WK
|
23天前
|
开发者 Python
Python中的包是什么?
在Python中,包是一种组织模块的方式,用于实现代码重用和模块化。通过包含`__init__.py`文件的目录定义包,形成树状结构,便于管理大型项目。包提高了代码的可读性和可维护性,允许重用现有代码,并避免模块名冲突。使用点操作符导入包中的模块,`__init__.py`可在包导入时执行初始化代码。从Python 3.3起,还可使用命名空间包来组织模块。掌握包的使用对大型Python项目开发至关重要。
WK
18 5
|
23天前
|
机器学习/深度学习 数据采集 算法
机器学习到底是什么?附sklearn代码
机器学习到底是什么?附sklearn代码
WK
|
23天前
|
开发工具 git Python
如何在Python中创建包?
在Python中创建包十分简便,主要步骤包括:创建目录(如 `mypackage`),并根据需求添加空的或含初始化代码的 `__init__.py` 文件;接着在该目录下添加 `.py` 文件作为模块;如有需要,可以进一步创建子包以形成层次结构。创建完成后,即可在其他脚本中导入并使用这些包。为避免名称冲突,请选择独特的包名,并考虑使用版本控制系统(如Git)管理代码变更。对于需分发的包,还应准备 `setup.py` 文件以方便构建与发布。
WK
19 3
|
26天前
|
项目管理 数据安全/隐私保护 Python
使用poetry来更优雅的管理 python 包
Poetry 的优势在于它提供了一个统一的工具来处理 Python 项目的整个生命周期,从依赖管理到打包和发布。它的依赖解析器非常强大,能够有效地处理复杂的依赖关系。此外,Poetry 还提供了一个直观的命令行界面,使得项目管理变得更加简单。 对于团队协作和项目部署来说,Poetry 的依赖锁定功能(通过 poetry.lock 文件)特别有用,因为它确保了所有环境中使用相同版本的依赖。
|
23天前
|
IDE 开发工具 Python
如何快速优化Python导包顺序
如何快速优化Python导包顺序
|
23天前
|
机器学习/深度学习 计算机视觉 Python
深度学习项目中在yaml文件中定义配置,以及使用的python的PyYAML库包读取解析yaml配置文件
深度学习项目中在yaml文件中定义配置,以及使用的python的PyYAML库包读取解析yaml配置文件
32 0
|
24天前
|
机器学习/深度学习 数据采集 算法
如何使用机器学习神器sklearn做特征工程?
如何使用机器学习神器sklearn做特征工程?