set_params ()
set_params ( **params ) |
||
设置此估算器的参数。该方法适用于简单的估计器以及嵌套对象(如管道)。后者具有<component> __ <parameter>形式的参数,以便可以更新嵌套对象的每个组件。 |
||
输入 |
**params |
dict估计器参数。 |
输出 |
self |
估计器实例 |
sparsify()
sparsify() |
||
将系数矩阵转换为稀疏格式。将coef_成员转换为稀疏的矩阵。对于L1正则化模型,它可以比平常numpy.ndarray描述更节省内存和存储。intercept_没有转化。 |
||
输出 |
self |
拟合估计量 |
注意:对于非稀疏模型,即coef_中的零不多时,这实际上可能会增加内存使用,因此请小心使用此方法。经验法则是,可以用(coef_ == 0).sum()计算的零元素数必须大于50%,这样才能提供显著的好处。调用此方法后,在调用densify之前,使用partial_fit方法(如果有)进行进一步拟合将不起作用。
sklearn.linear_model.Ridge
介绍
线性最小二乘与l2正则化。最小化目标函数:
||y - Xw||2_2+ alpha * ||w||2_2
该模型解决了一个回归模型,其中损失函数是线性最小二乘函数,正则化由l2范数给出。也称为岭回归或Tikhonov正则化。该估计器内置了对多元回归的支持(即当y是一个二维数组(n_samples, n_targets)时)。
函数表达式
sklearn.linear_model.Ridge(alpha=1.0,fit_intercept=True, normalize=False, copy_X=True, max_iter=None, tol=0.001,solver='auto')
参数
属性 |
解释 |
alpha |
{float, ndarray of shape (n_targets,)}, 默认=1.0 正则化强度;必须是正浮点数。正则化改进了问题的条件,减少了估计的方差。值越大,正则化越强。Alpha对应于其他线性模型中的1/(2C),如logisticsregression或LinearSVC。如果传递了数组,则假定惩罚是特定于目标的。因此它们在数量上必须一致。 |
fit_intercept |
bool, 默认=True。是否适合此模型的截距。如果设置为false,则在计算中不使用截距(即X和y应居中)。 |
normalize |
bool, 默认=False。当fit_intercept设置为False时,将忽略此参数。如果为真,回归系数X将在回归前通过减去平均值并除以l2范数进行归一化。如果您希望标准化,请在对normalize=False的估计器调用fit之前使用StandardScaler。 |
copy_X |
bool, 默认=True。如果为True,则复制X;否则,可能会覆盖X。 |
max_iter |
max_iterint, 默认=None. 共轭梯度解算器的最大迭代次数。对于'sparse_cg'和'lsqr'解算器,默认值由scipy.sparse.linalg. 对于'sag'解算器,默认值为1000。 |
tol |
float, 默认=1e-3 指定模型求解最优化问题的算法。 |
solver |
{'auto', 'svd', 'cholesky', 'lsqr', 'sparse_cg', 'sag', 'saga'}, 默认='auto' 在计算例程中使用的解算器: 'auto'根据数据类型自动选择解算器。 'svd'使用X的奇异值分解来计算岭系数。对于奇异矩阵,比'cholesky'更稳定。 'cholesky'使用标准scipy.linalg.solve解决方案函数以获得闭式解。 'sparse_cg'使用共轭梯度解算器,如中所示scipy.sparse.linalg.cg。作为一种迭代算法,该求解器比'cholesky'更适用于大规模数据(可以设置tol和max iter)。 'lsqr'使用专用的正则化最小二乘例程scipy.sparse.linalg.lsqr。它是最快的,并且使用迭代过程。 'sag'使用随机平均梯度下降,'sag'使用改进的无偏版本saga。这两种方法也都使用迭代过程,并且当n_samples和n_features都很大时,通常比其他解算器更快。请注意,'sag'和'saga'快速收敛仅在具有近似相同比例的特征上得到保证。您可以使用来自的定标器对数据进行预处理sklearn.预处理. 最后五个解算器都支持密集和稀疏数据。但是,当fit_intercept为真时,只有'sag'和'sparse_cg'支持稀疏输入。 新版本0.17:随机平均梯度下降解算器。 版本0.19中的新功能:SAGA solver。 |
random_state |
int, RandomState instance, 默认=None 当solver=='sag'或'saga'时用于洗牌数据。 版本0.17中的新功能:支持随机平均梯度的随机状态。 |
属性
属性 |
解释 |
coef_ |
ndarray of shape (n_features,) or (n_targets, n_features) 权重向量。 |
intercept_ |
float or ndarray of shape (n_targets,)。决策函数中的独立项。如果fit_intercept = False,则设置为0.0。 |
n_iter_ |
None or ndarray of shape (n_targets,)。每个目标的实际迭代次数。仅适用于sag和lsqr解算器。其他解算器将不返回任何值。版本0.17中的新功能。 |
方法
fit()
fit(X,y,sample_weight=None) |
||
拟合岭回归模型。 |
||
输入 |
X |
{ndarray, sparse matrix} of shape (n_samples, n_features) 训练数据 |
y |
ndarray of shape (n_samples,) or (n_samples, n_targets)。目标值 |
|
sample_weight |
每个样品的单独权重。如果给定一个float,每个样品的权重都是一样的。 |
|
输出 |
self |
返回self的实例 |
get_params()
get_params(deep=True) |
||
获取此估计器的参数 |
||
输入 |
deep |
bool, 默认=True如果为True,则将返回此估计器的参数以及作为估计器的包含子对象 |
输出 |
dict |
映射到其值的参数名称。 |
predict()
predict(X) |
||
用线性模型预测。 |
||
输入 |
X |
array-like or sparse matrix, shape (n_samples, n_features)。样本 |
输出 |
C |
array, shape (n_samples,)返回预测值。 |
score ()
score (X, y, sample_weight=None) |
||
返回给定测试数据和标签的平均精确度。在多标签分类中,这是子集精度,这是一个苛刻的度量标准,因为您需要为每个样本准确地预测每个标签集。 |
||
输入 |
X |
array-like, shape = (n_samples, n_features)。测试样本 |
y |
array-like, shape = (n_samples) or (n_samples, n_outputs)。真的X标签。 |
|
sample_weight |
array-like, shape = [n_samples], optional。测试权重 |
|
输出 |
score |
float。R2平均精度self.predict(X) wrt. y. |
注意:在回归器上调用R2 score时使用的score使用版本0.23中的multioutput='uniform_average'与r2_score的默认值保持一致。这会影响所有多输出回归器(除了多输出回归器)的得分方法。
set_params ()
set_params ( **params ) |
||
设置此估算器的参数。该方法适用于简单的估计器以及嵌套对象(如管道)。后者具有<component> __ <parameter>形式的参数,以便可以更新嵌套对象的每个组件。 |
||
输入 |
**params |
dict估计器参数。 |
输出 |
self |
估计器实例 |
sklearn.linear_model.Lasso
介绍
以L1先验作为正则化子训练的线性模型(又称套索)
Lasso的优化目标是:
(1 /(2 *n_samples)) * ||y - Xw||2_2 + alpha * ||w||_1
从技术上讲,套索模型优化的目标函数与弹性网络相同,l1_ratio=1.0(无L2惩罚)。
函数表达式
sklearn.linear_model.Lasso(alpha=1.0,fit_intercept=True, normalize=False, precompute=False, copy_X=True, max_iter=1000,tol=0.0001,warm_start=False, positive=False, random_state=None,selection='cyclic')
参数
参数 |
解释 |
alpha |
float, 默认=1.0.乘以L1项的常数。默认为1.0。alpha=0相当于一个普通的最小二乘法,由线性回归对象求解。由于数值原因,不建议对套索对象使用alpha=0。鉴于此,您应该使用LinearRegression对象。 |
fit_intercept |
bool, 默认=True.是否计算此模型的截距。如果设置为False,则在计算中不使用截距(即数据应居中)。 |
normalize |
bool, 默认=False.当fit_intercept 设置为False时,将忽略此参数。如果为真,回归系数X将在回归前通过减去平均值并除以l2范数进行归一化。如果您希望标准化,请在对normalize=False的估计器调用fit之前使用StandardScaler。 |
precompute |
'auto', bool or array-like of shape (n_features, n_features), 默认=False.是否使用预先计算的Gram矩阵来加速计算。如果设置为'auto',让我们决定。Gram矩阵也可以作为参数传递。对于稀疏输入,此选项始终为True以保持稀疏性。 |
copy_X |
bool, 默认=True.如果为True,则复制X;否则,可能会覆盖X。 |
max_iter |
int, 默认=1000.最大迭代数。 |
tol |
float, 默认=1e-4.优化的容差:如果更新小于tol,优化代码将检查对偶间隙的最优性,并一直持续到它小于tol。 |
warm_start |
bool, 默认=False.当设置为True时,重用上一个调用的解决方案以适应初始化,否则,只需擦除上一个解决方案。 |
positive |
bool, 默认=False.设置为True时,强制系数为正。 |
random_state |
int, RandomState instance, 默认=None.伪随机数生成器的种子,用于选择要更新的随机特征。当selection =='random’时使用。在多个函数调用之间传递一个int以获得可复制的输出。 |
selection |
{'cyclic','random'}, 默认='cyclic'.如果设置为'random'}, ,则每个迭代都会更新一个随机系数,而不是默认情况下按顺序在特征上循环。这(设置为'random'}, )通常会导致显著更快的收敛,尤其是当tol高于1e-4时。 |
属性
属性 |
解释 |
coef_ |
ndarray of shape (n_features,) or (n_targets, n_features). 参数向量(成本函数公式中的w) |
dual_gap_ |
float or ndarray of shape (n_targets,).给定参数 alpha,优化结束时的双间隙,与y的每次观测形状相同。 |
sparse_coef_ |
sparse matrix of shape (n_features, 1) or (n_targets, n_features).拟合系数coef_.的稀疏表示。 |
intercept |
float or ndarray of shape (n_targets,).b值,决策函数中的独立项。 |
n_iter_ |
int or list of int.实际迭代次数,由坐标下降解算器运行以达到指定公差的迭代次数。 |
方法
fit()
fit(X,y,sample_weight=None) |
||
用坐标下降法拟合模型。 |
||
输入 |
X |
{ndarray, sparse matrix} of shape (n_samples, n_features) 训练数据 |
y |
ndarray of shape (n_samples,) or (n_samples, n_targets)。目标。如有必要,将转换为X的数据类型。 |
|
sample_weight |
float or array-like of shape (n_samples,), 默认=None 样品的权重。版本0.23.中加入 |
|
check_input |
bool, 默认=True.允许绕过多个输入检查。除非您知道自己在做什么,否则不要使用此参数。 |
注意:坐标下降法是一种一次考虑每一列数据的算法,因此如果需要,它会自动将X输入转换为Fortran连续numpy数组。为避免内存重新分配,建议直接使用该格式在内存中分配初始数据。
get_params()
get_params(deep=True) |
||
获取此估计器的参数 |
||
输入 |
deep |
bool, 默认=True如果为True,则将返回此估计器的参数以及作为估计器的包含子对象 |
输出 |
dict |
映射到其值的参数名称。 |
path()
static path(*args, **kwargs)[source] |
||
用坐标下降法计算弹性网径。 单输出和多输出的弹性网络优化函数各不相同。 对于单输出任务,它是: 1/(2*n_samples)*||y-Xw||2_2+alpha*l1_ratio*||w||_1+0.5*alpha*(1 - l1_ratio)*||w||2_2 对于多输出任务,它是: (1/(2*n_samples))*||Y - XW||^Fro_2+alpha*l1_ratio*||W||_21+0.5*alpha*(1 - l1_ratio)*||W||_Fro2 当 ||W||_21=\sum_i\sqrt{\sum_jw_{ij}2} 即:每行的范数之和。 |
||
输入 |
X |
{array-like, sparse matrix} of shape (n_samples, n_features)。训练数据。作为Fortran连续数据直接传递,以避免不必要的内存重复。如果y是单输出,那么X可以是稀疏的。 |
y |
{array-like, sparse matrix} of shape (n_samples,) or (n_samples, n_outputs)。目标值 |
|
l1_ratio |
float, 默认=0.5。传递到弹性网的0到1之间的数字(在l1和l2之间缩放)。l l1_ratio=1对应套索。 |
|
eps |
float, 默认=1e-3。路径的长度。eps=1e-3意味着alpha_min/alpha_max=1e-3。 |
|
n_alphas |
int, 默认=100 沿正则化路径的字母数。 |
|
alphas |
ndarray, 默认=None。用于计算模型的alpha列表。如果没有自动设置字母。 |
|
precompute |
'auto', bool or array-like of shape (n_features, n_features), 默认='auto'。是否使用预先计算的Gram矩阵来加速计算。如果设置为'auto',让我们决定。Gram矩阵也可以作为参数传递。 |
|
Xy |
array-like of shape (n_features,) or (n_features, n_outputs), 默认=None。Xy = np.dot(X.T, y) 可以预先计算的。它只有在预先计算Gram矩阵时才有用。 |
|
copy_X |
bool, 默认=True 如果为True,则复制X;否则,可能会覆盖X。 |
|
coef_init |
ndarray of shape (n_features, ), 默认=None。系数的初始值 |
|
verbose |
bool or int, 默认=False。冗长的程度。. |
|
return_n_iter |
bool, 默认=False。是否返回迭代次数。 |
|
positive |
bool, 默认=False。如果设置为真,则强制系数为正。(仅当y.ndim==1时允许)。 |
|
check_input |
bool, 默认=True。如果设置为false,则跳过输入验证检查(包括提供的Gram矩阵)。假设它们是由调用方处理的。 |
|
**params |
Kwargs。传递给坐标下降解算器的关键字参数。 |
|
输出 |
alphas |
ndarray of shape (n_alphas,) 。沿模型计算路径的字母。 |
coefs |
ndarray of shape (n_features, n_alphas) or (n_outputs, n_features, n_alphas) 沿路径的系数。 |
|
dual_gaps |
ndarray of shape (n_alphas,)。每个alpha优化结束时的双间隙。 |
|
n_iters |
list of int。坐标下降优化器为达到每个alpha的指定公差而进行的迭代次数。(当return iter设置为True时返回)。 |
predict()
predict(X) |
||
用线性模型预测。 |
||
输入 |
X |
array-like or sparse matrix, shape (n_samples, n_features)。样本 |
输出 |
C |
array, shape (n_samples,)返回预测值。 |
core ()
score (X, y, sample_weight=None) |
||
返回预测的确定系数R2。系数R2定义为 ,其中是平方的剩余和((y_true - y_pred)2).sum(),是平方的总和((y_true - y_true.mean())2).sum()。最好的可能得分是1.0,它可以是负数(因为模型可以任意更差)。如果一个常数模型总是预测y的期望值,而不考虑输入特征,则R2值为0.0。 |
||
输入 |
X |
array-like, shape = (n_samples, n_features)。测试样品。对于某些估计器,这可能是一个预计算的核矩阵或一个通用对象列表,而不是形状(n_samples, n_samples_fitted),其中n_samples_fitted是估计器拟合中使用的样本数。 |
y |
array-like, shape = (n_samples) or (n_samples, n_outputs)。真的X标签。 |
|
sample_weight |
array-like, shape = [n_samples], optional。测试权重 |
|
输出 |
score |
float。R2平均精度self.predict(X) wrt. y. |
注意:在回归器上调用score时使用的R score使用版本0.23中的multioutput='uniform_average'与r2_score的默认值保持一致。这会影响所有多输出回归器(除了多输出回归器)的得分方法。
set_params ()
set_params ( **params ) |
||
设置此估算器的参数。该方法适用于简单的估计器以及嵌套对象(如管道)。后者具有<component> __ <parameter>形式的参数,以便可以更新嵌套对象的每个组件。 |
||
输入 |
**params |
dict估计器参数。 |
输出 |
self |
估计器实例 |
property sparse_coef_
property sparse_coef_ |
|
拟合系数的稀疏coef_表示。 |
拟合系数的稀疏表示。 |
—————————————————————————————————
软件安全测试
https://study.163.com/course/courseMain.htm?courseId=1209779852&share=2&shareId=480000002205486
接口自动化测试
https://study.163.com/course/courseMain.htm?courseId=1209794815&share=2&shareId=480000002205486
DevOps 和Jenkins之DevOps
https://study.163.com/course/courseMain.htm?courseId=1209817844&share=2&shareId=480000002205486
DevOps与Jenkins 2.0之Jenkins
https://study.163.com/course/courseMain.htm?courseId=1209819843&share=2&shareId=480000002205486
Selenium自动化测试
https://study.163.com/course/courseMain.htm?courseId=1209835807&share=2&shareId=480000002205486
性能测试第1季:性能测试基础知识
https://study.163.com/course/courseMain.htm?courseId=1209852815&share=2&shareId=480000002205486
性能测试第2季:LoadRunner12使用
https://study.163.com/course/courseMain.htm?courseId=1209980013&share=2&shareId=480000002205486
性能测试第3季:JMeter工具使用
https://study.163.com/course/courseMain.htm?courseId=1209903814&share=2&shareId=480000002205486
性能测试第4季:监控与调优
https://study.163.com/course/courseMain.htm?courseId=1209959801&share=2&shareId=480000002205486
Django入门
https://study.163.com/course/courseMain.htm?courseId=1210020806&share=2&shareId=480000002205486
啄木鸟顾老师漫谈软件测试
https://study.163.com/course/courseMain.htm?courseId=1209958326&share=2&shareId=480000002205486