核函数与松弛变量| 学习笔记

简介: 快速学习核函数与松弛变量。

开发者学堂课程【机器学习算法 :核函数与松弛变量】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/535/detail/7269


核函数与松弛变量

 

内容介绍

一、异常点造成的线性不可分

二、松弛变量

三、带松弛变量的极值求解

 

一、异常点造成的线性不可分

线性不可分的样本经过映射到高维空间后,找到分类超平面的几率大大增加。仍然有可能有一些情况很难处理,比如样本数据的结构本身不是非线性的,但是由于噪声带来一些偏离正常位置较远的点(异常点 Ourlier)有可能第模型造成很大的影响。

image.png

正常情况下是左侧图一,但如图二所示,其中一个支持向量偏移,虽然margin变小,但依旧可以找到一个分类超平面,若变量继续动,变成图三样式,蓝色点向红色方向移动,这个时候不可能按以前学习方式找到分类超平面。本来是线性可分的,但是由于个别点造成影响,使得线性不可分。

为了处理这种情况,svm 允许数据点在一定程度上偏离一下超平面。


二、松弛变量

不考虑异常点的线性可分的情况下,约束条件为:

image.png

考虑异常点的线性可分的情况下,约束条件要放宽(松弛):

image.png

变量ξi称为松弛变量(slack variable),即对应的数据点 x(i) 允许偏离最大间隔的量。这个变量越小越好,根据这点加入到目标函数中(否则如果松弛变量可以仁义达的话,所有的超平面都

满足要求),即:

image.png

原始是求最小值,但现在加上C,目标函数发生改变,加上ξ(非负数)后对以前的值是有影响的。

约束条件为:

在原有基础上大于等于1-ξ,ξ≥0

 

三、带松弛变量的极值求解

拉格朗日函数为:

image.png

将有约束的目标函数转换为无约束的拉格朗日函数,然后固定 μ、r,要让L(ω、γ、μ、r、ξ)对并ω、γ、ξ最小化,即对ω、γ、ξ 求偏导,令其等于0;

image.pngimage.png

image.png

μi=C-ri ≤C

将 ω 带回目标函数得到:

image.png

唯一有所区别的是 μi 有了上限小于等于 C,以前之后大于等于0。

对于松弛变量:

1.只有离群点才有松弛变量,表示对应点到底离群有多远,其值越大,点就越远

2.C为惩罚因子,为常量,需要提前定好

3.C表明有多重视离群点,C越大,目标函数损失越大

 

四、SVM 多分类  

SVM 是为二分类问题设计的,但可以通过构造合适的多分类器实现多分类问题:

1.直接法:直接修改目标函数,将多分类面的参数求解合并到一个最优化问题中

2.间接法:通过有效的组合多个二分类 SVM 分类器,从而实现多分类

(1)一对多法:将样本分为某类样本和其他类别的样本,进行训练得到 k 个 SVM,将未知样本归进具有最大分类函数值的那类

优点:训练 k 个 SVM 数量少,分类速度快

缺点:每次训练全部样本,且负样本数量远远大于正样本,增加新类别则需要重新训练所有模型

(2)一对一法:任意两个样本都设计一个 SVM,需要 k(k-1)/2 个 SVM 分类器,当对一个未知样本进行分类时,取所有分类器中得票最多的那一类。

优点:不需要训练所有模型,只需关注新增模型即可。

缺点:模型个数太多,训练、预测时间都比较长。

相关文章
|
Python
python使用pip镜像源加速安装包(清华、阿里、中科大)
python使用pip镜像源加速安装包(清华、阿里、中科大)
9092 0
python使用pip镜像源加速安装包(清华、阿里、中科大)
|
1月前
|
存储 JSON 前端开发
绕过验证码与登录:Playwright 自动化测试的身份认证策略
在Playwright自动化测试中,登录和验证码常成“拦路虎”。本文介绍四种绕过策略:复用Cookie/LocalStorage状态、调用API获取Token、测试环境禁用验证码、使用第三方测试账号。核心思想是“绕过而非破解”,提升测试效率与稳定性。推荐优先使用状态复用,避免重复登录,让测试聚焦核心业务逻辑。
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
大模型
大模型正重塑数字世界,以千亿级参数和深度学习技术驱动AI革命。它赋能内容生成、智能交互与知识服务,同时带来伦理、隐私与能耗挑战。未来需走向高效、可信、向善的可持续发展之路。
|
9月前
|
运维 测试技术
当一个按键“摆烂”时,需要更换整个键盘吗?
键盘按键失灵时,别急着更换整个键盘!本文教你通过三步解决:诊断病因、对症下药、预防复发。首先进行“键盘体检”,包括跨设备验证、软件驱动测试、BIOS检测及硬件检查,找出是污垢、物理损坏还是电路故障。接着针对问题提供治疗方案,如更新驱动、清洁键槽或更换零件。最后提醒大家优先排查软件问题,温柔清洁,理性对待物理损坏,并建议选购可维护性强的键盘。记住,善待键盘,远离零食屑,让输入更顺畅!
493 3
|
边缘计算 人工智能 数据处理
大模型能否通往AGI?
【2月更文挑战第29天】复旦大学张奇教授探讨大模型与人工通用智能(AGI)关系,指出大模型研发需大量资源,企业成为推动力,强调中国应加强自主创新。新书《大规模语言模型:从理论到实践》探讨合作模式及技术细节。张教授认为大模型处理多模态信息有挑战, Scaling Law存在争议,小模型在特定场景有优势。目前大模型尚未达到AGI的推理能力,实现商业化需平衡成本与收益。他通过项目展示大模型的社会应用潜力。
1026 1
大模型能否通往AGI?
|
传感器 算法 IDE
基于Arduino的遥控自平衡小车
基于Arduino的遥控自平衡小车
440 41
|
机器学习/深度学习 人工智能 自动驾驶
实战案例分析:AI在特定行业的深度应用
【7月更文第20天】随着人工智能技术的飞速发展,其在各行各业的应用日益广泛且深入,不仅推动了产业创新,也极大地提升了服务效率与质量。本文将聚焦于金融、教育、和交通三大领域,通过具体案例与技术解析,展现AI如何在这三个行业中发挥着革命性的作用。
2278 0
|
算法 5G Windows
OFDM系统中的信号检测算法分类和详解
参考文献 [1]周健, 张冬. MIMO-OFDM系统中的信号检测算法(I)[J]. 南京工程学院学报(自然科学版), 2010. [2]王华龙.MIMO-OFDM系统传统信号检测算法[J].科技创新与应用,2016(23):63.
334 4