Svm 介绍| 学习笔记

简介: 快速学习 Svm 介绍。

开发者学堂课程【机器学习算法 :Svm 介绍】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/535/detail/7262


Svm 介绍

 

内容介绍

一、支持向量机

二、问题分析

三、超平面

四、间隔

 

一、支持向量机

1.支持向量机(Support Vector Machine,SVM):由 Vapnik 领导的 AT&T Bell 实验室研究小组在1995年提出的一种基于统计学习理论的模式识别的分类方法,主要应用于模式识别领域。拥有坚实的统计学理论基础,所谓“支持向量”是指那些在间隔区边缘的训练样本点,“机”是指算法。就是要找到具有最大间隔的分隔面,实际上解决的是一个最优分类器设计的问题。

2.假设有两类样本,我们去找一个分类平面将两类样本隔开,实际上有一些样本和分类平面比较接近,那这些样本会决定和分类平面是什么样式的。这些关键样本就是支持向量。其实这些样本集中真正能决定操平面位置及超平面方程的样本量是很少的。

image.png

3.例:在一个二维平面中,有红色正样本和蓝色负样本,这个例子是线性可分的例子,可以通过直线将这两类样本分开。分法有很多种,例如下图所示三条线。会有很多分类器,但哪一个分类器是最佳的分类器呢?

image.png

假设白色线是最佳分类器,但实际上,还可以画两条辅助虚线,这个虚线会穿过一些样本点,首先保证分类超平面中间的实线到两条虚线距离相等,假设实线到虚线距离叫 d。虚线到虚线的距离叫 margin,如果 margin 数值最大,是不是分类超平面效果最好?

image.png

4.实际上,SVM 就是通过 margin 间隔最大,去找分类超平面的过程。落在虚线上的点就是支持向量。虚线以及分类超平面都是由这几个支持向量所决定的。

5.分类超平面方程:w*x+b=0,将红色点带到超平面方程中结果大于等于正一,蓝色的点带到超平面方程中结果小于一,不是大于等于0,原因是支持向量机到分类操平面还有 margin 距离,支持向量到分类超平面距离 d,所以是1/-1而不是0,其实并没有本质区别,是为了后续方便计算。

 

二、问题分析

目的:找到一个最优的分类器,换言之,找到一个超平面,使得分类间隔最大。即 margin 最大。

优化的目标函数:分类间隔。需要使得分类间隔最大。

优化的对象:分类超平面(决策平面)。通过调整分类超平面的位置,使得间隔最大,实现优化目标。

 

三、超平面

超平面(Hyperplane)是 n 维欧氏空间中余维度等于1的线性子空间。二维空间中即为一条直线,三维空间中即为一个二维的平面。

n 维欧式空间中,那么他的分类超平面是n-1维的超平面方程,在二维空间中就变成一条直线 例:y=2x+7。变换成超平面的表达式写成一般的形式:2x1-x2+7=0,其中将 y 和 x 转换成 x1 和 x2 的方式来表达。

在三维空间中即为一个二维的平面表达式为:z=5x+6y+7,转换为一般形式为:5x1+6x2-x3+7=0

利用线性代数的知识改写表达式:将x前系数表达成列向量,系数分别为5、6、-1记成 w,将x1,x2,x3记成x,两个列向量。

image.png

 

四、间隔

间隔实际上是从支持向量对应的点到分类超平面的垂直距离的2倍,即有:W=2d

image.png

假设支持向量坐标为 A(x1a,x2a),用 d 表示支持向量到分类超平面的距离,但怎么求呢?将A点坐标带到分类超平面表达式中,再除以法向量的模。

image.png

现在要做的是,从所有的样本点中,找到合适的支持向量,在保证分类正确的前提下,让间隔 W=2d 最大。

保证分类正确:

(1)以红色为正类,有:

image.png

即将红色点坐标带到分类超平面方程中去,值要大于0,y结果是正1,

(2)以蓝色为负类,有:

image.png

即将蓝色点坐标带到分类超平面方程中去,值要小于0,y结果是负1

想判断样本点属于哪一类,就将样本点坐标带到分类超平面方程中去,根据结果是大于0还是小于0来判断正负类。

相关文章
|
人工智能 安全 数据管理
百度智能云“千帆大模型平台”升级:大模型最多,Prompt模板最全(下)
百度智能云“千帆大模型平台”升级:大模型最多,Prompt模板最全
535 0
如何使用Postman里的collections?
如何使用Postman里的collections?
376 0
|
1月前
|
机器学习/深度学习 人工智能 算法
PAIFuser:面向图像视频的训练推理加速框架
阿里云PAI推出PAIFuser框架,专为视频生成模型设计,通过模型并行、量化优化、稀疏运算等技术,显著提升DiT架构的训练与推理效率。实测显示,推理耗时最高降低82.96%,训练时间减少28.13%,助力高效低成本AI视频生成。
238 22
|
1月前
|
Linux Android开发 iOS开发
Escrcpy手机投屏工具!Scrcpy最全安装指南教程!
Escrcpy是一款开源免费的安卓投屏工具,支持Windows、macOS、Linux,无需Root,无广告。可实现低延迟(35-70ms)、高帧率(120fps)投屏,支持键鼠控制、文件互传、录屏截图,适用于办公、游戏、开发等场景。
471 1
|
7月前
|
运维 容灾 安全
国网安徽电力与阿里云联合完成行业首个全场景容灾演练
在安徽合肥的一座不起眼的数据中心里,一场没有硝烟的“战役”悄然打响。这不是一次普通的系统升级,而是一场关乎全省电网稳定运行的关键演练——这是一场关于数据、系统、故障和时间的较量,将验证电力系统背后的数据中心在碰到故障时,是否能够做到“不停电、不掉线”。 这场演练的主角,是我们身边默默守护万家灯火的电力人——国网安徽电力以及背后的技术团队,大家的目标是在极端情况下保障电网云平台稳定运行,确保每一台服务器、每一套业务系统“永不宕机”。这次演练,不仅是加速构建新型电力系统、增强电网“灵活可靠”的一次探索,也是能源电力行业迈向智能化、数字化过程中的一次真实实践。
274 11
微博自动发布脚本,微博批量发布插件,关注私信点赞工具
这是一套微博营销自动化工具源码,可实现多账号同时发布微博、点赞、关注与私信功能,通过随机内容发布和延迟设置
|
6月前
|
存储 算法 关系型数据库
数据库主键与索引详解
本文介绍了主键与索引的核心特性及其区别。主键具有唯一标识、数量限制、存储类型和自动排序等特点,用于确保数据完整性和提升查询效率;而索引通过特殊数据结构(如B+树、哈希)优化查询速度,适用于不同场景。文章分析了主键与索引的优劣、适用场景及工作原理,并对比两者在唯一性、数量限制、功能定位等方面的差异,为数据库设计提供指导。
|
Web App开发 Windows
win 快捷键大全,虚拟窗口、桌面等操作细节,可以使界面整洁,分类工作;Chrome快捷键,都是一些开发的骚操作
这篇文章提供了Windows操作系统和Chrome浏览器的快捷键大全,以及Xshell的快捷键操作,旨在帮助用户提高工作效率和界面管理。
968 2
|
机器学习/深度学习 计算机视觉 文件存储
YOLOv5改进系列(5)——替换主干网络之 MobileNetV3
YOLOv5改进系列(5)——替换主干网络之 MobileNetV3
11084 3
YOLOv5改进系列(5)——替换主干网络之 MobileNetV3
|
前端开发 JavaScript API
MkDocs是一个用Python编写的快速、简单且易于定制的静态网站生成器
MkDocs是一个用Python编写的快速、简单且易于定制的静态网站生成器