暂时未有相关云产品技术能力~
CSDN优质创作者
使用 YOLO V2深度学习进行多类对象检测。
根据特征进行全景图像拼接。
使用校准相机测量平面物体。
使用迭代最近点算法组合多个点云以重建三维场景。
基于颜色特征的图像检索系统。
使用 HOG 功能和多类 SVM 分类器对数字进行分类。
使用点要素匹配在杂乱场景中检测对象。
基于深度学习的多光谱图像语义分割。
定位和读取图像中的多个条形码。
使用深度学习从分割图生成图像
使用高斯混合模型检测和计数视频序列中的汽车。
使用迭代方法为语义分割网络生成对抗性。
使用 Grad-CAM 探索预训练语义分割网络的预测。
使用预训练卷积神经网络 (CNN) 作为特征提取器来训练图像类别分类器。
使用单类全卷积数据描述 (FCDD) 异常检测网络检测药丸图像上的缺陷。
AprilTags被广泛用作物体检测、定位应用的视觉标记,并作为相机校准的目标。AprilTags类似于QR码,但旨在编码更少的数据,因此可以更快地解码,这对于实时机器人应用程序非常有用。使用 AprilTags 作为校准模式的优点包括更好的特征点检测以及一致、可重复的检测。
使用基于标记的增强现实将虚拟内容呈现到场景中。
使用光学字符识别 (OCR) 识别图像中的七段数字。
相机校准是使用特殊校准模式的图像估计相机参数的过程。参数包括相机内在系数、失真系数和相机外在系数。
使用简单的卷积神经网络 (CNN) 对晶圆图上的八种制造缺陷进行分类。
使用最大稳定极值区域 (MSER) 特征检测器检测图像中包含文本的区域。
使用基于深度学习的文本检测器和 OCR 执行文本识别。
检测使用校准的立体摄像头拍摄的视频中的人物,并确定他们与摄像头的距离。
视觉同步定位和映射 (vSLAM) 是指计算摄像机相对于周围环境的位置和方向,同时映射环境的过程。 您可以使用单眼摄像头执行 vSLAM。但是,深度无法准确计算,估计的轨迹未知,并且随着时间的推移而漂移。要生成无法从第一帧开始三角测量的初始地图,必须使用单眼相机的多个视图。更好、更可靠的解决方案是使用 RGB-D 相机,它由一个 RGB 彩色图像和一个深度图像组成。
处理来自安装在车辆上的传感器的 3-D 激光雷达数据,以便在惯性测量单元 (IMU) 读数的帮助下逐步构建地图。这样的地图可以促进车辆导航的路径规划,也可以用于定位。
使用激光雷达数据构建地图并使用SLAM算法估计车辆轨迹。
通过分割地平面并查找附近的障碍物来处理来自安装在车辆上的传感器的 3-D 激光雷达数据。这可以促进车辆导航的可驾驶路径规划。该示例还演示如何可视化流式激光雷达数据。
训练 PointNet 网络以进行点云分类。 点云数据由各种传感器获取,例如激光雷达、雷达和深度摄像头。这些传感器捕获场景中物体的3D位置信息,这对于自动驾驶和增强现实中的许多应用非常有用。例如,区分车辆和行人对于规划自动驾驶汽车的路径至关重要。然而,由于每个对象的数据稀疏性、对象遮挡和传感器噪声,使用点云数据训练稳健分类器具有挑战性。深度学习技术已被证明可以通过直接从点云数据中学习强大的特征表示来解决其中的许多挑战。点云分类的开创性深度学习技术之一是PointNet。
使用颜色信息来检测和跟踪在可能不存在车道标记的主要住宅环境中设置的道路边缘。基于颜色的跟踪示例说明了如何使用色彩空间转换块、霍夫变换块和卡尔曼滤波器块来检测和跟踪使用色调和饱和度的信息。
校正图像亮度不均匀问题并分析前景对象
使用 Inception-v3 深度神经网络对可能不适合内存的多分辨率全玻片图像 (WSI) 进行分类。 用于肿瘤分类的深度学习方法依赖于数字病理学,其中整个组织切片被成像和数字化。生成的 WSI 具有高分辨率,大约为 200,000 x 100,000 像素。WSI 通常以多分辨率格式存储,以促进图像的高效显示、导航和处理。
使用遮罩隔离感兴趣区域 (ROI) 来有效地处理被阻止的图像。 某些大图像源仅在图像的一小部分中具有有意义的数据。可以通过将处理限制为包含有意义数据的 ROI 来缩短总处理时间。使用掩码定义投资回报率。蒙版是一种逻辑图像,其中像素表示投资回报率。
使用工具箱可视化和分析视频或图像序列,检测交通视频中的汽车。
使用三种不同的照明算法估计场景的照明和执行白平衡。 眼睛非常善于判断不同照明条件下的白色。然而,数码相机如果不进行某种调整,就可以很容易地捕捉到具有强烈色偏的不真实图像。自动白平衡(AWB)算法试图以最少的用户输入来校正环境光,以便生成的图像看起来像我们眼睛看到的。
通过分析 L*a*b* 颜色空间来识别织物中的不同颜色
演示如何使用纹理分割根据纹理识别区域。目标是将狗从浴室地板上分开。由于浴室地板的规则、周期性图案与狗皮毛规则、光滑的纹理之间的质地差异,这种分割在视觉上很明显。
影像数据差异可用于区分影像的不同表面特征,这些表面特征在不同的光谱通道中具有不同的反射率。通过查找可见红色通道和近红外通道之间的差异,该示例标识了包含重要植被的区域。
说明如何自动检测图像中的圆或圆形目标并可视化检测到的圆。
说明如何准备用于读取和预处理可能不适合内存的多分辨率全玻片图像 (WSI) 的数据存储。肿瘤分类的深度学习方法依赖于数字病理学,其中整个组织切片被成像和数字化。生成的 WSI 具有高分辨率,大约为 200,000 x 100,000 像素。WSI 通常以多分辨率格式存储,以促进图像的高效显示、导航和处理。 读取和处理WSI数据。这些对象有助于使用多个分辨率级别,并且不需要将图像加载到核心内存中。此示例演示如何使用较低分辨率的图像数据从较精细的级别有效地准备数据。可以使用处理后的数据来训练分类深度学习网络。
说明如何使用 K 均值聚类自动分割颜色。聚类是一种分离对象组的方法。K 均值聚类将每个对象视为在空间中有一个位置。它将对象划分为若干分区,使每个簇中的对象尽可能彼此靠近,并尽可能远离其他簇中的对象。您可以使用 函数将图像像素按值分成一个颜色空间内的若干个簇。此示例在 RGB 和 L*a*b* 颜色空间中执行图像的 k 均值聚类,以显示使用不同颜色空间如何改进分割结果。