LSTM视频分类的深度学习——思路参考

简介: LSTM视频分类的深度学习——思路参考

设计思路


通过训练一个深层神经网络,直接从原始的 GelSight 视频回归硬度 使用一个卷积神经网络模型来表示 GelSight 视频的帧,使用一个递归神经网络模型来模拟凝胶变形随时间的变化。实验GelSight 在一个松散的控制条件下接触物体,并通过 GelSight 的触觉图像序列测量物体的硬度


1)Neural network神经网络设计


使用一个神经网络,映射一个图像序列到一个标量硬度值(测量Shore 00比例尺)。我们用卷积网络特征 φ (Ii)表示每个 GelSight 图像 Ii。对于这些,我们使用 VGG 体系结构的倒数第二层(fc7)。然后,我们使用带有长短期记忆单位的递归神经网络模型(LSTM)来模拟时间信息。在每一个时间步骤中,我们通过当前 LSTM 隐藏状态的一个仿射变换回溯它的输出硬度值:

image.png


其中 W 和 b 定义了隐藏状态 ht 的仿射变换,L使用当前映像根据以前的状态ht更新为ht-1(为简单起见,省略了LSTM 的隐藏单元状态)。预测指标为当前时间步长的硬度估计值。通过平均最后3帧的预测值来估计整个物体的硬度值。


在每帧的基础上进行回归,以增加视频的鲁棒性,其中压迫运动明显不同于那些训练集。在训练期间,我们减少损失,惩罚之间的差异预测和地面真实硬度值,使用胡伯损失。


image.png


图 2使用递归神经网络来映射由 GelSight 传感器记录的视频到硬度值。


这个网络类似于[25] : 图像使用 CNN 的特性 fc7从 vgg16网络,并提供给 LSTM 网络。网络输入是减去初始帧后的一个 GelSight 图像序列。特别是,从一个压入序列中均匀地选择5帧,每帧是一个压入阶段。只用最后3帧,即 y3,y4,y5的 RNN 输出来估计样品的硬度。


2)训练****


这个训练数据集包含了大约7000个视频(在不同的硅树脂样本上按压 GelSight),每个视频都是一个独立的按压序列。在训练过程中多次使用单个视频,采用不同的端点进行序列提取,从而包含了不同最大力的接触情况。


使用随机梯度下降训练模型,使用 ImageNet预训练初始化 CNN 权重,联合训练 CNN 和 LSTM。我们对算法进行了10,000次迭代的训练,学习速度为0.001,步长为1000。\


image.png

图 3  Gelsight大小25mmx25mm,厚度2.4mm。训练数据集主要包含基本对象形状(第1组) ,但也包含大量复杂形状或不良接触条件(第2组和第4组)。这些不规则的数据大大有助于防止模型的过度拟合。第五组是自然物体,可以粗略地感觉到它们是“软”、“非常软”或“硬”




相关文章
|
1月前
|
机器学习/深度学习 自然语言处理 PyTorch
【机器学习】探索LSTM:深度学习领域的强大时间序列处理能力
【机器学习】探索LSTM:深度学习领域的强大时间序列处理能力
|
5月前
|
机器学习/深度学习 PyTorch 算法框架/工具
【从零开始学习深度学习】36. 门控循环神经网络之长短期记忆网络(LSTM)介绍、Pytorch实现LSTM并进行训练预测
【从零开始学习深度学习】36. 门控循环神经网络之长短期记忆网络(LSTM)介绍、Pytorch实现LSTM并进行训练预测
|
6月前
|
机器学习/深度学习 存储 算法
基于CNN+LSTM深度学习网络的时间序列预测matlab仿真,并对比CNN+GRU网络
该文介绍了使用MATLAB2022A进行时间序列预测的算法,结合CNN和RNN(LSTM或GRU)处理数据。CNN提取局部特征,RNN处理序列依赖。LSTM通过门控机制擅长长序列,GRU则更为简洁、高效。程序展示了训练损失、精度随epoch变化的曲线,并对训练及测试数据进行预测,评估预测误差。
|
6月前
|
机器学习/深度学习 传感器 数据可视化
MATLAB用深度学习长短期记忆 (LSTM) 神经网络对智能手机传感器时间序列数据进行分类
MATLAB用深度学习长短期记忆 (LSTM) 神经网络对智能手机传感器时间序列数据进行分类
MATLAB用深度学习长短期记忆 (LSTM) 神经网络对智能手机传感器时间序列数据进行分类
|
5月前
|
机器学习/深度学习 自然语言处理 前端开发
深度学习-[源码+数据集]基于LSTM神经网络黄金价格预测实战
深度学习-[源码+数据集]基于LSTM神经网络黄金价格预测实战
128 0
|
6月前
|
机器学习/深度学习 数据可视化 网络架构
Matlab用深度学习循环神经网络RNN长短期记忆LSTM进行波形时间序列数据预测
Matlab用深度学习循环神经网络RNN长短期记忆LSTM进行波形时间序列数据预测
|
6月前
|
机器学习/深度学习 自然语言处理 算法
Python遗传算法GA对长短期记忆LSTM深度学习模型超参数调优分析司机数据|附数据代码
Python遗传算法GA对长短期记忆LSTM深度学习模型超参数调优分析司机数据|附数据代码
|
6月前
|
机器学习/深度学习 编解码 算法
R语言用FNN-LSTM假近邻长短期记忆人工神经网络模型进行时间序列深度学习预测4个案例
R语言用FNN-LSTM假近邻长短期记忆人工神经网络模型进行时间序列深度学习预测4个案例
|
9天前
|
机器学习/深度学习 数据采集 人工智能
AI赋能教育:深度学习在个性化学习系统中的应用
【10月更文挑战第26天】随着人工智能的发展,深度学习技术正逐步应用于教育领域,特别是个性化学习系统中。通过分析学生的学习数据,深度学习模型能够精准预测学生的学习表现,并为其推荐合适的学习资源和规划学习路径,从而提供更加高效、有趣和个性化的学习体验。
55 9
|
6天前
|
机器学习/深度学习 人工智能 监控
深度学习在图像识别中的应用与挑战
本文探讨了深度学习技术在图像识别领域的应用,并分析了当前面临的主要挑战。随着卷积神经网络(CNN)的发展,图像识别的准确性和效率得到了显著提升。然而,数据不平衡、模型泛化能力、计算资源消耗等问题仍然是制约深度学习在图像识别领域进一步发展的关键因素。本文将详细介绍深度学习在图像识别中的应用案例,并讨论解决现有挑战的可能策略。