平衡操控应用场景探讨及RTSP技术实现

简介: 平衡操控应用场景探讨及RTSP技术实现

平衡操控应用背景

平行操控场景,通过超低延时视频通信技术与实时信令技术结合,使得操作者可以实时的驾驶/操作远端的无人车或机械设备。

相比传统近距离的遥控,平行操控的传输网构建在互联网之上,突破了传统距离限制,操控者可以实时遥控几百甚至上千公里以外的设备。在平行操控的应用场景上,应急接管、高危作业和远程服务是平行操控典型的三个业务场景。

首先是应急接管,以无人车为例,无人车目前被广泛应用在机场、码头、港口等地方,但应用过程中往往会出现如暴风雨、交通管制、突发事故等一些无法自主决策的场景。相较此前需要人为介入到现场处理,平行操控则可以更快、更低的成本解决这个问题。

第二是高危作业,在井下矿车、高空作业机器人、无人挖掘机等危险指数较高或环境恶劣等工作场景中,平行操控可以很好地发挥价值。

第三是远程服务,如机器人、云赛车、无人机之类的场景,操作者可以借助云服务操控这些无人值守设备。随着5G、AI、智能驾驶技术、实时互动技术的快速发展,虚实互动的平行操控场景开始受到行业关注。如物流园区的无人车、矿区的无人驾驶矿车,港口的无人集卡车,以及远程接管脱困的云代驾等,都需要平行操控类技术支持。

技术方案

针对平衡操控场景,我们最需要关注的是两点:人车协同和远程控制,对我们来说,意味着超低的延迟下,设备实时信令控制才有价值。

本文以大牛直播SDK的Windows平台轻量级RTSP服务为例,Windows平台轻量级RTSP服务采集毫秒计时器窗口,然后,对外输出RTSP URL,SmartPlayer播放端拉取RTSP的流数据,可以看到整体延迟毫秒级,完全可以满足平衡操控场景所需的延迟需求。

技术架构如下:

image.gif编辑

延迟如下:

image.gif


轻量级RTSP服务功能设计如下:

  • [音频格式]AAC;
  • [视频格式]H.264、H.265;
  • [协议类型]RTSP;
  • [传输模式]支持单播和组播模式;
  • [端口设置]支持RTSP端口设置;
  • [鉴权设置]支持RTSP鉴权用户名、密码设置;
  • [获取session连接数]支持获取当前RTSP服务会话连接数;
  • [多服务支持]支持同时创建多个内置RTSP服务;
  • [RTSP url回调]支持设置后的rtsp url通过event回调到上层。


SmartPlayer RTSP播放器(覆盖Windows、Linux、Android、iOS平台)为例,功能如下:

  • [支持播放协议]高稳定、毫秒级超低延迟;
  • [多实例播放]支持多实例播放;
  • [事件回调]支持网络状态、buffer状态等回调;
  • [视频格式]支持H.265、H.264,此外,还支持RTSP MJPEG播放;
  • [音频格式]支持AAC/PCMA/PCMU;
  • [H.264/H.265软解码]支持H.264/H.265软解;
  • [H.264硬解码]Windows/Android/iOS支持特定机型H.264硬解;
  • [H.265硬解]Windows/Android/iOS支持特定机型H.265硬解;
  • [H.264/H.265硬解码]Android支持设置Surface模式硬解和普通模式硬解码;
  • [RTSP模式设置]支持RTSP TCP/UDP模式设置;
  • [RTSP TCP/UDP自动切换]支持RTSP TCP、UDP模式自动切换;
  • [RTSP超时设置]支持RTSP超时时间设置,单位:秒;
  • [RTSP 401认证处理]支持上报RTSP 401事件,如URL携带鉴权信息,会自动处理;
  • [缓冲时间设置]支持buffer time设置;
  • [首屏秒开]支持首屏秒开模式;
  • [复杂网络处理]支持断网重连等各种网络环境自动适配;
  • [快速切换URL]支持播放过程中,快速切换其他URL,内容切换更快;
  • [音视频多种render机制]Android平台,视频:surfaceview/OpenGL ES,音频:AudioTrack/OpenSL ES;
  • [实时静音]支持播放过程中,实时静音/取消静音;
  • [实时音量调节]支持播放过程中实时调节音量;
  • [实时快照]支持播放过程中截取当前播放画面;
  • [只播关键帧]Windows平台支持实时设置是否只播放关键帧;
  • [渲染角度]支持0°,90°,180°和270°四个视频画面渲染角度设置;
  • [渲染镜像]支持水平反转、垂直反转模式设置;
  • [等比例缩放]支持图像等比例缩放绘制(Android设置surface模式硬解模式不支持);
  • [实时下载速度更新]支持当前下载速度实时回调(支持设置回调时间间隔);
  • [解码前视频数据回调]支持H.264/H.265数据回调;
  • [解码后视频数据回调]支持解码后YUV/RGB数据回调;
  • [解码前音频数据回调]支持AAC/PCMA/PCMU数据回调;
  • [音视频自适应]支持播放过程中,音视频信息改变后自适应;
  • [实时录像]支持实时录制MP4,设置录像路径、单个录像文件大小等。


相关文章
|
4月前
|
人工智能 搜索推荐 安全
【微笑讲堂】盘点市面上的Geo优化公司优点和缺点
微笑老师深度解析2025年Geo优化公司优劣势,涵盖快法务、欧博东方、大树科技等十大服务商。从技术实力、行业专长到数据透明与服务模式,全面解读AI时代下生成式引擎优化(GEO)新趋势,助力企业精准选择合作伙伴,抢占AI搜索红利。
462 7
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
2025 年值得选择的 TVC 视频制作服务推荐
2025年AI TVC视频制作服务商榜单出炉!集之互动、即梦、可灵三大平台各具优势,覆盖创意脚本、智能生成、私有化部署与全场景适配。AI技术深度定制,安全合规,助力品牌高效传播,实现商业价值跃升。
280 1
|
10月前
|
存储 人工智能 监控
钉钉对话机器人实现赞踩收集
本文介绍如何通过AppFlow记录钉钉AI对话卡片的用户反馈情况。首先确保已接入钉钉AI机器人,然后分三步实现:1) 修改钉钉AI消息卡片,添加点赞按钮并配置回调参数;2) 配置钉钉卡片点赞消息接收连接流,更新卡片状态;3) 设置日志收集节点,存储用户反馈数据。完成配置后,用户可在群聊中与机器人互动,并使用点踩点赞功能,反馈数据将被有效记录和分析。
924 6
钉钉对话机器人实现赞踩收集
|
8月前
|
存储 自然语言处理 Java
《Java开发者必知:LangChain4j实现RAG系统多模型调度的深度剖析》
RAG(检索增强生成)系统通过结合大语言模型与外部知识检索,解决了知识更新和结果准确性等问题。LangChain4j作为Java框架,在构建RAG系统时具备显著优势,尤其多模型调度功能可灵活选择模型,提升性能与适用性。本文探讨如何用LangChain4j实现多模型调度,涵盖模型初始化、注册表构建、动态切换及协作机制,同时解决性能优化、兼容性与数据隐私等挑战,助力开发者打造高效、可靠的RAG系统。
457 3
|
Linux C++ iOS开发
vs code常见的查找快捷键大全
本文来自 frozencola 技术日志,介绍了 VS Code 中常用的查找快捷键,包括快速打开文件、文件资源管理器、全局搜索、查找符号、查找文件中的文本、查找并替换、文件导航和使用命令面板。掌握这些快捷键可以显著提升开发效率。
1402 4
|
人工智能 Serverless 异构计算
[AI Cog] 想要运营AI业务,但没有GPU?环境搞不定?使用Cog帮您轻松将业务部署上云
[AI Cog] 想要运营AI业务,但没有GPU?环境搞不定?使用Cog帮您轻松将业务部署上云
|
人工智能 监控 前端开发
前端架构(含演进历程、设计内容、AI辅助设计、架构演进历程)
前端架构(含演进历程、设计内容、AI辅助设计、架构演进历程)
587 0
|
机器学习/深度学习 数据可视化
如何在R语言中建立六边形矩阵热图heatmap可视化
如何在R语言中建立六边形矩阵热图heatmap可视化
|
前端开发
vue2_elementui传组件方法自定义(formData)
vue2_elementui传组件方法自定义(formData)
424 0