隔空“玩”物不再科幻!科学家研发新型可穿戴设备,未来有望用于智能假肢

简介: 【新智元导读】加州大学伯克利分校的工程师们开发出的一种新型可穿戴设备,该设备通过将可穿戴生物传感器与AI相结合,可以根据设备佩戴者前臂的电信号模式,识别出他计划做出的手势。

想象一下以下场景,在没有键盘的情况下在电脑上打字,在没有控制器的情况下玩电子游戏,在没有方向盘的情况下驾驶汽车。这么炫酷的场景,似乎只有科幻影片中才会出现。


如今,由加州大学伯克利分校的工程师们开发出的一种新型可穿戴设备或许可以实现这些场景。研究人员表示,该设备有望用于控制假肢,并且可与各种类型的电子设备进行交互


相关研究以“A wearable biosensing system with in-sensor adaptive machine learning for hand gesture recognition”为题,于 12 月 21 日在线发表在 Nature Electronics 上。


42.jpg(来源:Nature Electronics


对此,该设备的研发工程师之一、加州大学伯克利分校电子工程和计算机科学系博士 Ali Moin 表示:“假肢是这项技术的重要应用之一,它同时也提供了一种非常直观的、可与计算机交互的方式。”


改善人机交互的方式有多种,比如使用摄像头和计算机视觉技术,但读取手势是一个很好的解决方案,还可以保护个人隐私。


让科幻场景成为现实


近年来,可穿戴式生物传感器在健康监测和人机界面交互领域得到了广泛的应用。但是,想要使无线信号处理系统实现对生理信号的实时分析,还存在通信时延、安全性等问题。

虽然引入机器学习模型进行本地信号处理的系统具有许多优势,但同样面临着多种问题,在低功耗嵌入式处理器中,所使用的机器学模型通常需要事先进行离线训练,如果训练达不到预期效果,模型的分类精度就会降低,导致性能欠佳或用户体验不佳等问题。

为了解决当前可穿戴生物传感设备面临的技术壁垒,Moin 等人通过检测人体皮肤表面肌电图(surface electromyography,sEMG),研发了可穿戴的高密度 sEMG 生物传感系统。
该可穿戴系统总重量为 26g,也就是一块表的重量,佩戴十分方便系统所使用的电池为 3.7V、240mAh 的锂离子电池,连续手势识别续航时间长达 6 小时。

43.jpg图 | sEMG 可穿戴生物传感系统。a. 位于前臂上的设备;b. 丝网印刷过程的图解;c. 定制设计的 16*4 电极阵列;d. 小型八层 PCB 电路板;e. 构成可穿戴系统的主要组件的框架图。(来源:Nature Electronics

为了创建手势识别系统,该团队与加州大学伯克利分校电子工程教授 Ana Arias 合作,设计了一个灵活的臂带。


该臂带可以读取佩戴者前臂上 64 个不同点的电信号,并将电信号输入到一个使用 AI 算法编程的电子芯片中。


与其他人工智能算法一样,该算法首先要“学习”手臂上检测到的电信号,并与特定的手势相关联。要实现这一点,每个用户都必须戴上臂带,同时逐一做出手势。


44.gif

(素材来自 YouTube)

45.gif

(素材来自 YouTube)

46.gif

(素材来自 YouTube)

该生物传感系统穿着舒适,并且可以提供快速的初始训练,自适应性较强,这一特点对于可穿戴的人机界面应用至关重要。但是,目前该系统所检测的生理信号会因用户而异,并且不稳定。


竖起你的大拇指

与其他先进的手势识别系统相比,该设备使用超维计算(HDC)来实现传感器中的自适应学习,通过本地数据实时训练、推理和模型更新,来适应不断变化的情境,对手势分类进行实时推断的实时推断。


例如,如果设备佩戴者的手臂上有汗水或手臂举过头顶,与特定手势相关的电信号会发生变化,HD 算法可以将这些新信息纳入其模型。

Moin说:“在手势识别中,sEMG 信号会随着时间的推移而改变,这可能会影响模型的性能,我们能够通过更新设备上的模型来大大提高分类精度。”


47.jpgimage.gif

图 | 研究中使用的手势类别和 sEMG 记录特征(来源:Nature Electronics)

通过模型训练,该系统成功识别了 21 个单独的手势,包括竖起大拇指、握拳、平手、举起单个手指和数数字

该设备的另一个优势是,所有的数据运算都在芯片上进行,无需将个人数据传送到附近的电脑或设备上,这不仅加快了计算速度,还确保了个人生物数据的私密性。

Moin 表示:“当你想让手部肌肉收缩时,你的大脑会通过颈部和肩部的神经元向手臂和手部的肌肉纤维发送电信号。从本质上讲,臂带中的电极所检测到的就是这个电信号。它并不是那么精确,从某种意义上说,我们无法精确地指出到底是哪些纤维被触发了,但由于电极的分布密度较高,它仍然可以学习识别某些模式。”

论文通讯作者之一、加州大学伯克利分校的电机工程和计算机科学系杰出教授 Jan Rabaey 表示:“当亚马逊或苹果公司创建他们的算法时,他们会在云端运行一堆软件来创建模型,然后将模型下载到设备上。但是,在设备的使用过程中,往往会被所输入的特定模型所困。如今,我们实现了一个在设备本身完成学习的过程,而且它的速度极快,你只需要执行一次,它就会开始做这项工作。你做的次数越多,设备的性能就会变得越好。它在不断学习,这也是人类的工作方式。”

Rabaey 表示,该设备尚未准备好商用,可能还需要进行一些调整。

“这些技术大多数已经存在于其他地方,
但是该设备的独特之处在于,它将生物传感、信号处理和解释以及 AI 集成到一个系统中,而且该系统具有尺寸小、设计灵活、低功率等优点。

参考资料:
https://www.nature.com/articles/s41928-020-00510-8

https://techxplore.com/news/2020-12-high-five-thumbs-up-device-gesture.html

https://www.youtube.com/watch?v=z3D9WBfUKsQ&feature=emb_logo&ab_channel=UCBerkeley

相关文章
|
2月前
|
人工智能 自然语言处理 安全
阿里云万小智AI建站:基础版、标准版、企业版主要功能及价格对比和选择参考
阿里云万小智 AI 建站是一款基于 AI 驱动的自助建站产品,无需代码基础,通过可视化拖拽与 AI 对话即可快速构建高性能、多语言、安全合规的网站。系统深度集成阿里云 ECS、RDS、OSS、CDN、SLB 与 Web 应用防火墙,保障高可用性、数据安全与全球访问速度。其提供多个版本,精准匹配从个人工作室到中大型企业的差异化需求。
491 167
|
2月前
|
机器学习/深度学习 缓存 物联网
打造社交APP人物动漫化:通义万相wan2.x训练优化指南
本项目基于通义万相AIGC模型,为社交APP打造“真人变身跳舞动漫仙女”特效视频生成功能。通过LoRA微调与全量训练结合,并引入Sage Attention、TeaCache、xDIT并行等优化技术,实现高质量、高效率的动漫风格视频生成,兼顾视觉效果与落地成本,最终优选性价比最高的wan2.1 lora模型用于生产部署。(239字)
1145 103
|
弹性计算
关于ECS服务器搭建代理
基于CentOSx系统,使用ECS服务器搭建代理
1931 1
关于ECS服务器搭建代理
|
1月前
|
移动开发 API 双11
2026年阿里云最新一期域名注册和续费优惠口令内容,口令获取地址和使用教程参考
近年来,各大注册商的域名注册和续费价格都在上涨,为此,阿里云推出了针对域名产品注册、转入和续费的优惠口令。使用域名优惠口令,可享受一定的优惠。最新一期的优惠口令获取地址可通过阿里云的万网微信公众号或活动页面获取优惠口令,但不能与同域名产品的其他优惠(含代金券、折扣、满减等)同时使用。
2059 3
|
2月前
|
SQL 人工智能 缓存
阿里云百炼产品月刊【2025年11月】
通义千问本月重磅升级:上线10款多模态与语音模型,涵盖ASR、TTS、视觉语言及翻译;MCP市场新增3个云服务,上架24个电商应用模板;推出实训Agent创客活动,助力高效生成电商视觉内容。
818 10
|
2月前
|
人工智能 自然语言处理 语音技术
AI配音告别"罐头味儿",阿里Qwen3-TTS让机器"声情并茂"
2025年12月24日,阿里巴巴升级语音模型家族Qwen3-TTS,重磅发布音色创造模型Qwen3-TTS-VD(VoiceDesign)和音色克隆模型Qwen3-TTS-VC(VoiceClone)。仅用3秒音频就能"像素级"克隆人声,支持10大主流语言及9种方言,在权威测试中多项性能超越GPT-4
851 0
|
2月前
阿里云产品十二月刊来啦
全新万相2.6系列模型正式发布,通义百聆语音交互模型开源,PAI 模型评测新支持双模型离线竞技功能|产品十二月刊
172 12
阿里云产品十二月刊来啦
|
2月前
|
语音技术
阿里云产品十一月刊来啦
阿里云百炼多模态与语音识别模型全面升级,千问APP公测上线免费向用户开放|产品十一月刊
159 11
阿里云产品十一月刊来啦