通义听悟重磅升级!超长音视频自由问,还会做思维导图

简介: 通义听悟重磅升级!超长音视频自由问,还会做思维导图


今天,阿里大模型产品“通义听悟”发布多项新功能。音视频问答助手“小悟”上线,在业界首次实现单记录、跨记录、多语言自由问,支持对单个最长6小时、一次性上百条音视频的内容理解问答,用户可对超长音视频随心提问,让AI 总结任意知识点。此外,针对学习科研场景对AI工具的强烈需求,通义听悟推出“高校公益计划”,向所有中国大陆高校师生直接赠送价值数千元的500小时音视频转写时长。



升级六大新功能,AI多面体助手


音视频承载了密集的信息内容,但因涉及多模态理解、自然语言处理、搜索等多项复杂技术,长期以来内容查找难、回顾难、提炼难。


阿里通义听悟产品负责人杨帆介绍,通义听悟为这一需求而生。“作为一款工作学习AI助手,通义听悟希望让高知识附加值的音视频被轻松阅读、整理和分享。”

 

通义听悟接入通义千问大模型,融合了十多项AI功能,包括转写、翻译、角色分离、全文摘要、章节速览、发言总结、PPT提取等,并支持标重点、记笔记,被许多用户称为“宝藏AI工具”。


image.png

杨帆介绍通义听悟历程


通义听悟本次升级上新了六大功能点。最重磅的是音视频问答助手“小悟”,关键信息直接“问”出来。小悟通过多语言Query处理、长篇章文本理解、指令演化框架优化及检索增强生成算法,在业内首次实现对超长音视频的单记录、跨记录、多语言自由问答,支持内容问答的音视频时长和文件数均突破业界上限。


用户不仅可在单一记录页呼唤小悟,对最高6小时、6G大小的音视频提问任何相关话题,或直接小悟要求整理金句、梳理结论、写会议纪要;更可在首页针对用户所有记录提问,支持一次性扫描理解上百条音视频内容;也可花式对英文视频用中文提问,小悟将直接给出中文回答,省去翻译。作为一个“懂你”的AI,小悟还会智能推荐问题。


image.png

随时唤起“小悟”课代表


针对用户需求,通义听悟还上线了一键AI改写、思维导图生成等新能力。例如,一键AI改写,将口语转为书面表达,尤其适合整理采访;思维导图自动生成,最多支持五级xmind脑图,适合播客摘要。


image.png

通义听悟思维导图示例


产品细节体验也进一步升级,包括笔记支持一键插入视频时间戳及截图、音视频文件语种自动识别等。


推出高校公益计划,AI算力普惠


学生和科研群体对AI新工具有普遍需求,但目前音视频AI转写工具普遍收费,或仅提供如每月1小时的少量免费时长。


通义听悟推出“高校公益计划”,推动AI算力普惠。所有中国大陆高校师生通过后缀edu.cn的教育邮箱进行认证后,均可直接获赠500小时转写时长,存储空间从20G拓展至200G。按目前市面上语音厂商9.9元每小时的折扣价,这一教育福利价值数千元。


image.png

通义听悟高校公益计划


通义听悟能听、能看、能读,还能实现速览加精听,正成为学霸们的全新学习方式。杨帆介绍,调研中发现约一半用户是学生,他们活跃度相当高,后台每天收到大量私信“求时长”。


有的同学上课、开组会“无时无刻不听悟”;有的用通义听悟两倍速上网课备考;有的每天在“发现”栏目中阅读数十档播客节目,“获取最前沿新鲜的观点内容”。


成都一位管理学博士生蔡同学在社交媒体上写道,“通义听悟绝对是最强科研神器”,她向身边几乎所有亲朋好友推荐了这款产品。通义听悟发布才9个月,她的使用时长已近7000小时,平均每天转写20小时以上,包括分析网络视频进行学术研究,以及日常学习工作随时使用,这款软件已成为她沉淀知识和科研成果的重要平台。


作为国内首个开放公测的大模型产品,去年6月发布以来,通义听悟累计已有上百万用户,包括学生、老师、白领、记者、律师、金融分析师等群体,活跃用户日均转写音视频3次以上,平台每天处理字符数约20亿字。

目录
相关文章
|
8月前
|
人工智能 自然语言处理 开发者
通义千问升级免费开放1000万字长文档处理功能:利好与期待功能
最近技术圈的重大消息,那就是阿里通义千问在3月22日进行了重磅升级,向所有用户免费开放了1000万字的长文档处理功能,成为全球文档处理容量最大的AI应用。据悉,通义千问的文档处理容量和能力已经超越了全世界市场上的其他AI应用,包括ChatGPT等。关于阿里云的通义千问,不用多说,作为开发者大部分都知道且使用过,而且在日常开发过程中也或多或少会使用到,关于这次升级将会带来哪些利好?又有哪些功能值得期待呢?那么本文就来一探究竟,我们一起来看这次升级的影响,欢迎大家在评论区分享自己看法。
596 2
通义千问升级免费开放1000万字长文档处理功能:利好与期待功能
|
8月前
|
人工智能 自然语言处理 UED
通义听悟上线音视频问答助手
【2月更文挑战第30天】阿里巴巴“通义听悟”推出音视频问答助手“小悟”,能理解6小时内容,提供精准问答,适用于学术、会议、教育场景。此外,还具有一键AI改写、思维导图生成功能,优化笔记体验,支持多语种自动识别。已吸引百万用户,日处理字符数达20亿。但可能在专业术语理解及用户体验上存在挑战。
109 3
通义听悟上线音视频问答助手
|
4月前
|
API 云栖大会
通义千问升级旗舰模型Qwen-Max,性能接近GPT-4o
通义旗舰模型Qwen-Max全方位升级,性能接近GPT-4o
1704 11
|
4月前
|
IDE 算法 Java
通义灵码企业级能力全面升级
本指南介绍如何使用通义灵码企业版提升代码质量和效率。首先,需注册并登录通义灵码企业版及 IDE 插件,下载本地工程和知识库压缩包,创建企业知识库并上传文档和代码。随后,可通过开启检索增强功能体验基于企业规范的代码风格优化、前端组件代码补全及后端算法函数生成等功能,显著提高开发效率和代码质量。
114 2
|
30天前
|
人工智能 搜索推荐 安全
数百名研发人员用通义灵码,33%新增代码由AI生成,信也科技研发模式焕新升级
目前,信也科技数百名研发人员正在使用通义灵码,周活跃用户占比70%,新增代码中有33%由通义灵码编写,整体研发效率提升了11%,真正实现了数百研发人员开发效能的全面提升。
|
2月前
|
存储 人工智能 安全
【通义】AI视界|苹果停止签署iOS 18.0.1,升级用户无法降级
本文由通义自动生成,涵盖24小时内精选的五条科技资讯:奥特曼谈OpenAI未来发展方向,ChatGPT新搜索功能上线遇故障,Perplexity AI选举搜索面临挑战,马斯克谈特斯拉造手机的可能性,以及苹果停止签署iOS 18.0.1。更多精彩内容,欢迎访问通通知道。
|
3月前
|
自然语言处理 JavaScript 开发者
跟随通义灵码一步步升级vue2(ts)项目到vue3版本
本文介绍了如何将基于 TypeScript 的 Vue 2 项目升级到 Vue 3。主要内容包括:依赖升级、配置文件调整、组件代码迁移、状态管理迁移以及优化策略迁移。文章提供了详细的步骤和示例代码,帮助开发者顺利完成升级。特别推荐使用通义灵码工具来加速组件和状态的转写过程。
124 7
|
3月前
|
JavaScript 测试技术 API
跟随通义灵码一步步升级vue2(js)项目到vue3版本
Vue 3 相较于 Vue 2 在性能、特性和开发体验上都有显著提升。本文介绍了如何利用通义灵码逐步将 Vue 2 项目升级到 Vue 3,包括备份项目、了解新特性、选择升级方式、升级依赖、迁移组件和全局 API、调整测试代码等步骤,并提供了注意事项和常见问题的解决方案。
116 4
|
4月前
|
人工智能 架构师 IDE
阿里云通义灵码重磅升级,能自主修BUG、开发应用的AI程序员来了
通义灵码AI编程能力再进化,说几句话就能开发网页
6790 9
|
7月前
|
安全 测试技术 开发者
通义千问2.5有哪些升级
通义千问2.5有哪些升级
575 5