Siri太笨,根本打不过ChatGPT!苹果加急测试语言生成AI

简介: Siri太笨,根本打不过ChatGPT!苹果加急测试语言生成AI



 新智元报道  

编辑:桃子

【新智元导读】苹果也入场了。


「Siri太笨,根本无法与ChatGPT竞争!」

这是前苹果工程师John Burkey接受纽约时报一次采访时,对苹果语音助手Siri的评价。

他进一步表示,「Siri不可能成为像ChatGPT那样的「创意助手」,笨拙的代码使其难以添加新功能。」

Burkey曾在2014年参与了Siri的改进工作,并在2016年离开了苹果。

微软把GPT-4与自家产品结合正搞的正大火大热之时,谷歌、Meta紧随其后,唯独苹果却在这AI大潮中还未出手。

其实, 报道称Siri的团队已经在内部开始测试人工智能语言生成模型。

Siri太笨,苹果出手


Siri能够回答像「天气怎么样?」还有「你会唱‘这首’歌吗?」这样的简单问题,都是通过从数据库中提取大量词汇来完成的。

可见,Siri只能理解部分的人类请求。

这意味着工程师必须在数据库中添加新词,才能扩展其功能。

据了解,Siri本质上是「命令-控制」系统,笨拙的设计使得工程师们很难添加新的功能。

Burkey称,Siri的数据库包含了近24种语言的大量短语列表,使之成为「一个巨大的雪球」。

若要添加新词,这样简单更新都需要重建整个Siri数据库,可能需要长达6周的时间,因为进行全面的审查这一步是必不可少的。

而要集成更多类似ChatGPT的高级功能,比如新的搜索工具,可能需要大约1年的时间。

再者,即使升级Siri的基本功能,由于代码错综复杂,也可能需要数周时间。

为了应对ChatGPT等聊天机器人的崛起,苹果并非无动于衷。

2月,苹果举办的年度人工智能峰会上,重点关注当前人工智能工具和大型语言模型。

纽约时报称,许多团队,包括从事Siri研究的工程师,「每周」都在定期测试「语言生成概念」。

另外,苹果已经在tvOS 16.4中测试「Siri自然语言生成」的新框架,内部代号为「Bobcat」。

工程师通过自然语言生成技术在苹果电视上用Siri讲笑话,同时还在测试如何将语言生成用于定时器。

尽管新的语言生成功能目前只在Apple TV上启用,但9to5Mac透露这些功能的代码也包含在iPhone、 iPad、Mac、HomePod和Apple TV中。

只是目前除了苹果电视,还没有其他设备启用。

目前,苹果对外并没有公开自己在语言生成AI上的工作。

除了测试语言生成AI,在今年1月,苹果曾启动了一项计划,在Apple Books上提供数字旁白的功能,可以从书面文本中自动生成高质量的人工智能旁白音频。

这表明苹果已经在探索生成式AI的用例。在今年的WWDC上,苹果会介绍在这些领域的努力。

从仰慕到调侃,Siri已褪去光环


2011年,在旧金山一个下雨的星期二,苹果高管们在一个拥挤的礼堂里发布了第5代iPhone。

这款手机虽然看起来和之前的版本一模一样,但它有一个新功能:Siri,一个虚拟语音助手。

它的初次亮相成为发布会的最大亮点,一时间引起台下观众的欢呼。

时任苹果软件部门负责人的Scott Forstall按下iPhone的home键,召唤出Siri,并向其提出问题。

巴黎时间是?什么是有丝分裂(mitosis)?

现场,Siri大显身手:「巴黎时间晚上8点16分」;「细胞分裂,细胞核分裂成含有相同数量染色体的细胞核」。

并列出了14家好评的希腊餐厅名单,其中5家位于加利福尼亚州的帕洛阿尔托。

3年后,亚马逊的Alexa初试啼声,又过了2年,Google Assistant姗姗来迟。

然而,这项技术在基本上停滞不前,会说话的助手成了笑柄,包括在2018年的「周六夜现场」(Saturday Night Live) 节目中,一个为老年人设计的智能扬声器。

即Siri便经过数次改进,相比眼下「全能」的ChatGPT和微软Bing,Siri早已褪下当初的光环,功能鸡肋,甚至沦为脱口秀中的段子。

就连微软CEO纳德拉此前接受采访时表示, Siri和亚马逊的Alexa、以及自家的Cortana笨的像石头一样。

Siri的创造者Adam Cheyer也表示,ChatGPT能够写论文、代码,这让现有的语音助手看起来很愚蠢。

与此同时,Reddit上苹果用户发起了讨论来表达自己的不满,「为什么 Siri 如此愚蠢」,「Siri 是不是每年都在变笨」。

其实,不仅仅Siri被人斥责,就连亚马逊的语音助手Alexa也同样如此。该部门在去年营收亏损30多亿美元之后,目前还在强撑着。

这些语音助理产品和ChatGPT聊天机器人虽然功能类似,但本质上基于不同类型的人工智能模型。

聊天机器人由大型语言模型提供动力,这些模型是经过训练的系统,能够根据从网络上抓取的大量数据集识别和生成文本。

相比之下,Siri、Alexa和谷歌助理则通过所谓的指挥控制系统进行工作。

它们可以理解有限的问题和请求列表,比如「纽约市的天气怎么样?」或「打开卧室的灯」。如果用户要求虚拟助手做一些代码中没有的事情,机器人会简单地说它无法提供帮助。

这几家公司都尝试过将语音助手进行升级,但该类技术的升级难度似乎远超生成式人工智能。

前亚马逊和谷歌管理人员,「和亚马逊一样,谷歌发现Google Assistant很难带来高营收。」

不过,亚马逊和谷歌表示将继续发展他们的语音助手功能。

参考资料:https://www.nytimes.com/2023/03/15/technology/siri-alexa-google-assistant-artificial-intelligence.htmlhttps://9to5mac.com/2023/03/16/apple-testing-siri-natural-language-generating-chatgpt/

相关文章
|
2月前
|
机器学习/深度学习 数据采集 人工智能
从ChatGPT到文心一言:AI为什么能“懂人话”?——大语言模型的底层逻辑揭秘
从ChatGPT到文心一言:AI为什么能“懂人话”?——大语言模型的底层逻辑揭秘
394 9
|
3月前
|
人工智能 Rust 并行计算
AI大模型开发语言排行
AI大模型开发涉及多种编程语言:Python为主流,用于算法研发;C++/CUDA优化性能;Go/Rust用于工程部署;Java适配企业系统;Julia等小众语言用于科研探索。
1321 127
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
AI Compass前沿速览:ChatGPT Atlas、Claude Code、Haiku 4.5、Veo 3.1、nanochat、DeepSeek-OCR
AI Compass前沿速览:ChatGPT Atlas、Claude Code、Haiku 4.5、Veo 3.1、nanochat、DeepSeek-OCR
351 37
AI Compass前沿速览:ChatGPT Atlas、Claude Code、Haiku 4.5、Veo 3.1、nanochat、DeepSeek-OCR
|
3月前
|
人工智能 测试技术 项目管理
测试不再碎片化:AI智能体平台「项目资料套件」功能上线!
在实际项目中,需求文档分散、整理费时、测试遗漏等问题常困扰测试工作。霍格沃兹推出AI智能体测试平台全新功能——项目资料套件,可将多个关联文档打包管理,并一键生成测试用例,提升测试完整性与效率。支持套件创建、文档关联、编辑删除及用例生成,适用于复杂项目、版本迭代等场景,助力实现智能化测试协作,让测试更高效、更专业。
|
4月前
|
存储 人工智能 算法
AI测试平台实战:深入解析自动化评分和多模型对比评测
在AI技术迅猛发展的今天,测试工程师面临着如何高效评估大模型性能的全新挑战。本文将深入探讨AI测试平台中自动化评分与多模型对比评测的关键技术与实践方法,为测试工程师提供可落地的解决方案。
|
2月前
|
数据采集 人工智能 程序员
PHP 程序员如何为 AI 浏览器(如 ChatGPT Atlas)优化网站
OpenAI推出ChatGPT Atlas,标志AI浏览器新方向。虽未颠覆现有格局,但为开发者带来新机遇。PHP建站者需关注AI爬虫抓取特性,优化技术结构(如SSR、Schema标记)、提升内容可读性与语义清晰度,并考虑未来agent调用能力。通过robots.txt授权、结构化数据、内容集群与性能优化,提升网站在AI搜索中的可见性与引用机会,提前布局AI驱动的流量新格局。
152 8
|
7月前
|
人工智能 自然语言处理 安全
学不会编程也能写测试?AI让测试更平权
在传统的软件开发体系中,测试常被划分为“技术型测试”(如自动化、性能、安全)和“业务型测试”(如功能验证、用户体验)。前者掌握技术话语权,后者则更多依赖经验和流程规范。然而,随着大语言模型(LLM)等AI技术的迅猛发展,这一固有格局正被悄然打破:
242 10
|
2月前
|
人工智能 自然语言处理 JavaScript
Playwright MCP在UI回归测试中的实战:构建AI自主测试智能体
Playwright MCP结合AI智能体,革新UI回归测试:通过自然语言驱动浏览器操作,降低脚本编写门槛,提升测试效率与覆盖范围。借助快照解析、智能定位与Jira等工具集成,实现从需求描述到自动化执行的闭环,推动测试迈向智能化、民主化新阶段。
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
如何让AI更“聪明”?VLM模型的优化策略与测试方法全解析​
本文系统解析视觉语言模型(VLM)的核心机制、推理优化、评测方法与挑战。涵盖多模态对齐、KV Cache优化、性能测试及主流基准,助你全面掌握VLM技术前沿。建议点赞收藏,深入学习。
896 8
|
3月前
|
人工智能 数据可视化 测试技术
AI 时代 API 自动化测试实战:Postman 断言的核心技巧与实战应用
AI 时代 API 自动化测试实战:Postman 断言的核心技巧与实战应用
520 11