10亿参数的AI模型SEER「一视同仁」:服务富人,也服务全世界

简介: 一个主要以欧美家庭图片为训练内容的识别系统碰到「尼泊尔」家庭图片时,可能就识别不出,而无需标记、10亿参数的AI模型SEER表现惊人,它「一视同仁」,认得出美国厨房,也认得出尼泊尔厨房。

使用经过挑选和标记的数据集对人工智能系统进行训练,产生了专门的人工智能模型,擅长对象识别等任务。 但是仅仅依靠这种方法也有实际的局限性,其中一个我们认为特别重要: 这样的系统可能难以识别那些日常生活中很常见,但是在训练人工智能系统的数据中「没有被充分代表」的对象。

60.jpg

尤其是,关于训练哪些图片以及如何给它们贴标签的选择,这可能在不经意间引入「偏见」。 例如,一个主要以「美国和欧洲」家庭图片为训练内容的物体识别系统在被要求识别「尼泊尔」一个家中的物体时,可能难以取得同样好的效果。 这是我们对SEER感到兴奋的原因之一,SEER是我们开发的一种新的高性能计算机视觉系统。
通过利用自监督学习,SEER可以从任何数字图片集中学习,而不需要研究人员来挑选和标记每个对象。 初步评估表明,SEER在识别物体方面比传统的计算机视觉系统表现更好,这些物体虽然来自数十亿人的生活,但在用于训练人工智能系统的传统图片数据集中「体现较少」。 我们希望利用SEER使人工智能更好地为每个人服务,而不仅仅是那些一直以来受益最多的群体。 

从全球各地采集图片「考一考」人工智能

我们在2019年的计算机视觉系统偏差研究中使用了「Dollar Street数据集」,对SEER进行测试。SEER给出的结果令人兴奋,自监督学习让人工智能更好地为世界各地的人服务。


61.png

Dollar Street数据集——世界不同国家和地区不同收入的家庭

例如下面这张来自尼泊尔一个家庭的图,SEER的识别结果是:调料、药、碗、水果、社交饮酒 监督学习模型的识别结果是:清洗设备、厨房洗涤盆、展示物品、碗、水果、炊具、锅 所以,SEER正确地识别了图片中的物体,而传统的系统则没有。


                                   62.jpg

                                                         图源:Facebook AI Blog 

下面这张图来自一个中国家庭,SEER的识别结果是:炊具、炉子、锅、工具 监督学习模型的识别结果是:前门上的锁、电源开关、炊具、挂钟、炉灶 所以,SEER 正确地识别出了一个炉子,而传统的训练系统却没有。 

                           image.jpeg

                                                  图源:Facebook AI Blog

 下面这张照片显示了印度的一条小街道。SEER的识别结果是:自行车、街景、垃圾、菜地 监督学习模型的识别结果是:水果树、家、自行车、宠物、房顶


image.jpeg


                                                    图源:Facebook AI Blog

AI为人人

自监督学习在提高语言和方言的性能方面已经显示出巨大的前景,因为这些语言和方言没有大量的数字化文本作为标记的训练数据来使用。 SEER能够在上述例子中更好地进行物体识别,这是另一个令人兴奋的结果,因为该模型是在没有任何数据整理的情况下在随机的互联网图像上训练的。 这表明,用于训练SEER的自监督方法可能会对建立人工智能系统的努力产生巨大影响,这种系统不仅能有效地服务富人,而且能有效地服务整个世界。这些努力只是开始,但很明显,我们正在一条非常令人兴奋的进步之路上。 

相关文章
|
2月前
|
云安全 人工智能 自然语言处理
阿里云x硅基流动:AI安全护栏助力构建可信模型生态
阿里云AI安全护栏:大模型的“智能过滤系统”。
1779 120
|
2月前
|
人工智能 自然语言处理 安全
用AI重构人机关系,OPPO智慧服务带来了更“懂你”的体验
OPPO在2025开发者大会上展现智慧服务新范式:通过大模型与意图识别技术,构建全场景入口矩阵,实现“服务找人”。打通负一屏、小布助手等系统级入口,让服务主动触达用户;为开发者提供统一意图标准、一站式平台与安全准则,降低适配成本,共建开放生态。
325 31
|
3月前
|
人工智能 Java API
AI 超级智能体全栈项目阶段一:AI大模型概述、选型、项目初始化以及基于阿里云灵积模型 Qwen-Plus实现模型接入四种方式(SDK/HTTP/SpringAI/langchain4j)
本文介绍AI大模型的核心概念、分类及开发者学习路径,重点讲解如何选择与接入大模型。项目基于Spring Boot,使用阿里云灵积模型(Qwen-Plus),对比SDK、HTTP、Spring AI和LangChain4j四种接入方式,助力开发者高效构建AI应用。
1655 122
AI 超级智能体全栈项目阶段一:AI大模型概述、选型、项目初始化以及基于阿里云灵积模型 Qwen-Plus实现模型接入四种方式(SDK/HTTP/SpringAI/langchain4j)
|
2月前
|
人工智能 搜索推荐 程序员
当AI学会“跨界思考”:多模态模型如何重塑人工智能
当AI学会“跨界思考”:多模态模型如何重塑人工智能
310 120
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
AI Compass前沿速览:Qwen3-Max、Mixboard、Qwen3-VL、Audio2Face、Vidu Q2 AI视频生成模型、Qwen3-LiveTranslate-全模态同传大模型
AI Compass前沿速览:Qwen3-Max、Mixboard、Qwen3-VL、Audio2Face、Vidu Q2 AI视频生成模型、Qwen3-LiveTranslate-全模态同传大模型
690 13
AI Compass前沿速览:Qwen3-Max、Mixboard、Qwen3-VL、Audio2Face、Vidu Q2 AI视频生成模型、Qwen3-LiveTranslate-全模态同传大模型
|
3月前
|
人工智能 负载均衡 API
Vercel 发布 AI Gateway 神器!可一键访问数百个模型,助力零门槛开发 AI 应用
大家好,我是Immerse,独立开发者、AGI实践者。分享编程、AI干货、开源项目与个人思考。关注公众号“沉浸式趣谈”,获取独家内容。Vercel新推出的AI Gateway,统一多模型API,支持自动切换、负载均衡与零加价调用,让AI开发更高效稳定。一行代码切换模型,告别接口烦恼!
427 1
Vercel 发布 AI Gateway 神器!可一键访问数百个模型,助力零门槛开发 AI 应用
|
2月前
|
人工智能 供应链 搜索推荐
拔俗AI 智能就业咨询服务平台:求职者的导航,企业的招聘滤网
AI智能就业平台破解求职招聘困局:精准匹配求职者、企业与高校,打破信息壁垒。简历诊断、岗位推荐、技能提升一站式服务,让就业更高效。
|
2月前
|
人工智能 Cloud Native 自然语言处理
拔俗AI智能体服务开发:你的7x24小时数字员工,让企业效率飙升的秘密武器
在“人效为王”时代,企业面临服务响应慢、成本高、协同难等痛点。阿里云AI智能体以自主决策、多模态交互、持续学习三大引擎,打造永不疲倦的“数字员工”,实现7×24小时高效服务,助力企业降本增效、驱动创新增长。(238字)
|
2月前
|
人工智能 供应链 算法
AI 产业服务平台:打造产业智能化的“加速器”与“连接器”
AI产业服务平台整合技术、数据、算力与人才,为中小企业提供低门槛、一站式AI赋能服务,覆盖研发、生产、营销、管理全链条,助力产业智能化转型。

热门文章

最新文章