百度Create 2017:AI核心技术全面开放,与开发者共享未来

本文涉及的产品
NLP自然语言处理_高级版,每接口累计50万次
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_基础版,每接口每天50万次
简介: 为用户带来具有价值的技术,才会有真正持久的影响力。7 月 5 日,百度 AI 开发者大会(Baidu Create 2017)在北京国家会议中心举行,其中以「开放创新 共襄 AI 未来」为主题的 AI 技术与开放平台分论坛,吸引了众多开发者们的关注。

在昨天下午举行的论坛中,百度副总裁、百度 AI 技术与平台体系(AIG)总负责人王海峰在开场致辞中表示,百度在人工智能领域深耕多年,从十七年前百度诞生之日起就开始积累,几乎所有主要人工智能技术都已在百度搜索引擎中得到应用,来自搜索引擎的用户需求、数据和平台,支撑了百度 AI 技术的快速发展,现在百度人工智能在算法、数据、技术等方面具有领先优势。


微信图片_20211129094143.jpg


「在每天数十亿次用户请求的千锤百炼下,百度的人工智能技术已是真正实用的人工智能技术。」王海峰认为,人工智能的技术还在不断进步,但另一方面,只有将技术与实际应用相结合,根据用户需求和反馈反复迭代优化,才能打造强大、更具活力的 AI 技术。

 

作为一家大型科技公司,百度诞生于 PC 互联网时代,那是一个开放生态的时代。百度认为,在互联网的助力下得到迅速发展的 AI 技术,也应该秉承开放精神。更重要的是,AI 的影响将不限于互联网,AI 将影响各行各业和人们生活的方方面面。百度希望通过与开发者和社会共享 AI 技术成果,带动生态繁荣,推动社会进步。

 

在大会上,百度宣布其多年打造的完整 AI 技术平台将全面开放。百度的 AI 能力分为四层。在基础层,是 AI 算法、大数据、大计算能力。在感知层,包括语音、图像、视频、AR/VR 等技术。认知层有自然语言处理、知识图谱及用户画像等。在平台层,基础层、感知层、认知层的技术会平台化,通过百度 AI 开放平台 ai.baidu.com 开放,与开发者共享。截至目前,百度 AI 开放平台上开放的技术共有 60 个,已成为最全面的 AI 技术开放平台。

 

开放技术打造完整平台

 

百度正试图通过开放的生态体系在人工智能的时代引领发展的潮流。此次宣布开放的语音、自然语言处理、视频、增强现实、机器人视觉等技术,与已经开放的 AI 技术一起,构成具有 60 项开放技术的完整的、综合的 AI 开放平台,为开发者提供形式多样、可定制、可组合的 AI 技术,满足开发者从 API、源码、数据到计算能力的多层次需求。


微信图片_20211129094148.jpg

在自动驾驶的精细数据集中,每一帧的图片要几个小时才能完全标注,百度第一次开放了 3000 帧用于自动驾驶的全标注数据集,并计划在今年 9 月开放更多。


作为中国科技巨头中第一个选择转型的企业,百度在 AI 技术上具有先发优势,完整布局和深厚技术积累。百度的 AI 技术始终随着公司业务的发展而不断进化,由于庞大的用户规模和强大的人才积累,百度 AI 技术的开放对于开发者们来说是一个好消息。在大会上,百度表示,其 AI 开放平台多项技术的使用量过去半年都有 2 倍以上的增长。

 

唤醒万物:语音技术+自然语言处理


微信图片_20211129094151.jpg


语音交互或许是人机交互的下一个风口,随着亚马逊 Alexa 等智能设备的兴起,语音技术的需求正日益增加。百度语音技术部总监高亮在分论坛现场介绍了本次新开放的远场识别及语音唤醒、定制化语音合成、语音合成音色、情感语音交互(Emotional CUI)等技术。通过这些开源的技术,开发者们可以实现不同场景的智能应用,轻松设计出满足自己需求的产品。


微信图片_20211129094155.jpg


在利用语音技术,让机器理解用户所指之后,更重要的是能让机器懂得用户真正的需求,这就需要用到自然语言处理技术。在分论坛中,百度自然语言处理部总监赵世奇详细介绍了语言理解与交互技术平台——UNIT。该平台将开放语言理解技术、交互技术,从百度大数据中自动汲取最有价值的数据提供给开发者使用,为开发者提供了多种定制化方案,还首创「训练师」模式,助力开发者训练对话机器人,赋予机器「理解」自然语言,听懂用户需求,以及与用户进行多轮次对话的能力。

 

看懂世界:视频分析、人脸识别和 AR

 

在论坛中,百度研究院院长林元庆介绍了视频分析与理解、机器人视觉和人脸识别等技术。同时,本次开发者大会还发布了全面的视频语义理解技术,包括视频封面选摘、视频分类、视频比对、细粒度识别、视频审核、视频公众人物识别、视频结构化分析等。此外,林元庆还介绍了用于自动驾驶机器学习训练的语义分割 RGBD 视频数据集,以及完整的机器人视觉解决方案。


微信图片_20211129094159.jpg

增强现实(AR)技术作为全新的视觉交互形式,越来越受到营销、娱乐、游戏等行业关注。百度增强现实实验室主任吴中勤现场发布全新 DuMix AR 开放平台,为开发者供 AR SDK、内容制作工具、云端内容平台和内容分发服务。吴中勤表示,未来百度将提供更多场景的 AR 行业解决方案,赋能各行各业,共同探索 AR 价值。

 

在 AI 技术与开放平台分论坛上,除了发布新开放的核心技术能力,百度也表示将对已有技术进行改革。百度杰出科学家徐伟批露了 PaddlePaddle 的最新发展路径图,宣布百度会开源代码、开放大规模数据集、开放计算能力、开放应用模型库。作为国内首个开源深度学习平台,百度在 PaddlePaddle 的研发中持完全开放的态度,试图与开发者们共同推进技术的发展。「在重新设计之后,今年 9 月我们将推出全新版本的 PaddlePaddle,」徐伟表示。「在简化代码,运行更加高效的基础上,它将对移动端和嵌入式设备有更加完善的支持。」


微信图片_20211129094202.jpg


而在计划于 2017 年 12 月推出的新版本中,PaddlePaddle 将支持英伟达全新 Volta 架构的 16 位浮点运算,并加入 TensorRT 的支持。

 

Create 2017 开发者大会上备受瞩目的 AI 技术与开放平台分论坛,是整合了 NLP、KG、IDL、语音、大数据等核心技术部门的百度 AI 技术平台体系 AIG 成立后的首次集体亮相,全面展示了百度的 AI 技术能力。可以想象,未来随着百度 AI 技术的进一步开放,开发者、创业者、业内公司将不断从中受益,让人工智能技术赋能更多场景,创造更多价值;而另一方面,百度也会从这些行动中不断提升自己的竞争力。无论如何,这次开源行动必将推动国内人工智能领域的加速发展。微信图片_20211129092521.png


相关链接



相关文章
|
5天前
|
机器学习/深度学习 人工智能 API
Aligner:自动修正AI的生成结果,北大推出残差修正模型对齐技术
介绍北大团队提出的 Aligner 模型对齐技术,通过学习对齐答案与未对齐答案之间的修正残差,提升大语言模型的性能。
64 28
|
3天前
|
机器学习/深度学习 人工智能 自然语言处理
DeepSeek逆天,核心是 知识蒸馏(Knowledge Distillation, KD),一项 AI 领域的关键技术
尼恩架构团队推出《LLM大模型学习圣经》系列,涵盖从Python开发环境搭建到精通Transformer、LangChain、RAG架构等核心技术,帮助读者掌握大模型应用开发。该系列由资深架构师尼恩指导,曾助力多位学员获得一线互联网企业的高薪offer,如网易的年薪80W大模型架构师职位。配套视频将于2025年5月前发布,助你成为多栖超级架构师。此外,尼恩还提供了NIO、Docker、K8S等多个技术领域的学习圣经PDF,欢迎领取完整版资源。
|
16天前
|
存储 人工智能 安全
AI时代的网络安全:传统技术的落寞与新机遇
在AI时代,网络安全正经历深刻变革。传统技术如多因素身份认证、防火墙和基于密码的系统逐渐失效,难以应对新型攻击。然而,AI带来了新机遇:智能化威胁检测、优化安全流程、生物特征加密及漏洞管理等。AI赋能的安全解决方案大幅提升防护能力,但也面临数据隐私和技能短缺等挑战。企业需制定清晰AI政策,强化人机协作,推动行业持续发展。
48 16
|
17天前
|
机器学习/深度学习 存储 人工智能
AI实践:智能工单系统的技术逻辑与应用
智能工单系统是企业服务管理的核心工具,通过多渠道接入、自然语言处理等技术,实现工单自动生成、分类和分配。它优化了客户服务流程,提高了效率与透明度,减少了运营成本,提升了客户满意度。系统还依托知识库和机器学习,持续改进处理策略,助力企业在竞争中脱颖而出。
54 5
|
人工智能 城市大脑 智能设计
阿里云打下AI地基,更多的开发者走向了前台
不仅做前沿的智能技术探索,也要打造开发视觉开放平台这样的产品,将人工智能变成人人可及的普惠科技。
阿里云打下AI地基,更多的开发者走向了前台
|
23天前
|
人工智能 运维 物联网
云大使 X 函数计算 FC 专属活动上线!享返佣,一键打造 AI 应用
如今,AI 技术已经成为推动业务创新和增长的重要力量。但对于许多企业和开发者来说,如何高效、便捷地部署和管理 AI 应用仍然是一个挑战。阿里云函数计算 FC 以其免运维的特点,大大降低了 AI 应用部署的复杂性。用户无需担心底层资源的管理和运维问题,可以专注于应用的创新和开发,并且用户可以通过一键部署功能,迅速将 AI 大模型部署到云端,实现快速上线和迭代。函数计算目前推出了多种规格的云资源优惠套餐,用户可以根据实际需求灵活选择。
|
20天前
|
人工智能 算法 前端开发
OmAgent:轻松构建在终端设备上运行的 AI 应用,赋能手机、穿戴设备、摄像头等多种设备
OmAgent 是 Om AI 与浙江大学联合开源的多模态语言代理框架,支持多设备连接、高效模型集成,助力开发者快速构建复杂的多模态代理应用。
161 72
OmAgent:轻松构建在终端设备上运行的 AI 应用,赋能手机、穿戴设备、摄像头等多种设备
|
5天前
|
人工智能 自然语言处理 搜索推荐
【上篇】-分两篇步骤介绍-如何用topview生成和自定义数字人-关于AI的使用和应用-如何生成数字人-优雅草卓伊凡-如何生成AI数字人
【上篇】-分两篇步骤介绍-如何用topview生成和自定义数字人-关于AI的使用和应用-如何生成数字人-优雅草卓伊凡-如何生成AI数字人
68 23
【上篇】-分两篇步骤介绍-如何用topview生成和自定义数字人-关于AI的使用和应用-如何生成数字人-优雅草卓伊凡-如何生成AI数字人
|
14天前
|
人工智能 自然语言处理 JavaScript
微软开源课程!21节课程教你开发生成式 AI 应用所需了解的一切
微软推出的生成式 AI 入门课程,涵盖 21 节课程,帮助开发者快速掌握生成式 AI 应用开发,支持 Python 和 TypeScript 代码示例。
198 14
|
1月前
|
机器学习/深度学习 人工智能 算法
AI在体育分析与预测中的深度应用:变革体育界的智能力量
AI在体育分析与预测中的深度应用:变革体育界的智能力量
125 31

热门文章

最新文章