业界 | 百度Create 2017:AI核心技术全面开放,与开发者共享未来

本文涉及的产品
NLP自然语言处理_基础版,每接口每天50万次
NLP自然语言处理_高级版,每接口累计50万次
NLP 自学习平台,3个模型定制额度 1个月
简介: 为用户带来具有价值的技术,才会有真正持久的影响力。7 月 5 日,百度 AI 开发者大会(Baidu Create 2017)在北京国家会议中心举行,其中以「开放创新 共襄 AI 未来」为主题的 AI 技术与开放平台分论坛,吸引了众多开发者们的关注。

在昨天下午举行的论坛中,百度副总裁、百度 AI 技术与平台体系(AIG)总负责人王海峰在开场致辞中表示,百度在人工智能领域深耕多年,从十七年前百度诞生之日起就开始积累,几乎所有主要人工智能技术都已在百度搜索引擎中得到应用,来自搜索引擎的用户需求、数据和平台,支撑了百度 AI 技术的快速发展,现在百度人工智能在算法、数据、技术等方面具有领先优势。


微信图片_20211129011245.jpg


「在每天数十亿次用户请求的千锤百炼下,百度的人工智能技术已是真正实用的人工智能技术。」王海峰认为,人工智能的技术还在不断进步,但另一方面,只有将技术与实际应用相结合,根据用户需求和反馈反复迭代优化,才能打造强大、更具活力的 AI 技术。

 

作为一家大型科技公司,百度诞生于 PC 互联网时代,那是一个开放生态的时代。百度认为,在互联网的助力下得到迅速发展的 AI 技术,也应该秉承开放精神。更重要的是,AI 的影响将不限于互联网,AI 将影响各行各业和人们生活的方方面面。百度希望通过与开发者和社会共享 AI 技术成果,带动生态繁荣,推动社会进步。

 

在大会上,百度宣布其多年打造的完整 AI 技术平台将全面开放。百度的 AI 能力分为四层。在基础层,是 AI 算法、大数据、大计算能力。在感知层,包括语音、图像、视频、AR/VR 等技术。认知层有自然语言处理、知识图谱及用户画像等。在平台层,基础层、感知层、认知层的技术会平台化,通过百度 AI 开放平台 ai.baidu.com 开放,与开发者共享。截至目前,百度 AI 开放平台上开放的技术共有 60 个,已成为最全面的 AI 技术开放平台。

 

开放技术打造完整平台

 

百度正试图通过开放的生态体系在人工智能的时代引领发展的潮流。此次宣布开放的语音、自然语言处理、视频、增强现实、机器人视觉等技术,与已经开放的 AI 技术一起,构成具有 60 项开放技术的完整的、综合的 AI 开放平台,为开发者提供形式多样、可定制、可组合的 AI 技术,满足开发者从 API、源码、数据到计算能力的多层次需求。


微信图片_20211129011257.jpg

在自动驾驶的精细数据集中,每一帧的图片要几个小时才能完全标注,百度第一次开放了 3000 帧用于自动驾驶的全标注数据集,并计划在今年 9 月开放更多。


作为中国科技巨头中第一个选择转型的企业,百度在 AI 技术上具有先发优势,完整布局和深厚技术积累。百度的 AI 技术始终随着公司业务的发展而不断进化,由于庞大的用户规模和强大的人才积累,百度 AI 技术的开放对于开发者们来说是一个好消息。在大会上,百度表示,其 AI 开放平台多项技术的使用量过去半年都有 2 倍以上的增长。

 

唤醒万物:语音技术+自然语言处理


微信图片_20211129011301.jpg


语音交互或许是人机交互的下一个风口,随着亚马逊 Alexa 等智能设备的兴起,语音技术的需求正日益增加。百度语音技术部总监高亮在分论坛现场介绍了本次新开放的远场识别及语音唤醒、定制化语音合成、语音合成音色、情感语音交互(Emotional CUI)等技术。通过这些开源的技术,开发者们可以实现不同场景的智能应用,轻松设计出满足自己需求的产品。


微信图片_20211129011305.jpg


在利用语音技术,让机器理解用户所指之后,更重要的是能让机器懂得用户真正的需求,这就需要用到自然语言处理技术。在分论坛中,百度自然语言处理部总监赵世奇详细介绍了语言理解与交互技术平台——UNIT。该平台将开放语言理解技术、交互技术,从百度大数据中自动汲取最有价值的数据提供给开发者使用,为开发者提供了多种定制化方案,还首创「训练师」模式,助力开发者训练对话机器人,赋予机器「理解」自然语言,听懂用户需求,以及与用户进行多轮次对话的能力。

 

看懂世界:视频分析、人脸识别和 AR

 

在论坛中,百度研究院院长林元庆介绍了视频分析与理解、机器人视觉和人脸识别等技术。同时,本次开发者大会还发布了全面的视频语义理解技术,包括视频封面选摘、视频分类、视频比对、细粒度识别、视频审核、视频公众人物识别、视频结构化分析等。此外,林元庆还介绍了用于自动驾驶机器学习训练的语义分割 RGBD 视频数据集,以及完整的机器人视觉解决方案。


微信图片_20211129011309.jpg


增强现实(AR)技术作为全新的视觉交互形式,越来越受到营销、娱乐、游戏等行业关注。百度增强现实实验室主任吴中勤现场发布全新 DuMix AR 开放平台,为开发者供 AR SDK、内容制作工具、云端内容平台和内容分发服务。吴中勤表示,未来百度将提供更多场景的 AR 行业解决方案,赋能各行各业,共同探索 AR 价值。

 

在 AI 技术与开放平台分论坛上,除了发布新开放的核心技术能力,百度也表示将对已有技术进行改革。百度杰出科学家徐伟批露了 PaddlePaddle 的最新发展路径图,宣布百度会开源代码、开放大规模数据集、开放计算能力、开放应用模型库。作为国内首个开源深度学习平台,百度在 PaddlePaddle 的研发中持完全开放的态度,试图与开发者们共同推进技术的发展。「在重新设计之后,今年 9 月我们将推出全新版本的 PaddlePaddle,」徐伟表示。「在简化代码,运行更加高效的基础上,它将对移动端和嵌入式设备有更加完善的支持。」


微信图片_20211129011314.jpg


而在计划于 2017 年 12 月推出的新版本中,PaddlePaddle 将支持英伟达全新 Volta 架构的 16 位浮点运算,并加入 TensorRT 的支持。

 

Create 2017 开发者大会上备受瞩目的 AI 技术与开放平台分论坛,是整合了 NLP、KG、IDL、语音、大数据等核心技术部门的百度 AI 技术平台体系 AIG 成立后的首次集体亮相,全面展示了百度的 AI 技术能力。可以想象,未来随着百度 AI 技术的进一步开放,开发者、创业者、业内公司将不断从中受益,让人工智能技术赋能更多场景,创造更多价值;而另一方面,百度也会从这些行动中不断提升自己的竞争力。无论如何,这次开源行动必将推动国内人工智能领域的加速发展。


相关链接



本文为机器之心原创,转载请联系本公众号获得授权


相关文章
|
13天前
|
人工智能 达摩院 计算机视觉
SHMT:体验 AI 虚拟化妆!阿里巴巴达摩院推出自监督化妆转移技术
SHMT 是阿里达摩院与武汉理工等机构联合研发的自监督化妆转移技术,支持高效妆容迁移与动态对齐,适用于图像处理、虚拟试妆等多个领域。
49 9
SHMT:体验 AI 虚拟化妆!阿里巴巴达摩院推出自监督化妆转移技术
|
7天前
|
人工智能 Cloud Native 安全
|
9天前
|
存储 人工智能 安全
AI时代的网络安全:传统技术的落寞与新机遇
在AI时代,网络安全正经历深刻变革。传统技术如多因素身份认证、防火墙和基于密码的系统逐渐失效,难以应对新型攻击。然而,AI带来了新机遇:智能化威胁检测、优化安全流程、生物特征加密及漏洞管理等。AI赋能的安全解决方案大幅提升防护能力,但也面临数据隐私和技能短缺等挑战。企业需制定清晰AI政策,强化人机协作,推动行业持续发展。
40 16
|
18天前
|
人工智能 缓存 Ubuntu
AI+树莓派=阿里P8技术专家。模拟面试、学技术真的太香了 | 手把手教学
本课程由阿里P8技术专家分享,介绍如何使用树莓派和阿里云服务构建AI面试助手。通过模拟面试场景,讲解了Java中`==`与`equals`的区别,并演示了从硬件搭建、语音识别、AI Agent配置到代码实现的完整流程。项目利用树莓派作为核心,结合阿里云的实时语音识别、AI Agent和文字转语音服务,实现了一个能够回答面试问题的智能玩偶。课程展示了AI应用的简易构建过程,适合初学者学习和实践。
76 22
|
15天前
|
人工智能 Java 程序员
通义灵码AI编码助手和AI程序员背后的技术
通义灵码AI编码助手和AI程序员背后的技术,由通义实验室科学家黎槟华分享。内容涵盖三部分:1. 编码助手技术,包括构建优秀AI编码助手及代码生成补全;2. 相关的AI程序员技术,探讨AI程序员的优势、发展情况、评估方法及核心难点;3. 代码智能方向的展望,分析AI在软件开发中的角色转变,从辅助编程到成为开发主力,未来将由AI执行细节任务,开发者负责决策和审核,大幅提升开发效率。
105 12
|
17天前
|
人工智能 搜索推荐
AI视频技术的发展是否会影响原创内容的价值
AI视频技术的发展显著降低了视频制作的门槛与成本,自动完成剪辑、特效添加等繁琐工作,大大缩短创作时间。它提供个性化创意建议,帮助创作者突破传统思维,拓展创意边界。此外,AI技术使更多非专业人士也能参与视频创作,注入新活力与多样性,丰富了原创内容。总体而言,AI视频技术不仅提升了创作效率,还促进了视频内容的创新与多样化。
|
10天前
|
机器学习/深度学习 存储 人工智能
AI实践:智能工单系统的技术逻辑与应用
智能工单系统是企业服务管理的核心工具,通过多渠道接入、自然语言处理等技术,实现工单自动生成、分类和分配。它优化了客户服务流程,提高了效率与透明度,减少了运营成本,提升了客户满意度。系统还依托知识库和机器学习,持续改进处理策略,助力企业在竞争中脱颖而出。
35 5
|
15天前
|
人工智能 Cloud Native 大数据
云+AI开启算力新时代,共建开源开放生态赴未来 | 2024龙蜥大会主论坛
本次分享的主题是云 + AI开启算力新时代,共建开源开放生态赴未来 | 2024龙蜥大会主论坛,由阿里巴巴集团合伙人、阿里云基础设施事业部总经理蒋江伟分享。
|
14天前
|
机器学习/深度学习 人工智能 编译器
BladeDISC++:Dynamic Shape AI 编译器下的显存优化技术
本文介绍了阿里云 PAI 团队近期发布的 BladeDISC++项目,探讨在动态场景下如何优化深度学习训练任务的显存峰值,主要内容包括以下三个部分:Dynamic Shape 场景下显存优化的背景与挑战;BladeDISC++的创新解决方案;Llama2 模型的实验数据分析
|
14天前
|
存储 人工智能 边缘计算
AI时代下, 边缘云上的技术演进与场景创新
本文介绍了AI时代下边缘云的技术演进与场景创新。主要内容分为三部分:一是边缘云算力形态的多元化演进,强调阿里云边缘节点服务(ENS)在全球600多个节点的部署,提供低时延、本地化和小型化的价值;二是边缘AI推理的创新发展与实践,涵盖低时延、资源广分布、本地化及弹性需求等优势;三是云游戏在边缘承载的技术演进,探讨云游戏对边缘计算的依赖及其技术方案,如多开技术、云存储和网络架构优化,以提升用户体验并降低成本。文章展示了边缘云在未来智能化、实时化解决方案中的重要性。