吴恩达说人工智能永恒的春天已经到来你准备好了吗?

简介:

近日吴恩达在斯坦福MSx未来论坛上的演讲,描述他眼中的AI世界。

AndrewNg认为,人工智能(AI)对未来许多行业带来的变革,如同100多年前,美国“触电”一样——电对制造、运输、农业(尤其是冷藏)、医疗等等带来了划时代的变革。AI驱动着搜索和广告,AI也正在彻底改变金融工程,对物流的转变进行了一半,医疗和自动驾驶刚开始,前景巨大。

监督学习

驱动百亿的市场容量的,基本上属于同一种AI:监督学习(Supervisedlearning),即用AI来确定A-->B的映射——输入A和响应B的映射。

路用Email作为输入A,判断是否是垃圾邮件是响应B;

路用图像作为输入,识别这是一千种物体中的哪种;

路从声音A到文字B,从英文到法文,或从文字到声音;

软件可以学习这些输入A到响应B的映射——有很多好的工具来让机器学习。比如50,000小时的音频和对应的文本,就能让机器学到如何从音频内容转化为文本内容。通过大量的电邮数据和区分垃圾的标签,也可以很快地训练出一个垃圾邮件过滤器。

现在的AI还很初级——A到B的映射而已,不过已经推动着很大的市场。百度有很好的算法来预测某用户是否会点击某广告。向受众呈现更相关的广告,能为互联网营销和广告公司带来极大的赚钱机会。这可能是AI最赚钱的应用。

日本AI机器人Torobo-kun放弃了参加高考的计划,因为阅读理解的困难难以逾越

在哪些产品里能用到AI?

产品经理常常希望了解AI能实现的,和不能实现的。一个简单的思路是:一般人能在一秒内想出来的事情,现在或很快就可以用AI自动实现。

AI进展最快的领域正是人能做得到的领域。比如自动驾驶。人类能驾驶,所以AI也能驾驶。在医学影像阅片和分析上,人类放射科医生能够阅片,所以AI也很可能在未来几年内做到。

而人类难以做到的事情,比如预测股市变化,AI可能也难。

原因1:人类能做的,至少是可行的;

原因2:可以利用人类的数据作为培训样本,比如前面提到的输入A和响应B;

原因3:人类能提供指导。如果AI对某个放射影像的结论有误,设计者可以向医生请教,医生所做的正确结论的原因是什么?进而对AI进行改善;

在AndrewNg所接触到的80-90%的AI项目中,都遵循这一规律:在人类能做到的领域,AI的进展更快。很多项目的发展一旦超越人类水准,发展也会变得缓慢。这也带来一个社会矛盾:如果AI和人的水平类似,实质上是跟人类竞争。

AI的发展趋势

AI已经出现了几十年了,而近五年发展明显加速,为什么?

当以前的机器学习算法性能上升到一定程度,即使再增加数据样本量(前文谈到的输入A、响应B的A-B映射),性能改善也很有限。似乎超过一定样本量之后,再多的数据也对算法不起作用。

而过去几年,主要由于GPU,我们终于实现了能利用这么巨大的数据集的机器学习软件。将数据输入一个小的神经网络,当超过一定性能后,上升变得平缓。而不断地把数据输入一个很大的神经网络时,即使性能上升没有那么快,也会保持上升趋势,随着数据量的增大,不断提高。

因此,要想获得很好的AI性能,需要两样东西:

路很大的A-B映射的数据集;

路大的神经网络。现在常用的大型神经网络建立在HPC高性能计算集群上;

现在的大型AI团队包括机器学习和高性能计算两组人,才能获得足够计算能力。百度AI团队里的这两种人员都专注于各自领域,没有人能两者兼备。

什么是神经网络?有没可能取代人类大脑?

问题是,我们不清楚人脑如何工作,所以很难造出取代人类大脑的神经网络。

什么是神经网络?先看个最简单的神经网络:

如果想输入房屋面积,得到房屋总价,可以用面积-总价的一阶近似的线性模型来描述这个神经网络。

或者用更多因素建模,比如通过面积和卧室数,从第一个神经元得到可以支持的家庭人数。再通过所在地址的邮编和社区富裕程度,从第二个神经元得到附近学校的质量。

这就成为一个神经网络。面积、卧室数、邮编、社区富裕程度属于“输入”集合A,总价属于“响应”集合B。

好处在于,当训练这样一个神经网络时,用户无需关心中间因素,诸如家庭人数、安全度、学校质量等,也无需关心每个神经元如何将输入映射到中间结果。只需要给出输入集合A和响应集合B,神经网络将自动形成中间的计算过程和参数。当A和B的集合足够大,神经网络可以自动算出很多东西。神经网络看上去非常简单,让很多初学者觉得有点失望,但它确实能解决很多问题。关键在于数据量要够大——几万或几十万个样本本身能提供大量的信息,而软件本身只是一小部分。

如何保护AI业务?

AI研究较前沿的团队都比较开放,常常发布研究成果。百度的AI研究论文也没有隐藏什么成果——在人脸识别等论文里,都分享了所有的细节。既然很难把算法本身隐藏起来,如何保护AI业务?当前稀缺资源有两种,一种是数据,二是人才。获取巨量数据很难,要包括输入A+响应B。比如语音识别用了5万小时的音频来训练,今年准备用10万小时,相当于百度10年积累的音频。

以人脸识别所用的训练图像数量为例,

路学术上最常用的基准测试/比赛:1百万幅;

路所用图像数最多的计算机视觉对象识别学术论文:1500万幅;

路百度用来训练世界上最先进的人脸识别系统:两亿幅!

如果只是5-10人的研发团队,很难获得这样规模的数据。百度这样的大企业的经常推出一些新产品不一定是为了营收,而是为了数据,然后通过后续的产品来获得收益。

另一个稀缺资源是人才。AI的应用需要根据具体业务场景来定制。仅仅下载个开源包,无法解决问题。实际情况下,是否适合用某种垃圾邮件识别或语音识别技术?针对某种场景,机器学习怎么用?所以各个公司都在为数据挖掘争夺AI人才,来定制AI技术,找到所需要的A和B各自代表什么,怎么找到这些数据和如何调整算法来适应业务场景。

AI的良性循环

路先做出某种产品。比如通过语音识别,以语音实现搜索;

路然后吸引来很多用户,用户产生数据;

路再通过机器学习,用数据改善产品;

这就形成了AI产品的良性循环。最好的产品能获得最多的用户,带来最多的数据,通过现代机器学习体系,能得到最好的AI,最终让产品变得更好,周而复始。

这种良性循环的理念很早就有了,只是最近变得更加明显。正如前文所述,当数据超过一定规模后,传统AI算法无法明显改善AI性能,因此数据多的优势不明显,大公司也很难保护自己的AI业务。现在数据越多,AI性能越好,大公司也更容易保护自己的优势。

谷歌在AI领域已经成为最为创新的公司之一

AI产品管理

AI是个让人兴奋的领域,同时也存在一些挑战。如何将AI融入公司业务?

产品经理的职责是找到用户喜欢的,而工程师的角色是做出可行的产品。两者共同协作,才能做出理想的产品。

AI是个新生事物,所以技术公司以前的流程和工作方法,不太适用。硅谷的产品经理和工程师的合作已有一套标准流程。比如开发APP时,产品经理先画出线框图,比如logo,按钮,各个板块等,工程师再写出代码来实现。但是AI的APP无法通过画线框来描述。通过什么形式,把产品经理头脑里对AI产品的功能要求明白地分享给工程师呢?

比如开发语音识别系统,实现语音搜索,有很多改善方向。比如:

路在嘈杂环境下如何改善,比如车里或咖啡馆?

路仅改善窄带语音信号;

路对不同口音改善;

百度发现,产品经理通过数据和工程师沟通,是个较好的办法。产品经理负责提供测试数据集给工程师,比如一万个音频和对应的文字,来说明所关心的问题,工程师也能更明白需要解决的问题。如果这些音频里有大量车辆噪音,工程师就知道车辆噪音是问题。如果是混合了几种不同噪声,工程师也能想办法解决。最糟糕的情况是,产品经理提供的测试数据,并不能代表自己想解决的问题,那就出问题了。

同时,新产品设计的流程有很多,比如想设计一个交流型AI机器人:

-人:“我想叫个外卖”

-AI:“你喜欢哪种类型餐馆?”

-人:“川菜”

-AI:“这些可供选择,xxx,yyy,zzz,...”

线框图只能显示对话过程,无法描述所需AI的复杂程度等。百度的产品经理和工程师会在一起,写五十种对话,

-人:“请帮我定一个结婚纪念日的餐馆”

-AI:“你需要订花吗?”

这时候,工程师会问一些更具体的问题,比如每种场景是否都需要继续提配套产品的问题,比如谈到圣诞节时,是否要问对方要不要买圣诞装饰?一起思考,共同讨论需求和技术,很有效。

对AI的宣传里,有很多吸引眼球的技术,不过它们未必最有用。如何将吸引眼球的技术和产品、业务相结合?软件产业已经有标准流程,比如代码审查、敏捷开发等,如何组织AI的产品工作,有很长的路要走,现在正是考虑这些问题的时候。

短期内,AI有哪些机会?

语音识别正在起飞

最近准确率已经提高到很有用的程度。4-5个月之前,斯坦福大学计算机系教授JamesLanday、百度、华盛顿大学一起展示了在手机上输入英文和普通话,用语音识别的速度比用手机输入快3倍。去年百度的所有语音识别产品年度环比增长大约100%,现在正是语音识别技术腾飞之时。美国有几个公司做智能语音控制器(SmartSpeakers),用语音控制家用设备也会很快推广。相关的操作系统和硬件都会很快发布。

计算机视觉也即将到来

中国的人脸识别发展速度很快。因为中国的手机比笔记本更普及,很多人有手机,而不一定有笔记本。在中国可以仅仅凭手机申请助学贷款。涉及到钱,所以需要先验证身份和很多东西。这加速了人脸识别的发展。通过手机进行人脸识别,作为用生物标识进行身份认证的一种方法,在中国发展很快。

在百度总部,不需要RFID卡进行认证,而是直接刷脸进门,AndrewNg在YouTube上有一段视频。现在人们对人脸识别技术已经足够任,并在安全要求较高的场景下使用。

百度在语音识别和计算机识别上的资金投入和数据投入巨大,任何小开发团体远远无法相提并论,也不太可能有其他出乎意料的技术突破。

医疗健康(爱基,净值,资讯)的AI应用

AndrewNg对AI对医疗健康领域带来的影响很看好。很多现在的放射科医生会被AI影响到。如果想在放射科一直工作四十年,不是个好的职业计划。

还有很多垂直领域将受到AI的影响,比如金融工程和教育。不过短期之内还不太会对教育产生实质性的影响。

永恒的春天

光从监督学习已经看得出AI将如何逐渐改变各个行业。其他的AI形式,比如无监督学习、强化学习、迁移学习等等,都还在研究阶段,现在的市场规模较小。

有很多行业会经历几个冬天,然后迎来永恒的春天。AI经历过两个冬天,现在已经进入永恒的春天。就像硅的春天一样,半导体、晶体管、计算周期这些都将和人类一起发展很久。神经网络和深度学习会繁荣很长时间,一百年或许太远,但一些重要应用改变几个大行业的路线图已经很清晰。

AI确实正在取代人类的一些岗位。当某些岗位被AI取代后,我们需要新的教育系统,来帮助失去工作的人获得新的技能。政府应该为这些愿意学习新技能的人,提供基本收入保障,重新成为劳动者的一员。我们需要新的系统和结构,来让帮助社会向新世界进化。虽然会有新类型的工作,但工作岗位的消失也比以前更快。



本文出处:畅享网
本文来自云栖社区合作伙伴畅享网,了解相关信息可以关注vsharing.com网站。

相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
目录
相关文章
|
7月前
|
机器学习/深度学习 人工智能
【人工智能】<吴恩达-机器学习>多变量线性回归&学习率&特征值
【1月更文挑战第26天】【人工智能】<吴恩达-机器学习>多变量线性回归&学习率&特征值
|
7月前
|
机器学习/深度学习 人工智能 算法
【人工智能】<吴恩达-机器学习>批量梯度下降&矩阵和向量运算概述
【1月更文挑战第26天】【人工智能】<吴恩达-机器学习>批量梯度下降&矩阵和向量运算概述
|
7月前
|
机器学习/深度学习 人工智能
【人工智能】<吴恩达-机器学习>单变量的线性回归&认识梯度下降
【1月更文挑战第26天】【人工智能】<吴恩达-机器学习>单变量的线性回归&认识梯度下降
|
7月前
|
机器学习/深度学习 人工智能 数据挖掘
【人工智能】<吴恩达-机器学习>监督学习&非监督学习
【1月更文挑战第26天】【人工智能】<吴恩达-机器学习>监督学习&非监督学习
|
人工智能
AI时代已来,吴恩达呼吁向每个孩子教授人工智能知识
AI时代已来,吴恩达呼吁向每个孩子教授人工智能知识
107 0
AI时代已来,吴恩达呼吁向每个孩子教授人工智能知识
|
机器学习/深度学习 人工智能 自然语言处理
|
机器学习/深度学习 人工智能 自然语言处理
吴恩达NIPS 2016演讲现场直击:如何使用深度学习开发人工智能应用?
当地时间 12 月 5 日,机器学习和计算神经科学的国际顶级会议第 30 届神经信息处理系统大会(NIPS 2016)在西班牙巴塞罗那开幕。大会第一天,百度首席科学家、Coursera 主席兼联合创始人、斯坦福大学 adjunct professor 吴恩达采用手写板书的形式做了一个主题为《使用深度学习开发人工智能应用的基本要点(Nuts and Bolts of Building Applications using Deep Learning)》的 tutorial 演讲。机器之心经授权对吴恩达教授演讲的幻灯片进行了汉化梳理。同时,机器之心特派记者加号也在现场聆听了吴恩达教授的演讲,并将演
186 0
吴恩达NIPS 2016演讲现场直击:如何使用深度学习开发人工智能应用?
|
数据采集 机器学习/深度学习 人工智能
吴恩达出品:如何选择你的第一个人工智能项目?
  吴恩达相信大家都不陌生了,这位大佬曾担任百度副总裁和首席科学家,创立了 Google Brain 项目,还是 Coursera 的联合主席和联合创始人。前几天,吴恩达 亲笔撰写了一篇博文《How to Choose Your First AI Project》,分享了他的心得:在传统企业转型为人工智能企业之前,如何挑选第一个人工智能项目?为什么要这么重视第一个项目呢?AI 前线将该文章进行了翻译整理,以飨读者。   人工智能技术有望改变每一个行业,就像 100 年前的电力一样。据 McKinsey 称,预计到 2030 年,人工智能将创造 13 万亿美元的 GDP 增长,其中大部分将在制
157 0