2019 年,AI 为我们「渐渐无趣」的春节增色不少……它不仅可以帮助人们送出新年祝福,也能为人高效传递信息。在繁忙的春运期间,人工智能也能帮助人们更快地回到家乡。已到大年初三,让我们看看已有哪些公司的新技术融入了传统节日吧。
百度 AI「刷脸」生成春联
在 1 月 28 日小年夜的晚会上,百度推出了智能春联工具。基于人脸识别、自然语言处理等人工智能技术,这项技术可以凭借用户的人脸特性,为你生成充满创意的个性化春联。当然,用户也可在这个小工具中输入名字、甚至任何一段话,获取属于自己的专属春联。
在智能春联的背后,是计算机视觉、自然语言处理等 AI 技术。据介绍,百度通过先进的视觉技术让 H5 具有刷脸能力,通过其中的人脸检测、属性分析和人脸融合等,可对图片中的人脸进行检测,分析人脸对应的年龄、性别、颜值、微笑指数、是否佩戴眼镜等信息,并通过以一个词语概括人脸的特性;进而将图片中的人脸与指定模板图中的人脸进行融合,得到新的图片。这些技术的难度在于,需要对各种角度的人脸进行检测,并且能够提取人脸的五官特征,以便生成与原始人脸相似,但也和模板人脸神似,且毫无违和感的新图片。
上传百度 AI 技术生态部总经理喻友平的照片生成的对联
思必驰《经典咏流传》
小年夜,在朋友圈刷屏的还有中央电视台《经典咏流传》节目中出现的一款「读诗成曲」在线互动小工具。据统计,节目播出后的 90 分钟内,超过 14 万人次参与合成自己的歌,H5 转发量超过 10 万。
在这款互动小工具中,用户仅需要朗读一段诗词,就可以听到用自己声音演唱的经典诗词唱段。据机器之心了解,这款火热的小工具背后是思必驰提供的个性化歌声合成、语音识别等独家 AI 技术支持。
而其中尤其关键的是个性化歌声合成技术。据思必驰介绍,歌声合成技术是在语音合成(TTS-Text to Speech)技术上衍生出来的,其关键区别在于韵律预测模型的不同。在普通 TTS 系统中,通常有个韵律模型来根据句子的内容和语调环境预测每个音素(音节)的时长和音高曲线。在歌声合成中,这个韵律模型则更换成由乐谱来预测每个音素(音节)的时长和音高的歌曲韵律模型。最终的生成过程仍然跟语音合成类似,将韵律参数和频谱参数结合,生成歌声。
经典春晚也时髦
Oben 虚拟主持人
「虚拟主持人」现在已经可以主持春晚了。1 月 29 日,央视网络春晚在 CCTV3 播出,世界首个人工智能虚拟主持人团队正式登台。央视名嘴撒贝宁、朱迅、高博、龙洋的个人人工智能(PAI)主持人——「小小撒」、「朱小迅」、「高小博」、「龙小洋」全程主持央视网络春晚,为我们带来了全新体验。
虚拟主持人可以 24 小时直播,而且支持多种语言。"小小撒"一出场,撒贝宁就忍不住打量了一番:"感觉就像照镜子一样。"
据 ObEN 介绍,想让真实主持人进入虚拟世界并非想象中那么复杂。在节目开始之前,技术人员对撒贝宁等主持人进行了面部扫描,并输入了半小时的录音数据以生成形象和声音模型。在表演中,任何输入的文字都可以用撒贝宁的声音读或唱出来,甚至还有中日英韩四种语言。随着训练数据越来越多,小小撒会掌握更多技能,甚至了解撒贝宁的喜好、说话方式等,在更多方面上与本人更加相似。
科大讯飞春晚智能文稿唱词系统
据讯飞听见官方微博信息,讯飞听见为 2019 年中央电视台的春节联欢晚会提供了字幕制作支持。央视技术团队采用了讯飞听见的智能文稿唱词系统,通过最新的智能语音转写技术,原先 1 小时的节目只要 5 分钟就可以完成字幕制作,而且准确率高达 95%。
机器之心了解到,讯飞听见智能文稿唱词系统是科大讯飞专门面向广播、电视、新媒体等工作者,在录音整理成文稿和字幕制作时,解决过程繁琐效率低下等问题,推出的一款以语音转写、文本翻译等为核心的字幕与文稿制作的产品。在语音支持种类方面,讯飞听见智能文稿唱词系统支持中、英、粤、维四个语种的字幕制作,还支持中英、汉维互译,本地部署翻译引擎,确保数据安全。
春节作为最传统的节日,已经成为了人工智能这样最先进技术的实验现场。
优必选机器人 Walker 春晚伴舞
在今年的春晚舞台上,我们再次看到了优必选机器人的精彩亮相。央视春晚深圳分会场上,优必选 大型仿人服务机器人 Walker 为明星韩雪、关晓彤、王嘉、魏大勋、台风少年团参与的歌舞节目《青春畅想》当起了伴舞。
据了解,这是自 2016 年以来,优必选机器人第三次亮相央视春晚。今年,为了保证 Walker 圆满完成春晚任务,优必选直接、间接动用了大概 100 人以上的人力,并安排了 40 多人的研发团队在春晚节目现场支持,其中的技术团队包括视觉、导航、通信、伺服舵机、运动控制、结构、电子、交互等,每一部分的负责人都在彩排准备现场随时待命,手机也要保持 24 小时开机待命状态,最终保证春晚顺利进行,让大家能看到首个中国企业自主研发的大型仿人机器人。
百度春晚 AI 红包互动
如果你看过去年的春晚,就能注意到百度曾经展示了港珠澳无人车技术。今年的春晚上,作为央视 2019 春晚独家网络互动平台,百度则展示了惊艳的人工智能体验,在互动形式、互动奖品中都透露着浓浓的 AI 元素。
首先,在今年红包互动中,百度首次加入了语音搜索抢红包,参与者可以通过说出关键词「欢乐幸福年」的方式来获得红包;其次,在奖品上百度免费向春晚观众派送数量可观的小度智能硬件。按照百度副总裁王路的话说,百度希望让每一位参与春晚互动的观众都能体验到无所不在的人工智能,让春节、春晚也迈入人工智能时代。
春晚之前是团圆
阿里机器人主持央视春晚彩排直播
除了春晚当天,其实彩排与前期准备也应用了很多 AI 技术。1 月 31 日,央视新闻频道在报道 2019 年春晚彩排直播时,启用了一位特殊的「主持人」——由阿里巴巴人工智能实验室自主研发的机器人「天猫精灵福袋」(以下简称「福袋」)与真人主持搭档出镜,为观众共同揭秘 2019 年央视春晚台前幕后的故事。
据介绍,今年央视新闻将在春晚彩排直播中全程使用机器人主持,「福袋」不仅需要需要根据节目设计回答主持人的提问,与真人进行互动,完成「唱歌跳舞」等指定动作,还会与春晚演播室前方的记者进行直播连线,甚至还将在直播中参与用户的有奖互动环节。
在直播中,机器人「福袋」展现的「主持能力」虽然还比不上主持人的反应敏捷,但在人工智能和大数据的加持下,对「春晚金句」和各种典故的熟练运用,也让央视的工作人员感到十分惊喜。主持人王言表示,虽然这并不是首次和机器人搭档主持,但福袋的表现依然让他感到惊讶,「过去使用的一些机器人,都是为节目量身定制的,但这一次我们使用的是『公开版』,在这么重大的直播前我也只和福袋见了两次面,就能配合的这么好,真的是没想到。」他还跟现场进行技术支持的阿里巴巴工程师笑着说:「如果科学家们再『努力』一点,可能我就要下岗了。」
微软央视联手让 AI 为你唱歌
春晚之前是团圆,我们总会回忆起以前节日里不可或缺的团圆时刻,那么 AI 能理解当时的心情吗?不久之前,央视新闻官方微博发布了一个 HTML5 网页《你的生活 AI 为你唱作》,我们借助它体验了一把 AI 为自己歌唱的感觉。用户只要上传 1 到 4 张最爱的、最喜欢回忆的照片,AI 就能以说唱的形式为你作词、为你谱曲。
你的生活 AI 为你唱作:http://cctvsongbot.newscctv.net/index.html
小编体验发现,在上传图像后,我们可以选择两种语音进行创作,即央视主持人康辉与微软智能女声晓晓。其实生成的「歌曲」更像是一种带背景音乐的 Rap,不过歌词都非常有意思。例如我们上传机翼和天空的照片,歌词就会体现出「自由」的主题;又如上传高山草甸的图像,歌词会先描述广阔金色,再上升到畅想未来,真的是很有情怀了~
整体上 H5 会利用微软的技术对图像进行识别计算、制作抒情诗,并从央视现有曲库中挑选匹配的曲目,进行合并从而创作歌曲,最后再由央视主持人或微软智能女声演唱。因此从技术的角度来看,微软可能会利用 CNN 抽取图像特征,再将特征传入 LSTM 等时序模型生成抒情诗,最后利用 NLP 编码抒情诗、并检索对应的曲目,最后生成歌曲。
此外,这个 H5 也会特别关注隐私性,其承诺所有图像及创作结果都只在 H5 服务器保留 7 天,且央视和微软不会用于其它任何目的。
支付宝刷脸坐高铁
大年初三,随着返城期即将到来,人工智能技术在春运期间也能展现自己的能力。在刷脸、二维码等技术的基础上,广深高铁于春运开始第一天就宣布:乘客自 1 月 21 日起可通过手机上的支付宝小程序直接刷码进站——忘带身份证也没问题了!这也就意味着,使用手机就能乘火车了,像扫码坐公交地铁一样方便。更为便捷的是,乘客无须事先网络购票或在售票窗口排队购票,出行当天可直接使用支付宝刷码进站。
为了有效打击黄牛党,以往坐火车,在购票、进站等环节都需要用到身份证进行认证。而支付宝在实名制的基础上,加上「刷脸」认证技术和金融级的安全技术能力,可以确保乘客为本人购票。据铁路部门的推算,使用人工智能技术验证的整个过程耗时仅需 3 秒,相比之前现场核验身份等流程,平均节省时间 15 分钟以上。
目前,广深城际铁路全线各站都已支持支付宝扫码乘车。乘车前,乘客打开支付宝 APP,搜索「广深城际扫码通」,按照系统提示刷脸完成身份认证即可开通相关功能。出行当天就能直接使用支付宝刷码进站,无需到窗口和自动售票机排队购票或提前在网上购票。旅客刷码进站成功后,将会收到一条短信,告知最近一班火车的车次、座位号。进站时按照二等座全程费用预扣费,到达目的地后,系统会按照实际产生的票价计费,十分方便。
本文为机器之心原创,转载请联系本公众号获得授权。