2020年8月20日,小冰公司、rinna株式会社及微软(亚洲)互联网工程院在北京联合举行了第八代小冰年度发布会。小冰公司董事长、原微软全球执行副总裁沈向洋博士与微软全球资深副总裁、微软(亚洲)互联网工程院院长王永东博士主持了本次发布会。
本次大会主要围绕三部分内容:
第一,人工智能时代,我们对未来的判断和想法
第二,小冰人工智能方面核心技术的进展
第三,新产品发布
值得关注的是小冰已经学会了画画!经过小冰团队人工智能和美院老师的共同努力,她学会了怎么来绘画,并且她能够比较高质量的生产绘画作品,其中包括历史上7个流派。也就是说小冰已经突破了传统的框架,开启了人工智能的第二幕。
小冰有一个未来交流的框架,她是能够支持丰富多彩、千千万万的人工智能,所以她不仅仅只是我们看到的这样一个小冰,一个少女的形象,这个少女的形象只是这个框架支持的一个样板,可以让大家来体验,所以在过去每一代小冰上,小冰团队一直努力让这个框架能够更加完善。
从第一代到第八代的沿革
小冰是面向新交互形式的完整人工智能技术框架,也是目前全球范围内承载交互量最大的人工智能系统,占全球交互总量60%以上。该项目于2013年底在微软(亚洲)互联网工程院立项,采取代际更新的方式,逐年完善其基础框架结构。
2014年5月29日,小冰正式推出第一代产品,以对话式聊天机器人形式迅速积累训练数据。其后,第二代产品完成了跨平台部署的交互架构。第三代产品将交互从文本扩充至多模态,进一步积累多模态训练数据。从第四代小冰开始,交互总量稳居全球第一并保持至今,同时发布了全双工语音交互感官。第五代小冰采用Dual AI战略,大幅度扩展跨平台覆盖的规模,至20余个主流平台,并成为中国市场上涵盖了华为、小米、OPPO、vivo等智能手机及硬件的唯一的跨平台人工智能。第六代小冰完成了框架迭代目标,从第七代开始推出各类框架工具,以帮助创建第三方人工智能产品,并承载其各类交互。
目前,除中国小冰及日本凛菜(Rinna)第一方人工智能交互主体外,小冰框架还支撑了中国及日本100余个第三方品牌的交互主体(如软银Pepper)。在个人用户领域,由小冰框架应用户需求创造并提供交互的人工智能主体(虚拟人类),在公测阶段已超过100万个。
从第七代小冰开始,在尚未组建正式销售团队的商业化试水阶段,小冰收入已超过1亿元人民币。为加快小冰产品线的本土创新步伐,促进小冰商业生态环境的完善,2020年7月13日,微软宣布将小冰业务分拆为独立公司运营,并委任原微软全球执行副总裁沈向洋博士为董事长,原微软(亚洲)互联网工程院副院长李笛为首席执行官,陈湛为日本分部总经理。预计所有相关工作将于今年晚些时候完成。
小冰框架与面向未来的新交互形态
交互是人类社会发展的重要驱动力。每天都在发生的数以千亿次计的交互,随移动互联网的迅速发展,已进入明显瓶颈,表现为“流量红利消失”等。而现有的两种交互形式:人人交互与人机交互,可通过人工智能技术加以融合,从而在实现人人交互信任纽带和高转化率的同时,保有人机交互的高并发率特点。
上述融合依赖于小冰框架或其他类似的完整人工智能框架体系,可以在各种复杂的场景中实现高度拟人的交互。随着对现有交互瓶颈的不断突破,新形式的人工智能交互将无处不在,对人类社会及商业行为产生深远影响。
本次发布会主要披露的新技术
与主要同行业者相比,小冰框架最大的差异化在于,它是一个“session-oriented”的人工智能框架,框架中的各部分技术共同为“交互全程”目标服务,而不仅仅关注并优化局部。例如,在核心对话引擎方面,技术的研发及迭代方向是为更有效地预测、保持并引导对话,而不是仅仅实现回应。在语音方面,框架关注语音交互的质量与体验是否能支持长时间的混合交流,而不仅仅是将文本内容转为语音。
本次发布会升级了上一代小冰框架的各部分技术,并将一些新技术纳入系统之中。此外,本次发布会还披露了部分独有新技术及其产品化情况。如篇章内容主动学习技术,使对人工智能主体的对话训练不再需要采用“问答对”的方式;分层知识图谱技术,使小冰框架中的人工智能主体,在引导对话时的全程完成率突破42%,接近于人类表现等。上述技术均已实现产品化落地。
本次发布会宣布的上线产品
面向个人用户的第一个虚拟人类产品线。在公测阶段,该产品线应用户需求创造的虚拟人类已超过100万名。发布会上,小冰宣布第一个正式版本上线。用户可以自主通过小冰框架,创造并训练其拥有的人工智能主体。除基本交互体验外,该产品线还推出了以下新功能:
跨平台的统一账号体系。可理解为虚拟人类的身份证,实现跨平台统一。目前已开放的支持平台从华为拓展至小米及微博。
测试版的训练工具“X Eva”APP。用户也可在交互过程中训练其人工智能虚拟人类。与之相比,X Eva APP提供更丰富的强大训练能力。
多人交互的能力。通过多种方式,虚拟人类可与多人进行持续交互,而不局限于用户个体。
内容创造的能力。虚拟人类可进行多种自主的内容创造,并将之反映在其自身的“朋友圈”中。上述内容创造可反映虚拟人类与用户交流中所产生的变化。
针对需要具体完成特定任务的虚拟人类,框架提供特定的训练及托管平台。例如,在正式发布前的公测阶段,小冰框架已应用户需求,派出超过70000名人工智能小编,提供内容和交互服务。
部分新平台与新的第三方虚拟人类合作产品。发布会上发布了三项此类新合作:包括与企鹅电竞合作推出的直播间人工智能产品;与小米合作推出的小冰童话屋模式,可在语音交互之外配合2D场景及虚拟人类形象交互;与QQ合作推出的QQ群新机器人角色喵吉。
面向个人用户的“X套件”系列应用软件。包括基于文本协同的X Writer,面向声音协同的X Studio和面向虚拟人类3D演示文档驱动的X Presenter。X套件支持用户选择平台提供的虚拟人类,或自己创造的虚拟人类。X套件为小冰商业化解决方案版本的“个人版”。
X Writer:可实现在用户进行文字编辑或文本创作时的人工智能协同,随云端更新不断扩充各类文体。产品具备沉浸式体验。
X Studio:包括面向各类公众号文章、演讲、电台节目等的X Studio主播,以及面向人工智能歌声合成的X Studio歌手正式版软件。其中,主播应用已在商业化领域覆盖中国及日本超过50家主流电台电视台,累计制作超过8000小时高质量音频节目内容,此次推出的为其个人版本;歌手软件技术在全球范围内居于领先位置,并且是目前唯一一个完整产品化的同类软件。
X Presenter:驱动用户选择或创造的人工智能实体3D模型,配合X套件其他应用,实现人工智能对演示文档的演讲及交互。
配合 “X套件”发布,发布会还宣布了以下信息:
X Studio人工智能歌手入籍计划启动。任何机构或个人可申请并提交数据,由小冰框架训练并将其人工智能歌手登录进X Studio歌手平台中。机构或个人拥有该歌手的完整所有权,可通过平台制作内容,并自由进行相关人工智能歌手的销售转让等。此计划是为了进一步促进人工智能歌手市场发展。此外,X Studio人工智能歌手何畅演唱Burberry新系列推广单曲也已上线。除何畅演唱外,该广告单曲的词曲创作亦有小冰参与。
X Presenter。商业版为日本LAWSON驱动的自主舞蹈人工智能已上线。另外,基于自控系统,小冰与小米小爱团队进行了非常深入的合作,一起探索将小爱同学的虚拟形象试验性地引入到了聊天场景中。让用户可以和小爱同学的形象实时对话,除了语音维度,还能看到小爱同学的表情、动作等一系列视觉表达。该APP已于发布会之日起开始内测用户招募。