最近,笔者参加了首届情感AI大会,本次大会由自然语言处理(NLP)、文本分析、情绪分析及其商业应用领域的首席分析师和商业顾问SethGrimes组织。15年前笔者也有幸参加了Seth组织的第一届文本分析峰会,他组织的下一个会议CXEmotion将于7月22日在线上举行。
来自美国、加拿大和欧洲工业界和学术界约70人(包括演讲者和小组成员)出席了这次会议。
本次会议的主题是:什么是情感AI?为什么它很重要?我们需要了解什么?继续阅读本文,你将找到答案。但首先,读者需要了解一些背景知识。
情感是人类智慧和决策的基石
人类是高度情绪化的生物,即使大多数时候没有意识到,情绪也会影响人们所做的一切:引导注意力、影响学习和记忆的方式、对自己和他人的感知、最终影响个人成长以及人格形成。正如AI和深度学习的教父之一Yann LeCun所说:“没有情感就不可能拥有智能。”
情感在高度个人化的同时也是社会化的。一般来说,对他人和对自身行为的情感反应是婴儿期学习的第一件事。这也是人们喜欢讲故事,以及故事对于学习、影响和启发他人、鼓励行动和变革都非常有效的原因。
在一个结构合理的故事中,情节(叙事弧)与角色的情感演变(情感弧)紧密交织在一起,形成了“叙事+情感”的双螺旋。再者说,历史、政治和新闻及其内含的情感,如果不是真实或虚构的故事集,又是什么呢?
人们一生持续以微妙或不那么微妙的方式受到情感的支配。会议演讲者之一,TrueImpact的戴安娜·卢卡奇提到:“人们说出自己的想法,并根据自己的感受采取行动。”
因此,神经学研究和情感设计多年来一直是市场营销、广告、产品、服务和网站设计的主要内容,这也就不足为奇了。情感会促使用户点击链接购买产品,或者像设计者所期望的那样,在网站上跟随情感轨迹选择推荐产品。
情感AI试图理解、复制和模拟人类情感
多年来,在人工智能领域,研究人员和从业人员一直在研究模仿和探索人类情感的方法。
1995年,麻省理工学院媒体实验室教授罗莎琳德·皮卡德发表了一篇题为“情感计算”的文章,这一领域开始兴起,并催生出同名新学科,情感人工智能由此衍生而来。情感AI的目标是什么?通过机器理解、复制和模拟人类情感。
情感计算和情感AI融合了许多技术和应用领域。例如,麻省理工学院的情感计算团队“旨在弥合人类情感与计算技术之间的鸿沟”。
其项目范围包括:在出现任何明显的外部迹象之前,寻找预测和预防抑郁的新方法;为面临沟通、动机和情绪调节方面的问题,且有特殊需求的群体发明辅助方法;使机器人和计算机能够接收自然的情感反馈并改善人类体验。
以上示例只涉及了皮毛,在该实验室的网站上还有更多的项目、应用程序和用例。
情感分析趋向多模态
情感分析作为情感AI的一个领域,最早在21世纪初就存在了。情感分析通常是对文本数据进行的,例如电子邮件、聊天、社交媒体帖子或调查回复。它使用NLP、计算语言学和文本分析来推断文本作者的积极或消极态度(又名“导向” ):人们对你的品牌、你的产品或服务表达了肯定还是否定?
情绪分析的常见应用包括品牌/声誉管理(尤其是在社交媒体上)、推荐系统、基于内容的过滤、语义搜索、淡化用户/消费者意见的重要性,以及告知产品设计的需要、分流客户投诉等。
会议的几份报告都关于这个主题,尽管最近在NLP和相关领域研究取得了进展,但这仍然是个难题。伊利诺伊大学芝加哥分校的计算机科学教授刘冰说,这主要是因为,甚至人类基本情感的构成要素和其数量,研究人员也没有达成一致意见。
众所周知,由于情感的模糊性、可替换性、重叠性和相邻性,其很难被识别和编码(标签)。例如,一个人可以同时感到愤怒、悲伤和厌恶。
此外,情感并不总是容易抑制的。清晰、明确的标签也很重要:人工智能——或者至少70%被称为监督学习的人工智能——依赖于被人类标记( “注释”或“标记” )的数据。这就是机器学习的方式(因此名为“监督” )。
刘教授解释说,情感传递的方式也很复杂。说话时,情感通过广泛的语言和副语言线索进行交流,如语调、面部表情、身体动作、手势和姿势,以及生理信号(出汗、皮肤发红等)。
在写作中,通过标点符号、大写、表情符号和其他创造性的表达方式来表达,例如,单词加长(例如,“soooo slow” or“so sloooow”)。除此之外,还有单词选择和语法。
人们表达情感的方式也存在文化差异。更复杂的是,有一种现象被称为“认知差距”,人们所说的和他们真实的感受并不总是一致的。原因有很多:他们试图礼貌地表达或者避免伤害别人的感情,又或者他们只是试图隐藏自己的情绪。
刘教授说,上下文和多模态数据可能有助于解决许多此类歧义。事实上,随着生物识别技术和可穿戴设备的发展,该领域已经扩展到从传感器数据分析情感,包括心率、温度、脑电波、血流和肌肉生物信号,以及声音、面部表情、图像和视频。
战略专家和“技术情感学家”帕梅拉·帕夫里斯卡克预测,除了面部识别技术(FRTs)和触觉/触觉数据之外,这种利用传感器的趋势将继续发展。FRTs最近因为隐私问题而受到抨击。由于疫情影响,目前触摸相关数据是“不可行的”。
可穿戴设备可以用来识别情感吗?
弗罗茨瓦夫理工大学的Przemysław Kazienko教授进行的荟萃分析着重于可穿戴设备,并试图回答以下问题:它们可以用来识别日常生活中的情感吗?他认为:“如果我们能做到这一点,那我们就可以改善患有易改变情绪的疾病的患者的健康、福祉和临床结果(以肾功能障碍为例)。”
我们还可以将可穿戴设备用于压力控制、心理健康和自闭症的治疗。麻省理工学院媒体实验室开发了一款应用程序,通过监测一个人的心跳来检测他们是否正在经历压力、痛苦或沮丧等负面情绪,并释放一种气味来帮助佩戴者应对。
人们也可以利用从可穿戴设备检测到的情绪来实现“传统”个性化和产品/服务的改进:从在线内容和产品推荐到虚拟助手和游戏体验。他说,来自可穿戴设备的情感数据还可以用来防止车祸,追踪学生的注意力从而提高学业成绩,以及改善社交互动等。
帕夫里斯卡克女士与劳伦·李·麦卡锡和凯尔·麦克唐纳合作的US+项目对改善社交互动进行了说明。US+是“一款谷歌环聊(Hangout)视频聊天应用,利用音频、面部表情和语言分析来优化对话。”
该应用程序分析用户所说的内容以及他们是否使用常见的词汇和句子结构,随着对话的进行,人类倾向于这样做(这被称为“语言风格匹配”)。对于每个聊天参与者,该应用程序都会显示一个快速的可视化窗口和弹出通知,例如:“别老谈论自己”或“你在隐藏什么?克莱尔说得更诚实”。当对话失去平衡时,它甚至可以自动引导参与者。
帕夫利斯卡克女士在主题演讲“为情感智能的未来而设计”中,还有许多有趣的情感数据和情感分析应用程序。会议现场的所有录像都可以在会议网站上以200美元的价格购买,对于购买者所在组织中其他人来说则是100美元的折扣价,笔者强烈建议您观看。
回到先前的问题上来,“可穿戴设备可以用来识别日常生活中的情绪吗?” Kazienko教授的结论是:“可穿戴设备的情感识别是个性化情感计算的未来。我们需要更多实地研究、更多更好的数据、研究人员之间的积极合作、如何分类情绪的通用模型、数据和代码共享,以及其他一些事情,来提高识别质量和重现性。”
利用情绪让人工智能听起来像人(并像人一样行动)
随着越来越多的体验和日常生活受到人工智能的影响,人们越来越希望人工智能在外观、感觉、声音和行为反应上能像人类一样,或许是因为人类总体上不像机器那么可怕,亦或因为人们的想象力受到自身生理特征的限制——类似于萨丕尔-沃尔夫假说(Sapir-Whorf hypothesis),该假说认为语言的结构影响着使用者感知世界的方式。
再或许是因为人类喜欢按照自己的形象和喜好重塑世界。你看过波士顿动力公司的机器人Atlas表演体操吗?在其收获的所有的机械领域的荣耀中,Atlas表现得还不错,但该公司的无头机械狗却相当令人不安……
现在试想一下,如果Atlas会说话,你希望它的声音听起来是怎样的。虽然它还不能,但人们与聊天机器人和虚拟助手的互动越来越多。
咨询公司Rain的首席体验官格雷格· 赫奇斯表示,如果我们可以向机器灌输同理心,它们可以提供更好的消费者品牌体验,并以此来建立熟悉度,更牢固的联系和更深的信任。他的公司为耐克、星巴克、蒂芙尼、汰渍和芝麻街等品牌创造了“情感智能语音体验”。
从聊天机器人到“情感聊天机器”?
既然可以从具有情感意识的AI中获得潜在的大额商业利益,那么“情感智能”聊天机器人成为热门研究领域也就不足为奇了。上文提到的刘教授正在努力“创建可以感知和表达情感并在对话中不断学习的聊天机器人”,他称它们为“情感聊天机器”。
他说:“情商是人类智力的重要方面”。研究表明,有情感的对话系统可以提高用户满意度。表达同情心的聊天机器人可以减少用户的沮丧感和压力,它们减少了对话中的故障。他还表示,它们还可以激励人们合作而不是为“愚蠢的机器”而愤怒。
微软首席研究员丹尼尔·麦克杜夫说:“与模仿人类风格的系统互动起来更自然”,他的团队正在建立具身代理和其他一些项目。我们人类不断适应彼此,这种适应创造了社会凝聚力。随着时间推移,当人们与虚拟现实代理互动时,人们同样会尝试适应其风格。因此,虚拟代理和聊天机器人将需要适应人类。
在商业领域,情感型聊天机器人可能意味着更高的客户满意度和更低的成本,因为聊天机器人将能够处理大多数问询,并解放人工操作员,他们仅需参与不太常见或更复杂的互动,尤其是在当前危机时期。
在世界卫生组织宣布这种新型冠状病毒为全球大流行病的两个多月后,银行、保险公司、主要零售商和政府办公室的电话线路仍然拥挤不堪。
IBM提供了沃森助手帮助政府部署聊天机器人,其聊天机器人平台的流量增长了40%;谷歌立即推出了自己的快速响应虚拟代理,以“快速构建并实现定制的呼叫中心AI虚拟代理,以响应客户通过聊天、语音和社交渠道提出的关于COVID-19的问题。”
还没结束……
要注意供应商的承诺。一般来说,聊天机器人需要大量的训练和脚本,因此成本可能不会明显降低——成本取决于组织的规模和数量、用例的类型和复杂性,以及其他参数。“情感感知”聊天机器人给聊天机器人技术增加了另一层复杂性和挑战。以下是刘教授提到的几点:
- 这种具有情感感知能力的聊天机器人和虚拟现实设备所依赖的情感标记数据很难获得到训练机器所需的规模。
- 注释(即标签),如果可用,是主观的,且分类可能不准确。与AI和其他依赖数据的应用程序一样,“胡乱输入,胡乱输出”。
- 具有情感功能的机器人还必须能够在理解与之交谈的说话者的情感与产生自己的情感和语言反应之间取得平衡。这确实很难做到,因为这两个过程之间存在明显的依赖关系,并且需要几乎同时发生。
- 所有这些在所谓的“开放领域”中变得更加困难,不受机器人用例、应用领域、行业等的限制。
刘教授对具有情感意识的聊天机器人的看法是:“带着情感聊天对于对话系统至关重要”。但其仍存在大量质量问题,这项技术还没有准备好进入蓬勃发展期。
确实有部署带有情感的聊天机器人的例子,但是这类机器人主要基于规则——根据脚本做出反应,自身并没有智能。这些机器人也受到领域的限制:它们通常应用于较窄范围,如客户服务或作为情感伴侣。他说:为了创造更多的类似人类的“情感聊天机器”,我们需要在多模式情感检测和生成方面做得更好。
情感启发式机器学习
大会上最有趣的部分是微软首席研究员丹尼尔·麦克杜夫的主题演讲,他提出了一个问题:“机器学习如何利用情感来学习和探索?”他谈到了“内脏机器”,即机器学习/人工智能系统应该具有与人类相似的情感机制,或者至少它们应该能够基于上述原因建立情感模型:我们希望技术能像人类一样与我们互动。
但是还有另一个原因。麦克达夫先生说,情感帮助我们理解和探索世界,对于了解冒险、取得积极成果等的意义至关重要。当我们与世界互动时,我们会收到积极或消极的回应,引导我们采取进一步行动。如果我们可以将情绪整合到机器学习系统中以帮助其接收信息,会有怎样的效果?
他展示的示例是利用驾驶员的心跳来指导机器学习。心率是我们表达和体验情感的一种方式。其他方式包括生物学层面的变化:体温的变化,瞳孔和血管的扩张/收缩以及血流、呼吸和脑电波的变化,唾液分泌的增加/减少、激素和消化酶的分泌等等。
麦克杜夫先生的团队利用驾驶员心跳所表达的情绪反应来训练神经网络模型驾驶汽车,结果是该模型能够驾驶车辆的时间比最先进的无情感因素模型更长。
他的团队还研究了如何应用情感(或者说人类生理反应数据)来教机器避免车祸,本特殊案例利用了人类司机的面部表情,似乎也起了作用。他们的下一个项目希望“结合各种情感反应信号、风险规避和好奇心,推动机器以安全的方式进行更多探索。”
我们的看法
俄语中有一句谚语,大意是:当我们遇见一个人时,我们根据其穿着来判断他们;当他们离开时,我们根据其智力来判断他们。这也许是一个罕见的古老民间智慧不符真理的场合——人们通常不记得你穿过或说过或做过什么,但他们记得,你带给他们的感觉——换句话说,就是你的情感。
情感会影响个人和群体层面智力和行为的各个方面。总体而言,它们决定了市场行为、社会凝聚力、地方和全球经济的发展状况以及国家的进步。例如,北欧人是世界上最幸福的地区之一,也是最富有的地区之一。
那么,我们能否将情感——这一使我们成为人类的基本品质——解码并重新编码到机器中?通过语言、语音技术或者计算机视觉,大数据、廉价的计算能力、强大的硬件、快速改进的算法和协作/开源软件,在过去十年中取得了巨大的成功。
情感AI的发展始于60年前,其宏伟目标是模拟人类智能,开创者认为:“如果精心挑选一组科学家一起研究一个夏天,可以在一个或多个问题上取得重大进步”。然而如现在所知,该领域变得更加狭窄和脆弱:应用人工智能(或特定领域人工智能)。
这是否意味着情感人工智能太难了,我们应该放弃?尽管范围有限,许多特定领域的人工智能应用程序产生了巨大的商业利益和人文价值。正如情感人工智能大会所表明的那样,只要我们意识到该领域所面临的挑战并抱有理性的预期,情感人工智能也有可能做到这一点,但这与我们人类是如此的不同。
原文发布时间:2020-08-02
本文作者:读芯术