清华AI研究院里程碑事件:成立「智能人机交互研究中心」,发布四大开放平台

简介: 昨日(5 月 21 日),清华大学「智能人机交互研究中心」成立仪式在清华大学李兆基科技大楼举行。这是继「知识智能研究中心」、「听觉智能研究中心」、「基础理论研究中心」后,清华大学 AI 研究院第四个研究中心。

清华大学副校长、清华大学 AI 研究院管委会主任尤政院士和清华大学 AI 研究院院长张钹院士出席成立仪式,共同为中心揭牌。

尤政院士在致辞中表示,成立智能交互研究中心是清华大学推进人工智能发展的重要举措,也是清华大学 AI 研究院的里程碑事件。

微信图片_20211201005755.jpg

图说:智能交互中心成立仪式合影

「人工智能的重要需求来自人机交互。」张钹院士在致辞中表示,⼈机交互核⼼问题是⾃然⾏为的意图理解,而解决这一核心问题必须要经过跨学科的研究。

为了更好汇聚清华大学在智能人机交互方面多学科的优势研究力量,清华大学 AI 研究院决定成立智能人机交互研究中心(英文:Intelligent Human Computer Interaction Research Center,简称 THUII,以下简称「智能交互中心」)。

史元春教授(清华大学计算机系「长江学者」特聘教授、清华大学全球创新学院 GIX 院长)被聘请为智能交互中心主任,高文教授(中国工程院院士、北京大学博雅讲席教授、信息科学技术学院院长)和戴国忠研究员(中科院软件所人机交互技术与智能信息处理实验室首席研究员)被聘请为智能交互中心学术顾问。

微信图片_20211201005759.jpg

图说:尤政院士(左)、张钹院士(右)为史元春教授(中)颁发聘任证书

研究团队聚集了计算机系、心理学系、生物医学工程系、美术学院、工业工程系、社会科学学院等 6 个院系的专家学者。

三大使命

计算设备、传感器、数据和算法日益增多增强,马克•维瑟憧憬的普适计算时代已经到来。人们可能访问的计算设备和数据增多了,人机关系也变得更加丰富了。交互技术已经成为终端和应用创新的核心竞争力。

但普适计算时代下的自然交互存在诸多挑战,比如,用户心智模型的不可见性,传感器数据噪声,以及需要适应个体、环境的差异性等。

智能人机交互需要解决用户认知机理建模、用户行为的计算表征、交互意图的理解算法、自然界面生成方法以及情景感知等问题,为用户与计算设别间自然高效的信息交换提供理论基础和优化方法。

因此,智能交互中心的成立,有了三大使命:

一、开展基础理论。在人机交互、智能交互方面,探索自然交互的科学问题,建立通过智能技术实现自然交互的理论基础;

二、构建开放平台。建设典型自然交互应用中的用户心理和行为数据库,提供脑机交互实验系统,建成清华大学智能交互开放平台;

三、促进交流合作。举办开放的、国际化的与智能人机交互相关的学术活动,增进学术交流;普及智能人机交互技术,促进产学合作。

尤政院士表示,智能人机交互研究中心将以促进清华和国家人机交互研究与发展为宗旨,打造具有广泛影响力的学术研究、交流中心、智能交互平台与原创技术推广中心,更好地服务于国家和清华的人工智能发展战略。

八个研究内容

史元春教授对智能交互研究中心的八个研究内容做了介绍:

(一)自然交互行为的意图理解:在自然交互界面上,用户不再是严格地通过离散明确的交互操作完成交互,而是通过连续、非确定的多模态数据表达交互意图。

在解释用户的交互意图时,既可以使用「黑盒子」的机器学习方法,也可以利用「白盒子」的基于用户行为建模的方法。后者中的用户建模,其本质是通过计算的方法来刻画用户的行为能力,对于理解用户意图和探索自然交互的计算原理具有重要的科学意义。

在意图推理任务中,贝叶斯方法具有优势。

(二)多模态交互感知:多模态交互行为的智能感知是自然交互的基础。该研究内容的核心是识别具有高可用性的自然输入动作,创新成本可控、易于部署的感知技术。

(三)认知心理:认知心理学是对人类感知觉信息加工处理过程及其机制的探索,是人机交互设计与优化的基础和关键支撑。对积极心理的深入研究,有望为提升人机交互自然性提供重要的指导建议。

(四)情感计算与情感交互技术:是和谐人机交互的核心技术之一。

清华大学团队针对海量网络数据,在情感认知特性的可计算性、跨模态异构数据的情感建模、美学认知的建模、面向网络用户的情感交互等方面开展了深入研究。

(五)脑-机接口:基于大脑神经解码提供了新的智能交互方式,在残疾人康复、健康人群增强等方面具有重要的科学意义和应用前景。

(六)人因与工效学:具体包含生理人因学、认知人因学和组织人因学。

(七)人机融合的智能增强:研究人与机器两类智能体的双向耦合机制,突破阻碍人与机器智能双向沟通的技术瓶颈,构建可互相适应、协同工作的异构智能持续反馈回路,实现人与机器自然、生动、自适应的智能融合。

(八)交互设计:立足于艺术设计和人工智能技术的有机结合,从用户体验的角度出发,探索新技术所带来的可能性。

四个开放平台

智能人机交互研究中心成立仪式后,史元春教授还发布了四个智能交互开放平台:智能文本输入开发套件 ITIS、人机互启发式英文写作系统 ESODA、情感交互数据库 ACP、视觉脑机交互实验系统 VBCI。

易鑫博士、陶品副研究员、贾珈副教授、王毅军研究员分别对四个开放平台做了介绍。

(一)智能文本输入开发套件 ITIS

ITIS 针对文本输入任务中对用户输入意图的准确推理问题,从用户输入行为建模、输入意图推理算法、人机交互设计和技术评测四个方面提供数据和方法的支撑,推进文本输入这一基础而重要的人机交互任务在新一代交互场景下的体验显著提升。

其包含真实用户在多交互平台上的文本输入原始数据、智能文本输入意图推理算法、多交互界面上可直接使用的文本输入技术方案和文本输入技术评测任务集。

(二)人机互启发式英文写作系统 ESODA

「人工智能 AI『陪』您一起写作!让天下没有难写的论文!」

该产品专注于研究人机智能互启发式的 AI+Writing 全新写作交互技术,为学者从事英文学术论文写作提供智能化的新平台。

拥有 3300 万条优质英文学术论文例句,涵盖计算机、工程学、物理学、天文学、生物学、生态学、神经科学、地球科学、能源科学、医疗卫生、动物学等众多学科领域,更可根据用户自定义论文集作建立个性化学术领域,向作者提供英文写作句法、词汇搭配及替换的智能化专业建议。

通过智能化感知与交互技术,由用户向机器自然的传达英文写作意图,同时让计算机的智能计算结果优雅地为用户提供协助,实现人机智能互启发式的高效语言组织,帮助到广大学者进行更准确、更专业地完成论文写作。

(三)情感交互数据库 ACP

包含多模态情感计算数据库、心理健康数据库、美学计算数据库。

其中,多模态情感计算数据库包含语音、文本、图像情感交互数据。

  1. 语音情感交互数据库:包含 753 万句基于人机语音交互系统采集的语音情感数据,具有类别和维度的情感标签,特征包括语音、文本、用户属性和地理位置。
  2. 文本情感交互数据库:包含 178 万用户的 10 亿条文本,以情感类别为标签,特征包括文本、图像、表情符、用户属性、用户网络角色和社交关系。
  3. 图像情感交互数据库:包含约 35 万带情感的图片,特征包括图片的发布时间、标题、标签、描述等。

心理健康数据库中不仅有中文用户的数据、还有英文用户的数据。

  1. 中文用户心理健康数据库:包含 2 万用户的 50 万条文本,标注了抑郁倾向、压力源和压力水平,包括文本、图像、表情符、用户属性、社交关系等特征。
  2. 英文用户心理健康数据库:包含 2800 用户的 60 万条文本,标注了抑郁倾向,包括文本、图像、表情符、用户属性、社交关系等特征。

美学计算数据库中则涉及服装美学和图像美学。

  1. 服装美学数据库:包含男女装各分类图片 13 万张,以美学维度坐标值和美学类别为标注,数据包含颜色、材质、版型、场合、季节等特征。
  2. 图像美学数据库:包含约 12 万带有美学评价的图片,以美学评价词作为标签,特征包括图片特征和美学相关的文本描述。

(四)视觉脑机交互实验系统 VBCI

通过视觉诱发电位脑机接口技术将大脑意图转化为控制指令,为用户提供视觉神经编解码的通用软硬件系统框架,帮助用户快速实现个性化视觉脑机交互应用的方案设计、参数优化、以及性能测试验证。

VBCI 集成了视觉刺激呈现、脑电采集、脑电分析、控制反馈四大功能模块,兼容 NeuroScan、Neuracle、Wearable Sensing 等多种脑电采集设备,可根据用户需求构建个性化脑电控制指令集,提供多种视觉诱发脑电检测算法,实现脑开关、数字拨号、文字输入、机械臂控制等应用。

「除了促进我们研究院自己的分析研究、同行的交流,我们希望通过开放平台能够扩大合作的可能和成果影响的面,我们也希望能够带动产业进步。」史元春教授这样阐释发布开放平台的出发点。

她还表示,「开放平台今天是第一次,未来会有更多。」

智能交互中心官网:http://ai.tsinghua.edu.cn/thuii/



本文为机器之心报道,转载请联系本公众号获得授权

相关文章
|
25天前
|
机器学习/深度学习 人工智能
打开AI黑匣子,三段式AI用于化学研究,优化分子同时产生新化学知识,登Nature
【10月更文挑战第11天】《自然》杂志发表了一项突破性的化学研究,介绍了一种名为“Closed-loop transfer”的AI技术。该技术通过数据生成、模型训练和实验验证三个阶段,不仅优化了分子结构,提高了光稳定性等性质,还发现了新的化学现象,为化学研究提供了新思路。此技术的应用加速了新材料的开发,展示了AI在解决复杂科学问题上的巨大潜力。
25 1
|
3天前
|
人工智能 知识图谱
成熟的AI要学会自己搞研究!MIT推出科研特工
MIT推出科研特工SciAgents,结合生成式AI、本体表示和多代理建模,实现科学发现的自动化。通过大规模知识图谱和多代理系统,SciAgents能探索新领域、识别复杂模式,加速新材料发现,展现跨学科创新潜力。
23 12
|
2天前
|
机器学习/深度学习 人工智能 算法
基于AI的性能优化技术研究
基于AI的性能优化技术研究
|
30天前
|
人工智能 自然语言处理
召唤100多位学者打分,斯坦福新研究:AI科学家创新确实强
【10月更文挑战第6天】斯坦福大学最新研究评估了大型语言模型(LLMs)在生成新颖研究想法方面的能力,通过100多位NLP专家盲评LLMs与人类研究人员提出的想法。结果显示,LLMs在新颖性方面超越人类(p < 0.05),但在可行性上略逊一筹。研究揭示了LLMs作为科研工具的潜力与挑战,并提出了进一步验证其实际效果的设计。论文详见:https://arxiv.org/abs/2409.04109。
38 6
|
1月前
|
人工智能 自然语言处理 机器人
MIT新研究揭秘AI洗脑术!AI聊天诱导人类编造记忆,真假难辨
麻省理工学院的一项新研究《基于大型语言模型的对话式AI在证人访谈中加剧虚假记忆》显示,使用生成式聊天机器人进行犯罪证人访谈会显著增加参与者的虚假记忆,且影响持久。研究设置了对照组、问卷访谈、预设脚本及生成式聊天机器人四种条件,结果显示生成式聊天机器人诱导的虚假记忆数量远超其他方法。尽管AI技术在效率和准确性方面潜力巨大,但在敏感领域需谨慎应用,并需进一步评估风险,制定伦理准则和监管措施。论文详细内容见[这里](https://arxiv.org/abs/2408.04681)。
39 2
|
2月前
|
存储 人工智能 JavaScript
根据Accenture的研究,CEO和CFO谈论AI和GenAI是有原因的
数字化转型与当前GenAI领导者之间的关键区别在于,CEO和CFO(而非CIO)似乎参与了指导AI投资的过程。例如,Accenture在2024年1月报告称,到2023年底,在财报电话会议中提到AI的次数几乎达到4万次,因为C级领导层正在为“重大技术变革”做好准备
39 1
|
3月前
|
机器学习/深度学习 人工智能 人机交互
ICML 2024:AI也会刷抖音!清华领衔发布短视频全模态理解新模型
【8月更文挑战第20天】SALMONN是由清华大学在ICML 2024发表的一种开创性的多模态模型,专为短视频全模态理解设计。它集成了预训练文本大模型与语音、音频编码器,能直接处理多样音频输入,在自动语音识别、翻译、情绪识别等任务中表现出色。SALMONN展现了令人兴奋的新能力,如翻译未训练语言和基于语音的问答。通过少样本激活微调,可进一步发掘其跨模态潜能。尽管如此,模型的计算成本和泛化能力仍是待克服的挑战。SALMONN标志着AI在具备通用听觉理解方面迈出重要一步。[论文链接: https://arxiv.org/abs/2310.13289]
68 3
|
3月前
|
边缘计算 人工智能 监控
边缘计算与AI结合的场景案例研究
【8月更文第17天】随着物联网(IoT)设备数量的爆炸性增长,对实时数据处理的需求也随之增加。传统的云计算模型在处理这些数据时可能会遇到延迟问题,尤其是在需要即时响应的应用中。边缘计算作为一种新兴的技术趋势,旨在通过将计算资源更靠近数据源来解决这个问题。本文将探讨如何将人工智能(AI)技术与边缘计算结合,以实现高效的实时数据分析和决策制定。
222 1
|
3月前
|
人工智能 文字识别 自然语言处理
AI开放平台介绍
【8月更文挑战第1天】AI开放平台介绍。
137 2
|
4月前
|
数据采集 机器学习/深度学习 人工智能
AI小分子药物发现的百科全书,康奈尔、剑桥、EPFL等研究者综述登Nature子刊
【7月更文挑战第12天】康奈尔、剑桥及EPFL科学家合作,详述AI在药物发现中的突破与挑战[^1]。AI现用于新化合物生成、现有药物优化及再利用,加速研发进程。尽管取得进展,可解释性不足、数据质量和伦理监管仍是待解难题。 [^1]: [论文链接](https://www.nature.com/articles/s42256-024-00843-5)
63 3

热门文章

最新文章

下一篇
无影云桌面