助力 AI 技术共享,蚂蚁开源又一核心技术“因果学习系统 OpenASCE”

简介: 技术开源是蚂蚁集团的重要技术战略,我们希望通过开源建立起开放、包容的技术生态,让更多人共享技术红利。

当地时间 12 月 10 日,机器学习和人工智能领域的顶级国际会议 NeurIPS (Neural Information Processing Systems) 在美国路易斯安那州新奥尔良市开幕,来自全球产业界和学术领域的人工智能专家齐聚一堂。

首个分布式全链路因果学习系统 OpenASCE
大会第一天,蚂蚁集团在主题为“知识增强 AI 在垂直行业的应用探索”的研讨会上正式开源了业界首个分布式全链路因果学习系统 OpenASCE (Open All-Scale Causal Engine) 。

项目 GitHub:https://github.com/Open-All-Scale-Causal-Engine/OpenASCE

0109.1.png

因果推断主要研究如何从数据中推断因果关系,是数据科学领域的重要分支,而传统的机器学习则主要依赖数据中的相关关系。融合因果推断和机器学习可以同时发挥两者的强项,我们称之为因果学习。因果学习作为一种深入理解数据和决策背后关系的技术,在数据驱动的运营和决策中扮演着重要的角色。

OpenASCE 根植于蚂蚁集团多年积累的实践经验和技术突破,相较于业界已有的一些开源框架,支持全链路大规模因果学习,包含因果发现、因果效应估计和归因,覆盖了因果各个领域的相应实现。在因果发现上,OpenASCE 支持分布式贝叶斯网络结构搜索,能够处理百节点百万样本数据;同时支持基于连续优化的因果发现,支持万级节点亿级样本数据。

OpenASCE 实现的大规模分布式因果纠偏树可以在 4 小时内完成 1 亿样本的训练任务,是业界唯一的分布式因果提升树实现。此外,OpenASCE 还沉淀了 20 多个工业级因果学习算法,包括 15 个以上因果技术和深度学习结合的因果表征学习方法,有效降低了因果技术的工业应用门槛,在蚂蚁集团内部多个场景实现了规模化应用。

0109.2.png

在信贷风控领域,通过 OpenASCE 的因果学习方法,可以更准确地识别出风险因素和客户行为之间的因果关系,大幅提高了风险控制的精度和效率。在营销优化方面,OpenASCE 能够帮助营销人员有效寻找“营销敏感人群”,提升业务指标。在推荐场景中,因果推断可以帮助机器学习纠正数据中的偏置,去除伪相关,学习更稳定的因果关系。

开源开放,共建社区

作为一家科技公司,蚂蚁集团将 OpenASCE 开源,为业界提供一套大规模、高性能的因果学习技术,并通过开源吸引全球开发者共同参与项目的建设和完善,促进全链路因果学习系统领域的发展和创新。

技术开源是蚂蚁集团的重要技术战略,我们希望通过开源建立起开放、包容的技术生态,让更多人共享技术红利。

截至目前,蚂蚁集团已在数据库、云原生、中间件等基础软件领域开源了 1700 多个仓库、积累了 100 多个社区头部开源项目。《COPU2022 中国开源发展蓝皮书》显示,蚂蚁开源影响力排名国内前三,其中重点开源的 9 大技术均为支撑支付宝的核心技术。

相关文章
|
5天前
|
机器学习/深度学习 人工智能 自然语言处理
Baichuan-M1-14B:AI 助力医疗推理,为患者提供专业的建议!百川智能开源业内首个医疗增强大模型,普及医学的新渠道!
Baichuan-M1-14B 是百川智能推出的首个开源医疗增强大模型,专为医疗场景优化,支持多语言、快速推理,具备强大的医疗推理能力和通用能力。
84 16
Baichuan-M1-14B:AI 助力医疗推理,为患者提供专业的建议!百川智能开源业内首个医疗增强大模型,普及医学的新渠道!
|
13天前
|
Web App开发 机器学习/深度学习 人工智能
Weebo:支持多语言和实时语音交流的开源 AI 聊天机器人,回复具备语调、情感的语音
Weebo 是一款基于 Whisper Small、Llama 3.2 和 Kokoro-82M 技术的 AI 语音聊天机器人,支持实时语音交互和多语言对话,适用于个人助理、娱乐互动和教育辅导等多种场景。
131 17
Weebo:支持多语言和实时语音交流的开源 AI 聊天机器人,回复具备语调、情感的语音
|
10天前
|
存储 人工智能 自然语言处理
OmniThink:浙大联合阿里通义开源 AI 写作框架,基于深度思考扩展知识边界,实时展示思考过程
OmniThink 是浙江大学与阿里通义实验室联合开发的机器写作框架,通过模拟人类迭代扩展和反思过程,生成高质量长篇文章,显著提升知识密度和内容深度。
115 12
OmniThink:浙大联合阿里通义开源 AI 写作框架,基于深度思考扩展知识边界,实时展示思考过程
|
10天前
|
机器学习/深度学习 人工智能 自然语言处理
VideoWorld:字节开源自回归视频生成模型,支持输入视频指导AI生成视频!弥补文本生成视频的短板
VideoWorld 是由字节跳动、北京交通大学和中国科学技术大学联合推出的自回归视频生成模型,能够从未标注的视频数据中学习复杂知识,支持长期推理和规划任务。
101 8
VideoWorld:字节开源自回归视频生成模型,支持输入视频指导AI生成视频!弥补文本生成视频的短板
|
13天前
|
人工智能 达摩院 计算机视觉
SHMT:体验 AI 虚拟化妆!阿里巴巴达摩院推出自监督化妆转移技术
SHMT 是阿里达摩院与武汉理工等机构联合研发的自监督化妆转移技术,支持高效妆容迁移与动态对齐,适用于图像处理、虚拟试妆等多个领域。
49 9
SHMT:体验 AI 虚拟化妆!阿里巴巴达摩院推出自监督化妆转移技术
|
10天前
|
机器学习/深度学习 人工智能 vr&ar
Roop-Unleashed:开源 AI 换脸神器!支持批量、VR、直播实时换脸
Roop-Unleashed 是一款基于 Roop 的开源 AI 换脸工具,支持批量处理、VR 换脸和直播换脸,提供简单易用的图形界面,适用于多种场景。
103 5
Roop-Unleashed:开源 AI 换脸神器!支持批量、VR、直播实时换脸
|
10天前
|
人工智能 自然语言处理 API
百聆:集成Deepseek API及语音技术的开源AI语音对话助手,实时交互延迟低至800ms
百聆是一款开源的AI语音对话助手,结合ASR、VAD、LLM和TTS技术,提供低延迟、高质量的语音对话体验,适用于边缘设备和低资源环境。
253 4
百聆:集成Deepseek API及语音技术的开源AI语音对话助手,实时交互延迟低至800ms
|
9天前
|
人工智能 测试技术 Python
VideoChat-Flash:上海AI Lab开源高效处理超长视频的多模态大模型
VideoChat-Flash 是上海人工智能实验室等机构推出的多模态大模型,通过分层压缩技术高效处理长视频,支持长达数小时的视频输入,推理速度提升5-10倍。
40 1
VideoChat-Flash:上海AI Lab开源高效处理超长视频的多模态大模型
|
7天前
|
人工智能 自然语言处理 JavaScript
微软开源课程!21节课程教你开发生成式 AI 应用所需了解的一切
微软推出的生成式 AI 入门课程,涵盖 21 节课程,帮助开发者快速掌握生成式 AI 应用开发,支持 Python 和 TypeScript 代码示例。
134 14
|
9天前
|
存储 人工智能 安全
AI时代的网络安全:传统技术的落寞与新机遇
在AI时代,网络安全正经历深刻变革。传统技术如多因素身份认证、防火墙和基于密码的系统逐渐失效,难以应对新型攻击。然而,AI带来了新机遇:智能化威胁检测、优化安全流程、生物特征加密及漏洞管理等。AI赋能的安全解决方案大幅提升防护能力,但也面临数据隐私和技能短缺等挑战。企业需制定清晰AI政策,强化人机协作,推动行业持续发展。
40 16