正式开赛!阿里云携手 NVIDIA 举办首届 “通义千问 AI 挑战赛”
摘要:Qwen AI 挑战赛由阿里云和 NVIDIA 主办,天池平台和魔搭社区联合承办,目标是通过高质量的数据探索和拓展开源模型 Qwen- 1.8B 及 Qwen- 72B 的代码能力上限。
12 月1日,阿里云开源以业界领先前所未有的动作再次引领了人工智能领域的新浪潮,在发布会上公布了 通义千问“720 亿参数模型的 AI 巨模型 Qwen-72B” 、以及 “18 亿参数模型 Qwen-1.8B 、和音频大模型 Qwen-Audio,” 正式开源,并启动了揭幕了由阿里云和 NVIDIA 联合主办的重大赛事——“通义千问 AI 挑战赛”。宣布开源其 720 亿参数的 AI 巨模型 Qwen-72B,这一举措标志着阿里云在推动技术共享和生态协作上又迈出了重要一步。
Qwen 1.8B 及 Qwen 72B 开源模型特点
- Qwen-72B 模型:不仅在 10 个权威基准测评中取得了突出成绩,更为大中型企业和科研机构打开了新的可能性,行业客户和开发者可以基于 Qwen-72B 开发各类应用或者进行 AI for Science 等前沿科研。
- 在本次发布会上同步开源的还有 18 亿参数模型 Qwen-1.8B 和音频大模型 Qwen-Audio:,前者因其轻量级优势,能在普通消费级终端上运行,而后者则展现了感知和理解各类语音信号的能力,使得用户可以基于音频进行更为广泛的创作和逻辑推理。
至此,阿里云完成了 18 亿、70 亿、140 亿、720 亿参数的四款大语言模型,以及视觉和音频理解两款多模态大模型的全面开源,真正实现了“全尺寸、全模态”的开放愿景。
阿里云 CTO 周靖人指出,开源生态是推动中国大模型技术进步与应用落地的关键因素。通义千问的持续开源不仅彰显了阿里云“ AI 时代最开放的大模型”的愿景,也为参与者提供了共同促进大模型生态建设的平台。
发布会上,阿里云不仅公布了 720 亿参数的 Qwen-72B 开源的重磅消息,同时揭幕了一项重大赛事——首届“通义千问 AI 挑战赛”。
“通义千问 AI 挑战赛”简介
本届比赛由阿里云和 NVIDIA 英伟达联合发起,携手魔搭社区、天池平台等共同承办,比赛为开发者提供了免费体验和深度挖掘通义开源模型家族能力的机会。主办方为参赛者提供了比赛专属高达 50 万元的云上算力支持,同时还设有丰厚的奖金,以激励参赛者在技术探索和创新方面取得突破。
赛事分为算法和 Agent 两大赛道,前者专注于对通义千问大模型的微调训练,目标是通过优质数据挖掘模型的潜在代码能力;后者则是鼓励开发者利用通义千问大模型,结合魔搭社区提供的 Agent-Builder 框架,开发出行业领先的新一代 AI 应用,推进大模型在各个行业的实际部署。
开发者们已可以通过天池平台报名参加这场 AI 盛事,这不仅是一个展示个人技术实力的舞台,更是一个实践和实现AI商业化应用的绝佳机会,旨在将大模型的理论潜力转化为实际效能,进而促进整个行业的技术进步和创新发展。
赛题说明
赛道一:Code Qwen能力算法赛道
详细参赛信息请搜索“通义千问 AI 挑战赛 - Code Qwen 能力算法赛道”
赛题背景
聚焦于通义千问大模型微调训练的竞赛,其主要目标是通过高质量的代码实践数据探索和拓展开源模型 Qwen- 1.8B 、及 Qwen- 72B 的模型代码能力上限。
赛题赛制
【初赛阶段 - 小试牛刀 1.8B】2023年12月5日10:00-2023年12月18日18:00,UTC+8
初赛阶段主要聚焦在如何通过 SFT 提升基础模型的代码能力。需要选手基于最新开源的 Qwen -1.8B 模型作为基础模型,在主办方我们提供的训练框架上自行进行数据收集与微调,训练完成后将进行自动评估,返回最终结果进行排名。
【复赛阶段 - 八仙过海 72B】2023年12月20日18:00-2023年12月28日12:00,UTC+8
复赛阶段我们将提供 GPU 算力(在线 API 的方式),参赛队伍将基于 Qwen-72B 模型进行 PEFT (lora)进行训练;
复赛评测采用混合评测方式,评测时间为2023年12月20日18:00-2023年12月28日12:00,复赛的评测集为初赛公开数据集分数 * 0.5 + 隐藏的代码 QA 数据集 * 0.5。
奖励奖项
本次竞赛奖金池共计 9.5 万元人民币现金奖励(税前),具体奖励如下:
冠军(1名): 30000 元人民币奖金,亚军(1名):20000 元人民币奖金,季军(1名):10000 元人民币奖金,优胜奖(7名):5000 元人民币奖金;获奖者均颁发获奖证书。
赛道二:Agent Builder 创意挑战赛道
详细参赛信息请搜索“通义千问 AI 挑战赛 - Agent Builder 创意挑战赛道”
赛题说明
本赛道为开放赛题,基于魔搭社区开源 Agent-builder 框架和通义千问模型,使用魔搭创空间和官方操作指引,搭建基于通义千问的新一代 AI 应用 Demo,要求应用主题方向不违反法律、道德、公序良俗;
初赛 - 人气争夺战 2023年12月1日 10:00:00 —— 2023年12月20日 18:00:00,UTC+8
线上赛主要聚焦在如何通过通义千问模型和 Agent-builder 框架,创新各种各样的 AI Agent 应用。参赛选手在天池平台报名后,需将参赛 Agent 在魔搭社区-创空间部署,魔搭将针对选手的作品做宣传推广,并设相应奖励。
线上人气评选规则:大赛组委会将根据作品上线后截止12月21日 23:59:59 期间的“喜欢量”,两方面因素进行评选奖项,具体如下:
奖项 | 评选标准 | 奖品 | 数量 |
---|---|---|---|
最佳人气奖 | 作品”喜欢量“排名第1名 | 奖金3000元人民币(税前)+证书 | 1 |
优秀人气奖 | 作品”喜欢量“排名第2-3名 | 奖金2000元人民币(税前)+证书 | 2 |
人气作品奖 | 作品”喜欢量“排名第4-10名 | 奖金1000元人民币(税前)+证书 | 7 |
参与奖 | 公开作品中随机抽取10名 | 魔搭社区周边礼包 | 10 |
4.初赛晋级规则:2023年12月20日 —— 2023年12月22日期间,由大赛专业评委将从提交的 Agent 作品的 技术难度、应用前景、交互体验、人气值等维度进行综合评审打分,遴选得分最高的 10 支作品团队进入复赛答辩环节,入选团队需经过评委技术审核。
复赛 - 最佳应用,2023年12月26日,UTC+8(具体时段留意组委会通知)
复赛阶段选手们将通过线上答辩的方式来路演展示 Agent 作品,专业评委会根据内容评选本次比赛的获奖团队;评选方案:复赛采取答辩和主观评审方式>
3.复赛最终评选奖项如下:
奖项 | 奖品 | 数量 |
---|---|---|
最佳应用奖 | 奖金20000元人民币(税前)+证书 | 1 |
最佳创意奖 | 奖金10000元人民币(税前)+证书 | 1 |
Qwen最佳应用奖 | 奖金10000元人民币(税前)+证书 | 1 |
NVIDIA技术奖 | 奖金10000元人民币(税前)+证书 | 1 |
优秀应用奖 | 奖金2000元人民币(税前)+证书 | 5 |
魔搭最佳应用奖 | 奖金10000元人民币(税前)+证书 | 1 |
NVIDIA 作为联合主办方,对上述赛题提供了相关 AI 软件栈的信息作为参考和学习资料:
NVIDIA 企业开发者社区主要面向 GPU 开发者,分享 NVIDIA GPU 以及开发工具、AI 框架或者平台等相关开发技术经验。开发者可以免费加入 NVIDIA 开发者计划,免费访问 150 多种 SDKs 和模型、参与各类技术在线研讨会以及浏览如技术博客、白皮书、教程等技术资源。加入 NVIDIA 开发者计划:++https://developer.nvidia.cn/developer-program?ncid=ref-kc-482309-vt04++
- NVDIA TensorRT^TM^ 8.6.1 版本视频教程:++https: //www.bilibili.com/video/BV1jj411Z7wG++
- 大语言模型推理优化引擎 NVIDIA TensorRT-LLM:
- 官方 GitHub repo,获取开源代码:++https://github.com/NVIDIA/TensorRT-LLM++
- 技术博客:++https: //developer.nvidia.com/zh-cn/blog/qwen-model-support-nvidia-tensorrt-llm/++探索 TensorRT-LLM 的示例代码:++https://github.com/NVIDIA/TensorRT-LLM/tree/release/0.5.0/examples++
- 了解 TensorRT-LLM 的 benchmark:++https: //nvidia.github.io/TensorRT-LLM/performance.html++
- TensorRT-LLM的模型量化:实现与性能科普视频:++https: //www.bilibili.com/video/BV1Pw411h7nM/++
- 通过 NGC Catalog 企业级容器服务获取预训练的 AI 模型以及 AI 软件:++https: //catalog.ngc.nvidia.com/++