清华CodeGeeX项目原作解读:大规模多语言代码生成模型

简介: 清华CodeGeeX项目原作解读:大规模多语言代码生成模型

近年来,大规模预训练模型在各个领域取得飞速进步,不仅是文本、图像领域,用于代码领域也可以取得惊人的效果。OpenAI 的 Codex 模型首次展示了代码预训练模型的强大能力,并以此为基础开发了 Copilot 插件。然而,闭源、收费等特性使 Copilot 饱受研究者和程序员们的争议。

为了让更多研究者能参与到这一领域的探索、让广大程序员能够免费体验到自动代码生成带来的便利,清华大学知识工程实验室团队主导研发了 CodeGeeX,一个具有 130 亿参数的多编程语言代码生成预训练模型,采用华为 MindSpore 框架实现,在鹏城实验室 “鹏城云脑 II“平台上使用 1536 个昇腾 910 AI 处理器,在 20 多种语言的语料库上历时两个月训练得到。CodeGeeX 支持十多种主流编程语言的生成及翻译,在新的多语言基准 HumanEval-X 取得超过所有开源模型的效果。此外,团队和智谱 AI 合作,基于 CodeGeeX 开发了免费的 VS Code 插件,同时正在开发其他平台插件,帮助广大程序员提高开发效率。CodeGeeX 开源开放,所有代码和模型权重均已开源,并同时支持昇腾和英伟达平台。

机器之心最新一期线上分享邀请到了清华大学知识工程实验室研究助理郑勤锴,介绍 CodeGeeX 的技术原理、实现过程、评估指标,以及插件的使用教程等。


分享主题:CodeGeeX:大规模多语言代码生成模型

分享嘉宾:郑勤锴,清华大学知识工程实验室研究助理,本科及硕士毕业于上海交通大学,并取得巴黎高等电信学校工程师学位,研究领域是基于预训练模型的代码生成。

分享摘要:CodeGeeX 是一个具有 130 亿参数的多语言代码生成预训练模型,由清华大学知识工程实验室团队研发,支持十多种主流编程语言的生成及翻译,并开发了免费的 VS Code 插件,帮助广大程序员提高开发效率。本次报告将介绍 CodeGeeX 的技术原理、实现过程、评估指标,以及插件的使用教程等。

相关链接:

1)SOTA!模型平台项目主页链接:

https://sota.jiqizhixin.com/project/codegeex

2)GitHub 链接:

https://github.com/THUDM/CodeGeeX

3)技术博客:

https://models.aminer.cn/codegeex/blog/index_zh.html

4)主页(含在线DEMO):

https://models.aminer.cn/codegeex/zh-CN/

5)免费的 VS Code 插件:

https://marketplace.visualstudio.com/items?itemName=aminer.codegeex

相关文章
Linux Command lz4 压缩
Linux Command lz4 压缩
|
2月前
|
人工智能 自然语言处理 运维
保姆级教程:2026年OpenClaw(Clawdbot)本地安装与阿里云部署+WhatsApp集成步骤指南
2026年,OpenClaw(原Clawdbot)已成为轻量化、高可用、全平台兼容的开源AI智能体框架,支持本地私有化部署与阿里云云端7×24小时稳定运行,可无缝对接WhatsApp实现全球范围AI交互。本文从零开始,提供本地全平台部署、2026阿里云极简部署、WhatsApp通道集成的完整流程,附带可直接执行的代码命令、权限配置、端口放行、服务自启与问题排查方案,全程无无关平台信息,新手也能一次性跑通。
1058 3
|
5月前
|
搜索推荐 数据挖掘 关系型数据库
基于python大数据的汽车舆情可视化及分析系统
本项目构建基于Python、MySQL与Flask的汽车舆情分析与监测平台,融合社交关系、用户行为与信息传播数据,提升推荐精准度与个性化服务,助力智能营销与用户体验优化。
|
10月前
|
人工智能 JavaScript 数据可视化
VTJ.PRO:打破次元壁!AI驱动 + 双向代码自由穿梭,重新定义Vue高效开发!
VTJ.PRO推出“双向代码转换引擎”,实现可视化设计与手写代码无缝切换,真正践行“设计即代码,代码即设计”。支持Vue3组件一键生成、源码反向解析,兼顾开发自由度与效率,助力快速原型验证与项目迭代。
301 0
|
12月前
|
传感器 监控 网络协议
《鸿蒙软总线:基于UDP的数据传输奥秘与优势》
鸿蒙系统的分布式软总线以UDP协议为基础,构建了高效的多设备互联传输机制。通过UDP的无连接特性,软总线实现快速设备发现与广播通信,优化数据传输流程,引入流式传输和双轮驱动机制,提升可靠性与效率。其高带宽、低时延特性适用于文件共享、音视频传输等场景,同时智能适应复杂网络环境,确保稳定传输。简化开发流程降低门槛,助力鸿蒙生态繁荣,为万物互联提供核心技术支撑。
473 14
|
运维 Devops 测试技术
DevOps实践:自动化部署与持续集成
【8月更文挑战第24天】在软件工程的世界里,DevOps已经成为一种提升效率和质量的必由之路。本文将深入探讨如何通过自动化部署和持续集成来实施DevOps策略。我们将从基础概念出发,逐步引导读者理解并实现一个简单而强大的自动化部署流程,同时展示如何利用持续集成来保障代码质量和快速迭代。文章旨在为读者提供清晰的操作指南和思路启发,帮助团队构建更加高效、稳定和可靠的软件开发与运维环境。
|
存储 缓存 Java
Elasticsearch 8.X 聚合查询下的精度问题及其解决方案
Elasticsearch 8.X 聚合查询下的精度问题及其解决方案
|
算法 搜索推荐 安全
社交网络分析1:起源发展、不同领域的应用、核心概念
社交网络分析1:起源发展、不同领域的应用、核心概念
1388 0
社交网络分析1:起源发展、不同领域的应用、核心概念
水果软件FLStudio2023最新完整版本安装包下载
FL Studio是一款音乐编曲软件,全称:Fruity Loops Studio,也是我们经常说的水果音乐软件,该软件功能强大,让你拥有全功能的录音室、大混音盘、让你的音乐突破你的想象力。但是很多人不了解这款软件,不知道从何学起,下面就给大家介绍FL Studio21软件入门教程。FL Studio 简称为FL,全称:Fruity Loops Studio,因此它又有"水果"之称。 就在最近,FL Studio下载:http://t.csdn.cn/3irxK
707 3

热门文章

最新文章