C 语言写得比 Codex 还要好的 AI 开源了!

简介: C 语言写得比 Codex 还要好的 AI 开源了!

近几年来,AI 代码生成器十分流行,从 OpenAI 的 Codex 再到 DeepMind 的AlphaCode。然而,这两个 AI 模型全都没有开源:AlphaCode 只给出了一些测试样例,而 Codex 只开放了 API。

卡内基梅隆大学的研究人员表示:“尽管大型语言代码模型取得了巨大成功,但最强的模型都尚未公开。这阻止了这些模型在资源充足的公司之外的应用,并限制了资源匮乏的组织在这一领域的研究。”

因此,几个来自卡内基梅隆大学的研究人员推出了一个开源的自动代码生成器模型 PolyCoder,具有 27B 参数,基于 GPT-2 架构,在 12 种编程语言的 249GB 代码数据库中进行训练。

这 12 种编程语言分别是:C、C#、C++、Go、Java、JavaScript、PHP、Python、Ruby、Rust、Scala 和 TypeScript。

image.png

训练结果表明,PolyCoder 在编写 C 语言方面的表现优于包括 Codex 在内的所有已知模型。和其他开源模型比较,PolyCoder 在 C、JavaScript、Rust、Scala 和 TypeScript 方面的表现都比类似模型 GPT-Neo 2.7B 要好。但 Codex 在其他语言方面仍然要胜过 PolyCoder。

image.png

image.png

人工智能code

相关文章
|
2月前
|
人工智能 中间件 数据库
沐曦 GPU 融入龙蜥,共筑开源 AI 基础设施新底座
沐曦自加入社区以来,一直与龙蜥社区在推动 AIDC OS 的开源社区建设等方面保持合作。
|
3月前
|
人工智能 安全 API
HiMarket 正式开源,为企业落地开箱即用的 AI 开放平台
我们发起 HiMarket 的初心:帮助用户从 80% 开始构建 AI 开放平台。
475 32
|
4月前
|
人工智能 算法 开发者
开源VLM“华山论剑”丨AI Insight Talk多模态专场直播预告
开源VLM“华山论剑”丨AI Insight Talk多模态专场直播预告
396 10
开源VLM“华山论剑”丨AI Insight Talk多模态专场直播预告
|
3月前
|
人工智能 运维 安全
|
3月前
|
人工智能 云栖大会
|
2月前
|
人工智能 运维 Java
Spring AI Alibaba Admin 开源!以数据为中心的 Agent 开发平台
Spring AI Alibaba Admin 正式发布!一站式实现 Prompt 管理、动态热更新、评测集构建、自动化评估与全链路可观测,助力企业高效构建可信赖的 AI Agent 应用。开源共建,现已上线!
3874 56
|
人工智能 关系型数据库 MySQL
AI战略丨开源开放,构建 AI 时代的创新引擎
技术开源和产业开放彼此衔接、相互支撑,构建全产业链合作模式和无边界产业生态圈,日益成为数字时代全球分工体系的主流模式。