国内首发,百川13B大模型上架魔搭

本文涉及的产品
交互式建模 PAI-DSW,每月250计算时 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
模型训练 PAI-DLC,100CU*H 3个月
简介: 今日,百川智能发布130亿参数通用大语言模型Baichuan-13B-base和对话模型Baichuan-13B-Chat。两个模型全都开源、免费、可商用,均已在魔搭社区上架,属于国内首发。

模型介绍


今日,百川智能发布130亿参数通用大语言模型Baichuan-13B-base和对话模型Baichuan-13B-Chat。两个模型全都开源、免费、可商用,均已在魔搭社区上架,属于国内首发。


image.png


6 月 15 日,百川智能刚刚发布第一款 70 亿参数规模的中英文语言模型 Baichuan-7B,该模型也于当天在魔搭上架。


对比 Baichuan-7B,Baichuan-13B拥有更多参数和语料,模型参数130亿,在1.4万亿token数据集上训练,训练数据量超过LLaMA-13B 40%,是当前开源13B尺寸下训练数据量最多的模型。


本次发布,共包含基础模型(Baichuan-13B-Base)和对齐模型(Baichuan-13B-Chat)两个版本。基础模型是适用于开发者的“基座”,具有对话功能的对齐模型则可以满足普通用户的需求。


为了进一步降低模型使用门槛,满足更广大用户的需求,百川智能还开源了对齐模型(Baichuan-13B-Chat)的int8和int4两个量化版本,相对非量化版本,可以在几乎没有效果损失的情况下大幅降低部署门槛,比如将模型部署在Nvidia 3090等消费级显卡上。


此次推出的 Baichuan-13B 对学术研究完全开放,其他开发者也可通过邮件向百川智能申请授权,并获得官方商用许可后即可免费商用。


魔搭社区成立于2022年11月,致力于成为中国开源大模型第一平台,现已聚集 180 多万 AI 开发者,模型下载总量超过 3600 万次,累计开源开放 900多个优质AI模型,模型贡献者包括20多家顶尖人工智能机构,基本覆盖国内大模型赛道核心玩家,如百川智能、哔哩哔哩、IDEA研究院、兰丁股份、澜舟科技、openBMB社区、启智社区、清华TSAIL、RWKV、深势科技、WeNet社区、元语智能、浙江大学、智谱AI等(排名不分先后),他们贡献了30多个10亿以上参数规模的开源大模型。


找大模型,上魔搭!


模型链接


基础模型链接:

https://modelscope.cn/models/Baichuan-inc/Baichuan-13B-Base/summary


对话模型链接:

https://modelscope.cn/models/baichuan-inc/Baichuan-13B-Chat/summary


相关文章
|
8月前
|
人工智能 达摩院 自然语言处理
超好用的开源模型平台,ModelScope阿里达摩院
超好用的开源模型平台,ModelScope阿里达摩院
551 1
|
人工智能 自然语言处理 安全
国内首发,阿里云魔搭社区上架百川智能Baichuan 2系列模型
国内首发,阿里云魔搭社区上架百川智能Baichuan 2系列模型
1082 0
|
1天前
|
物联网 异构计算 Python
麦橘超然上线魔搭社区,免费生图和训练,文末返图有奖
麦橘超然是麦橘制作的基于Flux.1的模型,可以生成高度摄影写实和富有光影感的图片,尤其擅长表现人物的脸部和肌肤细节。麦橘之前的作品麦橘写实是各大文生图开源站点最受欢迎的模型之一。
|
2月前
|
机器学习/深度学习 算法
魔搭案例开源获奖
赵卫东老师在第七届CCF开源创新大赛教学案例赛道中荣获特等奖。他的案例设计注重理论与实践结合,采用阿里魔搭平台和英特尔OpenVINO等先进技术,提升课程的实用性与前瞻性。该案例已开源,并在教学中取得显著成效。赵卫东老师一直坚持“学以致用、产教融合”的理念,多次在教学比赛中获奖。
175 7
|
数据可视化 测试技术 PyTorch
昆仑万维「天工」Skywork-13B魔搭社区首发开源!魔搭最佳实践来了!
作为国内最具诚意的开源百亿大模型,「天工」Skywork-13B系列无需申请即可实现商用,授权链路极简,且无用户数、行业、公司规模限制。
|
8月前
|
数据采集 机器学习/深度学习 人工智能
阿里云魔搭社区发起ModelScope-Sora开源计划
阿里云魔搭社区在2024全球开发者先锋大会上启动ModelScope-Sora开源计划,聚焦中国多模态大模型研究,推出一站式工具链和Data-Juicer多模态数据处理系统,提升处理效率与质量。该计划还包括基础类Sora模型开源及沙盒实验室,以支持开发者迭代与训练。面对数据质量、安全、商业平衡及算力挑战,魔搭社区致力于推动AI创新,已汇聚众多模型与开发者。
1173 1
阿里云魔搭社区发起ModelScope-Sora开源计划
|
自然语言处理 测试技术 编译器
社区供稿 | 姜子牙大模型开源代码大模型Ziya-Coding-34B-v1.0 再创榜单新高,魔搭开源可体验!
使用自然语言生成高质量的代码是大模型落地中的高频需求。近日,IDEA研究院封神榜团队正式开源最新的代码大模型Ziya-Coding-34B-v1.0,我们在HumanEval Pass@1的评测上,取得了75.5的好成绩,超过了GPT-4(67.0)的得分,也成为目前已知开源模型新高。
|
SQL 人工智能 JSON
社区供稿 l ChatGLM金融开源FinGLM学习笔记
日前,由中国中文信息学会社会媒体处理专委会主办,智谱 AI、安硕信息、阿里云、魔搭社区、北京交通大学联合承办的「SMP 2023 ChatGLM 金融大模型挑战赛」落下帷幕,该赛事旨在推动大模型在金融垂直行业应用的研究和开发,沉淀大模型落地实践经验。赛后,赛事方第一时间开源开放了赛事相关的代码,目前也开始有开发者小伙伴基于此整理了一些干货笔记,小编特搜罗来向大家分享,希望能给正在关注大模型行业落地的小伙伴们一些帮助。
|
人工智能 算法 数据处理
零一万物发布首款大模型,阿里云魔搭社区开源首发
零一万物发布首款大模型,阿里云魔搭社区开源首发
380 0
|
人工智能 数据可视化 物联网
vivo AI全球研究院 BlueLM-7B系列开源!魔搭社区最佳实践教程来了!
BlueLM 是由 vivo AI 全球研究院自主研发的大规模预训练语言模型,本次发布包含 7B 基础模型、7B 对话模型,4bits量化的7B对话模型,支持 32K 的长文本基础模型和对话模型。

热门文章

最新文章

下一篇
开通oss服务