产品
解决方案
文档与社区
权益中心
定价
云市场
合作伙伴
支持与服务
了解阿里云
AI 助理
备案
控制台
开发者社区
首页
探索云世界
探索云世界
云上快速入门,热门云上应用快速查找
了解更多
问产品
动手实践
官方博客
考认证
TIANCHI大赛
活动广场
活动广场
丰富的线上&线下活动,深入探索云世界
任务中心
做任务,得社区积分和周边
高校计划
让每位学生受益于普惠算力
训练营
资深技术专家手把手带教
话题
畅聊无限,分享你的技术见解
开发者评测
最真实的开发者用云体验
乘风者计划
让创作激发创新
阿里云MVP
遇见技术追梦人
直播
技术交流,直击现场
下载
下载
海量开发者使用工具、手册,免费下载
镜像站
极速、全面、稳定、安全的开源镜像
技术资料
开发手册、白皮书、案例集等实战精华
插件
为开发者定制的Chrome浏览器插件
探索云世界
新手上云
云上应用构建
云上数据管理
云上探索人工智能
云计算
弹性计算
无影
存储
网络
倚天
云原生
容器
serverless
中间件
微服务
可观测
消息队列
数据库
关系型数据库
NoSQL数据库
数据仓库
数据管理工具
PolarDB开源
向量数据库
热门
百炼大模型
Modelscope模型即服务
弹性计算
云原生
数据库
云效DevOps
龙蜥操作系统
平头哥
钉钉开放平台
物联网
大数据
大数据计算
实时数仓Hologres
实时计算Flink
E-MapReduce
DataWorks
Elasticsearch
机器学习平台PAI
智能搜索推荐
数据可视化DataV
人工智能
机器学习平台PAI
视觉智能开放平台
智能语音交互
自然语言处理
多模态模型
pythonsdk
通用模型
开发与运维
云效DevOps
钉钉宜搭
支持服务
镜像站
码上公益
木子李炼丹术_个人页
木子李炼丹术
文章
1
问答
50
视频
0
个人介绍
暂无个人介绍
擅长的技术
获得更多能力
通用技术能力:
暂时未有相关通用技术能力~
云产品技术能力:
暂时未有相关云产品技术能力~
阿里云技能认证
详细说明
高分内容
最新动态
文章
问答
视频
暂无更多信息
2023年06月
06.25
10:12:40
回答了问题
2023-06-25 10:12:40
youku-mPLUG 预训练数据集下载报错
赞1
踩0
评论0
06.20
10:56:50
回答了问题
2023-06-20 10:56:50
ChatYuan-large-v2版本可以finetune吗?
赞0
踩0
评论0
06.20
10:53:29
回答了问题
2023-06-20 10:53:29
如何新增自己的训练集
赞0
踩0
评论0
06.20
10:50:33
回答了问题
2023-06-20 10:50:33
自然语言搜索业务数据,应该使用文本相似度模型来实现么?
赞0
踩0
评论0
06.20
10:35:12
回答了问题
2023-06-20 10:35:12
ChatPLUG-13B什么时候发布呢
赞0
踩0
评论0
06.20
10:31:15
回答了问题
2023-06-20 10:31:15
执行速度为什么这么慢?跑一个示例程序要几百秒啊
赞0
踩0
评论0
06.20
10:30:29
回答了问题
2023-06-20 10:30:29
翻译模型有中英-base模型吗,现在只有英中-base
赞0
踩0
评论0
06.20
10:27:03
回答了问题
2023-06-20 10:27:03
ChatYuan回复长度限制怎么修改
赞0
踩0
评论0
06.20
10:20:52
回答了问题
2023-06-20 10:20:52
Distributed package doesn't have NCCL built in
赞0
踩0
评论0
2023年03月
03.23
14:42:02
回答了问题
2023-03-23 14:42:02
如何多卡 Finetuning PALM 2.0预训练生成模型?
赞0
踩0
评论0
03.23
14:40:58
回答了问题
2023-03-23 14:40:58
damo/nlp_gpt3_text-generation_2.7B,是环境版本问题吗,感觉问题好多
赞0
踩0
评论0
03.23
14:40:24
回答了问题
2023-03-23 14:40:24
使用大模型推理pipeline()方法时,如何传入top_k、top_p等参数控制生成内容
赞1
踩0
评论0
03.22
22:47:06
回答了问题
2023-03-22 22:47:06
现在不能下载了?加载报错
赞0
踩0
评论0
03.22
22:46:16
回答了问题
2023-03-22 22:46:16
GPT-3 13B参数的模型文件没有啊
赞0
踩0
评论0
03.22
22:44:31
回答了问题
2023-03-22 22:44:31
请问用自己的数据finetune了gpt3后 应该怎么用本地的checkpoint推理呢
赞0
踩0
评论0
03.22
22:41:21
回答了问题
2023-03-22 22:41:21
使用fp16半精度进行微调时,为啥 loss直接就为nan
赞0
踩0
评论0
03.22
22:40:32
回答了问题
2023-03-22 22:40:32
模型不开放下载的吗?
赞0
踩0
评论0
03.22
22:39:47
回答了问题
2023-03-22 22:39:47
GPT3-2.7B用8卡训练时意外中断,如何恢复训练
赞0
踩0
评论0
03.22
22:36:43
回答了问题
2023-03-22 22:36:43
请问下 gpt-13b 中文 什么时候开源呢?目前中文百亿的GPT好像都还没有开源的
赞0
踩0
评论0
03.22
22:35:51
回答了问题
2023-03-22 22:35:51
文本续写任务总是截断
赞0
踩0
评论0
03.22
22:34:58
回答了问题
2023-03-22 22:34:58
GPT-3预训练生成模型-中文-2.7B 运行报错
赞0
踩0
评论0
03.22
16:19:25
回答了问题
2023-03-22 16:19:25
modelscope的palm模型,对联生成模型训练的src_text通过什么算法确定?
赞0
踩0
评论0
03.08
11:25:14
回答了问题
2023-03-08 11:25:14
使用pipeline进行推理时无法指定输出文本长度
赞1
踩0
评论3
03.08
11:24:44
回答了问题
2023-03-08 11:24:44
载入gpt3进行生成如何设置参数
赞0
踩0
评论0
03.07
22:00:06
回答了问题
2023-03-07 22:00:06
再训练以后,导出模型如何进行推理
赞0
踩0
评论0
03.07
21:58:39
回答了问题
2023-03-07 21:58:39
有没有模型是支持多轮问答过程中执行一些API或者函数调用的?
赞0
踩0
评论0
03.07
21:50:39
回答了问题
2023-03-07 21:50:39
GPT3-13B 推理运行报错 NCCL
赞0
踩0
评论0
2023年02月
02.03
11:39:54
回答了问题
2023-02-03 11:39:54
GPT3中文30B模型怎么下载
赞0
踩0
评论1
02.03
11:38:14
回答了问题
2023-02-03 11:38:14
请问模型文件怎么下载到本地?
赞0
踩0
评论0
02.03
11:36:56
回答了问题
2023-02-03 11:36:56
哪种模型对闲聊型的聊天机器人表现比较好 求推荐
赞0
踩0
评论0
2022年12月
12.22
13:41:17
回答了问题
2022-12-22 13:41:17
GPT-3模型在评估时报错
赞0
踩0
评论0
12.15
11:15:09
回答了问题
2022-12-15 11:15:09
PLUG大模型是否会出精简版以提供训练呢?
赞0
踩0
评论1
12.14
11:26:48
回答了问题
2022-12-14 11:26:48
使用PALM-v2进行文本摘要训练完以后,使用训练的模型再进行预测,结果为空。
赞0
踩0
评论1
2022年11月
11.21
15:29:38
回答了问题
2022-11-21 15:29:38
本地跑文本分类代码,结果乱码,求解答。
赞0
踩0
评论0
11.10
14:10:15
回答了问题
2022-11-10 14:10:15
文本生成中长文本生成报错
赞0
踩0
评论1
11.09
11:21:14
回答了问题
2022-11-09 11:21:14
ocr识别pipeline支持批处理识别吗
赞0
踩0
评论0
11.09
09:29:11
回答了问题
2022-11-09 09:29:11
mPLUG图像描述模型是什么?
赞0
踩0
评论0
11.09
09:27:20
回答了问题
2022-11-09 09:27:20
mPLUG图像描述模型-中文-base 如何finetune得到的?
赞0
踩0
评论0
11.07
15:45:13
回答了问题
2022-11-07 15:45:13
训练GPT-3模型使用的数据集可以包含tgt_txt字段吗?
赞0
踩0
评论1
11.04
14:15:13
回答了问题
2022-11-04 14:15:13
智能客服领域,如何搭建FAQ问答系统?
赞0
踩0
评论0
11.04
14:14:13
回答了问题
2022-11-04 14:14:13
modelscope有哪些信息抽取的模型?
赞0
踩0
评论0
11.04
14:13:30
回答了问题
2022-11-04 14:13:30
预训练对话模型跟预训练语言模型有啥区别
赞1
踩0
评论0
11.04
14:12:24
回答了问题
2022-11-04 14:12:24
相对latex公式和文本这两个进行一起识别,可以用什么方式?
赞0
踩0
评论0
11.04
14:10:33
回答了问题
2022-11-04 14:10:33
modelscope的识别类模型支持gpu吗?
赞0
踩0
评论0
11.04
13:12:04
回答了问题
2022-11-04 13:12:04
基于 RoBERTa 的中文 Large 预训练模型为什么文件大小只有几百kb?如何获取完整模型文件
赞0
踩0
评论1
2022年10月
10.30
23:04:19
提交了问题
2022-10-30 23:04:19
中文GPT-3是1750亿参数吗
10.30
22:57:55
提交了问题
2022-10-30 22:57:55
有一个文本生成的场景,该用哪个模型训练呢
10.30
22:51:57
回答了问题
2022-10-30 22:51:57
如何快速上手GPT3?
赞0
踩0
评论0
10.30
22:49:13
回答了问题
2022-10-30 22:49:13
palm是否可以支持本地自定义数据集?
赞0
踩0
评论1
1
2
跳转至:
发表了文章
2022-08-10
AI模型教你写出秒抓读者眼球的好标题
正在加载, 请稍后...
滑动查看更多
回答了问题
2023-06-25
youku-mPLUG 预训练数据集下载报错
您好,抱歉给您带来使用问题,您可以去数据集的modelcard页面,更新到最新的modelscope库版本来解决这个问题
赞1
踩0
评论0
回答了问题
2023-06-20
ChatYuan-large-v2版本可以finetune吗?
您好,目前该模型还不支持finetune
赞0
踩0
评论0
回答了问题
2023-06-20
如何新增自己的训练集
您好,目前还暂时不支持chatyuan的训练功能,可以试用下其他相关的生成大模型,如GPT-3等系列,是支持自定义训练等
赞0
踩0
评论0
回答了问题
2023-06-20
自然语言搜索业务数据,应该使用文本相似度模型来实现么?
您好,可以试下space系列的text-to-sql相关的模型,返回sql语句
赞0
踩0
评论0
回答了问题
2023-06-20
ChatPLUG-13B什么时候发布呢
您好,感觉您对我们模型的认可,我们正在规划更大规模的模型(13B)开源
赞0
踩0
评论0
回答了问题
2023-06-20
执行速度为什么这么慢?跑一个示例程序要几百秒啊
您好,您这边的执行环境是怎么样的呢,是CPU还是GPU环境
赞0
踩0
评论0
回答了问题
2023-06-20
翻译模型有中英-base模型吗,现在只有英中-base
您好,我们目前只有中英的large模型,您可以先使用large模型,我们规划下base模型相关的上线
赞0
踩0
评论0
回答了问题
2023-06-20
ChatYuan回复长度限制怎么修改
您好,可以按照这个配置修改参数
赞0
踩0
评论0
回答了问题
2023-06-20
Distributed package doesn't have NCCL built in
您好,如果是 nccl 改 gloo 可以通过修改配置文件中的 megatron: { 'world_size': ... 'distributed_backend': 'gloo',
赞0
踩0
评论0
回答了问题
2023-03-23
如何多卡 Finetuning PALM 2.0预训练生成模型?
您好,这个是一个未知的bug,我们正在尝试复现和修复,很抱歉很您带来不便,修复完成后我们会第一时间通知您
赞0
踩0
评论0
回答了问题
2023-03-23
damo/nlp_gpt3_text-generation_2.7B,是环境版本问题吗,感觉问题好多
请您在 finetune 时确认传入的 trainer name 为 Trainers.gpt3_trainer,大模型训练时我们额外定义了一些并行相关的代码,使用 nlp_trainer 或 default 训练时会出现这一报错 trainer = build_trainer(name=Trainers.gpt3_trainer, default_args=kwargs)
赞0
踩0
评论0
回答了问题
2023-03-23
使用大模型推理pipeline()方法时,如何传入top_k、top_p等参数控制生成内容
在 1.4.1 版本后 palm,gpt3 等生成模型可以直接在 pipeline 中传入生成参数,例如: pipe = pipeline(Tasks.text_generation, model=model_id) print(pipe('示例输入', top_p=0.95, temperature=0.9, max_length=1024)) 后续我们会完善文本生成相关文档~
赞0
踩0
评论0
回答了问题
2023-03-22
现在不能下载了?加载报错
您好,您指的是哪个模型呢,模型下载是缓存在cache目录
赞0
踩0
评论0
回答了问题
2023-03-22
GPT-3 13B参数的模型文件没有啊
您好,目前13B模型暂不支持下载,感谢您的关注
赞0
踩0
评论0
回答了问题
2023-03-22
请问用自己的数据finetune了gpt3后 应该怎么用本地的checkpoint推理呢
您好,直接修改pipeline load的模型路径为本地checkpoint即可 p = pipeline(Tasks.text_generation, model=dir)
赞0
踩0
评论0
回答了问题
2023-03-22
使用fp16半精度进行微调时,为啥 loss直接就为nan
您好,您使用的是哪个模型呢
赞0
踩0
评论0
回答了问题
2023-03-22
模型不开放下载的吗?
您好,您指的是GPT-3模型吗,目前GPT-3开源可支持下载训练的最大模型是2.7B,
赞0
踩0
评论0
回答了问题
2023-03-22
GPT3-2.7B用8卡训练时意外中断,如何恢复训练
您好,与文档中load模型类似,checkpoint_path 只需填写到 os.path.join(self.tmp_dir, 'epoch_1'),或是 iter_xxx 这一级即可,不用添加 .pth 后缀,读取过程后面会自动拼接文件名
赞0
踩0
评论0
回答了问题
2023-03-22
请问下 gpt-13b 中文 什么时候开源呢?目前中文百亿的GPT好像都还没有开源的
您好,目前暂时还没有开源的计划,有开源我们会第一时间在用户群通知~,感谢您的关注
赞0
踩0
评论0
提交了问题
2022-10-30
中文GPT-3是1750亿参数吗
正在加载, 请稍后...
滑动查看更多
正在加载, 请稍后...
暂无更多信息