产品
解决方案
文档与社区
权益中心
定价
云市场
合作伙伴
支持与服务
了解阿里云
AI 助理
备案
控制台
开发者社区
首页
计算机视觉
自然语言处理
语音
多模态
科学计算
魔搭社区官网
探索云世界
新手上云
云上应用构建
云上数据管理
云上探索人工智能
云计算
弹性计算
无影
存储
网络
倚天
云原生
容器
serverless
中间件
微服务
可观测
消息队列
数据库
关系型数据库
NoSQL数据库
数据仓库
数据管理工具
PolarDB开源
向量数据库
热门
百炼大模型
Modelscope模型即服务
弹性计算
云原生
数据库
云效DevOps
龙蜥操作系统
平头哥
钉钉开放平台
物联网
大数据
大数据计算
实时数仓Hologres
实时计算Flink
E-MapReduce
DataWorks
Elasticsearch
机器学习平台PAI
智能搜索推荐
数据可视化DataV
人工智能
机器学习平台PAI
视觉智能开放平台
智能语音交互
自然语言处理
多模态模型
pythonsdk
通用模型
开发与运维
云效DevOps
钉钉宜搭
支持服务
镜像站
码上公益
开发者社区
>
ModelScope模型即服务
>
自然语言处理
>
正文
使用fp16半精度进行微调时,为啥 loss直接就为nan
使用fp16半精度进行微调时,为啥 loss直接就为nan
展开
收起
GPT-3预训练生成模型-中文-2.7B
萧瑟的味道
2023-03-14 19:58:15
811
0
1
条回答
写回答
取消
提交回答
木子李炼丹术
您好,您使用的是哪个模型呢
2023-03-22 22:42:16
赞同
展开评论
打赏
相关问答
自然语言处理
域名在腾讯云备案成功,解析到阿里云服务器,提示仍需备案?
55799
29
0
this xml file does not appear to have any style in
30239
8
0
如果购买了域名,一定要备案才能用吗
36757
35
0
OSS的endpoint如何查看
29723
3
0
办理ICP经营许可证,需要网络接入协议,去哪下载
3449
2
0
企业邮箱
8727
7
0
com/action/joingroup?code=v1是什么意思
205542
20
0
有哪些值得收藏的五个种子搜索引擎&磁力搜索引擎?
92614
16
0
配置了安全组规则,端口还是无法访问
27400
21
0
支付宝H5 下载的时候,提示 【请确保该下载文件来源安全,如需浏览,请长按网址复制后使用浏览器访问】
229185
10
0
ModelScope模型即服务
自然语言处理
包含命名实体识别、文本分类、分词、关系抽取、问答、推理、文本摘要、情感分析、机器翻译等多个领域
我要提问
热门讨论
热门文章
modelscope-funasr的FunClip怎么安装的?
2296
练的pth模型文件,怎么转成bin文件?
980
为啥都不能很好的处理文本鉴黄
19
如何下载llama模型到本地?
2906
gpt3,加载数据时,MsDataset.load报错
1246
modelscope-funasr有说话人分离功能吗?
281
modelscope-funasr怎么使用 gpu 加速啊?
523
modelscope-funasr在安卓平台可以集成sense voice吗?
203
怎么抽取GPT-3 预训练模型的emb向量?
1609
modelscope-funasr有没有开源的语音唤醒,自定义唤醒?
451
展开全部
智胜未来:国内大模型+Agent应用案例精选,以及主流Agent框架开源项目推荐
2157
Micro LLAMA:教学版 LLAMA 3模型实现,用于学习大模型的核心原理
61
O1-CODER:北交大推出的O1代码版开源项目,专注于编码任务
47
Amurex:开源AI会议助手,提供实时建议、智能摘要、快速回顾关键信息
39
Llama 3.3:Meta AI 开源新的纯文本语言模型,专注于多语言对话优化
36
LLM 大模型学习必知必会系列(二):提示词工程-Prompt Engineering 以及实战闯关
1004
Perplexideez:开源本地 AI 搜索助手,智能搜索信息来源追溯
41
Vanna:开源 AI 检索生成框架,自动生成精确的 SQL 查询
53
LLM 大模型学习必知必会系列(一):大模型基础知识篇
1455
2024年6月118篇代码大模型论文最全整理
778
展开全部
相关文章
Director:构建视频智能体的 AI 框架,用自然语言执行搜索、编辑、合成和生成等复杂视频任务
DeepSeek-V2.5-1210 在线开放使用!支持联网搜索,在各大领域的表现得到全面提升
EXAONE 3.5:LG 推出的开源 AI 模型,采用 RAG 和多步推理能力降低模型的幻觉问题
如何构建媲美通义千问在线接口的qwen-max智能体
转载:【AI系统】AI的领域、场景与行业应用
相关电子书
更多
低代码开发师(初级)实战教程
立即下载
冬季实战营第三期:MySQL数据库进阶实战
立即下载
阿里巴巴DevOps 最佳实践手册
立即下载