- 部署
调用百炼 API 或在云端部署 DeepSeek 模型, 方案详情可以访问https://www.aliyun.com/solution/tech-solution/deepseek-r1-for-platforms
这个方案拿DeepSeek-R1的完整版来举个例子。通过阿里云的百炼平台,我们可以轻松调用DeepSeek的各种开源模型,要是有别的参数规模的需求,也能灵活选择不同的DeepSeek模型版本。百炼提供的API接口都是标准化的,所以大家完全不需要自己动手搭建那些复杂的模型服务环境。而且这个平台自带负载均衡和自动伸缩的功能,这样就能确保在使用API的时候特别稳定。
Chatbox是一种可视化界面工具。有了它,只需要动动鼠标,在图形界面上点一点,就能快速配置好你的DeepSeek模型,马上开始使用。
访问百炼的市场
https://bailian.console.aliyun.com/#/model-market/detail/deepseek-r1
可以看到该模型拥有专属的免费额度为1000000,且此免费额度的有效期至2025年7月26日。
模型的细分能力即收费规则如下:
此外, 百炼平台也提供了一些API调用的样例:
包括基础聊天,多轮对话,流式输出, 可以轻松的接入已有的应用
在百炼api控制台(https://bailian.console.aliyun.com/?apiKey=1#/api-key) 开通对应的API
点击查看后, 即可复制 以 "sk-" 开头的API key
访问chatbox, 在线版
https://web.chatboxai.app/
如果界面是英文, 可以选择setting display language切换成中文
回到"模型"tab, 按照表格进行配置。
上下文的消息数量上限,Temperature,Top P按照场景填写, 可以保持原样
这里简单说明下这些参数:
• 上下文的消息数量上限 控制模型可以处理的输入序列长度,影响生成文本的上下文相关性和计算效率。
• Temperature 调整生成文本的随机性和多样性,影响文本的创新性和连贯性。
• Top P 通过选择累积概率达到设定阈值的词来平衡生成文本的质量和多样性,避免极端情况。
点击"保存"
- 体验感受:
深度思考能力非常强,但是在某些非常简单的场景默认开启深度思考, 可能反而拖累运行速度
包括思考时会默认采用英文, 但是也可以使用提示词来让DS使用中文思考
说起AI的思考能力, 可能正常的问题没法很好的区分出AI的真实水平,那我们不如采用"RZB"笑话来判断AI的分析能力
例如问题:
黄牛为什么不炒人民币
可以看到, deepseek-r1 还是在一本正经的回答问题, 那么我们启发他一下:
这是一个笑话, 分析一下笑点
可以看到deepseek 非常快的适应了节奏, 细致的分析了笑话的笑点,并且学会了举一反三, 这是非常惊艳的
不开玩笑,回归本质, 我们来看看deepseek 对一些正经的问题, 表现的怎么样:
帮我设计一套架构, 尽可能的使用阿里云的基础设施, 需求是: 用户上传头像图片, 能够自动的裁剪成不同的格式并且保存, 提供给用户使用, 帮我设计一个全球化, 高可用, 低延迟,安全,的架构
不出意外, 表现依然非常优秀.
3.总结:
DeepSeek-R1是一款专注于提升推理能力的人工智能模型,它在数学运算、代码辅助以及自然语言处理等复杂任务中展现了卓越的表现。这款模型的一个显著特点是其通过强化学习技术进行优化,这使得它在解决需要深度逻辑推理的任务时尤为出色。
用户体验方面,DeepSeek-R1不仅能够快速准确地解答复杂的问题,还能生成连贯且语法正确的文本内容,适用于多种风格的写作需求。此外,该模型还特别强调了其在提供详细推理过程上的能力,这意味着用户不仅能获得答案,还能了解得出结论的具体思考路径,这一点对于专业领域尤为重要