HELLO_JOEY_个人页

个人头像照片 HELLO_JOEY
个人头像照片
1
0
0

个人介绍

暂无个人介绍

擅长的技术

获得更多能力
通用技术能力:

暂时未有相关通用技术能力~

云产品技术能力:

暂时未有相关云产品技术能力~

阿里云技能认证

详细说明
暂无更多信息

2025年02月

  • 02.09 20:41:46
    发表了文章 2025-02-09 20:41:46

    DeepSeek-R1:Incentivizing Reasoning Capability in LLMs via Reinforcement Learning论文解读

    DeepSeek团队推出了第一代推理模型DeepSeek-R1-Zero和DeepSeek-R1。DeepSeek-R1-Zero通过大规模强化学习训练,展示了卓越的推理能力,但存在可读性和语言混合问题。为此,团队引入多阶段训练和冷启动数据,推出性能与OpenAI-o1-1217相当的DeepSeek-R1,并开源了多个密集模型。实验表明,DeepSeek-R1在多项任务上表现出色,尤其在编码任务上超越多数模型。未来研究将聚焦提升通用能力和优化提示工程等方向。
  • 发表了文章 2025-02-09

    DeepSeek-R1:Incentivizing Reasoning Capability in LLMs via Reinforcement Learning论文解读

正在加载, 请稍后...
滑动查看更多
正在加载, 请稍后...
暂无更多信息
正在加载, 请稍后...
暂无更多信息