开发者社区> 问答> 正文

能不能描述下投机采样的设计思路及其在RTP-LLM中的实现方式?

能不能描述下投机采样的设计思路及其在RTP-LLM中的实现方式?

展开
收起
花开富贵111 2024-05-23 17:32:59 36 0
1 条回答
写回答
取消 提交回答
  • 投机采样的设计思路基于两点认知:部分token生成难度低,可以用小模型生成;在小批次情况下,大模型的前向推理时间主要受加载模型权重影响。在RTP-LLM中,我们基于论文思路使用大小模型进行了投机采样的实践。代码设计上考虑系统可维护性,与原始流程解耦,封装了一层编排层提供统一API,内部组织参数顺序调用正常流程。

    2024-05-23 17:49:46
    赞同 2 展开评论 打赏
问答标签:
问答地址:
问答排行榜
最热
最新

相关电子书

更多
PAI灵骏智算 构建全链路LLM服务的最佳实践 立即下载
低代码开发师(初级)实战教程 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载