开发者社区> 问答> 正文

能不能举例说明多轮对话复用KV cache策略的应用场景?

能不能举例说明多轮对话复用KV cache策略的应用场景?

展开
收起
花开富贵111 2024-05-23 17:32:55 26 0
1 条回答
写回答
取消 提交回答
  • 多轮对话复用KV cache策略的应用场景包括两类:一是问答类的场景,每次请求模型时会拼接之前的问答;二是LangChain应用,它在模型生成结束后会调用外部插件,拼接插件返回的结果再次请求模型。在这两类场景中,由于前一轮对话的输出构成后一轮对话输入的一部分,或者存在较长的公共前缀,因此可以通过复用KV cache来减少FTT。

    2024-05-23 17:48:16
    赞同 1 展开评论 打赏
问答地址:
问答排行榜
最热
最新

相关电子书

更多
低代码开发师(初级)实战教程 立即下载
冬季实战营第三期:MySQL数据库进阶实战 立即下载
阿里巴巴DevOps 最佳实践手册 立即下载