OpenDeepResearcher:开源 AI 研究工具,自动完成搜索、评估、提取和生成报告

简介: OpenDeepResearcher 是一款开源 AI 研究工具,支持异步处理、去重功能和 LLM 驱动的决策,帮助用户高效完成复杂的信息查询和分析任务。

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日分享大模型与 AI 领域的最新开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦


🚀 快速阅读

  1. 工具介绍:OpenDeepResearcher 是一款开源 AI 研究工具,能自动完成从搜索到报告生成的全过程。
  2. 主要功能:支持迭代研究循环、异步处理、去重功能和 LLM 驱动的决策。
  3. 技术原理:利用 SERPAPI、Jina 和 OpenRouter 提供的 LLM 进行搜索、数据获取和推理。

正文(附运行示例)

OpenDeepResearcher 是什么

OpenDeepResearcher

OpenDeepResearcher 是一款开源的 AI 研究工具,旨在帮助用户高效地完成复杂的信息查询和分析任务。基于迭代搜索和推理,系统能够自动从网络中获取相关数据,并生成综合报告。用户只需输入研究主题,系统即可自动完成搜索、评估、提取和报告生成的全过程。这使得 OpenDeepResearcher 成为金融、科学、政策和工程等领域研究人员的理想选择,提供了低成本且高效的解决方案。

OpenDeepResearcher 支持异步处理,显著提高了处理速度和效率。此外,系统具备去重功能,避免重复处理相同内容,进一步节省时间和资源。通过大型语言模型(LLM)驱动的决策,系统能够生成高质量的搜索查询、评估页面的相关性、提取关键信息,并最终生成详细的综合报告。

OpenDeepResearcher 的主要功能

  • 迭代研究循环:根据用户输入的研究主题,系统生成初始搜索查询,并在每次迭代中逐步细化研究范围,直到满足研究目标或达到设定的迭代次数。
  • 异步处理:搜索、网页抓取、页面评估和上下文提取等操作并行执行,显著提高处理速度和效率。
  • 去重功能:系统自动聚合和去重链接,避免重复处理相同的网页内容,节省时间和资源。
  • LLM 驱动的决策:使用大型语言模型(LLM)生成搜索查询、评估页面的相关性、提取关键信息,并生成最终的综合报告。

OpenDeepResearcher 的技术原理

  • 搜索与数据获取:使用 SERPAPI 进行 Google 搜索,快速获取与用户查询相关的网页链接。基于 Jina 提取网页内容,将 HTML 网页转换为适合 LLM 处理的纯文本格式。
  • LLM 驱动的推理:使用 OpenRouter 提供的 LLM(如 anthropic/claude-3.5-haiku)进行自然语言处理和推理。LLM 负责生成搜索查询、评估网页的相关性、提取关键信息,并决定是否需要进一步的搜索。
  • 迭代优化:系统将每次迭代获取的信息反馈给 LLM,根据 LLM 的评估结果生成新的搜索查询,逐步优化研究结果。
  • 异步处理与去重:使用 nest_asyncio 等异步编程技术,实现搜索、抓取、评估和提取的并行处理。基于去重机制,避免重复处理相同的链接,提高效率。

如何运行 OpenDeepResearcher

1. 克隆或打开 Notebook

下载 Notebook 文件或直接在Google Colab中打开。

OpenDeepResearcher-colab

2. 安装 nest_asyncio

运行第一个代码单元格以安装 nest_asyncio

3. 配置 API 密钥

将笔记本中的 OPENROUTER_API_KEYSERPAPI_API_KEYJINA_API_KEY 替换为你的实际 API 密钥。

4. 运行 Notebook 单元格

依次执行所有单元格。系统将提示你输入:

  • 研究查询/主题。
  • 可选的最大迭代次数(默认为 10)。

5. 跟随研究过程

  • 初始查询与搜索生成:系统使用 LLM 生成初始搜索查询。
  • 异步搜索与提取:系统并发执行 SERPAPI 搜索,聚合唯一链接,并并行处理每个链接以确定页面的相关性和提取相关信息。
  • 迭代优化:每次迭代后,系统将聚合的上下文传递给 LLM,判断是否需要进一步的搜索查询。
  • 最终报告生成:一旦 LLM 表示无需进一步研究(或达到迭代限制),系统将生成最终的综合报告。

6. 查看最终报告

最终的综合报告将在输出中显示。

资源


❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日分享大模型与 AI 领域的最新开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦

相关文章
|
4月前
|
人工智能 运维 Java
Spring AI Alibaba Admin 开源!以数据为中心的 Agent 开发平台
Spring AI Alibaba Admin 正式发布!一站式实现 Prompt 管理、动态热更新、评测集构建、自动化评估与全链路可观测,助力企业高效构建可信赖的 AI Agent 应用。开源共建,现已上线!
5768 79
|
4月前
|
机器学习/深度学习 人工智能 算法
AI可以做电商主图了:技术原理,AI电商图生成工具对比及技术解析
双十一临近,电商主图需求激增。AI技术凭借多图融合、扩散模型等,实现高效智能设计,30秒生成高质量主图,远超传统PS效率。支持风格迁移、背景替换、文案生成,助力商家快速打造吸睛商品图,提升转化率。
1367 0
|
4月前
|
人工智能 缓存 运维
【智造】AI应用实战:6个agent搞定复杂指令和工具膨胀
本文介绍联调造数场景下的AI应用演进:从单Agent模式到多Agent协同的架构升级。针对复杂指令执行不准、响应慢等问题,通过意图识别、工具引擎、推理执行等多Agent分工协作,结合工程化手段提升准确性与效率,并分享了关键设计思路与实践心得。
799 20
【智造】AI应用实战:6个agent搞定复杂指令和工具膨胀
|
4月前
|
人工智能 自然语言处理 Shell
我们开源了一款 AI 驱动的用户社区
KoalaQA 是一款开源的 AI 驱动用户社区,支持智能问答、语义搜索、自动运营与辅助创作,助力企业降低客服成本,提升响应效率与用户体验。一键部署,灵活接入大模型,快速构建专属售后服务社区。
467 5
我们开源了一款 AI 驱动的用户社区
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
双 11 电商效率突围:10 款 AI 工具的技术落地与实践指南
2025年双11促销长达38天,电商迎来AI重构关键期。本文剖析10款主流AI工具技术原理,涵盖设计、文案、投放、客服等场景,揭示计算机视觉、自然语言处理等技术如何驱动电商智能化升级,助力企业高效应对大促挑战。
824 1
|
4月前
|
消息中间件 人工智能 安全
云原生进化论:加速构建 AI 应用
本文将和大家分享过去一年在支持企业构建 AI 应用过程的一些实践和思考。
1116 51
|
5月前
|
人工智能 安全 中间件
阿里云 AI 中间件重磅发布,打通 AI 应用落地“最后一公里”
9 月 26 日,2025 云栖大会 AI 中间件:AI 时代的中间件技术演进与创新实践论坛上,阿里云智能集团资深技术专家林清山发表主题演讲《未来已来:下一代 AI 中间件重磅发布,解锁 AI 应用架构新范式》,重磅发布阿里云 AI 中间件,提供面向分布式多 Agent 架构的基座,包括:AgentScope-Java(兼容 Spring AI Alibaba 生态),AI MQ(基于Apache RocketMQ 的 AI 能力升级),AI 网关 Higress,AI 注册与配置中心 Nacos,以及覆盖模型与算力的 AI 可观测体系。
1203 60
|
4月前
|
人工智能 运维 Kubernetes
Serverless 应用引擎 SAE:为传统应用托底,为 AI 创新加速
在容器技术持续演进与 AI 全面爆发的当下,企业既要稳健托管传统业务,又要高效落地 AI 创新,如何在复杂的基础设施与频繁的版本变化中保持敏捷、稳定与低成本,成了所有技术团队的共同挑战。阿里云 Serverless 应用引擎(SAE)正是为应对这一时代挑战而生的破局者,SAE 以“免运维、强稳定、极致降本”为核心,通过一站式的应用级托管能力,同时支撑传统应用与 AI 应用,让企业把更多精力投入到业务创新。
608 30
|
4月前
|
设计模式 人工智能 自然语言处理
3个月圈粉百万,这个AI应用在海外火了
不知道大家还记不记得,我之前推荐过一个叫 Agnes 的 AI 应用,也是当时在 WAIC 了解到的。
598 1

热门文章

最新文章