智能文档检索和简便集成的开源 AI 问答工具:Danswer

简介: 当你使用 Danswer 时,只需以自然的方式提出问题,就像与朋友交谈一样简单,它会自动搜索公司内部的文件和资料,然后给你一个可靠的答案,并附上来源。

Danswer 是一个开源企业问答工具。当你使用 Danswer 时,只需以自然的方式提出问题,就像与朋友交谈一样简单,它会自动搜索公司内部的文件和资料,然后给你一个可靠的答案,并附上来源。除此之外,Danswer 还可以和其他常用的工具一起使用,比如 Slack、GitHub、Confluence 等。这样你可以更方便地获取答案,同时也可以和团队成员一起分享和讨论。

640.png

功能特性

  • answer 提供直接问答功能,它由生成式 AI 模型驱动,所得答案都有引用和来源链接支持。
  • 智能文档检索采用最新的 LLMs 进行语义搜索和重新排序。
  • AI 助手由定制的深度学习模型支持,可以解释用户意图。
  • 已包含用户认证和文档级别的访问管理功能。
  • 可以连接到 Slack、GitHub、GoogleDrive、Confluence、本地文件和网络爬虫等,未来还会添加更多连接方式。
  • 管理仪表盘可以管理连接器,并设置功能,比如实时更新获取。
  • 只需一行 Docker Compose(或 Kubernetes)命令,即可在任何地方部署 Danswer。

快速开始

要求:
git
带有 compose 的 docker(docker 版本 >= 1.13.0)

  1. 克隆 Danswer 存储库:
    git clone https://github.com/danswer-ai/danswer.git
    
  2. 导航到 danswer/deployment/docker_compose

  3. 打开 docker 引擎并运行:

  • 要从 DockerHub 提取镜像并运行 Danswer:
    docker compose -f docker-compose.dev.yml -p danswer-stack up -d --pull always --force-recreate
    
  • 或者,要从源代码构建容器并启动 Danswer,运行:
    docker compose -f docker-compose.dev.yml -p danswer-stack up -d --build --force-recreate
    
  • 如果更新了任何.env 变量,这些命令也可用于重新部署
  • 可能需要 15 分钟以上,具体取决于网速

OpenAI API 密钥

注意:首次访问时,Danswer 将提示输入 OpenAI API 密钥。如果没有这个,Danswer 将能够提供搜索功能,但不能提供直接的问答功能。

可以在以下位置获取 OpenAI API 密钥:https: //platform.openai.com/account/api-keys

索引文档

快速将公开可访问的网站添加到 Danswer 中,无需任何额外的授权设置。

1、导航至 Danswer 主屏幕的右上角并选择管理面板

640 (1).png

2、在 Web Connector 仪表板中,选择要索引的任何基本 URL。

  • 这将为可通过超链接访问的基本 URL 下的所有页面建立索引
  • 可以检查索引状态页面以监控进度

640 (2).png

3、页面编入索引后,现在可以导航回主页并开始提出问题并获取答案!

640 (3).png

传送门

开源协议:MIT

开源地址:https://github.com/danswer-ai/danswer

关注微信公众号「开源技术专栏」了解更多!


相关文章
|
8天前
|
机器学习/深度学习 人工智能 自然语言处理
DeepSeek Artifacts:在线实时预览的前端 AI 编程工具,基于DeepSeek V3快速生成React App
DeepSeek Artifacts是Hugging Face推出的免费AI编程工具,基于DeepSeek V3,支持快速生成React和Tailwind CSS代码,适合快速原型开发和前端组件构建。
189 28
DeepSeek Artifacts:在线实时预览的前端 AI 编程工具,基于DeepSeek V3快速生成React App
|
5天前
|
人工智能 供应链 PyTorch
TimesFM 2.0:用 AI 预测流量、销量和金融市场等走势!谷歌开源超越统计方法的预测模型
TimesFM 2.0 是谷歌研究团队开源的时间序列预测模型,支持长达2048个时间点的单变量预测,具备零样本学习能力,适用于零售、金融、交通等多个领域。
73 23
TimesFM 2.0:用 AI 预测流量、销量和金融市场等走势!谷歌开源超越统计方法的预测模型
|
6天前
|
机器学习/深度学习 人工智能 自然语言处理
Agent Laboratory:AI自动撰写论文,AMD开源自动完成科研全流程的多智能体框架
Agent Laboratory 是由 AMD 和约翰·霍普金斯大学联合推出的自主科研框架,基于大型语言模型,能够加速科学发现、降低成本并提高研究质量。
102 23
Agent Laboratory:AI自动撰写论文,AMD开源自动完成科研全流程的多智能体框架
|
5天前
|
人工智能 文字识别 异构计算
NVIDIA-Ingest:英伟达开源智能文档提取及结构化工具,支持 GPU 加速和并行处理
NVIDIA-Ingest 是英伟达开源的智能文档提取工具,支持 PDF、Word、PPT 等多种格式,提供并行处理和 GPU 加速,适用于企业内容管理和生成式应用。
60 18
NVIDIA-Ingest:英伟达开源智能文档提取及结构化工具,支持 GPU 加速和并行处理
|
6天前
|
人工智能 资源调度 JavaScript
PPTAgent:中科院开源AI工具,自动将文档转化为高质量PPT
PPTAgent 是中科院推出的自动生成演示文稿框架,基于两阶段编辑方法,支持智能分析、大纲生成、幻灯片生成与评估,适用于教育、企业培训等多种场景。
166 18
PPTAgent:中科院开源AI工具,自动将文档转化为高质量PPT
|
3天前
|
人工智能 运维 Serverless
低成本 Serverless AI 检索介绍和实验
本文介绍了低成本Serverless AI检索技术,分为四部分:1) AI检索介绍,通过电商客服案例展示AI检索的应用和优势;2) 表格存储介绍,详细解释了表格存储的结构化数据处理能力及其在AI检索中的作用;3) 实验:RAG,通过具体实验演示基于表格存储的RAG流程及效果;4) 总结,强调向量检索、易用性和丰富的接口特性。整体内容展示了如何利用Serverless架构实现高效、低成本的AI检索解决方案。
|
4天前
|
人工智能 Cloud Native 大数据
云+AI开启算力新时代,共建开源开放生态赴未来 | 2024龙蜥大会主论坛
本次分享的主题是云 + AI开启算力新时代,共建开源开放生态赴未来 | 2024龙蜥大会主论坛,由阿里巴巴集团合伙人、阿里云基础设施事业部总经理蒋江伟分享。
|
2月前
|
人工智能 自然语言处理 机器人
文档智能与RAG技术如何提升AI大模型的业务理解能力
随着人工智能的发展,AI大模型在自然语言处理中的应用日益广泛。文档智能和检索增强生成(RAG)技术的兴起,为模型更好地理解和适应特定业务场景提供了新方案。文档智能通过自动化提取和分析非结构化文档中的信息,提高工作效率和准确性。RAG结合检索机制和生成模型,利用外部知识库提高生成内容的相关性和准确性。两者的结合进一步增强了AI大模型的业务理解能力,助力企业数字化转型。
136 3
|
2月前
|
人工智能 JSON API
阿里云文档智能 & RAG解决方案:提升AI大模型业务理解与应用
阿里云推出的文档智能 & RAG解决方案,旨在通过先进的文档解析技术和检索增强生成(RAG)方法,显著提升人工智能大模型在业务场景中的应用效果。该方案通过文档智能(Document Mind)技术将非结构化文档内容转换为结构化数据,提取文档的层级树、样式和版面信息,并输出为Markdown和Json格式,为RAG提供语义分块策略。这一过程不仅解决了文档内容解析错误和切块丢失语义信息的问题,还优化了输出LLM友好的Markdown信息。方案的优势在于其多格式支持能力,能够处理包括Office文档、PDF、Html、图片在内的主流文件类型,返回文档的样式、版面信息和层级树结构。
192 2
|
3月前
|
机器学习/深度学习 数据采集 人工智能
文档智能 & RAG 让AI大模型更懂业务 —— 阿里云LLM知识库解决方案评测
随着数字化转型的深入,企业对文档管理和知识提取的需求日益增长。阿里云推出的文档智能 & RAG(Retrieval-Augmented Generation)解决方案,通过高效的内容清洗、向量化处理、精准的问答召回和灵活的Prompt设计,帮助企业构建强大的LLM知识库,显著提升企业级文档管理的效率和准确性。

热门文章

最新文章