PPTAgent:中科院开源AI工具,自动将文档转化为高质量PPT

本文涉及的产品
图像搜索,7款服务类型 1个月
简介: PPTAgent 是中科院推出的自动生成演示文稿框架,基于两阶段编辑方法,支持智能分析、大纲生成、幻灯片生成与评估,适用于教育、企业培训等多种场景。

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日分享大模型与 AI 领域的最新开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦


🚀 快速阅读

  1. 功能:PPTAgent 支持从文档自动生成高质量演示文稿,涵盖大纲生成、幻灯片设计与内容评估。
  2. 技术:基于两阶段编辑方法,结合大型语言模型(LLM)实现智能分析与迭代优化。
  3. 应用:适用于教育、企业培训、市场营销等多个领域,提升演示文稿生成效率与质量。

正文(附运行示例)

PPTAgent 是什么

PPTagent-advanced

PPTAgent 是由中国科学院软件研究所中文信息处理实验室推出的创新框架,旨在通过模仿人类工作流程的两阶段编辑方法,从文档自动生成高质量的演示文稿。该框架通过分析参考演示文稿,提取结构模式和内容模式,并基于代码动作草拟大纲并生成幻灯片,确保内容的一致性和对齐。

PPTAgent 基于大型语言模型(LLM)的能力,将演示文稿生成过程分解为迭代的编辑工作流程,从而提高生成演示文稿的连贯性和适应性。此外,PPTAgent 还引入了 PPT Eval 评估框架,从内容、设计和连贯性三个维度全面评估生成的演示文稿质量,为未来的演示文稿生成研究提供宝贵的资源和见解。

PPTAgent 的主要功能

  • 分析参考演示文稿:理解其结构模式和内容模式。
  • 草拟大纲:基于分析结果,创建详细的演示文稿大纲。
  • 生成幻灯片:基于代码动作,将大纲转化为具体的幻灯片内容,确保内容的一致性和对齐。
  • 编辑和修正:提供反馈机制,对生成的幻灯片进行编辑和自我修正,提高生成文稿的质量。
  • 综合评估:基于 PPT Eval 框架,从内容、设计和连贯性三个维度评估生成的演示文稿质量。

PPTAgent 的技术原理

  • 第一阶段:演示文稿分析

    • 幻灯片聚类:将幻灯片分为结构幻灯片和内容幻灯片,分别通过 LLM 和层次聚类方法进行分析。
    • 模式提取:利用 LLM 的情境感知能力,提取多样化的内容模式,确保编辑的目的性。
  • 第二阶段:演示文稿生成

    • 大纲生成:指导 LLM 创建结构化大纲,结合文档内容和参考演示文稿的语义信息。
    • 幻灯片生成:在大纲指导下,基于迭代编辑参考幻灯片生成新幻灯片,并通过 API 支持文本和视觉元素的编辑。

如何运行 PPTAgent

运行该项目一般需要以下几个步骤,确保你已经安装了 Node.js 和 npm(或 yarn)。以下是详细的步骤:

1. 安装 Node.js 和 npm(如未安装)

Vue 项目依赖于 Node.js 环境。如果你还没有安装 Node.js,可以访问 Node.js 官网 下载并安装适合你操作系统的版本。npm 会随 Node.js 一起安装。

2. 克隆该项目到本地运行环境

git clone https://github.com/icip-cas/PPTAgent.git

3. 进入项目目录

进入到项目web_ui目录。例如:

cd PPTAgent/pptagent_ui

4. 安装依赖

在项目目录下运行以下命令来安装项目所需的依赖包:

npm install
# 或者使用 yarn
# yarn install

5. 运行开发服务器

安装完依赖后,你可以通过以下命令启动开发服务器:

npm run serve
# 或者使用 yarn
# yarn serve

这将启动一个本地开发服务器,默认情况下会在 http://localhost:8080 提供项目。你可以通过浏览器访问这个地址来查看你的 Vue 应用。

如何使用 PPTAgent 评估生成的 PPT

1. 安装依赖

pip install -r requirements.txt
sudo apt install libreoffice
sudo apt install poppler-utils

2. 生成演示文稿

python rebuild.py rebuild_all --out_filename "final.pptx"

3. 将 PPT 转换为图片

python evals.py pptx2images

4. 评估演示文稿

python evals.py eval_experiment -s 0 -j 0

资源


❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发非常感兴趣,我会每日分享大模型与 AI 领域的最新开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦

相关文章
|
3天前
|
机器学习/深度学习 人工智能 自然语言处理
DeepSeek Artifacts:在线实时预览的前端 AI 编程工具,基于DeepSeek V3快速生成React App
DeepSeek Artifacts是Hugging Face推出的免费AI编程工具,基于DeepSeek V3,支持快速生成React和Tailwind CSS代码,适合快速原型开发和前端组件构建。
139 28
DeepSeek Artifacts:在线实时预览的前端 AI 编程工具,基于DeepSeek V3快速生成React App
|
1天前
|
机器学习/深度学习 人工智能 自然语言处理
Agent Laboratory:AI自动撰写论文,AMD开源自动完成科研全流程的多智能体框架
Agent Laboratory 是由 AMD 和约翰·霍普金斯大学联合推出的自主科研框架,基于大型语言模型,能够加速科学发现、降低成本并提高研究质量。
75 23
Agent Laboratory:AI自动撰写论文,AMD开源自动完成科研全流程的多智能体框架
|
5天前
|
数据采集 人工智能 算法
Seer:上海 AI Lab 与北大联合开源端到端操作模型,结合视觉预测与动作执行信息,使机器人任务提升成功率43%
Seer是由上海AI实验室与北大等机构联合推出的端到端操作模型,结合视觉预测与动作执行,显著提升机器人任务成功率。
41 20
Seer:上海 AI Lab 与北大联合开源端到端操作模型,结合视觉预测与动作执行信息,使机器人任务提升成功率43%
|
18天前
|
机器学习/深度学习 人工智能 自动驾驶
企业内训|AI大模型在汽车行业的前沿应用研修-某汽车集团
本课程是TsingtaoAI为某汽车集团高级项目经理设计研发,课程全面系统地解析AI的发展历程、技术基础及其在汽车行业的深度应用。通过深入浅出的理论讲解、丰富的行业案例分析以及实战项目训练,学员将全面掌握机器学习、深度学习、NLP与CV等核心技术,了解自动驾驶、智能制造、车联网与智能营销等关键应用场景,洞悉AI技术对企业战略布局的深远影响。
166 97
|
8天前
|
机器学习/深度学习 人工智能 算法
AI在体育分析与预测中的深度应用:变革体育界的智能力量
AI在体育分析与预测中的深度应用:变革体育界的智能力量
67 31
|
3天前
|
人工智能 运维 负载均衡
智能运维新时代:AI在云资源管理中的应用与实践
智能运维新时代:AI在云资源管理中的应用与实践
69 23
|
15天前
|
机器学习/深度学习 人工智能 自然语言处理
CogAgent-9B:智谱 AI 开源 GLM-PC 的基座模型,专注于预测和执行 GUI 操作,可应用于自动化交互任务
CogAgent-9B 是智谱AI基于 GLM-4V-9B 训练的专用Agent任务模型,支持高分辨率图像处理和双语交互,能够预测并执行GUI操作,广泛应用于自动化任务。
69 12
CogAgent-9B:智谱 AI 开源 GLM-PC 的基座模型,专注于预测和执行 GUI 操作,可应用于自动化交互任务
|
10天前
|
机器学习/深度学习 人工智能 监控
AI在交通管理系统中的应用
AI在交通管理系统中的应用
52 23
|
22小时前
|
人工智能 自然语言处理 搜索推荐
云端问道12期实操教学-构建基于Elasticsearch的企业级AI搜索应用
本文介绍了构建基于Elasticsearch的企业级AI搜索应用,涵盖了从传统关键词匹配到对话式问答的搜索形态演变。阿里云的AI搜索产品依托自研和开源(如Elasticsearch)引擎,提供高性能检索服务,支持千亿级数据毫秒响应。文章重点描述了AI搜索的三个核心关键点:精准结果、语义理解、高性能引擎,并展示了架构升级和典型应用场景,包括智能问答、电商导购、多模态图书及商品搜索等。通过实验部分,详细演示了如何使用阿里云ES搭建AI语义搜索Demo,涵盖模型创建、Pipeline配置、数据写入与检索测试等步骤,同时介绍了相关的计费模式。

热门文章

最新文章