AI加持的WPS来了:金山开源全球首个办公DL框架KSAI-Lite

本文涉及的产品
教育场景识别,教育场景识别 200次/月
文档理解,结构化解析 100页
通用文字识别,通用文字识别 200次/月
简介: 自动生成 PPT,自动图片转文字 + 翻译,甚至自动辅助写文章…… 办公自动化的未来已来。


WPS 是个已有超过 30 年历史的办公软件,但它最近的用户数量增长却越来越快——这款工具目前已有接近 4.9 亿活跃用户,其中还包括 1 亿海外用户。

如此受欢迎的原因当然是因为最近的大幅升级,如今在 WPS 上你会发现不少 AI 能力的加持。

7 月 22 日,金山办公在珠海举行了首次技术开放日。在活动中这家公司不仅展示了 WPS 上最新应用的技术,还发布了 KSAI-lite,业内第一个面向办公领域的深度学习框架。

微信图片_20211206093515.jpg


对于众多使用者来说,如今的 WPS 已不再仅仅是一个文件编辑工具。「WPS 是一个成熟的办公软件,应该学会自己做 PPT 了,」金山办公副总裁、AI 中台负责人姚冬说道。

用最新版本的 WPS 编辑演示文稿,你只需要用文字列出一个思维导图,或者在每一页空白的 PPT 上打上文字,甚至只需要打开一个 Word 文档,AI 就可以帮助你实现智能配图、表格美化、多图拼图、多图轮播、图片介绍等多种效果,几秒钟生成一份可用的 PPT。

微信图片_20211206093520.gif


如上图所示,「智能美化」功能可以自动为纯文字内容推荐出几十种 PPT 样式,加入背景、调好字号和格式,它们都是使用 AI 算法基于文字内容的语义产生的。如果你已有素材图片,只需要把它们堆放在幻灯片上就可以一键美化图片,自动整理好排版或加入动画特效。

这种自动生成 PPT 的功能既可以进行单页面美化,也可以实现全局换肤、对齐排版、配色、字体统一等问题。在使用时,你只需关注要介绍的内容,无须在选模版、调格式等操作上花费时间,大幅提升了效率,也解决了不常做 PPT 的人「一时找不到如何下手」的重要问题。

值得注意的是,在 AI 推荐的模板中,也有相当一部分是由算法自动生成的,这些都是金山办公后台几十台服务器 AI 模型训练获得的成果。

除了自动生成 PPT 之外,WPS 强大的 OCR「光学文字识别」技术也被人们经常使用。这个工具可以将书籍和文件的图片转成文字,并保留原排版,让原照片上的表格、分栏和图片都转至新文档中,并成为可编辑状态。对于 AI 来说,即使是照歪一点也不是问题。

金山办公还介绍了 WPS 中的「辅助写作」功能:如果你对写文章一时没有思路,只要写一个大概的提纲,AI 就可以自动生成一些段落。没开始写的情况下文章就已经有上千字了,其中都是语料算法生成的段落。

自动生成的文字内容合理吗?金山办公表示,用于模型训练的语料库是与人民网等机构合作完成的,其中包括媒体历年发布的文章,此外还包含大量官方出版物。

轻松办公是金山对 AI 时代办公软件确立的目标。「在效率上,WPS 的智能美化、智能表格等功能可以将用户的很多操作由分钟级提升至秒级;在用户体验方面,我们自研的全文翻译引擎可以解决不同类别文档识别翻译难、排版还原难等问题,快速输出高质量的译文,」姚冬表示。

微信图片_20211206093525.jpg

金山办公副总裁、AI 中台负责人姚冬在活动中。

在开放日上,金山办公还发布了一款人工智能深度学习推理框架 KSAI-lite,这是一款免费、开源、跨多个终端的全新工具,适配国内外主流软硬件平台,在 OCR、机器翻译、智能校对等落地场景上为开发者们带来了新选择。

KSAI-lite 面向通用性、高性能、轻量和专业性四个目标构建。在技术实践中,金山的开发团队在多框架支持、软硬件适配、性能、功耗、内存等方面都进行了优化。

在 KSAI-lite 中首个开源的是 OCR 模型,其支持移动端设备的离线识别,模型和库文件共计不到 9MB。该模型在文本检测、文本分类和文本识别上都表现出了业内第一梯队的性能。

据介绍,KSAI-lite 框架底层基于 TensorFlow,目前已经在 GitHub 上开源:https://github.com/kingsoft-wps/KSAI-Toolkits

微信图片_20211206093529.jpg


金山办公表示,未来 KSAI-lite 还会在更丰富的平台适配能力、更个性的开发方式、更稳定的业务支持能力上持续发力,为金山办公产品线和整个业界提供更多 AI 能力的支持。

金山办公转型 AI 的时间其实已经不短:其自 2017 年成立的 AI 中台如今已拥有超过 100 人的规模。几年内这一团队完成了 OCR、文档翻译、图文识别检测等多领域应用的落地,一些研究也已被 AI 顶会收录。

迄今为止,金山办公 AI 中台围绕办公领域的计算机视觉、自然语言处理相关算法研究已开发了近 100 项 AI 能力,WPS 的智能校对功能月校对字数超过 70 亿,智能生成的内容占据云端整体内容资源的 33.6%,智能美化功能月度活跃用户数量也已超过百万。

在公司内部,AI 中台还打造了基于分布式训练的 AI 训练平台,包含了训练数据处理、训练调度、服务监控告警、链路追踪等一站式平台。

WPS 在办公软件领域已拥有 30 余年的技术积累,由于支持从 Windows 到 Linux 的绝大多数操作系统和硬件,它受到了人们的持续欢迎。随着 AI 等技术的应用,未来我们还能期待 WPS 为我们带来更多、更方便的功能。

「WPS 为文字处理而生,而文字是办公活动的核心。我们在未来会继续以文字处理为核心研发新技术,满足企业数字化转型的巨大需求,」姚冬表示。

相关文章
|
7天前
|
机器学习/深度学习 人工智能 算法
整合海量公共数据,谷歌开源AI统计学专家DataGemma
【10月更文挑战第28天】谷歌近期开源了DataGemma,一款AI统计学专家工具,旨在帮助用户轻松整合和利用海量公共数据。DataGemma不仅提供便捷的数据访问和处理功能,还具备强大的数据分析能力,支持描述性统计、回归分析和聚类分析等。其开源性质和广泛的数据来源使其成为AI研究和应用的重要工具,有助于加速研究进展和推动数据共享。
32 6
|
26天前
|
存储 人工智能 uml
介绍一款好用的开源画图神器-draw.io | AI应用开发
draw.io 是一款基于浏览器的开源绘图工具,无需安装即可使用,支持多种操作系统和设备。其简洁的界面、丰富的形状库、智能对齐功能和强大的云端协作能力,使其成为专业人士和创意爱好者的首选。无论是产品设计、流程图绘制还是思维导图构建,draw.io 都能满足你的多样化需求。【10月更文挑战第7天】
82 0
|
8天前
|
存储 人工智能 SEO
全开源免费AI网址导航网站源码
Aigotools 可以帮助用户快速创建和管理导航站点,内置站点管理和自动收录功能,同时提供国际化、SEO、多种图片存储方案。让用户可以快速部署上线自己的导航站。
19 1
|
21天前
|
人工智能 安全 决策智能
OpenAI推出实验性“Swarm”框架,引发关于AI驱动自动化的争论
OpenAI推出实验性“Swarm”框架,引发关于AI驱动自动化的争论
|
15天前
|
人工智能 API 决策智能
swarm Agent框架入门指南:构建与编排多智能体系统的利器 | AI应用开发
Swarm是OpenAI在2024年10月12日宣布开源的一个实验性质的多智能体编排框架。其核心目标是让智能体之间的协调和执行变得更轻量级、更容易控制和测试。Swarm框架的主要特性包括轻量化、易于使用和高度可定制性,非常适合处理大量独立的功能和指令。【10月更文挑战第15天】
111 6
|
23天前
|
人工智能 开发框架 Java
总计 30 万奖金,Spring AI Alibaba 应用框架挑战赛开赛
Spring AI Alibaba 应用框架挑战赛邀请广大开发者参与开源项目的共建,助力项目快速发展,掌握 AI 应用开发模式。大赛分为《支持 Spring AI Alibaba 应用可视化调试与追踪本地工具》和《基于 Flow 的 AI 编排机制设计与实现》两个赛道,总计 30 万奖金。
|
24天前
|
人工智能 Java API
阿里云开源 AI 应用开发框架:Spring AI Alibaba
近期,阿里云重磅发布了首款面向 Java 开发者的开源 AI 应用开发框架:Spring AI Alibaba(项目 Github 仓库地址:alibaba/spring-ai-alibaba),Spring AI Alibaba 项目基于 Spring AI 构建,是阿里云通义系列模型及服务在 Java AI 应用开发领域的最佳实践,提供高层次的 AI API 抽象与云原生基础设施集成方案,帮助开发者快速构建 AI 应用。本文将详细介绍 Spring AI Alibaba 的核心特性,并通过「智能机票助手」的示例直观的展示 Spring AI Alibaba 开发 AI 应用的便利性。示例源
|
29天前
|
人工智能 Java API
阿里云开源 AI 应用开发框架:Spring AI Alibaba
阿里云开源 Spring AI Alibaba,旨在帮助 Java 开发者快速构建 AI 应用,共同构建物理新世界。
|
28天前
|
机器学习/深度学习 人工智能 TensorFlow
解锁AI潜力:让开源模型在私有环境绽放——手把手教你搭建专属智能服务,保障数据安全与性能优化的秘密攻略
【10月更文挑战第8天】本文介绍了如何将开源的机器学习模型(如TensorFlow下的MobileNet)进行私有化部署,包括环境准备、模型获取与转换、启动TensorFlow Serving服务及验证部署效果等步骤,适用于希望保护用户数据并优化服务性能的企业。
48 4
|
1月前
|
数据采集 人工智能 自然语言处理
Python实时查询股票API的FinanceAgent框架构建股票(美股/A股/港股)AI Agent
金融领域Finance AI Agents方面的工作,发现很多行业需求和用户输入的 query都是和查询股价/行情/指数/财报汇总/金融理财建议相关。如果需要准确的 金融实时数据就不能只依赖LLM 来生成了。常规的方案包括 RAG (包括调用API )再把对应数据和prompt 一起拼接送给大模型来做文本生成。稳定的一些商业机构的金融数据API基本都是收费的,如果是以科研和demo性质有一些开放爬虫API可以使用。这里主要介绍一下 FinanceAgent,github地址 https://github.com/AI-Hub-Admin/FinanceAgent

热门文章

最新文章

下一篇
无影云桌面