AI加持的WPS来了:金山开源全球首个办公DL框架KSAI-Lite

简介: 自动生成 PPT,自动图片转文字 + 翻译,甚至自动辅助写文章…… 办公自动化的未来已来。


WPS 是个已有超过 30 年历史的办公软件,但它最近的用户数量增长却越来越快——这款工具目前已有接近 4.9 亿活跃用户,其中还包括 1 亿海外用户。

如此受欢迎的原因当然是因为最近的大幅升级,如今在 WPS 上你会发现不少 AI 能力的加持。

7 月 22 日,金山办公在珠海举行了首次技术开放日。在活动中这家公司不仅展示了 WPS 上最新应用的技术,还发布了 KSAI-lite,业内第一个面向办公领域的深度学习框架。

微信图片_20211206093515.jpg


对于众多使用者来说,如今的 WPS 已不再仅仅是一个文件编辑工具。「WPS 是一个成熟的办公软件,应该学会自己做 PPT 了,」金山办公副总裁、AI 中台负责人姚冬说道。

用最新版本的 WPS 编辑演示文稿,你只需要用文字列出一个思维导图,或者在每一页空白的 PPT 上打上文字,甚至只需要打开一个 Word 文档,AI 就可以帮助你实现智能配图、表格美化、多图拼图、多图轮播、图片介绍等多种效果,几秒钟生成一份可用的 PPT。

微信图片_20211206093520.gif


如上图所示,「智能美化」功能可以自动为纯文字内容推荐出几十种 PPT 样式,加入背景、调好字号和格式,它们都是使用 AI 算法基于文字内容的语义产生的。如果你已有素材图片,只需要把它们堆放在幻灯片上就可以一键美化图片,自动整理好排版或加入动画特效。

这种自动生成 PPT 的功能既可以进行单页面美化,也可以实现全局换肤、对齐排版、配色、字体统一等问题。在使用时,你只需关注要介绍的内容,无须在选模版、调格式等操作上花费时间,大幅提升了效率,也解决了不常做 PPT 的人「一时找不到如何下手」的重要问题。

值得注意的是,在 AI 推荐的模板中,也有相当一部分是由算法自动生成的,这些都是金山办公后台几十台服务器 AI 模型训练获得的成果。

除了自动生成 PPT 之外,WPS 强大的 OCR「光学文字识别」技术也被人们经常使用。这个工具可以将书籍和文件的图片转成文字,并保留原排版,让原照片上的表格、分栏和图片都转至新文档中,并成为可编辑状态。对于 AI 来说,即使是照歪一点也不是问题。

金山办公还介绍了 WPS 中的「辅助写作」功能:如果你对写文章一时没有思路,只要写一个大概的提纲,AI 就可以自动生成一些段落。没开始写的情况下文章就已经有上千字了,其中都是语料算法生成的段落。

自动生成的文字内容合理吗?金山办公表示,用于模型训练的语料库是与人民网等机构合作完成的,其中包括媒体历年发布的文章,此外还包含大量官方出版物。

轻松办公是金山对 AI 时代办公软件确立的目标。「在效率上,WPS 的智能美化、智能表格等功能可以将用户的很多操作由分钟级提升至秒级;在用户体验方面,我们自研的全文翻译引擎可以解决不同类别文档识别翻译难、排版还原难等问题,快速输出高质量的译文,」姚冬表示。

微信图片_20211206093525.jpg

金山办公副总裁、AI 中台负责人姚冬在活动中。

在开放日上,金山办公还发布了一款人工智能深度学习推理框架 KSAI-lite,这是一款免费、开源、跨多个终端的全新工具,适配国内外主流软硬件平台,在 OCR、机器翻译、智能校对等落地场景上为开发者们带来了新选择。

KSAI-lite 面向通用性、高性能、轻量和专业性四个目标构建。在技术实践中,金山的开发团队在多框架支持、软硬件适配、性能、功耗、内存等方面都进行了优化。

在 KSAI-lite 中首个开源的是 OCR 模型,其支持移动端设备的离线识别,模型和库文件共计不到 9MB。该模型在文本检测、文本分类和文本识别上都表现出了业内第一梯队的性能。

据介绍,KSAI-lite 框架底层基于 TensorFlow,目前已经在 GitHub 上开源:https://github.com/kingsoft-wps/KSAI-Toolkits

微信图片_20211206093529.jpg


金山办公表示,未来 KSAI-lite 还会在更丰富的平台适配能力、更个性的开发方式、更稳定的业务支持能力上持续发力,为金山办公产品线和整个业界提供更多 AI 能力的支持。

金山办公转型 AI 的时间其实已经不短:其自 2017 年成立的 AI 中台如今已拥有超过 100 人的规模。几年内这一团队完成了 OCR、文档翻译、图文识别检测等多领域应用的落地,一些研究也已被 AI 顶会收录。

迄今为止,金山办公 AI 中台围绕办公领域的计算机视觉、自然语言处理相关算法研究已开发了近 100 项 AI 能力,WPS 的智能校对功能月校对字数超过 70 亿,智能生成的内容占据云端整体内容资源的 33.6%,智能美化功能月度活跃用户数量也已超过百万。

在公司内部,AI 中台还打造了基于分布式训练的 AI 训练平台,包含了训练数据处理、训练调度、服务监控告警、链路追踪等一站式平台。

WPS 在办公软件领域已拥有 30 余年的技术积累,由于支持从 Windows 到 Linux 的绝大多数操作系统和硬件,它受到了人们的持续欢迎。随着 AI 等技术的应用,未来我们还能期待 WPS 为我们带来更多、更方便的功能。

「WPS 为文字处理而生,而文字是办公活动的核心。我们在未来会继续以文字处理为核心研发新技术,满足企业数字化转型的巨大需求,」姚冬表示。

相关文章
|
2月前
|
人工智能 中间件 数据库
沐曦 GPU 融入龙蜥,共筑开源 AI 基础设施新底座
沐曦自加入社区以来,一直与龙蜥社区在推动 AIDC OS 的开源社区建设等方面保持合作。
|
3月前
|
人工智能 安全 API
HiMarket 正式开源,为企业落地开箱即用的 AI 开放平台
我们发起 HiMarket 的初心:帮助用户从 80% 开始构建 AI 开放平台。
488 32
|
2月前
|
人工智能 监控 安全
员工使用第三方AI办公的风险与解决方案:从三星案例看AI的数据防泄漏
生成式AI提升办公效率,也带来数据泄露风险。三星、迪士尼案例揭示敏感信息外泄隐患。AI-FOCUS团队建议构建“流式网关+DLP”防护体系,实现分级管控、全程审计,平衡安全与创新。
|
3月前
|
人工智能 运维 安全
|
2月前
|
人工智能 运维 Java
Spring AI Alibaba Admin 开源!以数据为中心的 Agent 开发平台
Spring AI Alibaba Admin 正式发布!一站式实现 Prompt 管理、动态热更新、评测集构建、自动化评估与全链路可观测,助力企业高效构建可信赖的 AI Agent 应用。开源共建,现已上线!
3916 58
|
3月前
|
人工智能 Java 开发者
阿里出手!Java 开发者狂喜!开源 AI Agent 框架 JManus 来了,初次见面就心动~
JManus是阿里开源的Java版OpenManus,基于Spring AI Alibaba框架,助力Java开发者便捷应用AI技术。支持多Agent框架、网页配置、MCP协议及PLAN-ACT模式,可集成多模型,适配阿里云百炼平台与本地ollama。提供Docker与源码部署方式,具备无限上下文处理能力,适用于复杂AI场景。当前仍在完善模型配置等功能,欢迎参与开源共建。
1684 58
阿里出手!Java 开发者狂喜!开源 AI Agent 框架 JManus 来了,初次见面就心动~
|
2月前
|
人工智能 自然语言处理 Shell
我们开源了一款 AI 驱动的用户社区
KoalaQA 是一款开源的 AI 驱动用户社区,支持智能问答、语义搜索、自动运营与辅助创作,助力企业降低客服成本,提升响应效率与用户体验。一键部署,灵活接入大模型,快速构建专属售后服务社区。
299 5
我们开源了一款 AI 驱动的用户社区
|
3月前
|
人工智能 数据可视化 数据处理
AI智能体框架怎么选?7个主流工具详细对比解析
大语言模型需借助AI智能体实现“理解”到“行动”的跨越。本文解析主流智能体框架,从RelevanceAI、smolagents到LangGraph,涵盖技术门槛、任务复杂度、社区生态等选型关键因素,助你根据项目需求选择最合适的开发工具,构建高效、可扩展的智能系统。
928 3
AI智能体框架怎么选?7个主流工具详细对比解析