向前一步,AI,退后一步,RPA

本文涉及的产品
教育场景识别,教育场景识别 200次/月
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_高级版,每接口累计50万次
简介: 先有流程自动化,然后是智能化,RPA 1.0自动化手,RPA 2.0自动化脑......数字化劳动力的故事能否如预期般展开,整个行业都在观望。

向前一步,AI,退后一步,RPA。

AI落地难成为业界面临的共同难题,往前走难以为继,于是被寄予厚望的AI后退一步,RPA(Robotic Process Automation,机器人流程自动化)适时出现在牌桌。

一批 RPA+AI 厂商如雨后春笋般出现,让人不禁回忆起“AI+一切”的炒作热潮。这次的不同之处在于,少了些厂商自嗨,多了些呼声一致的默契,因为RPA+AI 在技术端和市场端的需求确实存在,而且还很刚性。雷锋网了解到,当下企业对RPA的需求在以每年翻倍的速度增长,很多咨询公司已经忙到无法完成所有订单交付。

如果你还没感受到RPA的受欢迎程度,不妨看看投资层面的变化:今年6月份,弘玑Cyclone宣布获DCM、源码资本千万美元A轮融资;云扩科技宣布获金沙江创投、明势资本千万美元A轮融资;来也科技与RPA公司奥森科技合并成“新来也”,并宣布获凯辉创新基金、双湖资本和光速中国的3500万美元B+轮投资;8月份云扩科技宣布再获得红杉资本中国基金数千万元A+轮融资。

这只是公布出来的一部分,更多的融资还在进行中或者未披露,RPA市场去年增长了63%以上,成为增长最快的企业软件,同时相较于其他成熟的企业软件,RPA还有不小的增长空间。略显寒冷的2019年投资市场,不说一枝独秀,也算是难得的好项目。

就这样,有市场、有对标、有技术的RPA在国内进入爆发期。浮华背后总有隐忧,抱着一探新时期RPA究竟的心思,雷锋网对话了阿里云、文因互联、达观数据、阿博茨科技和明势资本等,希望呈现RPA行业的全貌。
f127f4336754427abec36f3948b8e0bf.jpg

到底什么是RPA?

此RPA,非彼RPA。

传统对RPA的理解——通过配置计算机软件或机器人抓取并解析现有应用程序来处理事务、操纵数据、触发响应并与其他数字系统通信的技术应用。针对重复性工作的自动化以及高度智能处理的自动化,达到优化整个企业基础流程作业、降低成本、提高效率、和确保零失误。

当下风靡的RPA已经超过了传统RPA的范畴,按键精灵,甚至Word和Excel的VBA(也称宏)都可以算做传统RPA,今天我们讨论的当然不是此类,姑且将RPA分为狭义的RPA和广义的RPA,目前RPA翻红就是从狭义RPA走向广义RPA的过程。

狭义RPA本身的技术实质是快速构建可执行的操作并且稳定回放。构建可执行的操作并且稳定会放的技术其实并不少,单纯代码的编写也可以做到,为什么一定要用RPA?
0c847d1137dc4cc59817cd652694830c.jpg

阿里云RPA案例:自动赔付机器人

阿里云RPA团队负责人李立峰对雷锋网表示,核心在于“快速”两个字,无论是在比较流行的可视化编排还是说所编即所得的录制能力,这些技术都是为了降低门槛,将快速能够发挥到极致。如果不用RPA,按照原来用一些脚本或者用一些底层开发的技术,可能需要几个人月,或者几十个人月的开发工作,使用RPA可以可以减少到几个人日甚至几个人时的高度。快速构建知易行难,底层的能力尤其纷繁复杂,要想从80%要想提高到90%,甚至从90%提高到95%,需要非常深层次的底层技术能力才可以做到。

广义RPA=狭义RPA+各种可被组合能力的集合。可被组合能力指的就是各种AI技术,在广义RPA中,狭义RPA所代表的的技术占比已经非常小,考验的是其他可被组合能力的广度和深度,比如OCR能力做的好不好,IoT能力结合的深不深等等。

有一些RPA厂商搬出RPA+AI的旗号,那么各种AI能力的深度融合就是他们的重点,但是具体深度的AI能力,到底是否一定要依赖于RPA才能做的很好,这是另外一个问题。

李立峰坦言,到目前为止,任何一家厂商,即便是阿里巴巴经济体,也不可能拥有全部可以被组合的最深度的能力产品,所以全部或者部分能力一定会需要外部的合作集成,阿里巴巴也需要和很多公司去合作和集成。

RPA市场的四类玩家

和众多新技术发展轨迹类似,RPA源于大洋彼岸,并且也正是由于海外市场的火热效应,传导至国内并引发资本的追捧。RPA有现成的国外对标厂商,UiPath、Automation Anywhere、Blue Prism,这里面Blue Prism估值最低为13亿美元,UiPath的估值高达70亿美元,中国的市场规模不亚于其他市场,RPA也不是高高在上的技术,资本和厂商都在致力于寻找/成为中国的UiPath。

目前国内的RPA玩家主要有4类:
第一类是新公司,如2015年成立的弘玑信息、2017年成立的云扩科技。这一类公司还是专注在传统 RPA 的业务范畴。
第二类是在to B领域耕耘很长时间的老玩家,如艺赛旗、金智维。这类厂商要么依托原本公司丰富的商务资源渠道丰富,或者原本就已经做了不少 RPA 的系统,在原有的系统和业务范畴框架下结合新技术进一步去探索。
第三类是切入RPA市场的AI公司,也是目前市场相对活跃的类别。这一类公司,主要是从新型业务机会入手,比如信贷流程自动化入手,把这一部分做得足够好,和传统RPA公司合作或者搭建团队把传统 RPA 环节完成就是更加简单的事情,如文因互联、达观数据、阿博茨等。
最后,还有巨头。这类公司的核心还是更加偏向底层,会通过开放平台提供组件支持,行业还没有非常聚焦,如阿里云,最早从淘宝的前身码栈开始,而后一直在内部演进到如今的RPA。

玩家众多抢食风口,市场空间还未完全释放。据HFSResearch数据,RPA全球市场规模从2016年的6.12亿美元增长至2018年的17.14亿美元,近3年的年增速均超过50%;预计到2022年,市场规模将达到43.08亿美元。

“新”RPA的爆发:人工智能带来了什么?

新RPA,在于AI和RPA的结合。
RPA+AI的提出不禁让雷锋网回忆起另一个相似概念,早在2017年,麦肯锡就撰文特别介绍了智能流程自动化(IPA,Intelligent Process Automation),只不过当时囿于多种因素,IPA还没得到很好的推广,IPA其实等同于RPA+AI,相信IPA概念的火热也只是时间问题。

麦肯锡认为,IPA包括如下五个核心技术:
机器人流程自动化RPA,这是IPA的基础。
智能工作流(Smart Workflow),流程管理软件工具,集成了由人和机器团队执行的工作,允许用户实时启动和跟踪端到端流程的状态,用来管理不同组之间的切换,包括机器人和人类用户之间的切换,并提供瓶颈阶段的统计数据。

机器学习/高级分析,通过“监督”或者“无监督”学习来识别结构化数据中模式的算法。监督算法在根据新输入做出预测之前,通过已有的结构化数据集的输入和输出进行学习,无监督算法观察结构化的数据,直接识别出模式。

自然语言生成(NLG, Natural-Language Generation):在人类和系统之间创建无缝交互的引擎,遵循规则将从数据中观察到地信息转换成文字,结构化的性能数据可以通过管道传输到自然语言引擎中,并自动编写成内部和外部的管理报告。

认知智能体(Cognitive Agents),一种结合了机器学习和自然语言生成的技术,它可以作为一个完全虚拟的劳动力,并有能力完成工作,交流,从数据集中学习,甚至基于“情感检测”做出判断等任务,认知智能体可以通过电话或者交谈来帮助员工和客户。
和众多企业服务软件一样,RPA的本质目标就是降本增效,在经济周期的循环中,类似的需求总是间歇性特别突出,RPA需求爆发也不是凭空而来,主要推动力主要来自两方面,技术的成熟和市场的需求。

原先 RPA 没有办法处理的环节,人工智能技术可以做到,这在金融场景表现的十分明显,比如,原本银行信贷流程中有大量需要处理的信贷文件,包含大量非结构化的数据,传统的 RPA 技术没有处理这些数据的能力,因此这部分业务范畴就不包含在其中。

人工智能底层的技术为自然语言处理(NLP)和知识图谱(KG),自然语言处理技术让原先做不到的事情能够做到了,瞬间打开了一个新局面。智能审批、智能合规、智能信贷流程、智能风控……一系列的需求都可以解锁。

其中,NLP主要进行从文本中进行表格识别、关键实体和关系抽取;KG主要建模业务知识(实例图谱和业务规则),如公司图谱、人物图谱、产业链图谱、风险传导关系、合规规则、信贷规则等。

文因互联CEO鲍捷表示,之前有人戏称,RPA 是 AI 的接盘侠,或许能在某种程度解释这一轮小高潮。2015年-2018年,大家对 AI 能够带来的智能化还是有很多不切实际的幻想,想象破灭之后发现AI 当前真真正正能够落地的是帮助解决一些业务流程或者操作流程的自动化,比如用算法人脸识别,比如用机器来批量化处理基础的财务报表,和大家对 RPA 的理解很像。而这一轮人工智能技术和应用落地的热潮,也给传统的 RPA 赋能,能做到未来很多做不到的事情,有了更大的想象空间。

就文因互联的实践经验来总结,在金融领域RPA之所以能够迎来小高潮,首先是技术走向成熟,金融文本分析经过这几年的深耕,已经具备极强的工程落地能力,技术指标成熟,金融文档的机器理解、信息抽取已发展到业务可用 ;原始数据储备丰富,各单位自己的大数据系统建设完毕,为下一步AI化提供了原始数据。
a52de4494f5a4d658d6f8dd6941d4ad0.jpg
达观数据结合OCR和NLP的RPA系统
动作较快的厂商已经开始着手推新品,达观数据日前正式推出国内首款自主研发集OCR(光学字符识别)与 NLP(自然语言处理)于一体的达观智能RPA。

达观数据CEO陈运文表示,达观数据的RPA没有采用开源技术而是自研,而且在自研的时候,把NLP系统、OCR系统、RPA系统紧密结合在一起,达观数据的RPA机器人所做的菜单内嵌NLP模块,而不是作为一个插件另外再插入进去。

“OCR如同人的眼睛,NLP 如同人的大脑,RPA则是人的双手,手脑眼三者结合才能承担更复杂的流程化工作”,陈运文表示,这也代表了大多数RPA+AI厂商的观点。

RPA不是万能药

RPA是通往AI快车道的第一步,但,万事开头难。
明势资本创始合伙人黄明明告诉雷锋网,其投资团队从2016年开始就关注及投资过很多RPA在垂直行业应用的项目,但那时候大家还不太清楚RPA这个词,RPA也远不及当下火热。后来团队受国外几家RPA企业快速发展的启发,开始系统地去看RPA这个赛道。

这也从侧面体现出RPA发展的曲折,蛰伏许久终见曙光,以至于现在RPA火热的有些过分。黄明明坦言,如果类比其他行业软件的市销率来看,RPA企业普遍估值比较高。但是对于早期投资来说,挖掘出优秀的企业家和正确的方向是最关键的,这个阶段过分关注估值会错过很多优秀的企业。按照早期VC投资企业的评估标准,优秀的RPA企业会带来50、100倍以上回报。
相比2016年,至少现在行业变得明朗了许多,围绕RPA的技术壁垒存在两种截然不同的观点,一种是RPA技术壁垒很低,另一种则是RPA难度很大。其实两种观点所聚焦的范围出现了偏差,如前所述,狭义RPA的技术门槛包括UI Automation界面自动化,流程配置和执行引擎,RPA平台节点数量和函数数量,前两者都有现成的开源技术,大部分厂商也是在此基础上做二次开发,所以难度并不大,以至于入局者众。

而广义RPA的技术壁垒也不在于RPA本身,行业喊出RPA+AI的厂商,RPA能力本身并不是他们的重点。RPA并不是万能药,而且其缺点和优点一样明显,换句话说,RPA缺点恰恰是由于它的优点带来的。

首先,RPA是非常明显的直线性流程,狭义RPA能够实现可视第三方系统非侵入操作,虽然造成了不需要依赖于第三方系统是否提供接口,也可以去操作第三方系统的优点,但是也会导致第三方系统的任何改动,都会对RPA流程产生某种影响。

李立峰提到,有一些第三方系统的修改比较频繁,但是即便是不频繁的三方系统的修改,不像接口一样,有相对明确的接口声明,明确输入、输出,声明异常返回值,在RPA界面级是没有声明的,所以第三方系统可能的修改就可以轻易破坏掉原来运行非常稳定的一些流程,有时候甚至可能会导致无法挽回的损失。

随着RPA流程大量的行业运用,会逐渐产生一些微小的偏差并累计下来成为隐患,就算一个流程的失败率和造成影响的概率只有千分之一,但是一千个流程运行下来,出现累计偏差的概率会变得非常大。

对此,阿里云认为,在未来的每一个时刻,在RPA流程当中某一次致命的损失,有可能会导致整个行业对于那些在稳定性以及异常处理能力不健全的RPA产品敬而远之,RPA行业会进入一个相对低谷,阿里云认为这是一个必然会发生的事件。

要规避潜在的灾难级损失,可从两方面着手,其一是尽可能的想尽办法去尽量降低这些缺点,以及这个缺点可能导致的影响,虽然缺点是RPA本身不可避免,但是RPA可能造成的影响可以尽量去规避;其二,在业务场景上展现出足够大的价值,高价值会改变用户的判断,优点和缺点让用户去做自我权衡。也只有如此,RPA才能越来越多用在一些重要的场合,而不是在一些边边角角的边缘领域使用。

阿博茨CEO杨永智提到了其他可能影响RPA发展的因素,国内外市场IT市场和人力成本的差异,发达国家市场如欧美,人力成本贵是RPA火热的直接原因;其次,发达国家市场IT系统建立的比较早,有很多历史遗留系统,这些系统已经年老失修,再去做集成成本非常高。

中国市场相对易获得的人力是与国外市场在外部环境上的不同,相较于国外,中国市场在软件付费习惯层面也面临考验,杨永智认为,在传统的RPA没有什么技术壁垒的情况下,RPA厂商最终可能难免打价格战,客观影响RPA行业形成一个比较健康的商业模式,这是行业已经发生的事情。

风口盛时,各种玩家蜂拥而进,RPA厂商完全有可能遇到来自于客户层面的降维打击,比如有实力的银行不乏自己搭建团队去做RPA,越来越多的银行成立金融科技子公司,探索的一大重点就是 RPA,传统 RPA 公司如果不转型,最大的竞争对手可能是银行自身的技术团队。

先有流程自动化,然后是智能化,RPA 1.0自动化手,RPA 2.0自动化脑......数字化劳动力的故事能否如预期般展开,整个行业都在观望。

本文转自雷锋网,作者:张帅 ,如需转载请至雷锋网官网申请授权。
原标题:鉴:RPA『真』『伪』
原文链接:https://www.leiphone.com/news/201908/XZQEK3LbJ6yvzjXQ.html

相关实践学习
基于阿里云短信服务的防机器人验证
基于阿里云相关产品和服务实现一个手机验证码登录的功能,防止机器人批量注册,服务端采用阿里云ECS服务器,程序语言选用JAVA,服务器软件选用Tomcat,应用服务采用阿里云短信服务,
相关文章
|
6月前
|
数据采集 安全 测试技术
【专栏】阿里云RPA浏览器自动化插件是一款基于AI的创新工具
【4月更文挑战第29天】阿里云RPA浏览器自动化插件是一款基于AI的创新工具,能模拟浏览器操作,实现自动化业务流程,提升效率,降低成本。其特点包括强大的自动化能力、智能识别处理、灵活定制、稳定性能及安全保障。适用于数据采集、表单填写、网页测试、办公自动化和电商运营等场景,助力企业数字化转型。
668 5
|
6月前
|
机器学习/深度学习 人工智能 供应链
【专栏】阿里云RPA的Rap程序是自动化流程脚本,基于AI和机器学习,实现业务流程自动化
【4月更文挑战第29天】阿里云RPA的Rap程序是自动化流程脚本,基于AI和机器学习,实现业务流程自动化。具有灵活性、易用性、高效稳定和智能学习等特点。广泛应用于财务、人力资源、客服和供应链等领域,未来将与AI深度融合,跨平台应用,行业定制化,并构建完善生态,助力企业效率提升和创新。
443 2
|
人工智能 自然语言处理 机器人
AIGC如何借AI Agent落地?TARS-RPA-Agent破解RPA与LLM融合难题
AIGC如何借AI Agent落地?融合LLM的RPA进化到了什么程度?来看看实在智能刚发布的TARS-RPA-Agent。
449 1
|
传感器 人工智能 自然语言处理
AI大模型加速RPAxAI时代到来,谁会是RPA领域的杀手级应用?
GPT等AI大模型如何重新定义RPA?能够为企业级RPA带来哪些技术变革与商业机会?什么是RPAxAI? 一篇文章看明白 。
354 0
|
人工智能 边缘计算 算法
AI开发者大会之计算机视觉技术实践与应用:2020年7月3日《RPA+AI助力政企实现智能时代的人机协同》、《5G风口到来,边缘计算引领数据中心变革》、《数字化时代金融市场与AI算法如何结合?》
AI开发者大会之计算机视觉技术实践与应用:2020年7月3日《RPA+AI助力政企实现智能时代的人机协同》、《5G风口到来,边缘计算引领数据中心变革》、《数字化时代金融市场与AI算法如何结合?》
AI开发者大会之计算机视觉技术实践与应用:2020年7月3日《RPA+AI助力政企实现智能时代的人机协同》、《5G风口到来,边缘计算引领数据中心变革》、《数字化时代金融市场与AI算法如何结合?》
|
机器学习/深度学习 人工智能 算法
深度实测 | 10万次运行,探究AI技术融合为RPA火爆赛道带来的价值
深度实测 | 10万次运行,探究AI技术融合为RPA火爆赛道带来的价值
182 0
深度实测 | 10万次运行,探究AI技术融合为RPA火爆赛道带来的价值
|
人工智能 自然语言处理 安全
重新认识人机协同,从RPA+AI理解人机协同系统三层架构
重新认识人机协同,从RPA+AI理解人机协同系统三层架构 从2020世界人工智能大会看RPA,RPA+AI已成备受关注人机协同系统 人机协同时代已来,RPA+AI或将成为“普惠”人机协同系统
889 0
重新认识人机协同,从RPA+AI理解人机协同系统三层架构
|
文字识别 机器人 机器学习/深度学习
RPA之眼:AI-OCR,Fax-OCR概述
文丨马磊 OCR是一种与RPA机器人协作的一项重要技术,相当于机器人的眼睛。 OCR是英文“Optical Character Recognition/Reader”的简称,光学字符识别。从名字我们不难看出,OCR就是读取手写和印刷文字,并把读取的信息转换成可以在电脑的Excel,World等软件上使用的文字信息处理技术。
1218 0
|
5天前
|
机器学习/深度学习 数据采集 人工智能
AI赋能教育:深度学习在个性化学习系统中的应用
【10月更文挑战第26天】随着人工智能的发展,深度学习技术正逐步应用于教育领域,特别是个性化学习系统中。通过分析学生的学习数据,深度学习模型能够精准预测学生的学习表现,并为其推荐合适的学习资源和规划学习路径,从而提供更加高效、有趣和个性化的学习体验。
38 9
|
3天前
|
人工智能 JSON API
阿里云文档智能 & RAG解决方案:提升AI大模型业务理解与应用
阿里云推出的文档智能 & RAG解决方案,旨在通过先进的文档解析技术和检索增强生成(RAG)方法,显著提升人工智能大模型在业务场景中的应用效果。该方案通过文档智能(Document Mind)技术将非结构化文档内容转换为结构化数据,提取文档的层级树、样式和版面信息,并输出为Markdown和Json格式,为RAG提供语义分块策略。这一过程不仅解决了文档内容解析错误和切块丢失语义信息的问题,还优化了输出LLM友好的Markdown信息。方案的优势在于其多格式支持能力,能够处理包括Office文档、PDF、Html、图片在内的主流文件类型,返回文档的样式、版面信息和层级树结构。
24 2

热门文章

最新文章