【业界】开源大势降低技术门槛,人工智能企业更依赖大数据

简介:

美国巴布森学院(Babson College)管理与信息科学学院的教授,MIT 院士,德勤资深研究员Thomas H. Davenport 最近有一个新发现:并不是所有想要使用人工智能的企业都会跟提供技术的公司合作。


为什么,因为有免费的开源算法可用。


靠销售AI软件来赚钱变得越来越难


Thomas以一家向他咨询的出版公司为例,这家公司希望能在产品的数据化和情景化中使用人工智能技术,但是,跟其他纷纷与IBM Watson合作的竞争对手不一样,这家出版公司并没有打算从IBM购买认知技术。


他们说:“我们认为AI软件的市场是迅速商品化的,我们能够以更低的成本来获得所需要的(AI)能力”。 


这家出版公司几位经验丰富的经理还提到,他们认为可以利用开源的人工智能软件来降低成本,现在可以选择的有好几种。另外,很多开放资源提供者并不是小企业,它们可都是谷歌、Facebook、微软和亚马逊这样的巨头。


Thomas说:“刚听到这样的观点时,我略微有一点意外。智能技术现在难道已经那么便宜,那么开放了吗?”


在一个已经变得相对更新的市场上,所谓的认知软件市场要怎样进行商品化?为什么深度学习和机器学习的开发者会进行开源?如果真的比不上免费的软件,Watson为什么可以为IBM带来100亿以上的收入。


首先,从为什么AI技术,也就是上文所说的认知技术为何会商品化这一方面,可以得到一些启示。


现在,软件开发中有一股强大的趋势——在向“微服务”发展,这种“微服务”在小型的功能块上处理运算,然后得到结果。这和传统的“API”或者应用程序交互界面的工作方式一样。由于这些都是小型的功能模块,比起大型的软件单元,企业更难为此付费。因为都是小型的和模块化的,所以这些企业会租用多个软件开发者开发的东西,而不是直接从大企业购买。


这几乎就是认知软件领域过去10多年所发生的事。现在开源库很多,其中不乏一些拥有通用认知功能的算法,比如神经网络、深度学习、语音解析和识别、图像识别等等。


一些库已经开源好几年了,谷歌、微软、Facebook和亚马逊都是最近一两年才开源。通常,通过这些开源库供应商的云平台,可以使用这些开源工具(这样一来,开源的公司至少还可以挣一点钱)。还有另一种方法,就是通过编程网站,比如Github来使用这些开源库。


理想的情况是,如果多家公司和大量的程序员都在使用某一家公司的开放资源认知工具,那么很有可能,软件将会变得标准化,另外,把这些工具嵌入到公司的其他产品中,也会变得更容易一些。


即便是为 IBM 带来丰厚收入的Watson也在走开源的道路。据统计,在Watson 开发者云上,现在有近20个API是可用的。另外,这个数字是不断变化的,因为会不断增加新的API、测试版会下架以及相关的API可能会被整合。


Thomas说,考虑到认知工具商品化的速度非常快,不久后,更多Watson的API进一步开源的话,我一点也不会觉得惊讶。


另一个驱动商品化的因素是“Bots”,也叫智能人机交互API,或聊天机器人,它通过文本或者声音的输入,允许人和程序间进行对话式的交流。Bot想要成功的话,首先要把语音转化成文本,然后分析分本,理解其含义。这听起来似乎很难,但是许多同类的公司已经发布了自己的Bot AI软件开放资源,并把Bot加入到了自己程序的交互中。很快,这一技术就会变得很普遍。由于Bot只是一个交互界面,一种像打字或者点击一样的东西,只不过更加容易一些罢了,所以没人会愿意在这个技术上花太多的钱。


以上这一切意味着,靠销售AI软件来赚钱会变得越来越难。当然,对于没有数据科学家的公司来说,会需要许多外部的建议。公司也需要去研究在自己的业务中哪些部分使用这些工具比较好。


Thomas说,我认为,会有一些高度定制化的AI解决方案,它们会是非常详细和具体的,并且通过开放资源就能获取。比如,能探测到欺诈的图像分析系统。


但是,总体上,拥有AI技术的软件会越来越多,而且都是免费的。如果你的公司知道做什么,怎么使用,或者怎样把其加入你的业务中,你就能挣钱。如果只是打算卖AI软件,收益可能就不会那么好了。


技术门槛降低,数据门槛变高


虽然算法的开源降低了技术门槛,但是在智能产品的开发中,只有算法是远远不够的。《财富》网站在7月11日一篇名为《为什么说数据是原油?》的报道中提到,只有拥有了数据,人工智能才会腾飞。


风险投资公司Bloomberg Beta的合伙人Shivon Zilis在评价的数据的价值时说:“数据是新的原油”。她认为,虽然谷歌、Facebook和亚马逊对人工智能软件进行了开源,任何工程师都可以获得代码并开发新的应用程序,但是,大公司并不会公开必需的数据。


谈到大公司开源软件的原因,她认为,这些公司正在通过开放AI软件工具包来招纳更多的人才。所以,如果真的要竞争,公司拥有的数据实际上比开源的软件更加重要。


IBM Watson 数据处理服务部门的总经理David Keeny说:“数据会成为主流。此外,现在全世界的数据,只有20%在互联网上,剩下的80%都被各大公司和组织占据。


谈到数据,希望在产品中加入人工智能技术的公司又分为两种,一种是有数据的,另一种是无数据的。有数据的是那些长久以来注重收集数据的老牌公司,比如医院;没有数据的通常是许多初创企业。


有数据的公司在智能化的道路上要走得容易一些,以自己手上的数据为资本,他们可以轻松地与拥有强大算法计算的公司达成合作,这种模式最典型的便是DeepMind与英国全民医疗体系(NHS)的合作,两家机构最新的技术成果是使用计算机视觉来诊断眼疾。


没有数据的初创企业也存在机会,那便是在“无数据问题”的环境,比如日程安排这些还没有公司取得巨大进展的问题处理上。


国外媒体Verge报道说,像X.ai这样的初创企业并没有谷歌在Gmail上累积的海量数据,但也开发出了智能化的日程安排软件,并获得商业的成功。 通过这一案例,Verge认为,初创企业可以聚焦于特别小的领域,比如X.ai关注日程安排的智能化。这是一个没有数据的人工智能企业取得突破的途径。


文章转自新智元公众号,原文链接

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
2月前
|
存储 人工智能 大数据
云栖2025|阿里云开源大数据发布新一代“湖流一体”数智平台及全栈技术升级
阿里云在云栖大会发布“湖流一体”数智平台,推出DLF-3.0全模态湖仓、实时计算Flink版升级及EMR系列新品,融合实时化、多模态、智能化技术,打造AI时代高效开放的数据底座,赋能企业数字化转型。
675 0
|
3月前
|
SQL 人工智能 分布式计算
ODPS十五周年实录|构建 AI 时代的大数据基础设施
本文根据 ODPS 十五周年·年度升级发布实录整理而成,演讲信息如下: 张治国:阿里云智能集团技术研究员、阿里云智能计算平台事业部 ODPS-MaxCompute 负责人 活动:【数据进化·AI 启航】ODPS 年度升级发布
193 9
|
4月前
|
数据采集 人工智能 分布式计算
ODPS在AI时代的发展战略与技术演进分析报告
ODPS(现MaxCompute)历经十五年发展,从分布式计算平台演进为AI时代的数据基础设施,以超大规模处理、多模态融合与Data+AI协同为核心竞争力,支撑大模型训练与实时分析等前沿场景,助力企业实现数据驱动与智能化转型。
400 4
|
2月前
|
数据可视化 大数据 关系型数据库
基于python大数据技术的医疗数据分析与研究
在数字化时代,医疗数据呈爆炸式增长,涵盖患者信息、检查指标、生活方式等。大数据技术助力疾病预测、资源优化与智慧医疗发展,结合Python、MySQL与B/S架构,推动医疗系统高效实现。
|
2月前
|
存储 人工智能 安全
拔俗AI临床大数据科研分析平台:让医学研究更智能、更高效
阿里云原生AI临床大数据科研平台,打通异构医疗数据壁垒,实现智能治理、可视化分析与多中心安全协作,助力医院科研提速增效,推动精准医疗发展。
|
2月前
|
人工智能 Cloud Native 算法
拔俗云原生 AI 临床大数据平台:赋能医学科研的开发者实践
AI临床大数据科研平台依托阿里云、腾讯云,打通医疗数据孤岛,提供从数据治理到模型落地的全链路支持。通过联邦学习、弹性算力与安全合规技术,实现跨机构协作与高效训练,助力开发者提升科研效率,推动医学AI创新落地。(238字)
|
2月前
|
传感器 人工智能 监控
拔俗多模态跨尺度大数据AI分析平台:让复杂数据“开口说话”的智能引擎
在数字化时代,多模态跨尺度大数据AI分析平台应运而生,打破数据孤岛,融合图像、文本、视频等多源信息,贯通微观与宏观尺度,实现智能诊断、预测与决策,广泛应用于医疗、制造、金融等领域,推动AI从“看懂”到“会思考”的跃迁。
|
人工智能 大数据 安全
拔俗AI临床大数据科研分析平台:用智能技术加速医学研究新突破
AI临床大数据科研平台基于云原生架构,融合医疗NLP、联邦学习与智能分析技术,破解非结构化数据处理难、多源数据融合难、统计周期长等痛点,实现数据治理、智能分析与安全协作全链路升级,赋能医学科研高效、安全、智能化发展。
|
3月前
|
数据采集 传感器 人工智能
没有大数据,哪来人工智能?——聊聊“大数据喂养下的AI进化史”
没有大数据,哪来人工智能?——聊聊“大数据喂养下的AI进化史”
196 6