AI/ML项目中四大常见障碍

简介: 随着应用需求和技术发展,各种规模和各个垂直领域的企业都开始拥抱人工智能(AI)和机器学习(ML)。他们渴望利用人工智能进行大数据分析,以识别商业趋势,同时改善服务和产品。公司也在利用人工智能自动化销售流程、营销计划和客户服务计划,共同的目标是降低成本、增加收入。

但不幸的现实是,85%的AI和ML项目都无法完整交付,只有53%的项目能从原型到生产。尽管如此,根据最近的IDC支出指南,到2025年,美国在人工智能方面的支出将增长到1200亿美元,增幅将达到20%甚至更多。
image.png
因此,避免五个经常导致AI和ML项目失败的常见错误是很重要的。

  1. 了解训练ML算法所需的资源,特别是数据资源

虽然说正在利用AI和ML革新公司的流程听起来很不错,但事实是80%的公司发现这些项目比预期的更难。

为了使这些项目获得成功,需要清楚地了解在资源和人员方面需要什么。最常见的错误之一是不了解如何获得正确的训练数据——这不仅对此类计划的成功至关重要,而且还需要大量的努力和专业知识才能成功完成。大多数希望采用AI/ML项目的公司无法获得确保高质量、公正结果所需的数据数量或数据多样性。

然而,如果做不到这一点,往往会给成功带来巨大的障碍,导致项目成本飙升,项目信心暴跌。

可供公司购买的训练数据并不匮乏,许多第三方数据公司能够提供服务。问题在于,一家公司可以轻松地以低廉的价格购买大量数据并不意味着它就是高质量的训练数据,而这正是成功的AI和ML项目所需要的。公司需要的不是简单地购买一刀切的数据,而是特定于项目的数据。

因此,为了减少偏见,确保数据能够代表广泛而多样的受众是很重要的。数据还需要针对你的算法进行准确的标注,并且应该始终检查数据是否符合数据标准、数据隐私法和安全措施的要求。

2.不要奢望人工智能发展会一帆风顺
ML算法的训练不是一个奇异的过程。一旦训练开始并且更好地理解了数据模型,就必须不断地对所收集的数据进行更改。在算法训练过程开始之前,要知道您实际需要什么数据并不容易。例如,您可能会意识到训练集或数据收集方式存在问题。

如同传统的软件开发一样,人工智能本质上也是软件构成的,需要通过持续、稳定的投入并逐渐产生效益。而在这一过程中,永远不要掉以轻心。

  1. 始终集成质量保证(QA)测试

通常,QA测试被认为是确保产品正确工作的附加项或形式,而不是被视为在所有迭代中优化产品的必备工具。事实上,QA测试是成功AI开发的重要组成部分。结果验证应该整合到人工智能开发过程的每个阶段,以降低成本,加快开发时间表,并确保资源的有效分配。

  1. 安排频繁的应用反馈

尽管想象起来可能令人气馁,但现实是,人工智能项目永远不会真正完成。即使项目超出了准确性和性能预期,你仍然有上升和完善的空间。此外,算法会根据不断变化的事物(观点、对话、图像等)做出决策。为了让人工智能体验在现在和未来都获得成功,它必须在滚动的基础上进行再训练,以适应新的社会环境、技术发展和其他影响数据的变化。

事实上,从AI的采用中看到最积极影响的公司遵循核心和AI最佳实践,在AI上的投入比同行更高效和有效。这包括在部署前测试AI模型的性能、跟踪性能以查看结果是否随着时间的推移而改善,以及制定良好的协议以确保数据质量。

通过开发一个强大的开发AI程序的方法,公司可以避免这些常见的错误,并确保他们的AI和ML计划的长期成功。​

相关文章
|
8天前
|
存储 人工智能 数据库
Codel:AI代理工具,支持在终端、浏览器、编辑器执行复杂任务和项目
Codel是一款全自主AI代理工具,支持在终端、浏览器和编辑器中执行复杂任务和项目。它运行在沙盒化的Docker环境中,具备自主操作能力,内置浏览器和文本编辑器,所有操作记录存储于PostgreSQL数据库。Codel能够自动完成复杂任务,如创建项目结构、进行网络搜索等,适用于自动化编程、研究与开发、教育与培训以及数据科学与分析等多个领域。
40 11
Codel:AI代理工具,支持在终端、浏览器、编辑器执行复杂任务和项目
|
20天前
|
人工智能 物联网 Shell
今日 AI 开源|共 12 项|开源的DIY健康追踪项目,基于低成本的智能戒指构建私人的健康监测应用
本文介绍了多个开源项目,涵盖了从量子计算错误纠正到视频生成和编辑的广泛应用领域。这些项目展示了AI技术在不同领域的创新和应用潜力。
135 10
今日 AI 开源|共 12 项|开源的DIY健康追踪项目,基于低成本的智能戒指构建私人的健康监测应用
|
13天前
|
存储 人工智能 缓存
官宣开源 阿里云与清华大学共建AI大模型推理项目Mooncake
近日,清华大学和研究组织9#AISoft,联合以阿里云为代表的多家企业和研究机构,正式开源大模型资源池化项目 Mooncake。
|
14天前
|
存储 人工智能 缓存
官宣开源|阿里云与清华大学共建AI大模型推理项目Mooncake
2024年6月,国内优质大模型应用月之暗面Kimi与清华大学MADSys实验室(Machine Learning, AI, Big Data Systems Lab)联合发布了以 KVCache 为中心的大模型推理架构 Mooncake。
|
1月前
|
存储 人工智能 文字识别
AI与OCR:数字档案馆图像扫描与文字识别技术实现与项目案例
本文介绍了纸质档案数字化的技术流程,包括高精度扫描、图像预处理、自动边界检测与切割、文字与图片分离抽取、档案识别与文本提取,以及识别结果的自动保存。通过去噪、增强对比度、校正倾斜等预处理技术,提高图像质量,确保OCR识别的准确性。平台还支持多字体识别、批量处理和结构化存储,实现了高效、准确的档案数字化。具体应用案例显示,该技术在江西省某地质资料档案馆中显著提升了档案管理的效率和质量。
|
1月前
|
人工智能 安全 网络安全
揭秘!大模型私有化部署的全方位安全攻略与优化秘籍,让你的AI项目稳如磐石,数据安全无忧!
【10月更文挑战第24天】本文探讨了大模型私有化部署的安全性考量与优化策略,涵盖数据安全、防火墙配置、性能优化、容器化部署、模型更新和数据备份等方面,提供了实用的示例代码,旨在为企业提供全面的技术参考。
94 6
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
探索未来AI趋势:掌握Function Calling技巧,解锁大模型精度提升的秘密武器,让你的数据科学项目事半功倍!
【10月更文挑战第6天】随着深度学习技术的发展,神经网络模型日益复杂,Function Calling作为一种机制,在提升大模型准确度方面发挥重要作用。本文探讨Function Calling的概念及其在大模型中的应用,通过具体示例展示如何利用其优化模型性能。Function Calling使模型能在运行过程中调用特定函数,提供额外的信息处理或计算服务,增强模型表达能力和泛化能力。例如,在文本生成模型中,根据上下文调用词性标注或实体识别等功能模块,可使生成的文本更自然准确。通过合理设计条件判断逻辑和功能模块权重,Function Calling能显著提升模型整体表现。
69 3
|
1月前
|
人工智能 Anolis 开发者
|
2月前
|
人工智能 自动驾驶 机器人
【通义】AI视界|苹果自动驾驶汽车项目画上句号:加州测试许可被取消
本文精选了24小时内的重要科技新闻,包括Waymo前CEO批评马斯克对自动驾驶的态度、AMD发布新款AI芯片但股价波动、苹果造车项目终止、Familia.AI推出家庭应用以及AI逆向绘画技术的进展。更多内容请访问通义官网体验。
|
3月前
|
数据采集 人工智能 安全
AI项目高昂成本与数据问题阻碍进展,2025年前30%的GenAI项目或将搁浅
AI项目高昂成本与数据问题阻碍进展,2025年前30%的GenAI项目或将搁浅