当纺织遇上阿里云,数学博士钻进车间要让企业更高效

简介:

从数学博士到阿里云工程师,夏分一直学以致用。加入阿里云接手的第一个ET工业大脑项目,因为数据传输问题丢失大量数据,导致机器误判拉响警报,这让他意识到自己不能只坐在电脑前做“码农”,也要下到车间做实地考察。

然而,之后夏分参与的项目是一家有32年历史的毛纺企业,从订单到配色、染毛、混毛,到纺线、织布和成衣,没有一套完整的数据采集系统。车间主任“迷信”人工智能和机器算法,在没有数据的情况下提出一系列“无解”要求,夏分利用数学思维将其一一解决。

虚惊一场的教训

从本科到博士,夏分在浙江大学研究了10年数学,毕业后一度从事人工智能辅助医疗方面的研究,却因为缺乏结构化数据陷入瓶颈。刚好,有人推荐他去阿里云,抱着“医疗是民生,工业是战略”的想法,夏分于2017年7月加入阿里云,成为一名算法工程师,也是第一代车间程序员。

入职后的第4个月,夏分接手了第一个项目,用ET工业大脑帮一家风电企业提前预测风电机组故障。

当纺织遇上阿里云,数学博士钻进车间要让企业更高效

夏分

由于无法实时掌握工作状态,传统风电机组维护,通常都是在故障发生后亡羊补牢,维修费用高,维修周期长,还会影响生产的连续性。

一个5万千瓦的风电场,平均每年维护费用高达300万元,还会以平均3%的速率逐年递增。而这家风电企业拥有10个风电场、500多台风电机组,维护成本带来的压力可想而知。

就像一个人生病,病情发展有迹可循,如果能提早发现,提前干预,就能阻止病情恶化,节省医疗成本。而对风电机组来说,一个核心健康指标是温度,长期高速运转下,部件老化导致摩擦碰撞,就会产生不必要的热能,但有些时候,没有机械故障也会引起部件发热,怎么样才能在不放过故障的同时,做到不误报、减少风电场工程师工作量?

工程师爬上几十层楼高的风电机,为两台验证机组装上数十组温度传感器,在运转中源源不断地采集温度数据,夏分则在杭州的办公室里,实时监控并分析着数千里之外的数据。积累到上亿条温度数据后,夏分建立机器学习模型,希望能提前识别风电机组运行异常并预警。

一次,机器检测出的温度数值与模型预估的相差20多度,这让夏分有点不知所措,“温度过高将导致风电机组无法正常运作,这可不是个小问题。”远在新疆吐鲁番的工程师接到警报后,赶紧查看了“异常”风电机组测点的温度数据,却发现完全正常。那么,是网络传输不稳定?还是传感器故障或老化影响了数据的采集?夏分在脑海中推理着各种原因,不相信自己的算法会出错。

“怎么会只有1%的数据?”紧张排查几个小时,原因找到了,风电场出现严重的数据缺失,大量数据未同步上传,导致机器学习的并不是完整数据。

最终,ET工业大脑做到能提前2周识别风电机组潜在故障,大修变小修,单次重大事件维护成本降低20-40万元。夏分却意识到,要将前沿科技真正带入工厂,光靠在电脑前码出一套算法还不够,必须去实地考察真实情况。

毛纺企业的配色难

今年四月,夏分接到又一个项目需求——一家国内毛纺行业的龙头企业,希望借助ET工业大脑,来提高配色的效率。毛纺行业,染色质量是衡量呢绒产品质量的金标准,而染色的关键,在于染料配方的准确程度。

夏分一头扎进毛纺企业的混合羊毛车间。车间里闷热潮湿,羊毛和化学溶剂的味道混在一起,钻进鼻子令人犯呕,轰隆作响的混毛机器旁,放着一个个一米多高的白色塑料桶,里面塞着不同颜色的羊毛。

当纺织遇上阿里云,数学博士钻进车间要让企业更高效

纺织车间

这一次,客户来样是蓝色。试验台前坐着二三十名工艺员,他们从一缸染好颜色的羊毛中,撕取一小撮大概15厘米长、5厘米直径的羊毛小样,人工梳毛后,拿着小样去称量,然后通过美国进口的datacolor测色仪,检测染色结果是否与客户要求一致。

验色结果不尽人意,颜色严重偏紫,红色太多。第二次配色,又偏绿了,黄色太多。工艺员把第一缸和第二缸的羊毛倒入混毛机,充分混匀后,再撕取一撮上机器测色,若不正确,就再重复一次。

当纺织遇上阿里云,数学博士钻进车间要让企业更高效

成检车间

“还是很原始的方式。”夏分从老师傅口中得知,从拿到订单指令到完成配色,至少要一周时间,老师傅一般5次左右便可配色成功,而新人7次8次都未必能成功。染料配方频繁调整,生产周期随之拉长,库存积压还是小事,倘若色光不符合客户来样,能不能顺利交货都是问题。

夏分琢磨着,建立模型导入数据,让机器学习染料配方,再将老师傅总结出的经验,通过机器算法来学习,几次推荐出符合来样的染料配方易如反掌。夏分正想得出神,车间主任突然来了一句“我们没有数据”……

想要数据得先洗脑

数据,其实是有一些的。比如每次配色成功,工艺员都会详细记录染料配方和混色数据,只是没有数字量化最终配出的颜色,而是保存了实物样本。每次拿到客户来样,工艺员就拿出以前做过的实物样本对比,找出色光最接近的方案,不断调整测试。

可是经验丰富的工艺员都知道,哪怕配的是之前配过的同一种颜色,按照历史记录配出的颜色,也会因为车间环境温度湿度的变化而发生细微偏差,而染料员稍偷点懒,30分钟的染色时间缩短到26分钟,就会直接影响染料在羊毛上的附着力。而这些有可能导致配色失败的因素,都没有以数据的方式留存下来。

企业的IT员工,其实早就认识到数据生成和数据采集的短板,一直在向车间主任推荐数据的功效,可是对方的回答永远是“大家都那么忙,哪有空做这个?”

对于ET工业大脑,车间主任倒是寄予厚望,见到夏分就说,“人工智能嘛,你们阿里云就是很厉害,没有数据你们也应该能做出来。”

“没有数据不行?那你们就估计一个数据出来。”车间主任甚至提出,希望通过算法,自动填补缺失的空白数据。

“这根本就是悖论嘛。”夏分抿了抿嘴,车间主任“神化”了人工智能和机器算法,给他提出一个大难题。

当纺织遇上阿里云,数学博士钻进车间要让企业更高效

两次见面沟通,一次电话会议,夏分只要逮到机会,就给车间主任灌输“要采集数据”的观念。到了5月底,IT人员发来了专门采集的数据,夏分如释重负。

目标节省两成人力

从车间回到办公室,夏分坐在电脑前,在网上搜索起契合业务背景的论文。

《基于共轭梯度法的纱线染色配方预测优化算法》,外行人读个题目都费劲的论文,夏分抱起来就啃。从中午吃完饭到零点睡觉前,从一开始的三四篇论文再到引申出的10余篇参考文献,夏分一边仔细研读,一边做笔记标注,仿佛回到读研读博的时光。

既然目前车间工作流的操作无碍,就把不稳定的因素暂放一旁,只要减少配色的尝试次数,在一定程度上就是节省工作量,夏分理清了思路,“我们要做的就是找到一个平衡点,提高算法的准确率,从而减少他们的工作流和人力。”

“收集历史配方数据,列出用了哪个工厂的染料,哪几种颜色,比例分别是多少,染色出来的颜色是什么……”夏分给车间主任开出了数据采集要求,在配色染色的每一个步骤都加上了使用数值化记录的环节。

毛纺企业目前有几十类配方,而机器学习一类配方大概需要上百条数据,只要拥有数据,夏分很快就能完成数据清洗,特征构造,特征筛选,模型筛选,参数调优等建模步骤。

结合前期试验和算法模型,夏分设想,首次推荐配方的成功率只有60%,二次推荐的成功率是84%,三次推荐的成功率则在90%以上,可以节省20%的人力,现在就只差实践验证。

“分析、比较、判断,其实都是数学中的逻辑思维。”夏分笑着说,自己跟数学早已难舍难分。


原文发布时间为:2018-08-30

本文作者:王安忆

本文来自云栖社区合作伙伴“天下网商”,了解相关信息可以关注“天下网商”。

相关文章
|
3月前
|
人工智能
AI设计自己,代码造物主已来!UBC华人一作首提ADAS,数学能力暴涨25.9%
【9月更文挑战第15天】近年来,人工智能领域取得了显著进展,但智能体系统的设计仍需大量人力与专业知识。为解决这一问题,UBC研究人员提出了“自动智能体系统设计(ADAS)”新方法,通过基于代码的元智能体实现智能体系统的自动化设计与优化。实验结果表明,ADAS设计的智能体在多个领域中表现优异,尤其在阅读理解和数学任务上取得了显著提升。尽管如此,ADAS仍面临安全性、可扩展性和效率等挑战,需进一步研究解决。论文详情见链接:https://arxiv.org/pdf/2408.08435。
56 4
|
4月前
|
达摩院 供应链 安全
光储荷经济性调度问题【数学规划的应用(含代码)】阿里达摩院MindOpt
本文介绍使用MindOpt工具优化光储荷经济性调度的数学规划问题。光储荷经济性调度技术旨在最大化能源利用率和经济效益,应用场景包括分布式光伏微网、家庭能源管理系统、商业及工业用电、电力市场参与者等。文章详细阐述了如何通过数学规划方法解决虚拟电厂中的不确定性与多目标优化难题,并借助MindOpt云建模平台、MindOpt APL建模语言及MindOpt优化求解器实现问题建模与求解。最终案例展示了如何通过合理充放电策略减少37%的电费支出,实现经济与环保双重效益。读者可通过提供的链接获取完整源代码。
|
4月前
|
存储 分布式计算 大数据
惊了!大数据时代来袭,传统数据处理OUT了?创新应用让你眼界大开,看完这篇秒变专家!
【8月更文挑战第6天】在数据爆炸的时代,高效利用大数据成为关键挑战与机遇。传统数据处理手段难以胜任现今海量数据的需求。新兴的大数据技术,如HDFS、NoSQL及MapReduce、Spark等框架,为大规模数据存储与处理提供了高效解决方案。例如,Spark能通过分布式计算极大提升处理速度。这些技术不仅革新了数据处理方式,还在金融、电商等领域催生了风险识别、市场预测及个性化推荐等创新应用。
103 1
|
6月前
|
存储 人工智能 固态存储
计算机基础概论:构筑数字社会的硬件基础与交互技术
计算机基础概论:构筑数字社会的硬件基础与交互技术
85 2
|
5月前
|
存储 达摩院 供应链
排产排程问题【数学规划的应用(含代码)】阿里达摩院MindOpt
**文章摘要:** 本文探讨了使用阿里巴巴达摩院的MindOpt优化求解器解决制造业中的排产排程问题。排产排程涉及物料流动、工序安排、设备调度等多个方面,通常通过数学规划方法建模。MindOpt支持线性规划、整数规划等,能有效处理大规模数据。案例以香皂制造工厂为例,考虑了多种油脂的购买、存储和生产计划,以及价格变化和存储成本。问题通过数学建模转化为MindOpt APL代码,求解器自动寻找最优解,以最大化利润。文章还提供了代码解析,展示了解决方案的细节,包括目标函数(利润最大化)、约束条件(如生产效率、库存管理)以及结果分析。
|
算法 数据挖掘
点球成金:数据分析对抗传统经验的超级案例 | 彭文华
点球成金:数据分析对抗传统经验的超级案例 | 彭文华
|
弹性计算 运维 负载均衡
第十七届振兴杯计算机程序设计员(云计算平台运维与开发)决赛
第十七届振兴杯计算机程序设计员(云计算平台运维与开发)决赛
214 0
|
存储 数据采集 机器学习/深度学习
什么是科学问题,大数据考试题
什么是科学问题,大数据考试题
103 2
什么是科学问题,大数据考试题
|
存储 缓存 算法
2022年中国研究生数学建模竞赛C题 汽车制造涂装-总装缓存调序区调度优化问题思路分析
2022年中国研究生数学建模竞赛C题 汽车制造涂装-总装缓存调序区调度优化问题思路分析
|
人机交互 芯片 异构计算
2019年全国大学生电子设计大赛(简单电路特性测试仪)
本测试仪以低功耗STM32F407单片机为核心控制器件,利用DDS芯片AD9850和电阻分压电路产生1kHz 30mV正弦信号输入到待测电路,通过采集输入电压Ui和流过输入电阻上电流Ii,算出输入电阻Ri;采集开路电压Uopen和带载电压U1并结合流过负载电阻上的电流Io,算出输出电阻Ro;结合待测电路的工作特性来分析和判断待测电路的故障原因。   实测结果表明,该测试仪能正常输出1KH的正弦波,测得输入电阻为3.2K ohm,输出电阻为1.96K ohm,在输入1KHz正弦信号下,增益为20.3dB,扫描频率可清晰显示该放大电路的幅频特性曲线且测得上限频率为65KHz;改
432 0
2019年全国大学生电子设计大赛(简单电路特性测试仪)