近10年数据智能团队建设,联想总结了由内而外的发展经验 | 专访联想集团副总裁田日辉

简介: 近10年数据智能团队建设,联想总结了由内而外的发展经验 | 专访联想集团副总裁田日辉

去年6月,联想集团公开宣布,成立数据智能业务集团 (Data Intelligence Business Group,DIBG),由蓝烨担任高级副总裁,直接向杨元庆汇报。同时,联想集团副总裁田日辉负责数据智能业务集团的产品和生态业务,汇报给蓝烨。

在当时写给数据智能业务集团的内部信中,联想集团董事长兼首席执行官杨元庆表示,“在大数据积累的基础上成立联想数据智能业务集团,是为了加速智能化变革,是实施联想行业智能(Smart Verticals)战略的重要举措。”

这也是一直被外界誉为信息化标杆企业的联想,向数据智能领域延伸业务的一次重要的商业布局。

其实联想内部广义上的信息化早在2000年左右就开启了。经过20多年的信息化实践和积累,联想目前的大型主系统有上千套,整个公司服务器加起来有上万台,数据链量级已经达到十几个PB。

同时,联想在全球都运营着庞大的上下游生态,在全球两百多个国家和地区同步进行用户服务与体系构建,目前有50多家上游企业,2000多家下游渠道企业。

经过一年的发展,联想数据智能业务集团发展如何?联想集团的数据平台构建与数据团队建设又有怎样的进展?针对以上问题,上个月,我们对联想数据智能业务集团产品及生态总经理田日辉先生进行了一次专访。

三阶段数据团队建设,打造全价值链数据智能平台

在成立数据智能业务集团之前,联想内部的数据团队其实已经初具规模,团队建设也不是一蹴而就的。

自2011年联想开始应用大数据至今,联想的数据平台建设主要可以划分成三个阶段:
第一阶段:企业内部先进数据应用建设;
第二阶段:在内部和外部构建平台;
第三个阶段:构建上下游企业的数据智能生态。

2011年到2015年是联想数字团队建设的起步阶段。当时的数据团队还主要是服务联想内部拓展数据的应用,因此数据团队的规模很小,只有十几个人,四年后慢慢扩展到一百多人。

田日辉告诉我们,当时团队研发中国第一款安卓系统手机乐phone,通过应用商店、SBK模拟器、开发环境与数据分析工具等来构建一套大数据体系,进而帮助应用商店开发者收集相关使用数据。联想的数据团队最早就是从此入手,帮助应用商店的开发者分析月活、日活与产品质量等数据,持续不断优化这些智能应用。

田日辉表示,在初期内部硬件的生产上,联想就对于信息化比较重视,是国内首批使用ERP的企业之一,因为自2004年收购IBM 的PC业务后,全球化运作对信息系统的要求较高,IBM原本的很多系统被逐渐废掉,联想也构建了自有系统,提升效率。

之后随着这些应用的深入,大数据不仅能在应用层对产品提供优化,企业内部大量的运营数据,对企业产品研发、供应链管理、市场营销还有很多影响,使得数据应用可以扩展到整个延产供销服务全价值链。

2016年到2019年下半年,联想开始进入了数据团队建设的第二阶段,开始把数据应用大规模进行平台化和推广,并开始将能力对外输出,拓展给外部用户,并在公司内部构建平台。

这一阶段,联想开始有计划的建设全公司“人人都能使用”的数据平台,“这个过程中,公司内部核心策略就是人人都是分析师。”

田日辉提到,数据团队负责建平台,把核心数据和公用数据帮用户整理好;业务人员(IT部门、业务部门等)完成平台分析工作,大量人员参与进来,使得业务经验能够与数据分析方法更好结合起来,以自服务式应用致力于解决数据科学家缺失的难题。数据团队开发平台性产品之后,在公司内部先部署与使用,比较成熟之后,再服务外部客户(汽车、石化、钢铁等企业)。外部客户因为和与内部的应用模式有所不同,有很多创新的需求和应用点,通过反馈去优化产品,增加内部应用平台的功能特性,并建立内外部互动模式。

而到了现在,联想数据团队建设已经进入了构建生态化阶段。联想所处的行业生态链中,上下游企业都处于数据智能转型时期,联想数据团队现在已经构建了上下游合作伙伴都能利用的智能化应用平台。平台除了提供算法工具之外,还预置了多年积累的分析数据模型,包括预测、仓储优化、用户画像、精准营销等,使合作伙伴能够很快地使用,把数据与业务模型对接,实现业务价值闭环。上下游企业可以选择用联想平台去做智能化软件,也可以使用联想的产品构建私有平台。下游大量中小型制造业企业受限于信息化成本,在数字化转型过程面临很多挑战,建立生态系统可以使其直接使用经过实践验证的平台。

联想希望在对外服务的同时,也能够建立起生态系统,服务更多的尤其是中小企业客户,推动中国智能制造快速转型。

内外部数据治理结合,优化数据平台结构

细数数据团队建设的三个阶段,田日辉对第二个阶段的印象最为深刻。

和很多业务部门较多的集团型企业一样,业务规模如此庞大的联想也面临着数据分散在不同的业务系统中,难以整合的痛点。数据团队建设在初具规模之后的最重要任务,就是建立起一个更完善的企业级数据分析平台,把这些内部分散的数据以集中的方式进行整合管理并科学地利用起来。

正如上文提到,联想注重业务与数据团队的紧密结合,内部的数据团队与不同业务部门分工合作。因此从2016年开始,联想就开始把联想几十年信息化中的大小数据系统整合起来,形成企业整体数据湖,并构建统一的数据模型。

数据团队在中央提供分析算法工具,积累推广模型,提供复杂建模过程的二线帮助并举办培训活动,辅助业务部门采取自助式的服务。

田日辉给我们举了个销量预测的例子,说明联想数据智能团队内部是如何使用内部流程化工具为业务部门提供辅助的。

联想生产销售各种复杂的设备,因此销量预测是多层次的,总销量预测会分不同地区和不同产品线。在不断发展中,数据团队把预测模型放到平台上,通过几轮配型后,进行模型积累。平台本身提供很多分析和算法工具,使业务人员运用不同的数据级,使用自动化机器学习工具测试不同的算法,并给出最优结果,同时根据业务实践来判断哪个参数和配置最符合要求。

由于相关数据表极其庞大,可能会存在一些数据冲突,因此公司级大平台可以进行统一数据治理,让所有人的分析工作达到比较好的效果。

要做一个有效的预测或者优化,数据链,尤其数据的广度是非常关键的,因此联想也引入了很多外部数据。在内部平台建设的同时,联想接入大量外部数据进行合作。合作的供应商、市场预测部门、客户满意度调查,各种产品质量反馈等数据都会作为外部数据汇总进来。

内部的数据平台建设逐渐成熟后,联想的数据团队也开始将数据能力输出给提供商与服务提供商,更需要深入理解客户业务和机理模型。

对于外部行业客户,联想内部的数据科学家在专业知识理解方面相对薄弱。在进入行业初期,团队与客户的行业专家一起做项目,客户对企业的数据积累情况与行业的机理模型更清楚,而团队对数据与算法比较清楚。渐渐,客户本身会具备数据使用能力,团队也会积累一些所谓的行业专家,进而把应用模型带给其他客户。由于很多案例和应用框架可以复用,团队也一直在尝试加强对行业的理解,建立一些行业专家人才队伍。

因此,田日辉对于意向进入数据科学领域的高校学生,也提出了一些行业知识的期待。

“掌握新技术有较好的基础,且自学能力与使用能力强。但是应该更多理解企业的运营模式,业务需求和机理模型,多参加一些真正与实战相结合的活动,或到企业里面参与一些实际的工作与项目。”

明确团队绩效指标,“不是一件难事”

很多团队关心数据团队本身的商业影响力及其产生的价值,相比一些传统的部门,数据团队的价值比较难估计与量化。

但在联想内部,估算产出投入与价值却并不是一个很困难的事情。

田日辉提到,由于在第二阶段建设了全集团统一的数据平台,只需要了解公司内外对于数据平台的调用有多少,并且在平台内的操作帮助业务部门创造了多少价值即可。

具体来说,团队关键KPI有用户数,产生的价值量等。由于最终的应用由业务部门完成,完成这个项目后,它的质量提升了多少,它的预测精准度提高了多少,意味着多少业务价值,都是很明显的。

到了第三阶段,对于上下游企业来说,外部企业客户最直接的价值就是其购买产品与服务花费的数额,且客户对于投入产出比的敏感性,这个指标也是很容易衡量的。

举个例子,2017年底联想开始与中国顶尖的石化企业合作,一起做催化裂化装置的工艺参数优化。最后联想的投入是客户出资的五六倍,但是团队也乐于与跟客户一起,把石化行业的标杆客户拿下,这件事对企业有非常大的业务价值,且这类价值比较容易衡量。

今年的疫情期间,虽然全球经济都受到了影响,但是田日辉的团队并没有改变原有的发展路线图和考核标准。

田日辉告诉我们,从用户使用的角度来说,云模式的产品无论从分析还是从报表各方面,基本上没有太大的影响。中央的数据团队虽然在家里远程办公,数据用户也在家里办公,但是整个平台运转还是很正常。

疫情对团队业务本身供应链会有一些影响,即用户的需求。由于疫情影响,客户对联想的产品,无论是业内产品还是云服务的产品,以及数据智能转型服务这些产品的需求,都是有所提升的。联想的私有云给外部客户提供的服务略有影响,体现在团队帮助客户来构建私有云之后,在建设初期,需要做用户访谈和数据治理,和云业务部门有比较多的沟通,这些项目会受一定的影响,但是比例不是很大。在面对疫情等重大社会事件下的经济现状中,田日辉也希望团队保持积极心态,推定数据平台与服务升级,寻求稳定发展。

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
3月前
|
数据采集 JSON API
小红书获取笔记正文和点赞数的API接口
本文介绍如何通过小红书API获取笔记正文和点赞数,涵盖认证流程、API调用方法及Python代码示例,助力开发者实现内容分析与应用集成,确保合规高效地利用平台数据。
633 0
|
SQL 开发框架 Ubuntu
阿里云轻量应用服务器系统镜像和应用镜像区别及选择
阿里云轻量应用服务器可选应用镜像和系统镜像,应用镜像和系统镜像有什么如何?阿里云轻量应用服务器操作系统如何选择镜像?笔者分享阿里云轻量应用服务器应用镜像和系统镜像的区别及选择方法:
阿里云轻量应用服务器系统镜像和应用镜像区别及选择
|
10月前
|
人工智能 算法 安全
深度:善用人工智能推动高等教育学习、教学与治理的深层变革
本文探讨人工智能技术与高等教育深度融合带来的系统性变革,从学习进化、教学革新与治理重构三个维度展开。生成式AI作为技术前沿代表,正通过标准化认证体系(如培生的Generative AI Foundations)提升职场人士、教育者及学生的能力。文章强调批判性思维、高阶认知能力与社交能力的培养,主张教师从经验主导转向数据驱动的教学模式,并提出构建分布式治理结构以适应技术迭代,最终实现人机协同的教育新生态,推动高等教育在智能时代焕发人性光辉。
|
10月前
|
人工智能 自然语言处理 监控
人工智能赋能教育变革的关键变量:教育管理者的数字化领导力重塑
在人工智能重构教育生态的背景下,我国“教育数字化行动计划”取得显著成果,但技术赋能教育的深层价值尚未充分释放。关键在于教育管理者的数字化领导力转型。生成式AI认证体系为管理者能力升级提供解决方案,强调技术认知、实践能力和伦理治理三方面提升。未来教育治理需实现技术与管理双轮驱动,推动从“数字工具应用”到“教育模式创新”的转变,最终达成公平且高质量的教育目标。
|
9月前
|
安全 网络协议 搜索推荐
远控安全金标准,ToDesk、向日葵、网易UU安全功能盘点,是否能攻破防线
本文对ToDesk、向日葵和网易UU三款主流远程控制软件进行了安全性评测。远程控制技术虽带来便利,但也存在安全隐患。文章从设备授权管理、远程连接与数据传输、隐私安全机制及主动防诈保护四个方面展开分析。ToDesk在二次验证、金融窗口保护等方面表现突出;向日葵基础安全功能完善但缺乏创新;网易UU侧重基础功能,安全机制尚待完善。最终通过星级表对比,ToDesk综合表现最佳,向日葵次之,网易UU适合低风险场景。未来远控软件需向体系化、智能化方向发展以应对不断演变的威胁。
|
10月前
|
机器学习/深度学习 人工智能 算法
DeepSeek深度解析:一场「通用人工智能」的觉醒革命
DeepSeek,由幻方量化打造的国产大模型,正以彗星般的速度革新AI领域。它不仅刷新了中文AI技术基准,还在底层架构上实现颠覆性突破。文章从技术逻辑、产业影响和未来挑战三个维度解析这场AI革命。DeepSeek采用多模态神经网络设计,融合异构数据,展现通感能力;引入动态神经元编织与具身智能,提升参数效率。其混合架构在数学推理中表现卓越,并通过认知卸载机制优化长文本处理。DeepSeek正在重塑金融投研范式,推动AI原生开发模式,同时引发对伦理与硬件限制的深思。最终,DeepSeek重新诠释了“智能”本质,促使人类与AI共同进化为认知伙伴。
531 8
|
10月前
|
人工智能 自然语言处理 供应链
产品设计师如何培养创造力?生成式人工智能时代的破局之道
本文探讨生成式人工智能对产品设计师创造力的影响,从技术赋能、认知升级和伦理坚守三方面分析。技术赋能通过效率提升与灵感激发重构设计流程;认知升级强调理解技术本质,将局限转化为创新契机;伦理坚守确保技术应用正向价值。最后提出通过实践与认证构建未来创造力体系,在技术与人文交汇处重新定义创造力边界。
|
12月前
|
安全 搜索推荐 数据安全/隐私保护
VoceChat站内社区:连接你我,共享精彩
VoceChat站内社区提供语音和文本通讯,内置丰富主题板块,支持实时互动、群组聊天和个人化设置,保障数据安全。用户可在此分享、讨论、组织活动,结交全球好友,构建开放包容的交流空间。官方部署教程:<https://doc.voce.chat/zh-cn/install/docker>,推荐使用阿里云服务器部署。
383 3
|
5G 网络架构
计算机网络与技术——物理层
物理层是计算机网络OSI模型中最低的一层,它规定了为传输数据所需要的物理链路的创建、维持、拆除,以及提供具有机械的、电子的、功能的和规范的特性。物理层考虑的是怎样才能在连接各种计算机的传输媒体上传输数据比特流,而不是具体的传输媒体。物理层的主要任务是为数据传输提供可靠的环境,它为设备之间的数据通信提供传输媒体及互连设备,确保原始的数据可在各种物理媒体上传输。物理层的基本概念包括物理层的作用、物理层的主要任务、数据在传输媒体上的传输方式等。用于物理层的协议也常称为物理层规程(procedure),其实物理层规程就是物理层协议。
计算机网络与技术——物理层
|
JavaScript 前端开发
ESlint + Stylelint + VSCode自动格式化代码(2023)
ESlint + Stylelint + VSCode自动格式化代码(2023)
480 0