业界 | 对话车品觉:顶级数据团队该像支配合默契的篮球队

简介:

大数据文摘: 什么样的数据团队才称得上顶级?

车品觉: 我想先定义一下顶级。

一般人听到顶级一般会想,团队里有一个非常厉害的科学家,但是我定义的顶级是整个团队的配合天衣无缝,像一个篮球队。

数据团队是指数据部门的团队还是整家公司作为一个数据团队。如果是后者,必言产品,有一个产品可以辅助公司每一个人的数据,这个时候就对数据核心团队的要求很高。不再是公司的中央数据部门解决公司数据问题,而是整个公司都在解决整个公司的数据,这是很不一样的,能够达到这个境界,不再单纯依靠某个部门解决数据问题,而是整个公司都在产生依靠数据,才能说是顶级数据团队。

数据科学家只是整个环节中的一环,厉害的数据科学家会帮公司想几年后的东西,而不是现在就产生结果。如果作为整个团队,那么肯定是有一些灵魂人物出现,这些人不一定是数据技能有多厉害,而是懂得翻译,从数据能力到业务创新,或者商业团队的意愿转达给技术团队,这种角色是最难的。

大数据文摘: 这样的人才我们应该给在业务团队培养还是在技术团队培养呢?

车品觉: 我想答案应该是,哪边有这样的人,我们就去培养。

因为这种人非常少,再加上如果讲顶级大数据团队,在数据上继续构建,还要多一个东西,还有其他领域的数据在自己领域的增值是什么?(其他场景的数据进到我的主场景的时候会产生什么价值),这是个跨界的东西。需要一个人指挥这个团队的前进方向。

我希望用一个公司的例子来解释这个问题。我不是夸阿里很厉害,但目前来讲,我见到的公司,还几乎没有一个公司像阿里一样,对自己的数据岗位有一个很清晰的描述,也即绩效考核。比如一个P8的数据开发的人需要做什么?职责是什么,怎么知道他做得好?

因此,要建设一个顶级数据团队,你要知道怎么盘点这个数据团队,盘点一个团队肯定分两种:为了业务盘点技术,还是为了技术盘点业务,这两种有什么不一样,这是很多公司不具备的,我觉得这才是宝贵的。我在阿里这么多年,这是我最引以为傲的,至于培养了多少人,这不是重要的。

阿里的考核指标如何,阿里会让P8自己描述,你需要做什么。阿里有个优点,团队多,所以经过很多P8的描述,你就可以发现一个共同点,做一个P8要有什么样的水平。还有一个关键点,晋升一个P7到P8,到底晋升的时候有没有一个严谨的晋升之道,这也是建立一个数据团队的必经之路。

作为总监,会有一个数据的价值观,我会问你为了别人做了什么,有没有贡献过数据给别的部门,或者上下游,举个例子。这样就可以发现,团队凝聚力就很高,这不仅仅是说你自己做了什么,而是为整个大的队伍做了什么。

大数据文摘: 数据团队的构成上,嵌入式和中央式的数据团队更看好哪一个?

车品觉: 我更看好这两者混合的数据团队,就好像打架,肯定有前锋,但是前锋和后方部队的工作不一样。你可以培养很懂数据的团队来产生价值,但是谁来培养培养数据呢?数据不是资产,是资源。要时刻问自己,你的资源够不够?如果现在够,还需要问一下,公司准备在两三年后做的事情,资源又够不够?

所以数据战略应该和业务战略是同步的,业务战略走多高,数据战略也应该走多高。而数据战略又分为数据能力的战略和数据资源的战略,我们现在很多人都提到一个问题,数据的发展会成为很多东西的壁垒。数据要越来越像一个战略,算法是技术,是一个效率问题,产品和业务场景是变现,我觉得这三个点要分开来讲。

大数据文摘: 数据应用落地需要数据、业务、工程三方合作,这三方(数据团队与IT团队和业务团队)应该如何有效协作?

车品觉: 这实际上是有一个上下游的关系,最难的点是,下游的人想做上游的事情,上游的人想干掉下游的人,就是在大部分的数据团队,大家都想一条线都做完,所以问题的关键在管理。但是当中需要想的是,为什么下游的人想做上游的事情。关键在晋升。一般业绩考核都是在前段,如果你的绩效没有鼓励供应枪炮的人也得到认可,那供应枪炮的人就会想,为什么我不自己去前线。

如果把这一点逐步平台化,这个问题会改善。我们有一次在阿里,打开了整个云,看数据的重复,发现非常多,每个人都在建自己的底层。从管理者的角度来说,怎么解决?把用得多的数据变成公共层,没有人可以copy出去。

借这次采访,我也希望让更多数据公司的管理者知道,数据不是自然变好的。比如说有一年,阿里曾经把公司的三大团队拉到一个酒店,描述自己在干嘛,发现都一样。阿里有几个大团队,我所在的部门、广告、推荐,让大家都画一下自己在做事情的图,发现做的都一样,数据很多重复,每一个都想干掉对方,都在建同样的架构。如果一个公司没有CTO,没有人对此负责人,会很乱。数据重复会导致算法重复,产品重复。我在阿里这些年也在努力做这样的事情,把18个产品变成6种,算法、数据集中起来变公用。先收,而不是扩,才能做出精锐的顶级团队。

大数据文摘: 如何看待数据驱动?

车品觉: 数据驱动的定义是,我在做一个决策的时候是不是数据支持的。

这里我想举三个例子。

如果给你看一份报告,让你对这个事情有了一定的认知,接下来做了一个正确的决定,算不算数据驱动?

在一个保险计算中,有没有风险工具在其中,直接把大数据算法能力放在风控领域中,算不算数据驱动?

有一个无人飞机,这个飞机的飞行是按照数据的,风向、天气变化数据,这算不算数据驱动?

这三个都是数据驱动,但是第一个不能看待feedback。数据的闭环有很多断点,第二个场景下,数据是可以回来的,但是也存在一些断点,也不完全是一个非常紧密的数据回流;第三个是一个base on feedback的数据驱动。

当然这三个都是数据驱动,但是一个比一个有更紧密的数据回流,而且改进的时间是一个比一个更短。首先公司要明白,刚刚说的三种数据驱动在一家公司会同时存在,它是基于管理层还是中层还是直接应用。管理层的问题是不可能完全数据化的,几乎没有数据,需要基于判断,基于不完美数据的判断,第二个闭环情况下,是可以在部分环节套进去,第三个是可以自适应的。

大数据文摘: 数据团队建设最大的痛点是什么?

车品觉: 人才缺乏。

在一个行业正走红的时候,找人很难找,即使是阿里,也很难得心应手找到合适的人。刚刚讲的东西也就更关键了,依靠团队,而不是依靠某一个人,在大家都没有人的时候,我刚刚进阿里的时候就是这样,一定要打配合,我常常跟我的团队说,我们不是单人作战的,我们是一起打的。

大数据文摘: 对有志于进入数据科学领域学生/数据团队领导人的建议和意见。

车品觉: 最好在培养的时候能培养多一点domain的人才,其实AI和大数据都有两类:基础AI/大数据和应用AI/大数据,应用是跟行业联系起来的,这两种人才的培养是不一样的,在应用端的培养,应该在大学时候给予多一些行业知识。我在念书时候,有business computing,懂商业。当然我们也不仅要培养应用类AI/大数据,也要培养基础的。


原文发布时间为:2018-08-27

本文作者:文摘菌

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“大数据文摘”。

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
PyTorch API 算法框架/工具
MMsegmentation教程 6: 自定义运行设定
MMsegmentation教程 6: 自定义运行设定
1095 0
|
10天前
|
人工智能 开发工具 iOS开发
Claude Code 新手完全上手指南:安装、国产模型配置与常用命令全解
Claude Code 是一款运行在终端环境中的 AI 编程助手,能够直接在命令行中完成代码生成、项目分析、文件修改、命令执行、Git 管理等开发全流程工作。它最大的特点是**任务驱动、终端原生、轻量高效、多模型兼容**,无需图形界面、不依赖 IDE 插件,能够深度融入开发者日常工作流。
3255 9
|
3天前
|
人工智能 自然语言处理 文字识别
阿里云百炼Qwen3.7-Max简介:能力、优势、支持订阅计划参考
Qwen3.7-Max是阿里云百炼面向智能体时代推出的新一代旗舰模型,对标GPT-5.5、Claude Opus 4.7等闭源旗舰。该模型支持百万级token上下文窗口,具备顶级推理能力、多模态搜索与视觉理解增强、流式输出低延迟响应等核心优势,覆盖编程、办公、长周期自主执行等复杂场景。同时支持OpenAI接口兼容,便于系统快速迁移。用户可通过Token Plan团队或节省计划等订阅方式灵活调用,适合企业级高要求场景使用。
阿里云百炼Qwen3.7-Max简介:能力、优势、支持订阅计划参考
|
13天前
|
Shell API 开发工具
Claude Code 快速上手指南(新手友好版)
AI编程工具卷疯啦!Claude Code凭借任务驱动+终端原生的特性,成了开发者的效率搭子。本文从安装、登录、切换国产模型到常用命令,手把手带新手快速上手,全程避坑,30分钟独立用起来。
3309 23
|
7天前
|
人工智能 Linux BI
国内用 Claude Code 终于不用翻墙了:一行命令搞定,自动接 DeepSeek
JeecgBoot AI专题研究 一键脚本:Claude Code + JeecgBoot Skills + DeepSeek 全平台接入 一行命令装好 Claude Code + JeecgBoot Skills + DeepSeek 接入,无需翻墙使用 Claude Code,支持 Wind
2320 4
国内用 Claude Code 终于不用翻墙了:一行命令搞定,自动接 DeepSeek
|
26天前
|
人工智能 JSON 供应链
畅用7个月无影 JVS Claw |手把手教你把JVS改造成「科研与产业地理情报可视化大师」
LucianaiB分享零成本畅用JVS Claw教程(学生认证享7个月使用权),并开源GeoMind项目——将JVS改造为科研与产业地理情报可视化AI助手,支持飞书文档解析、地理编码与腾讯地图可视化,助力产业关系图谱构建。
23597 15
畅用7个月无影 JVS Claw |手把手教你把JVS改造成「科研与产业地理情报可视化大师」
|
13天前
|
人工智能 JSON BI
DeepSeek V4-Pro 接入 Claude Code 完全实战:体验、测试与关键避坑指南
Claude Code 作为当前主流的 AI 编程辅助工具,凭借强大的代码理解、工程执行与自动化能力深受开发者喜爱,但原生模型的使用成本相对较高。为了在保持能力的同时进一步降低开销,不少开发者开始寻找兼容度高、价格更友好的替代模型。DeepSeek V4 系列的发布带来了新的选择,该系列包含 V4-Pro 与 V4-Flash 两款模型,并提供了与 Anthropic 完全兼容的 API 接口,理论上只需简单修改配置,即可让 Claude Code 无缝切换为 DeepSeek 引擎。
2800 3
|
4天前
|
人工智能 自然语言处理 安全
Claude Code 全攻略:命令大全+三种模式+记忆体系+实战工作流完整手册
Claude Code 是当前最流行的终端级 AI 编程助手,能够直接在命令行中完成代码生成、项目理解、文件修改、命令执行、错误修复等全流程开发工作。它不依赖图形界面、不占用额外资源,却能深度理解项目结构,自动生成规范代码,大幅提升研发效率。
877 2

热门文章

最新文章