洞悉2020年数据团队建设,我们和清华、领英一起搞了个大事情,你也可以参与!

简介: 洞悉2020年数据团队建设,我们和清华、领英一起搞了个大事情,你也可以参与!

我的公司是否需要独立的数据团队?
我该何时、怎么样建设自己的数据团队?
数据团队的价值如何衡量?
疫情之下,数据团队又受到哪些影响?

加入我们,一起透析数据团队建设全景!

数据驱动时代,数据团队作为一家公司的核心竞争力所在,正在受到越来越多高管、从业者和投资人的关注。而目前,相对公司中的财务、运营等已经规模化的组成,数据团队还是不少公司可有可无的部分,即使是一些已经建立了独立数据团队的公司,其运作方式以及与其他团队的协作仍然处于探索阶段。

2017年起,清华数据科学研究院联合大数据文摘发布了首份《顶级数据团队建设全景报告》。《报告》囊括50,000余条网络招聘数据分析、1,000余份问卷调查和10余位海内外数据团队负责人深度访谈综合而成,致力于盘点数据团队建设现状,回答数据团队发展中面临的问题,力求为行业内数据团队的组建和高校数据人才的培养提供指导性意见。

2018年9月,第二份《顶级数据团队建设全景报告》也重磅发布,调研囊括110,000+条海内外网络数据分析、1,000+份调查问卷内容,和8位海内外业界大咖深度访谈内容,从数据团队本身、技术从业者和高校三个方向,给出了一幅顶级数据团队建设图景。

在之前的课题基础上,今年,我们将继续联合清华数据科学研究院,并邀请领英作为数据合作方,继续“数据团队”的话题。除了继续关注AI转型浪潮中数据团队的变革情况,以及数据从业者的自我建设之外,今年的报告也将从疫情、数据团队全球输入输出情况等更多独特的视角,进一步探索数据团队的全景建设。

如果你是——
数据团队的一员、和数据团队一起工作,或者希望了解其他数据团队的发展现状和未来
那么恳请你花费5分钟时间点击“阅读原文”填写问卷,帮助我们完成这次调研。

如果你是——
相关领域数据科学团队负责人:
希望分享自己的团队建设经验给更多读者,我们诚挚的邀请您作为深度访谈嘉宾,与我们的记者和研究员就相关话题深入沟通。相关专访内容将作为重点专题,在《数据团队建设全景报告》中呈现。请将您的需求和团队介绍发给我们。

问卷参与者将在2个月后,通过邮箱收到2020年《顶级数据团队建设全景报告》完整版PDF,包含此次问卷全部数据分析、2020年数据类招聘信息分析、顶级机构数据团队负责人访谈等内容。

*为保证结果尽量准确,我们恳请你认真完成本次调研。
*本次调研匿名进行,不涉及任何个人信息,所留邮箱仅用于获取完整版报告,请放心填写。

接下来,文摘菌将带你回顾之前两份《顶级数据团队建设全景报告》的部分精彩内容:

人工智能大背景下的数据团队建设

人工智能正在成为时代重要议题,也对数据团队建设产生了重要影响。部分数据团队也已经承担或者计划开展人工智能相关工作。

据调研问卷结果显示,人工智能技术已经成为一半以上数据从业者所在机构的战略性议题。八成以上从业者考虑在未来工作中更频繁使用人工智能相关技术。

在人工智能项目实施上,18%的机构直接由原有数据团队实施,14%的机构为数据团队转型的AI团队实施,22%的机构新建AI团队实施项目,10%的机构将这一工作外包出去。

Python为数据从业者使用最多的数据分析工具,但C、C++、JS 含金量最高

根据数据相关职位描述中要求的编程语言信息以及相对应的薪资水平,我们计算出了每种编程语言的“技能含金量指数”。

从数据分析结果来看,Python可以说是数据从业者中最受欢迎的编程语言,问卷调研的受访者中,超过 7 成在工作中需要使用 Python。

但大量的使用者也拉低了该语言的含金量。相反,使用人数占比相对较少的 C、C++ 和 JavaScript 在市场上更具薪资竞争力。

多数数据从业者愿意承担相关技术责任,监管机构和团队管理者更应该对技术后果负责

数据从业者是否应该在技术之外分出心力,了解技术背后更深的影响呢?这一在战争年代常引发巨大争议的话题,在数据安全和人工智能威胁日渐严重的今天,又被重新提上辩论场。

针对“开发者是否应该考虑代码的道德性?”,“如果需要为不正当的用途写代码,你会写吗?”两个问题,多数从业者选择为自己的技术/代码结果负责。

开发人员或可以成为抵御不道德代码和数据安全的最后一道防线。

在我们的问卷反馈中,针对“你认为谁应该为使用大数据与人工智能技术带来的道德问题承担主要责任”这一问题,36%的受访者选择了政府/监管机构,30%选择了管理者、19%选择了技术人员。

在2018年 Stack Overflow 针对同一问题的全球调研中,近半数开发人员认为,机器学习和人工智能算法背后的创造者和技术人员最应该对人工智能所带来的社会问题负责。

高校传授技能与市场需求匹配存在偏差:高校注重基础学科,市场更看重实操技能

通过对比国内高校传授技能和公司技能需求,我们发现高校课程设计十分重视包括计算机系统、数据结构、高等数学等基础课程,然而这些基础学科能力并不常出现在市场招聘需求中。

图片

组建高效数据团队

顶级数据团队一般具有相似的特征:所在组织或机构数据驱动战略明确,数据团队运作高效。高层需要设置清晰的数据团队建设目标并将数据纳入决策流程;数据团队的高效运作则需要优秀的团队领导、合理的组织架构和多样化的人才。

1、高层重视
“一个公司能否有领先市场的发展,决策者的眼界非常重要,高管对数据是否敏感,能否下决心把数据推动做好,决定了这个公司的前景和竞争力。”
——时任LinkedIn用户增长部门数据科学团队负责人 周洋

2、嵌入式工作
“我希望团队在满足业务增长需要的前提下,能保持一个扁平的架构。我会鼓励自己的团队成员与业务部门尽可能多的泡在一起,争取嵌入式的工作,主动研究业务,寻求数据驱动的机会。”
——时任猎聘首席数据官 单艺

3、Quick Wins
“我鼓励数据团队一旦有了新想法,便去说服同伴,组成2-3人的小团队把这个想法实现出来。再自下而上扩展影响圈,不断完善想法,直至一个新数据应用场景的出现,变成产品。”
——【友盟+】时任首席数据官 李丹枫

参与2020年报告
点击文末“阅读原文”
或扫码填写问卷▼

*电脑浏览器填写问卷请用以下链接:
https://wj.qq.com/s2/5881984/302b/

相关文章
|
Rust 算法 网络安全
【密码学】一文读懂CMAC
介于上一篇文章比较水,然后这个和上一篇也比较相似,CMAC是为了解决DAA当中安全性不足的问题而出现的,这个算法一共有三个密钥,K, K1, K2, 其中K1和K2可以由K导出,接下来就来一起看一下CMAC的具体过程吧,这一篇文章其实也不长。
5554 0
【密码学】一文读懂CMAC
|
JSON 前端开发 API
TDesign中后台管理系统-用户登录
TDesign中后台管理系统-用户登录
|
3月前
|
人工智能 架构师 算法
AI Agent 职业路线全解析:从入门到专家的进阶指南
AI Agent正推动大模型从“聊天工具”升级为能感知、思考、规划与执行的智能系统。本文详解其与传统AI工程师的本质区别,梳理三大核心技能(思维设计、记忆构建、外部行动)及入门→架构师→领域专家的进阶路径,揭示其作为下一代人机交互与认知自动化核心的职业价值。(239字)
382 2
|
6月前
|
传感器 运维 监控
基于北斗和蓝牙beacon的室内北斗定位系统从原理到应用全面详解(一)
本文介绍基于北斗与蓝牙beacon的室内定位系统,融合卫星与蓝牙技术优势,实现室内外无缝覆盖、多精度分级、低成本部署及多功能扩展,适用于工厂、园区等全域定位场景。
|
5月前
|
机器学习/深度学习 人工智能 算法
构建AI智能体:六十八、集成学习:从三个臭皮匠到AI集体智慧的深度解析
集成学习不是简单的"模型堆砌",而是有深刻理论支撑的系统性方法。理解其核心思想:集体智慧,多个不完美的个体可以组成一个强大的集体,误差分解,通过降低方差或偏差来提升性能,多样性驱动,模型间的差异是集成效果的关键,分层学习,从数据学习到学习如何学习。集成学习代表了机器学习中的一个重要哲学:通过协作和组合,我们可以创造出超越任何单个组件能力的系统。这正是"三个臭皮匠,顶个诸葛亮"在人工智能时代的具体实践。
518 108
|
3月前
|
关系型数据库 MySQL 应用服务中间件
phpstudy_x64_8.1.1.3安装教程(含Apache/MySQL启动与端口修改)
PhpStudy 8.1.1.3(64位)是一款Windows本地PHP集成环境,一键安装Apache/Nginx、PHP、MySQL,支持Win7/10/11。安装简单,含图形化管理界面,轻松搭建测试站点,适合PHP开发与源码调试。(239字)
590 11
|
6月前
|
人工智能 弹性计算 自然语言处理
1688诚信通AI版七大专属权益全解析,助力商家抢占数字化先机
在深入探讨权益之前,我们首先要理解诚信通AI版的核心价值。它不仅仅是传统诚信通的升级,更是一个集成了人工智能、大数据分析和平台生态资源的智能经营中枢。它通过智能客服、商机预测、运营自动化等能力,极大提升了商家的运营效率和决策精准度。而本次推出的七大权益,正是为了降低商家使用这一先进工具的门槛,并加速其价值释放,实现“开箱即用,用之即效”的良性循环。
1441 14
|
Go 索引
Go语言数组的定义与操作 - 《Go语言实战指南》
本文介绍了 Go 语言中的数组(Array)相关知识,包括定义、初始化方式(默认、显式、指定索引及自动推导长度)、访问与修改、遍历方法(for 循环和 for range)、值类型特性(复制行为)、多维数组支持以及其与切片的区别。数组是定长且同类型的集合,适合性能敏感场景,但实际开发中更常用动态的切片(slice)。
355 11
|
网络协议 前端开发 应用服务中间件
nginxconf.sh 自动生成 nginx tcp 转发配置文件 conf
该脚本由 eisc.cn 开发,用于自动生成 Nginx 代理配置。它根据预设的域名、IP 和端口信息,为多个项目(如 www、work、sou 等)创建对应的 Nginx 配置文件,设置前端转发、端口对端口及后端转发规则,并生成日志和 301 跳转配置。支持自动创建 CGI 解析目录,确保各项目能够正确访问。运行时需具备 root 权限或使用 sudo。
482 9
|
JavaScript 中间件 关系型数据库
构建高效的后端服务:Node.js 与 Express 的实践指南
在后端开发领域,Node.js 与 Express 的组合因其轻量级和高效性而广受欢迎。本文将深入探讨如何利用这一组合构建高性能的后端服务。我们将从 Node.js 的事件驱动和非阻塞 I/O 模型出发,解释其如何优化网络请求处理。接着,通过 Express 框架的简洁 API,展示如何快速搭建 RESTful API。文章还将涉及中间件的使用,以及如何结合 MySQL 数据库进行数据操作。最后,我们将讨论性能优化技巧,包括异步编程模式和缓存策略,以确保服务的稳定性和扩展性。

热门文章

最新文章