泼冷水:为什么如此多的数据科学家正在抛弃他们的工作?

简介:

在你的印象中数据科学是21世纪最性感的工作,他不仅能够带来满意的薪酬,而且领域内大量高技能的“极客” 会帮你享受到思想碰撞的乐趣。

但英国《金融时报》的一篇文章中提到:“数据科学家每周花1-2个小时寻找新工作。”此外,文章还指出“在要找新工作的程序员的列表中,机器学习专家们以14.3%的比例名列第一。数据科学家们紧随其后,为13.2%。”这些数据是从对Stack Overflow 上的64000名程序员的问卷调查中来的。

那么,为什么有这么多的数据科学家在寻找新的工作呢?

在享受这份职业带来的激情与满足之余,总有一些消极的方面在给你泼冷水。下面文摘菌就为你带来四盆冷水,希望不要把你心中的热火扑灭~

期望和现实不符

4d894ac652c493e227242a64402ce3f06d8aed6d

期望与现实的对比

大数据就像青少年的性爱:每个人都在谈论它,没有人真正知道如何去做,每个人都认为其他人正在做,所以每个人都声称自己在做。

——丹•艾瑞里

这句至理名言十分恰当的描述了初级数据科学家进入数据科学领域的初衷——每个人都不想让自己脱离群体。另外想用酷炫到爆的机器学习算法解决复杂问题,从而对企业产生巨大的影响,也是入坑数据科学的另一重要原因。

你或许认为你能从高超的技能中充分感觉到自我价值的实现。然而,事实往往并非如此。

期望与现实不符是许多数据科学家离开的根本原因。其中原委无法一一列举。

每个公司的情况都不尽相同。但许多公司雇佣数据科学家的时候都没有做好准备从人工智能中获取价值的准备,这就导致了人工智能的冷启动问题。

加之如果这些公司没有高级的或者资深的数据从业人员“撑场面”,那就不可避免的会出现让双方都处在失望和不愉快的境地。数据科学家们想要编写机器学习算法来创造有价值信息,但却做不到。

因为他们的第一项工作是整理数据基础结构或创建分析报告。然后公司会因无法看到可观的价值而感到失望。而这一切都会导致数据科学家们对他们现状的不满。

Robert Chang曾给初级数据科学家提供了一个非常有见地的建议:

你的雄心与你的团队所选择的方向是否一致是非常重要的。如果不一致,那么你就需要找到那些最适合你的项目、团队和公司。

这句话强调了雇主和数据科学家之间的双向关系。如果公司与数据科学家的目标不一致,那么数据科学家另择新主就只是时间问题。

数据科学家们感到失望的另一个原因是他们曾经相信我能够对世界各地的人们产生巨大的影响,而不是仅仅在公司内部。实际上,如果公司的核心业务不是机器学习,你所做的数据科学很可能只会带来小幅的增量收益。

政治统治最高

数据科学最困难,而且是不得不面对问题是:政治。

当我早上6点起床去学习支持向量机(Support Vector Machines)的时候,我想:“这真的很难!但是,嘿,至少我会变得对我未来的老板很有价值!”如果我能得到DeLorean时间机器,我就会回到过去,并对自己说“胡说八道!”

如果你真的认为了解大量的机器学习算法会使你成为最有价值的数据科学家,那么回到我的第一个观点:期望与现实不符。

事实是,在商业中最具影响力的人需要对你有不错的印象。这可能意味着你必须经常做一些从数据库中获取数据的简单项目,来使正确的人对你有正确的认知。

是的,这些工作令人很沮丧。但是,必不可少。

你想上天

a2c172b2958c512e6427fe5899770a1e8ec86a0b

希望能够成为取悦所有人的数据科学家,意味着将成为分析专家,去做报告的人,同时还是数据库专家。但是这往往偏离了数据科学家的含义。

不仅仅是非技术高管对你的技能有太多的假设,技术部门的其他同事也会假定你知道所有与数据相关的东西。你熟悉Spark、Hadoop、Hive、Pig、SQL、Neo4J、MySQL、Python、R、Scala、Tensorflow、A/B测试、NLP,以及任何与机器学习和数据相关内容。

顺便说一句,如果你看到一个岗位对上面这些都有要求,请保持远离。因为这说明这家公司不知道自己的数据策略是什么,他们会随便招人,因为貌似任何懂数据的人都可以解决他们所有的问题。

但它不止于此。既然你懂得这些技术,而且显然又可以拿到所有的数据,别人就会期望你在极短的时间内回答所有的问题。

尝试在可控范围内交底你的短板,你并不会真的得到轻视。而作为一个没有什么行业经验的初级数据科学家,你担心人们会轻视你。

在一个孤立的团队中工作

787ce4f707c32e0e28b23cec3e9dc3bb88622683

我们看到的成功的数据产品,往往具有设计巧妙且具有智能功能的用户界面。最重要的是,它至少会有一种有用的输出使得用户可以通过它来解决一个相关的问题。

现在的问题是,如果一个数据科学家只学习如何编写和执行机器学习算法,那么他们就只能是一个成功的项目,一个有价值的产品的团队的一小部分(尽管是必要的)。这意味着孤立工作的数据科学团队将难以提供价值!

尽管如此,许多公司仍然有数据科学团队提出自己的项目并编写代码来尝试解决问题。在某些情况下,这可能是有价值的。例如,如果公司需要的只是每季度一张静态的电子表格,那么它确实可以提供一些价值。

可另一方面,如果目标是为网站构建的优化提供明智的建议,那么这将涉及到许多不同的技能,而这对于绝大多数的数据科学家来说是不可能的(只有真正的数据科学独角兽才能解决这个问题)。

因此,如果项目由一个孤立的数据科学团队承担,它很可能会失败。

因此,要想成为一名数据科学的业界翘楚,仅仅在Kaggle竞赛中做得很好并完成一些在线课程是不够的。寻找一个与你的目标大方向一致的公司,应该是你在寻找能满足你需求的数据科学工作时的一个关键指标。但是,你可能仍然需要调整自己对从事数据科学的期望。

我希望我没有把你从这条路上拉下来。


原文发布时间为:2018-04-13

本文作者:文摘菌

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“大数据文摘”。

相关文章
|
10月前
|
存储 人工智能 编译器
【03】鸿蒙实战应用开发-华为鸿蒙纯血操作系统Harmony OS NEXT-测试hello word效果-虚拟华为手机真机环境调试-为DevEco Studio编译器安装中文插件-测试写一个滑动块效果-介绍诸如ohos.ui等依赖库-全过程实战项目分享-从零开发到上线-优雅草卓伊凡
【03】鸿蒙实战应用开发-华为鸿蒙纯血操作系统Harmony OS NEXT-测试hello word效果-虚拟华为手机真机环境调试-为DevEco Studio编译器安装中文插件-测试写一个滑动块效果-介绍诸如ohos.ui等依赖库-全过程实战项目分享-从零开发到上线-优雅草卓伊凡
665 10
【03】鸿蒙实战应用开发-华为鸿蒙纯血操作系统Harmony OS NEXT-测试hello word效果-虚拟华为手机真机环境调试-为DevEco Studio编译器安装中文插件-测试写一个滑动块效果-介绍诸如ohos.ui等依赖库-全过程实战项目分享-从零开发到上线-优雅草卓伊凡
|
10月前
|
算法 安全 Go
公司局域网管理系统里的 Go 语言 Bloom Filter 算法,太值得深挖了
本文探讨了如何利用 Go 语言中的 Bloom Filter 算法提升公司局域网管理系统的性能。Bloom Filter 是一种高效的空间节省型数据结构,适用于快速判断元素是否存在于集合中。文中通过具体代码示例展示了如何在 Go 中实现 Bloom Filter,并应用于局域网的 IP 访问控制,显著提高系统响应速度和安全性。随着网络规模扩大和技术进步,持续优化算法和结合其他安全技术将是企业维持网络竞争力的关键。
224 2
公司局域网管理系统里的 Go 语言 Bloom Filter 算法,太值得深挖了
|
10月前
|
机器学习/深度学习 传感器 人工智能
《AI赋能星际探索:机器人如何开启宇宙新征程!》
人工智能(AI)正革新空间探索机器人技术,提升其在复杂宇宙环境中的操作能力。AI助力精准导航与路径规划,使机器人能自主分析环境、避开危险;实现复杂任务的自主决策,如设备维修和样本采集;高效处理海量数据,快速提取有价值信息;优化人机协作模式,增强宇航员与机器人之间的默契。这些进步大幅提高了空间探索的效率和安全性,为人类揭开宇宙奥秘提供了强有力的支持。
396 4
|
机器学习/深度学习 人工智能 算法
探索AI在医疗诊断中的应用与挑战
【10月更文挑战第21天】 本文深入探讨了人工智能(AI)技术在医疗诊断领域的应用现状与面临的挑战,旨在为读者提供一个全面的视角,了解AI如何改变传统医疗模式,以及这一变革过程中所伴随的技术、伦理和法律问题。通过分析AI技术的优势和局限性,本文旨在促进对AI在医疗领域应用的更深层次理解和讨论。
397 31
|
数据采集 前端开发 数据挖掘
利用 html_table 函数轻松获取网页中的表格数据
本文介绍了如何使用 R 语言中的 `html_table` 函数结合代理 IP 技术,轻松提取网页表格数据并规避反爬机制。通过设置代理和请求头,示例代码展示了如何从 58 同城采集租房信息并保存为 CSV 文件。该方法适用于需要频繁采集数据的场景,确保数据采集的高效和稳定性。
440 2
利用 html_table 函数轻松获取网页中的表格数据
|
11月前
|
供应链 监控 数据挖掘
1688 商品详情接口系列(1688 API)
1688商品详情接口系列(1688 API)是阿里巴巴旗下批发电商平台提供的强大工具,支持开发者、商家获取商品的详细信息。通过商品基本信息、价格库存、图片和描述查询接口,用户可以精准高效地获取商品数据,涵盖电商运营、数据分析、市场调研等领域,极大提升工作效率。示例代码展示了如何使用Python调用这些接口,助力电商平台整合、价格监控、商品展示优化及库存管理等应用场景。
|
11月前
|
监控 安全 物联网
工厂人员定位管理系统方案:实现低成本高精度人员定位
蓝牙定位技术结合Lora技术,实现低成本、高效率的工厂人员定位管理,能够提升生产效率、保障安全、优化应急响应的关键工具。该系统能够实时获取工厂内人员的位置信息,为生产调度、安全监控、紧急疏散等提供精确、及时的数据支持。
631 5
|
机器学习/深度学习 人工智能 算法
探索深度学习的最新进展
探索深度学习的最新进展
446 1
flutter系列之:构建Widget的上下文环境BuildContext详解
我们知道Flutter中有两种Widget,分别是StatelessWidget和StatefulWidget,StatelessWidget中有一个build方法来创建对应的Widget,虽然StatefulWidget中没有对应的build方法,但是和StatefulWidget对应的State中也有同样的build方法。 这个build方法就是用来创建Widget的核心方法。
flutter系列之:构建Widget的上下文环境BuildContext详解
|
关系型数据库 MySQL 测试技术
应用中抛出SELECT/UPDATE/INSERT/DELETE command denied to user 'XXX'@'XXX.XXX.XXX.XXX' for table 'xxx' 的5种原因
SELECT/UPDATE/INSERT/DELETE command denied to user 'XXX'@'XXX.XXX.XXX.XXX' for table 'xxx'的错误大部分出现在应用程序中,有时用客户端登录mysql后执行操作也会遇到,后者更容易排查,前者由于涉及应用逻辑以及对象.
10617 0