数据来源

我从这个网站(https://h1bdata.info/index.php)获得这些薪资数据,这个网站对劳工部(DOL)的劳动条件申请(LCA)数据进行了索引。当一家公司打算雇佣一名需要 H1B 签证担保的员工时,他们需要在提交 H1B 签证申请之前向 DOL 提交 LCA。LCA 中包含了与公司、薪水和职位相关的数据,这些数据都是公开的。

我从上面提到的网站(如果你想自己抓取,可以在我的 GitHub 上找到爬虫代码:https://github.com/yiuhyuk/ds_salary_h1b)搜索以下地区数据科学家的薪资数据(我主要关注美国西海岸,因为我在那里生活和工作):

  • 旧金山湾区 (旧金山、圣何塞、库比蒂诺、山景城、帕洛阿尔托等);

  • 西雅图 (包括微软雷德蒙);

  • 奥斯汀;

  • 洛杉矶 (包括圣莫尼卡)。

此外,这次薪资分析只针对数据科学家,所以不包括资深数据科学家或员工数据科学家等更有经验的数据科学职位,也不包括数据分析师。

在经过这些过滤器过滤之后,我得到了 2818 个样本。

需要注意的是,这是与 H1B 相关的薪资数据,所以用于分析的薪资数据不包括美国公民的收入。由于没有看到任何反面证据,我将会假设美国公民数据科学家和持有绿卡的数据科学家的薪资数据也遵循与 H1B 数据相同的趋势。

年薪在 12万 美元上下徘徊

看下面这幅图,你会发现这些数据科学家的平均年薪中位数为 12 万美元,而且按照年薪的划分,趋势是相当平稳的。但是有一点请记住,这个中位数只是基本工资,不包括现金奖金、股票和福利。因此,数据科学家的总体薪酬中位数可能比这些要高得多。

数据科学家年薪中位数

工作岗位逐年递增,薪资却缓慢下降

在过去的五年时间里,被雇佣的数据科学家的数量显著增加。请注意,这篇文章是在 2019 年 8 月份写的,这一年还没有结束,所以最后一根柱子(棕色)较短。

年度被雇佣的数据科学家数量

数据科学家无疑是目前的一个时髦又性感的职业,而且我认为,过去几年被雇佣的数据科学家人数大幅上升,这也反映了另一种趋势——很多公司正试图赶上大数据和人工智能的潮流。这些公司的团队以前叫作决策分析或研究,现在改名叫数据科学。因此,几年前的研究分析师现在摇身变成了数据科学家。

但我不认为这有什么问题。数据科学家的头衔并没有那么神圣——如果你能够以一种饱含见解的方式应用定量数据来帮助企业做出更好的决策,那么在我看来,你就是一名数据科学实践者!

但请注意,并不是所有的数据科学工作都是一样的。数据科学家的头衔被过度使用了,A 公司的数据科学家可能将 80% 的时间花在 SQL 上,而 B 公司的数据科学家则一整天都在用 Python 实现机器学习算法。不管是否合理,这可能是数据科学家的工资差异如此之大的原因之一(其他原因还包括经验、雇佣地点、公司的平均薪资水平,以及员工是否拥有高等学位)。

我们通过柱状图来查看薪资的分布情况。由于不同年份的数据差别不大,我用柱状图来表示五年的数据。两条黑线分别表示 25 百分位 (102,600 美元) 和 75 百分位 (135,475 美元),红线表示中位数 (120,000 美元)。

数据科学家薪资柱状图

这些年来薪资的分布变化并不大,如果你不相信我的话,可以用方框图来比较年度薪资分布:

数据科学家年度薪资方框图

供参考,2015 年薪资分布情况为:

  • 25 百分位:100000 美元

  • 50 百分位:115000 美元

  • 75 百分位:130000 美元

2019 年分布情况是:

  • 25 百分位:100000 美元

  • 50 百分位:119850 美元

  • 75 个百分位:135000 美元

薪水确实有所上升,但不是很明显。此外,在撰写本文时,2019 年数据科学家的薪资与 2018 年相比有所下降。

Airbnb 出手最大方,沃尔玛给钱也不少

那么,到哪些公司可以拿到较高的薪资呢?下图从公司维度按照从高到低的顺序对数据科学家薪资中位数进行排列。这张图只包含了样本中涉及的雇佣了 10 个或更多数据科学家的公司——如果有某家公司只雇佣了一名数据科学家,即使他或她挣了 20 万美元,这些信息对于你来说也没有多大意义。

你会发现,AirBnB、Lyft、Facebook 和苹果的薪水高达 13.5 万美元或更高,这个并不足为奇。让你感到惊喜的是,Ancestry.com 居然是数据科学家的主要高薪雇主(我也没想到沃尔玛会接近榜首——我一直以为低价就意味着低工资)。

去哪些公司可以拿到较高的薪资

我在下图中给出了数据科学家的主要雇主(那些提交 H1B 申请最多的雇主)。正如我们所料,排在前面的都是些大型的科技公司。但很明显,谷歌被遗漏了。不管是因为什么原因,数据库中有关谷歌数据科学家的信息并不多。也许谷歌使用了不一样的头衔——我以后再去研究这个问题。

雇主排行

后续的报告

我希望以上这些数据对读者来说有所帮助。虽然这不是一个全面的分析,因为只基于 H1B 的数据,但我分析出来的结果与我所听到的和所看到的薪资聚合网站(如 Paysa:https://www.paysa.com/salaries/data-scientist--san-francisco,-ca--tl)上的结果都相当吻合。

在下一篇文章中,我将深入研究数据,绘制其他与数据相关的角色(如数据工程师和数据分析师)的图表。我还将研究公司内部的趋势——例如,Facebook 是否会随着时间的推移为数据科学家提供越来越高的薪水?


©著作权归作者所有:来自51CTO博客作者mb5fdb0a1b25659的原创作品,如需转载,请注明出处,否则将追究法律责任

更多相关文章

  1. “高级工程师”没用!你应该成为一名 “成熟的工程师”
  2. 最强深度学习优化器Ranger开源:RAdam+LookAhead强强结合,性能更优
  3. 程序员最大的遗憾:在大学时忽略了数学
  4. JavaScript面向对象编程理解
  5. 华为麒麟990 5G芯片重磅发布!全球首个旗舰版5G SoC芯片,支持双组网
  6. 干货丨DolphinDB通用计算教程
  7. 妇女能顶半边天, 关于“中国女性”最新研究!
  8. 空间双重差分法(spatial DID)最新实证papers合辑!
  9. 在数据中查找异常值的5种方法总结及示例解释

随机推荐

  1. 为什么要学习C语言
  2. devc不能编译运行怎么办
  3. c语言自学要多久?
  4. c语言中的注释符号是什么
  5. c语言的标识符允许使用关键字吗?
  6. c语言函数类型有几种
  7. c语言输出语句是什么
  8. 输入一个字符,如何判断是字母,数字还是特
  9. asp.net是什么?
  10. C语言怎么输入十个数输出最大值