女程序员大起底:Stack Overflow调研称女性更偏爱这些编程语言

简介: 前言 Stack Overflow的2017年程序员问卷调查[1]已在上周启动,我们(Stack Overflow的数据组)十分期待通过分析这次的调查结果来更好地了解我们的程序员群体。


前言


Stack Overflow的2017年程序员问卷调查[1]已在上周启动,我们(Stack Overflow的数据组)十分期待通过分析这次的调查结果来更好地了解我们的程序员群体。(译者注:Stack Overflow是一个IT技术问答网站,用户可在上面免费浏览、提交和回答问题。)我一直关注从事科技相关领域的女性群体,所以为了进一步地了解女程序员群体的现状,最近我特地去研究了去年(2016年)的程序员调查问卷的数据。(译者注:作者自己也是一位女程序员)


有多少女性参与了程序员问卷调查?


您可以在GithubR程序包中找到Stack Overflow的2016年程序员调查的结果[2]。基于Stack Overflow的用户反馈,从今年起,我们改变了性别一栏的可选项。在2017版的问卷中,参与者可以从以下几个选项中进行单选或多选:

  • 男性

  • 女性

  • 跨性别者

  • 非二元性别(译者注:拒绝接受传统性别二元区分的人),酷儿性別(译者注:“酷儿”(Queer)这个词本意是奇怪,但是最近几十年来已经成为非传统性别的代称词语之一),或非常规性别

  • 其他(请注明)


首先,让我们用去年的结果(沿用去年的性别划分)来了解不同性别的人中各有多少参与了这一调查。


上图:2016年程序员问卷调查中不同性别的参与人数,从左至右分别为:女性,男性,其他,不方便透露,不适用。


总共有3202位女性参与了2016年程序员问卷调查,占所有问卷参与者的5.76%我们都知道在IT领域,女性员工的比例要低于男性,但是这一比例(5.76%)比我们预计的还要低。根据QuantcastStack Overflow用户人口调查显示,女性约占用户的10%,这要高于参与这一问卷调查得女性比例。

 

我们对去年这两比例的差异有些失望,因为我们希望这一问卷调查的结果能够代表各种类型的程序员群体。我们重视每一位 Stack Overflow用户的观点,所以希望在今年的问卷调查中能听到更多用户的观点。


我们为什么使用Stack Overflow

 

接下来,让我们以问卷中的一个问题为例来比较一下男性和女性的回答。这是一个多选题:你为什么使用Stack Overflow


上图:在“你为什么使用Stack Overflow这个问题上,在各选项上的男女程序员百分比(深绿色为男性,紫色为女性)。前三个选项分别为:“寻求工作上的帮助”;“因为我热爱学习”;“帮助他人”。

 

首先,我们注意到在各选项的选择比例上,女性的误差要大于男性;这是因为参与调查的男性数量远高于女性,从而导致了我们对女性的分析结果不如男性的精确。其次,我们发现在某些选项上男性和女性的选择百分比有所不同。比如,女性更倾向于选择和工作相关的选项,而较少选择类似帮助他人或者维持网络参与度这样的选项。

 

我们通过统计分析(尤其是卡方检验(chi-squared test))发现,这些男女回复的不同分布并不是一个偶然。它表明男性和女性使用Stack Overflow的目的和体验是不同的。女性使用Stack Overflow更多是源于工作需求。她们在这一问题上给出的是非常实用主义的回答,而不是选择类似“帮助或者学习这样的选项。


使用的IT技术

 

问卷中的另一个多选题调查了参与者都使用什么IT技术。对这个问题,男性和女性的答案又有什么异同呢?


上图:男女对不同的编程语言/技术的使用比例:横轴为男性使用比例,纵轴为女性使用比例。


这张图的横轴代表各项编程技术的男性使用比例,而纵轴代表了女性使用比例。首先我们可以看到大多数编程技术在虚线(斜率为1)(译者注:对角线)附近,这表明总体而言,女性和男性在编程语言的选择上较为相似。比如,男性和女性中都有很多人使用JavaScript


我们也注意到几乎所有的编程语言/技术都在虚线的右下方。这也就是说,对大多数技术而言,男性中使用它们的比例高于女性。由于这是一个多选题,这也表明了男性在这一问题上相对于女性选择了更多门编程语言/技术——数据显示,男性选择技术数量的中位数是4,而女性则是3。这一差异的背后可能隐藏着复杂的原因(比如男女在对自身技能的评估标准不同等等),但其中一个可能的原因是参与这一问卷调查的女性的平均年龄要低于男性[3]。


上图:在男女使用比例上差距较大的编程语言/技术:横坐标为女性/ 男性相对比例。

 

尽管男性和女性在使用的技术上有很多相似之处,但在对某些技术的认可上依旧存在着不小的差异:选择使用SalesforceMatlabRRuby的女性比例更高。作为一个数据科学家(和一个女性!),我也会在工作中使用R,所以我觉得这一发现十分有趣。相比之下,男性使用比例较高的编程语言和技术则包括RustRedis、F# Arduino/Raspberry Pi


探究更多的问卷问题


以上问题只是我们程序员调查问卷的众多问题中的两个,我们想通过研究更多的问题答复来找出男性和女性程序员的异同。我用Shiny[4](译者注:Shiny是RStudio公司开发的R程序包。有了它,用户就可以使用R语言轻松开发交互式的网络应用程序。)制作了一个应用程序,这样用户就可以自己用它来探究这些问卷的答复。


上图:基于Shiny的应用程序(用户界面展示):Stack Overflow程序员问卷调查结果。通过这个应用程序,用户可以自己去查看更多问卷问题的答复和分析。

 

当使用这个应用程序时,您会注意到以下几件有趣的事

  • 相对于男性,更多女性重视职场中的多样性。

  • 女性更容易热爱她们的老板和赞同她们所在的公司的使命。

  • 相对于男性,女性更厌恶熬夜写码,她们更喜欢每天按时下班或者在家办公。

  • 在一些问题上(比如:学习新技术是否重要?你是否喜欢解决问题?升职是否重要?),男女答复接近或几乎相同。

  • 我们都赞同我们可不想去火星那鬼地方!

 

这个应用程序界面上方的版块展示了问卷结果,而下方的版块展示了与此图对应的卡方检验的结果。在这里我们比较了20P值,虽然不是很多,但我还是为这里的多重比较的结果作了一个校正(译者注:多重比较校正是研究中常见的用来控制假阳性的一个方法。)。你可以点击注释中的GitHub链接[5]浏览我制作这个应用的代码。

 

这些来自男女两性的问卷答复向我们展示了男女程序员之间的异同点,帮助我们更好的了解程序员这一群体。2017年Stack Overflow程序员问卷调查现已拉开帷幕,我们想要听见你的声音来帮助我们进一步了解程序员群体。再重复一遍,我们想要得到各种类别的程序员的回复。从去年的结果来看,程序员中的少数群体的调查回复率更低,所以重要的事情重复三遍,我们想要知道你(是的,就是你)是怎么想的。今天就来参与我们的程序员问卷调查吧[6]!

原文发布时间为:2017-02-02

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关文章
|
10月前
|
人工智能 Linux API
119K star!无需GPU轻松本地部署多款大模型,DeepSeek支持!这个开源神器绝了
"只需一行命令就能在本地运行Llama 3、DeepSeek-R1等前沿大模型,支持Windows/Mac/Linux全平台,这个开源项目让AI开发从未如此简单!"
646 0
|
人工智能 Cloud Native 大数据
构建高性能云原生大数据处理平台:融合人工智能优化数据分析流程
构建高性能云原生大数据处理平台:融合人工智能优化数据分析流程
982 0
|
SQL 存储 数据库
excel导入sql数据库
将Excel数据导入SQL数据库是一个相对常见的任务,可以通过多种方法来实现。以下是一些常用的方法: ### 使用SQL Server Management Studio (SSMS) 1
|
人工智能 文字识别 语音技术
Megrez-3B-Omni: 首个端侧全模态理解开源模型
Megrez-3B-Omni是由无问芯穹(Infinigence AI)研发的端侧全模态理解模型,基于无问大语言模型Megrez-3B-Instruct扩展,同时具备图片、文本、音频三种模态数据的理解分析能力。
789 3
Megrez-3B-Omni: 首个端侧全模态理解开源模型
|
11月前
|
机器学习/深度学习 传感器 数据采集
基于机器学习的数据分析:PLC采集的生产数据预测设备故障模型
本文介绍如何利用Python和Scikit-learn构建基于PLC数据的设备故障预测模型。通过实时采集温度、振动、电流等参数,进行数据预处理和特征提取,选择合适的机器学习模型(如随机森林、XGBoost),并优化模型性能。文章还分享了边缘计算部署方案及常见问题排查,强调模型预测应结合定期维护,确保系统稳定运行。
1101 0
|
消息中间件 Java API
解析Java微服务架构:从零构建高性能系统
解析Java微服务架构:从零构建高性能系统
1244 1
|
XML 数据可视化 Java
文本对比工具,绕不开这个6款!
文本对比工具,绕不开这个6款!
2197 0
|
存储 安全 算法
信息安全基础:密码学与哈希函数
【7月更文挑战第11天】密码学和哈希函数作为信息安全领域的核心技术,在保护数据机密性、完整性和可鉴别性方面发挥着重要作用。通过深入研究密码学的基本概念和哈希函数的特性,我们可以更好地理解和应用这些技术,确保信息在传输和存储过程中的安全性。随着技术的不断发展,密码学和哈希函数的应用也将更加广泛和深入。
|
安全 网络安全 数据安全/隐私保护
深入理解HTTP协议:工作原理与安全性
【6月更文挑战第28天】HTTP是互联网基础协议,用于浏览器与服务器通信。基于请求-响应模型,无状态且可扩展。但其明文传输、缺乏身份验证和数据完整性校验导致安全问题。HTTPS 加入SSL/TLS,提供加密、身份验证和完整性校验,保障网络安全。了解HTTP原理和安全至关重要。
|
机器学习/深度学习 人工智能 自然语言处理
谷歌开源最精确自然语言解析器SyntaxNet的深度解读:一次关键进步以及一个重要工具
自然语言理解研究中,如何处理语言歧义是个难题。 SyntaxNet 将神经网络和搜索技术结合起来,在解决歧义问题上取得显著进展:SyntaxNet 能像训练有素的语言学家一样分析简单句法。今天,谷歌开源了SyntaxNet,也发布了针对英语的预训练解析程序 Parsey McParseface。除了让更多人使用到最先进的分析技术之外,这次开源举措也有利于公司借助社区力量加快解决自然语言理解难题的步伐,惠及谷歌业务。
1209 0
谷歌开源最精确自然语言解析器SyntaxNet的深度解读:一次关键进步以及一个重要工具

热门文章

最新文章