女程序员大起底:Stack Overflow调研称女性更偏爱这些编程语言

简介: 前言 Stack Overflow的2017年程序员问卷调查[1]已在上周启动,我们(Stack Overflow的数据组)十分期待通过分析这次的调查结果来更好地了解我们的程序员群体。


前言


Stack Overflow的2017年程序员问卷调查[1]已在上周启动,我们(Stack Overflow的数据组)十分期待通过分析这次的调查结果来更好地了解我们的程序员群体。(译者注:Stack Overflow是一个IT技术问答网站,用户可在上面免费浏览、提交和回答问题。)我一直关注从事科技相关领域的女性群体,所以为了进一步地了解女程序员群体的现状,最近我特地去研究了去年(2016年)的程序员调查问卷的数据。(译者注:作者自己也是一位女程序员)


有多少女性参与了程序员问卷调查?


您可以在GithubR程序包中找到Stack Overflow的2016年程序员调查的结果[2]。基于Stack Overflow的用户反馈,从今年起,我们改变了性别一栏的可选项。在2017版的问卷中,参与者可以从以下几个选项中进行单选或多选:

  • 男性

  • 女性

  • 跨性别者

  • 非二元性别(译者注:拒绝接受传统性别二元区分的人),酷儿性別(译者注:“酷儿”(Queer)这个词本意是奇怪,但是最近几十年来已经成为非传统性别的代称词语之一),或非常规性别

  • 其他(请注明)


首先,让我们用去年的结果(沿用去年的性别划分)来了解不同性别的人中各有多少参与了这一调查。


上图:2016年程序员问卷调查中不同性别的参与人数,从左至右分别为:女性,男性,其他,不方便透露,不适用。


总共有3202位女性参与了2016年程序员问卷调查,占所有问卷参与者的5.76%我们都知道在IT领域,女性员工的比例要低于男性,但是这一比例(5.76%)比我们预计的还要低。根据QuantcastStack Overflow用户人口调查显示,女性约占用户的10%,这要高于参与这一问卷调查得女性比例。

 

我们对去年这两比例的差异有些失望,因为我们希望这一问卷调查的结果能够代表各种类型的程序员群体。我们重视每一位 Stack Overflow用户的观点,所以希望在今年的问卷调查中能听到更多用户的观点。


我们为什么使用Stack Overflow

 

接下来,让我们以问卷中的一个问题为例来比较一下男性和女性的回答。这是一个多选题:你为什么使用Stack Overflow


上图:在“你为什么使用Stack Overflow这个问题上,在各选项上的男女程序员百分比(深绿色为男性,紫色为女性)。前三个选项分别为:“寻求工作上的帮助”;“因为我热爱学习”;“帮助他人”。

 

首先,我们注意到在各选项的选择比例上,女性的误差要大于男性;这是因为参与调查的男性数量远高于女性,从而导致了我们对女性的分析结果不如男性的精确。其次,我们发现在某些选项上男性和女性的选择百分比有所不同。比如,女性更倾向于选择和工作相关的选项,而较少选择类似帮助他人或者维持网络参与度这样的选项。

 

我们通过统计分析(尤其是卡方检验(chi-squared test))发现,这些男女回复的不同分布并不是一个偶然。它表明男性和女性使用Stack Overflow的目的和体验是不同的。女性使用Stack Overflow更多是源于工作需求。她们在这一问题上给出的是非常实用主义的回答,而不是选择类似“帮助或者学习这样的选项。


使用的IT技术

 

问卷中的另一个多选题调查了参与者都使用什么IT技术。对这个问题,男性和女性的答案又有什么异同呢?


上图:男女对不同的编程语言/技术的使用比例:横轴为男性使用比例,纵轴为女性使用比例。


这张图的横轴代表各项编程技术的男性使用比例,而纵轴代表了女性使用比例。首先我们可以看到大多数编程技术在虚线(斜率为1)(译者注:对角线)附近,这表明总体而言,女性和男性在编程语言的选择上较为相似。比如,男性和女性中都有很多人使用JavaScript


我们也注意到几乎所有的编程语言/技术都在虚线的右下方。这也就是说,对大多数技术而言,男性中使用它们的比例高于女性。由于这是一个多选题,这也表明了男性在这一问题上相对于女性选择了更多门编程语言/技术——数据显示,男性选择技术数量的中位数是4,而女性则是3。这一差异的背后可能隐藏着复杂的原因(比如男女在对自身技能的评估标准不同等等),但其中一个可能的原因是参与这一问卷调查的女性的平均年龄要低于男性[3]。


上图:在男女使用比例上差距较大的编程语言/技术:横坐标为女性/ 男性相对比例。

 

尽管男性和女性在使用的技术上有很多相似之处,但在对某些技术的认可上依旧存在着不小的差异:选择使用SalesforceMatlabRRuby的女性比例更高。作为一个数据科学家(和一个女性!),我也会在工作中使用R,所以我觉得这一发现十分有趣。相比之下,男性使用比例较高的编程语言和技术则包括RustRedis、F# Arduino/Raspberry Pi


探究更多的问卷问题


以上问题只是我们程序员调查问卷的众多问题中的两个,我们想通过研究更多的问题答复来找出男性和女性程序员的异同。我用Shiny[4](译者注:Shiny是RStudio公司开发的R程序包。有了它,用户就可以使用R语言轻松开发交互式的网络应用程序。)制作了一个应用程序,这样用户就可以自己用它来探究这些问卷的答复。


上图:基于Shiny的应用程序(用户界面展示):Stack Overflow程序员问卷调查结果。通过这个应用程序,用户可以自己去查看更多问卷问题的答复和分析。

 

当使用这个应用程序时,您会注意到以下几件有趣的事

  • 相对于男性,更多女性重视职场中的多样性。

  • 女性更容易热爱她们的老板和赞同她们所在的公司的使命。

  • 相对于男性,女性更厌恶熬夜写码,她们更喜欢每天按时下班或者在家办公。

  • 在一些问题上(比如:学习新技术是否重要?你是否喜欢解决问题?升职是否重要?),男女答复接近或几乎相同。

  • 我们都赞同我们可不想去火星那鬼地方!

 

这个应用程序界面上方的版块展示了问卷结果,而下方的版块展示了与此图对应的卡方检验的结果。在这里我们比较了20P值,虽然不是很多,但我还是为这里的多重比较的结果作了一个校正(译者注:多重比较校正是研究中常见的用来控制假阳性的一个方法。)。你可以点击注释中的GitHub链接[5]浏览我制作这个应用的代码。

 

这些来自男女两性的问卷答复向我们展示了男女程序员之间的异同点,帮助我们更好的了解程序员这一群体。2017年Stack Overflow程序员问卷调查现已拉开帷幕,我们想要听见你的声音来帮助我们进一步了解程序员群体。再重复一遍,我们想要得到各种类别的程序员的回复。从去年的结果来看,程序员中的少数群体的调查回复率更低,所以重要的事情重复三遍,我们想要知道你(是的,就是你)是怎么想的。今天就来参与我们的程序员问卷调查吧[6]!

原文发布时间为:2017-02-02

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关文章
|
9月前
|
人工智能 JavaScript 前端开发
全球首个 用代码画地球、日月的动态轨道模型
本文介绍了太阳、地球和月球之间的关系,并详细展示了如何利用WxGL绘制三者的动态轨道模型。内容涵盖天体的起源、大小、运行轨迹及关键数据,帮助读者直观理解四季变化、日月食等自然现象。通过代码实现,模型可演示天体运动规律,适合科普与教学应用。
|
人工智能 Kubernetes 负载均衡
AI应用交付厂商F5打造六大解决方案,助用户应对复杂挑战
AI应用交付厂商F5打造六大解决方案,助用户应对复杂挑战
335 16
|
SQL 存储 数据库
excel导入sql数据库
将Excel数据导入SQL数据库是一个相对常见的任务,可以通过多种方法来实现。以下是一些常用的方法: ### 使用SQL Server Management Studio (SSMS) 1
|
算法 API 异构计算
MistoLine-线条魔法,驾驭每一缕创意!
MistoLine 是一个可以适配任意类型线稿,准确性高,稳定性优秀的SDXL-ControlnetNet模型。它可以基于用户输入的任意类型的线稿图(手绘、各类controlnet-line preprocessor、模型线框轮廓等)作为条件,生成高质量图像(短边大于1024px),无需再根据不同线预处理器选择不同的controlnet模型,MistoLine在各类线稿条件下都有较好的泛化能力。
|
人工智能 物联网
关于flux.1 loras的8个问题
Flux LoRA是一系列用于微调FLUX.1 AI模型的低阶适应模型,专为生成多样风格图像设计,如现实主义、动漫或艺术风格。LoRA通过调整模型权重实现特定美学或主题输出,无需大量再训练。Flux LoRA能创作从真实场景到幻想风光的各种图像,具体取决于选用的LoRA及输入提示。模型许可各不相同,使用前需确认授权范围。用户可通过ComfyUI等界面轻松集成LoRA模型。流行模型包括Flux Realism LoRA、Anime LoRA等。亦可利用自定义数据集训练个人化的LoRA。FLUX Lora提供在线免费试用。
|
XML 数据可视化 Java
文本对比工具,绕不开这个6款!
文本对比工具,绕不开这个6款!
2522 0
|
负载均衡 算法 应用服务中间件
Nginx 常用的负载均衡算法
【10月更文挑战第22天】不同的负载均衡算法各有特点和适用场景。在实际应用中,需要根据具体的业务需求、服务器性能和网络环境等因素来选择合适的算法。
469 3
|
人工智能 搜索推荐 量子技术
关键词感知检索
【11月更文挑战第7天】关键词感知检索是一种先进的信息检索技术,通过识别、分析和匹配用户输入的关键词,提供更精准的搜索结果。它不仅涉及简单的字符串匹配,还考虑了关键词的语义关系、文本结构等因素。主要应用于搜索引擎、学术文献检索和企业内部文档管理等领域。未来的发展趋势包括语义理解的深化和多模态融合。
485 0
|
存储 安全 算法
信息安全基础:密码学与哈希函数
【7月更文挑战第11天】密码学和哈希函数作为信息安全领域的核心技术,在保护数据机密性、完整性和可鉴别性方面发挥着重要作用。通过深入研究密码学的基本概念和哈希函数的特性,我们可以更好地理解和应用这些技术,确保信息在传输和存储过程中的安全性。随着技术的不断发展,密码学和哈希函数的应用也将更加广泛和深入。
|
Java 关系型数据库 MySQL
基于springboot的网上订餐系统
基于springboot的网上订餐系统

热门文章

最新文章