分析 OpenStack 社区的性别多样性

尚无读者喜欢此内容。
Open here.

Opensource.com

Daniel Izquierdo,软件开发分析提供商 Bitergia 的联合创始人,一直在为他在奥斯汀 OpenStack 峰会上的即将到来的演讲分析数据。在本次采访中,他提供了他的演讲的预览 OpenStack 项目中技术贡献的性别多样性分析

您何时开始分析 OpenStack 生态系统的性别多样性?多年来它发生了怎样的变化?

Daniel Izquierdo 的头像这个想法是在上次 OpenStack 峰会 [2015 年 10 月,东京] 期间提出的。此前,我们进行了一场名为 克服微妙偏见 的演讲。似乎有人介绍了关于性别多样性的一些数字,但社区中的某人要求提供 OpenStack 项目中女性的实际技术贡献。这正是我们在 Bitergia 所做的事情——从多个角度分析开源社区。此分析专门将这些技术贡献定义为提交、补丁集和代码审查操作。

关于数据,项目开始之初和现在之间存在明显的差异。这表明自 2010 年以来增长了至少 5 倍,尽管目前的百分比约为贡献的 6% 和人口的 10%。然而,这种增长在过去几年中似乎更加稳定。这种增长也体现在开发人员和审查人员的总体项目中。同样值得注意的是,即使新女性加入 OpenStack 的趋势趋于稳定,但成为核心审查人员(可以在代码审查过程中投票 +2 或 -2 的审查人员)的女性人数也出现了跃升。

请告诉我们您是如何收集和分析数据的。以及需要哪些“手动润色”?

这包括对开发人员名字的初步分析,并使用 Genderize 团队 提供的 API。我们知道,在某些情况下,名字会随着年份甚至国家/地区的不同而演变为女性或男性的名字。这就是 API 的用武之地,它可以提供给定名字是女性还是男性的概率。

通过这种视角,我们可以轻松地处理姓名列表。为了提供一些背景信息,我们涵盖了在从 Git 和 Gerrit 存储库聚合的信息中找到的约 10,000 个总姓名中的约 60%。

到目前为止,此分析提供了一种自动查找 OpenStack 存储库中性别的方法,但是有些开发人员使用昵称或更难分析的姓名,例如来自亚洲的人,API 对他们的帮助不大。然后,此润色过程包括手动查找达到一定级别的最重要开发人员,以确保我们掌握了主要数字。我们还希望确保 WOO wiki 中列出的女性参与了分析。在自动化过程中,由于使用了昵称和其他类似问题,其中八位女性未被正确检测到。

数据告诉您女性对 OpenStack 项目做出的贡献类型是什么?

出于某种原因,贡献类型存在差异。女性的贡献显示在代码方面的工作——以提交衡量——占 40%,而男性则显示该值增加到 60%。话虽如此,女性提交次数最多的前五个项目依次是:文档、基础设施以及 Neutron、Nova 和 Horizon。

您主要专注于分析 Git 和 Gerrit 存储库。哪些额外的分析领域可能有助于提高结果的准确性?

社区不仅仅是代码,但这只是第一步。像 OpenStack 这样大的项目有很多额外的数据来源,例如邮件列表、Askbot 实例Launchpad 或 IRC 频道等。如果我们专注于技术贡献,Launchpad 似乎是另一个可以参与分析的对象。邮件列表或 IRC 是进行大量技术讨论的沟通渠道。当然,将这些添加到分析中将有助于获得更多数据。

关于结果的准确性,仍然有一堆身份未链接到任何性别群体,这约占贡献的 7% 和总身份的 24%。由于亚洲国家通常显示从事技术问题(例如开发任务)的女性比例更高,因此此分析可能低估了这些结果。拥有包含亚洲姓名的适当数据库或额外的手动工作将有助于大大改进分析。

您从 OpenStack 社区分析中学到了哪些其他内容?

自 2012 年左右以来,我们一直在通过 Activity Board 仪表板分析 OpenStack,后来又制作了季度 报告。我想提一下社区自我调节和指数级增长的方式,这是其成功的关键因素之一。作为此数据的一个示例,季度报告显示核心审查人员的数量持续增加,这与社区的持续增长相符。即使大型参与者可能是竞争对手,但在 OpenStack 社区中,他们也在同一规则下在同一保护伞下进行游戏,这有助于展示稳定的开发过程。

此外,有趣的是看到 [OpenStack] 基金会 如何在同一个社区感到效率正在下降时(例如,合并变更集的时间在增加)开始制定具体政策。再次,在季度报告中可以看出,由于应用于新来者的政策,例如峰会期间的培训课程,以及增加新的核心审查人员并让开发人员了解及时审查的重要性,这些数字有所下降。

当然,这更多是每个项目团队的问题以及他们如何看待项目的行为方式,但数据在此过程中提供了很大帮助。Gitdm 数据集、Russell Bryant 脚本 用于代码审查,或 Stackalytics 帮助人们越来越意识到 OpenStack 的开发方式。

您还想分析哪些其他开源社区的多样性或其他社区见解?

我想检查一下社区内应用的一些政策对于社区某些成员付出的努力和其他类型的资源是否有效。我可以想到 Outreachy 计划。我个人的看法是,每年拥有数字和或许进行此分析可能有助于了解这些计划是否有助于为项目带来多样性。由于参与这些计划的人数不多,因此很容易检查吸引的开发人员是否在一段时间后仍留在项目中。

此外,我想研究的一件事是,加入 OpenStack 的女性核心人员是否真的是因为某些组织将开发人员带入了该项目。如果是这样,基金会可以考虑针对项目中的组织采取更多行动。或者,或许可以在高中阶段针对 OpenStack 未来的开发人员采取行动,他们将在那里决定自己的近期未来。

因此,我想说任何开源项目社区都意识到多样性对他们来说是一个加分项。Wikimedia、Mozilla 等基金会可能是进一步分析的良好起点。这应该有助于比较他们为解决多样性差距问题而应用的几项政策。如果数据显示社区中应用的一些政策有效,那么以后可以将其应用于其他社区。但要达到那个水平,我们首先需要生成数据来做出这些决定。

请于 4 月 28 日星期四上午 11:50 至中午 12:30 在奥斯汀观看 Daniel 的 OpenStack 峰会演讲

User profile image.
Rikki Endsley 是 Red Hat 的开发人员计划管理编辑,也是 Opensource.com 的前社区架构师和编辑。

评论已关闭。

知识共享许可协议本作品根据知识共享署名-相同方式共享 4.0 国际许可协议获得许可。
© . All rights reserved.