GitHub 数据通过“数字复杂性”预测 GDP 和不平等
realtime news May 08, 2026 15:38
研究人员利用 GitHub 创新图谱数据来衡量“数字复杂性”,揭示了 GDP、不平等和排放的洞察。
研究人员正在利用 GitHub 的创新图谱,以揭示数字时代隐藏的经济洞察。通过分析全球开源软件的贡献,他们引入了一种新的指标——“软件经济复杂性”,据称该指标能够以传统经济数据集无法达到的精确度预测人均 GDP、收入不平等,甚至排放量。
这项研究发表在Research Policy期刊上,利用了 GitHub 公开可用的创新图谱数据,该数据追踪了 163 个国家和地区的开发者活动以及 150 种编程语言的动态。合著者 Jermain Kaminski 将这一方法描述为揭示了经济的“数字暗物质”——嵌入于软件中的生产性知识,这种知识绕过了传统贸易或专利渠道。
工作原理:从代码到复杂性
研究人员将经济复杂性指数 (ECI) 应用于 GitHub 数据,这一指数传统上用于评估实体商品的出口。他们将编程语言分组为 59 个“软件捆绑包”,例如 Python 与 Jupyter Notebook 的数据科学组合,或者 HTML 与 JavaScript 的网页开发组合。通过衡量一个国家在这些捆绑包中的专业化程度,他们揭示了经济能力的一个新维度。
“软件 ECI 即使在考虑传统指标时也能帮助解释 GDP 和不平等的变化,”Kaminski 表示。例如,德国在他们的软件经济复杂性排名中名列前茅,反映了其在高价值软件开发领域的强大专业化。
主要发现和全球排名
在软件经济复杂性排名前 20 的经济体中,德国、澳大利亚和加拿大领先,而美国排名第六。值得注意的是,各国往往倾向于多样化到邻近其现有专业领域的软件技术中——这一模式与实体贸易数据中的“关联性原则”一致。
然而,这一分析也存在局限性。GitHub 数据集仅包括公共代码仓库,这可能低估了那些重视专有开发的国家的软件活动。此外,数据的时间范围(2020-2023 年)对于长期增长预测来说过于短暂。
对政策和开发者的影响
首席研究员 César Hidalgo 表示,这些发现可能会影响产业政策。“软件是独特的——它高度依赖于流动性的人力资本。那些能够吸引和培养软件人才而不通过设计不当的法规扼杀其发展的国家会更具竞争力,”他说。对于开发者来说,这项研究提供了一个实用工具:通过识别各国的软件专业化,程序员可以更好地将自己的技能与潜在的迁移机会相匹配。
接下来是什么?
随着 GitHub 的创新图谱每季度更新一次,研究人员计划在更多数据可用时优化他们的模型。他们还在探索生成式 AI 如何重塑数字复杂性。“如果 AI 编程工具降低了学习新语言的门槛,是不是会加速多样化,还是现有领军者会进一步巩固其主导地位?”另一位合著者 Johannes Wachs 问道。
GitHub 创新图谱于 2023 年推出,旨在为政策制定者、研究人员和开发者提供全球开发者活动的洞察。该研究强调了其潜力,不仅是一个开发者工具,更是理解数字经济的重要资源。
Image source: Shutterstock