统计绩效指标(SPI):综合评分(0-100分制)
Statistical performance indicators (SPI): Overall score (scale 0-100)
下载数据指标解释
World Bank official description / 世界银行官方说明
The SPI overall score is a composite score measuring country performance across five pillars: data use, data services, data products, data sources, and data infrastructure. The new Statistical Performance Indicators (SPI) will replace the Statistical Capacity Index (SCI), which the World Bank has regularly published since 2004. Although the goals are the same, to offer a better tool to measure the statistical systems of countries, the new SPI framework has expanded into new areas including in the areas of data use, administrative data, geospatial data, data services, and data infrastructure. The SPI provides a framework that can help countries measure where they stand in several dimensions and offers an ambitious measurement agenda for the international community.
可供参考的中文翻译:SPI综合评分是衡量各国在五个支柱领域表现的综合得分:数据使用、数据服务、数据产品、数据来源和数据基础设施。新的统计绩效指标(SPI)将取代世界银行自2004年起定期发布的统计能力指数(SCI)。尽管目标相同,都是为衡量各国统计系统提供更好的工具,但新的SPI框架已扩展到新领域,包括数据使用、行政数据、地理空间数据、数据服务和数据基础设施等。SPI提供了一个框架,可帮助各国衡量自身在多个维度上的现状,并为国际社会提供了一项雄心勃勃的测量议程。
数据口径与风险提示
- SPI综合评分涵盖数据使用、数据服务、数据产品、数据来源和数据基础设施五个维度,但各维度权重和内部构成未在指标层面完全公开,可能影响跨维度比较的精确性
- 中国数据最早可追溯至2016年,无法获取此前统计系统绩效的连续记录,与其他有更长历史数据国家的可比性受限
- SPI评分方法论在2016年后经历调整或更新,不同时期的评分可能因方法论变化而存在口径不连续性,直接比较期初期末数值需审慎
- 综合评分作为单一数值掩盖了五个支柱各自的优劣势,结构相近但支柱构成差异较大的国家可能被误判为相近水平
- 中国作为发展中国家,其统计系统在某些传统数据采集维度可能具有优势,而在数据开放和新兴数据应用等维度可能面临发展阶段差异
- 该指标侧重统计系统自身的绩效表现,不直接反映经济统计数据与真实经济活动之间的偏差程度
中国趋势
中国SPI综合评分在2016至2024年间呈现波动上行态势,从期初的53.64分逐步提升至期末的57.93分,累计增长约4.29个百分点。从时间序列特征来看,2016至2019年间为持续上升期,于2019年触及记录高点59.56分;此后2020年出现短暂回调至57.48分,可能与疫情期间统计工作开展受限有关;2021年恢复性增长至58.65分,但2022年再度回落至55.87分,2023年回升至58.84分后2024年轻微回落至57.93分。这种波动特征显示中国统计系统绩效在达到阶段性高点后面临巩固压力,可能反映在数据基础设施持续投入的同时,数据应用和数据服务等软性维度的提升需要更长时间积累。整体而言,八年间增幅约为8%,表明中国统计系统在既有框架下的渐进改善趋势。
- 2016年中国SPI综合评分为53.64分,为该指标有记录以来的最低值
- 2019年达到峰值59.56分,为目前中国最高记录
- 2024年最新评分为57.93分,较2016年累计提升约4.29个百分点
- 近期一年变化(2023至2024年)仅增加约0.45分,变化幅度较前几年明显收窄
- 2016至2024年间共包含9个年度数据点,未出现连续三年上升的情形
- 数据序列仅从2016年开始,无法观察更早时期中国统计系统的变化轨迹
- 综合评分的五个支柱各自贡献未知,难以识别评分波动主要来源于哪个维度
- 2020和2022年均出现年度回落,可能与外部冲击或方法论调整有关,单从评分变化本身无法区分原因
全球趋势
当前预计算数据中未提供全球或区域汇总的SPI综合评分时间序列,世界银行可能尚未针对全球或中国以外区域计算并发布该指标的汇总统计。这意味着从现有数据无法直接观察全球统计系统绩效的整体变化趋势,亦无法进行中国与世界平均水平的同期对比。此外,排名快照显示2024年排名靠前的国家多为北欧、西欧及OECD发达经济体,其评分普遍在88至94分之间,与中国约58分的水平存在显著差距,但该差距究竟反映统计系统发展阶段差异还是评估框架对特定发展模式的选择性,尚需结合各支柱细分数据加以验证。
- 2024年SPI排名首位国家为挪威,评分为94.14分
- 排名前十的国家评分均在91分以上,依次为挪威、瑞典、加拿大、丹麦、西班牙、新西兰、韩国、波兰、斯洛文尼亚和罗马尼亚
- 日本以90.99分排名第11位,美国以90.06分排名第18位
- 排名后30位国家中未包含中国,根据评分分布推测中国排名可能在100位之后
- 预计算数据显示全球平均或世界汇总SPI评分未被计算
- 世界汇总统计数据不可得,导致中国与世界平均水平的差距无法量化
- 排名靠前国家多为小规模发达经济体,其统计系统在资源投入和制度成熟度上与中国差异显著,直接比较意义有限
- SPI框架可能更多反映OECD国家统计实践,欠发达国家在某些维度上的统计创新可能被低估
每十年变化摘要
| 十年区间 | 中国变化 | 世界变化 | 提示 |
|---|---|---|---|
| 1960-1969 | - | - | 该阶段变化应结合指标定义、宏观背景、统计口径和缺失年份进行审慎解读。 |
| 1970-1979 | - | - | 该阶段变化应结合指标定义、宏观背景、统计口径和缺失年份进行审慎解读。 |
| 1980-1989 | - | - | 该阶段变化应结合指标定义、宏观背景、统计口径和缺失年份进行审慎解读。 |
| 1990-1999 | - | - | 该阶段变化应结合指标定义、宏观背景、统计口径和缺失年份进行审慎解读。 |
| 2000-2009 | - | - | 该阶段变化应结合指标定义、宏观背景、统计口径和缺失年份进行审慎解读。 |
| 2010-2019 | 1.1x | - | 该阶段只有中国具备可比变化率,适合先观察本国供需结构变化,不宜直接推断全球差异。 该判断仍应结合指标定义、相关变量和缺失年份理解,避免把单一比例变化写成确定因果。 |
| 2020-2029 | 1.0x | - | 中国在此期间首尾倍数约为1.01,几乎持平;世界同期数据不可得。这一极低倍数可能反映中国统计绩效在经历2010年代快速增长后进入平台期,也可能反映疫情等特殊因素对统计工作连续性的短期干扰,尚需结合各支柱分项数据和相关变量加以验证。 |
2024 年全部国家排名
排名已尽量排除 World、地区组和收入组,仅保留国家参与比较。排名高低应结合指标口径解释。
使用建议、常见误用与研究场景
数值较高通常意味着什么
较高的SPI综合评分意味着该国统计系统在数据使用、数据服务、数据产品、数据来源和数据基础设施五个维度上整体表现更优,具备更完善的统计法律框架、更规范的行政数据采集体系、更及时的官方数据发布机制,以及更广泛的数据开放和共享实践。
数值较低通常意味着什么
较低的SPI综合评分表明该国统计系统在统计能力建设的某些方面存在薄弱环节,可能体现在数据采集覆盖范围有限、数据发布时效性不足、数据质量控制机制不完善或数据基础设施投入不足等方面。
鍙e緞闄愬埗
- 综合评分将五个维度加权合成为单一数值,掩盖了各支柱内部的具体差异,两个评分相近的国家可能在各支柱上的表现截然不同
- SPI框架主要反映统计系统绩效的结构性特征,不直接衡量统计数据与真实经济活动之间的偏差程度
- 由于发展中国家的统计实践与评估框架的契合度可能存在结构性差异,该指标对不同发展阶段国家的适用性可能不同
- SPI每五年更新一次评估,且数据最早可追溯至2016年,历史时间序列较短,难以支持长期趋势判断
- 世界汇总或区域汇总数据不可得,限制了跨国比较中基准参照的选择
使用建议
- 优先使用SPI五个支柱分项指标(IQ.SPI.PIL1至IQ.SPI.PIL5)替代综合评分进行细分维度分析,以识别具体优势和短板
- 结合CPIA制度评估系列指标(如IQ.CPA.PADM.XQ公共管理质量评级、IQ.CPA.BREG.XQ企业监管环境评级)进行制度背景交叉验证
- 在研究中使用SPI作为控制变量或制度质量代理变量时,建议同时报告结果对指标选择和权重假设的敏感性
- 关注同一国家SPI评分的时间序列波动而非仅依赖单一年份数据,以降低评估时点特殊因素的干扰
- 在进行跨国回归分析时,考虑引入人均GDP、识字率等发展水平控制变量,以缓解遗漏变量偏误
常见错误用法
错误做法:将SPI综合评分直接等同于统计数据质量或经济数据可信度
正确做法:将SPI视为统计系统绩效的结构性指标,结合具体数据准确性和及时性指标综合判断
SPI衡量的是统计系统自身建设水平而非产出数据的精确程度,一个统计系统可能在流程规范但数据采集方法上存在系统性偏差
错误做法:直接比较中国SPI评分(约58分)与排名前列国家评分(约90分)并得出中国统计数据质量仅为发达国家约60%的结论
正确做法:认识到SPI框架可能对特定发展阶段国家的统计实践存在适配性差异,在比较时加入发展水平控制变量或采用分位数比较方法
SPI框架的设计参考了OECD国家的统计实践,框架维度权重可能内生于发达国家统计系统特征,直接比较可能高估发展中国家的统计能力差距
错误做法:使用SPI综合评分作为唯一变量构建经济发展模型
正确做法:将SPI分项指标与CPIA制度评级、人力资本指标等作为一组制度质量代理变量纳入模型
单一综合指标难以捕捉制度质量的多个维度,不同代理变量之间可能存在信息互补,使用单一变量可能导致遗漏变量偏误
错误做法:基于SPI排名断言某国统计数据存在造假
正确做法:SPI不包含任何关于数据真实性或统计舞弊的评估维度,该指标无法用于判断统计数据是否造假
SPI评估的是统计系统建设水平的高低,与统计数据的真实性是两个完全不同的问题
错误做法:将SPI评分的年度变化解释为统计工作好坏的变化
正确做法:关注评分变化的结构性原因,结合该国统计法律修订、普查周期或方法论变化等事件进行解读
SPI评分受方法论更新、数据源扩展等非绩效因素影响,年度间波动可能反映评估范围调整而非实际工作改进
实际应用场景
- 统计能力与经济分析质量的关系研究:研究国家统计系统绩效是否影响宏观经济分析的准确性 解释变量或控制变量 可将SPI或其分项指标作为统计能力代理变量纳入回归模型,同时控制GDP人均水平、经济结构和经济周期等因素;建议使用面板固定效应模型控制国家固有特征,并通过替换不同制度指标进行稳健性检验
- 制度质量对外国直接投资的影响:评估东道国统计系统绩效是否构成营商环境评估的一个维度,进而影响FDI流入 控制变量或机制变量 将SPI作为制度环境质量的细分维度,与CPIA系列指标配合使用,避免共线性问题;可考虑使用两阶段模型,先检验SPI与FDI的关系,再引入中介变量验证统计透明度是否为影响FDI的机制之一
- 发展中国家统计能力建设的国际比较:比较不同发展中国家在统计系统建设方面的进展及其决定因素 被解释变量或结果变量 聚焦SPI五个支柱分项指标进行结构分析,识别发展中国家在不同维度上的相对优劣;可结合人均国际援助、统计人员培训投入等变量进行决定因素分析
- 统计系统改革效果的量化评估:评估一国统计法律修订或统计机构重组对统计绩效的因果效应 被解释变量(结果变量) 采用合成控制法或双重差分法,将实施统计改革的国家与未改革的相似国家进行比较;需注意SPI数据序列较短对统计检验力的限制
统计绩效指标(SPI):综合评分(0-100分制)常见问题
中国统计绩效指标SPI在全球排多少位
根据2024年排名快照,中国未进入前30名,结合排名前30国家评分均在88分以上的分布特征,中国排名可能在100位之后。具体排名位次受参与评估国家总数影响,建议以实际计算结果为准,不宜基于前30名国家数据估算中国排名的精确位置。
SPI和SCI统计能力指数有什么区别
SPI(统计绩效指标)是世界银行新推出的综合评估框架,涵盖数据使用、数据服务、数据产品、数据来源和数据基础设施五个支柱;SCI(统计能力指数)是2004至2016年间使用的旧框架,侧重数据采集和报告能力。两者目标相似但评估维度和权重体系存在差异,直接跨期比较需注意口径连续性问题。
为什么中国SPI评分只有50多分而发达国家接近90分
评分差距可能源于三个方面:一是SPI框架的评估维度权重内生于发达国家统计实践,对发展中国家适配性可能存在差异;二是中国统计系统在数据基础设施和行政数据方面具有优势,但在数据开放和应用等新兴维度可能面临发展阶段限制;三是部分评分差异可能反映统计传统和制度安排的结构性差异,而非统计能力的绝对差距。
SPI综合评分可以单独使用吗
建议慎用综合评分进行精细分析。五个支柱的内部构成和权重未完全公开,两个评分相近的国家可能在数据来源、数据基础设施等具体维度上差异显著。如需深入分析,建议优先使用SPI五个支柱分项指标(IQ.SPI.PIL1至PIL5)进行细分比较,以识别具体优势领域和改进方向。
为什么中国SPI在2019年达到高点后出现波动
具体原因从评分本身无法直接判断。可能因素包括:2019年达到阶段性高峰后边际改善空间收窄;2020年受疫情等外部冲击影响统计工作连续性;2022年回落可能与评估方法论调整或数据采集范围变化有关;2023和2024年恢复增长显示韧性。确切原因需要结合各支柱分项数据和该时期中国统计工作实践进行综合研判。
下载数据
免费获取世界银行WDI完整数据集,包含统计绩效指标(SPI):综合评分(0-100分制)等所有指标,支持按国家、指标或主题下载CSV、Excel和XML格式数据。
下载数据