您的当前位置:首页正文

省会城市及计划单列城市综合经济实力评价指标统计分析

2022-06-15 来源:知库网
 .

基于城市综合经济实力评价指标的统计分析

张三

摘要 本文采用中国2010年省会城市和计划单列市主要经济指标统计数据,首先利用相关分析对地区生产总值各产业间进行了简单相关分析,以及控制了年末总人口对客运和货运量等进行了偏相关分析;接着利用各种经济指标对地区生产总值进行多元线性回归,利用逐步回归方法获知社会商品零售总额、剧场影剧院、普通高等学校在校学生数、固定资产投资总额、货物进出口总额、三废综合利用产品产值、客运量等和地区生产总值有显著关系;最后利用因子分析对各地区进行因子分析,通过计算综合得分,获得各地区综合排名,其中北京、上海一枝独秀,重庆、深圳、天津与北京、上海构成前五强。 关键词 地区生产总值;相关分析;回归分析;因子分析

1 研究背景及目的

2009年10月17日,第六届中国城市论坛北京峰会在朝阳规划艺术馆召开。这次峰会不仅吸引了城市发展领域内几百位专家的专注和参与,跟让来自全国各个城市的会议代表们受益匪浅。会议指出,“十二五”期间既是全球经济复苏的关键时期,也是我国加快城市化进程的关键时期。

以前我国采取的城市外延式扩张战略导致城市发展中出现了资源浪费、环境污染、不注重保护城市历史文脉和特点等各种各样的问题。城市发展将呈现出五个新变化:一是城市发展开始从外延式扩张向内涵式发展转变;二是城市软实力成为城市发展的核心竞争力;三是城乡统筹和城乡一体化成为城市发展的新格

word 资料

.

局;四是综合配套改革实验区的示范意义进一步凸显;五是城市群对城市建设与发展的作用日益增强。

在这种大背景下对我国各城市的综合经济实力进行研究,不论是对于促进我国城市本身又好又快地发展,还是对于充分发挥城市在社会经济生活中所起的主导作用,都有着极为重要的意义。

本研究的目的如下:通过对描述我国各城市综合经济实力的各种指标进行各种分析,一方面找出用来衡量我国城市综合经济实力的各个指标之间的内在联系,另一方面找出各城市综合经济实力的差异,为城市的发展提供政策建议[1]。

2 研究方法

对城市综合经济实力的概念,中国城市经济发展研究中心指出:城市综合经济实力是指城市所拥有的全部实力、潜力及其在国内外经济社会中的地位和影响力。据此概念我们可以看出,评价城市综合经济实力应该包括人口、地区生产总值、拥有的交通运输以及通讯能力、地方财政预算内收支、固定资产投资总额、城乡居民工资水平及储蓄水平、环境污染治理投资总额、商贸市场水平、人才状况及社会医疗保障水平等方面。所以我们采用的数据指标有:年末总人口、地区生产总值、第一产业、第二产业、第三产业、客运量、货运量、地方财政预算内收入、地方财政预算内支出、固定资产投资总额、城乡居民储蓄年末余额、在岗职工平均工资、年末邮政局数、年末固定电话用户数、社会商品零售总额、货物进出口总额、年末实有公共(汽)电车运营车辆数、剧场、影剧院数、普通高等学校在校学生数、医院、卫生院个数、执业(助理)医师、三废综合利用产品总值等22个指标。

本研究采用的数据是《中国2010年省会城市和计划单列市主要经济指标统

word 资料

.

计(包括直辖市)》,数据摘自《中国统计年鉴2011》11-3。

采用数据分析方法主要有回归分析[2]、相关分析、因子分析等。

基本思路是:首先使用回归分析、相关分析等分析方法研究构成城市综合经济实力的各个变量之间的关系;然后使用因子分析对构成城市综合经济实力的各个变量提取公因子;最后使用一些简单的SPSS数据处理技巧依据提出的公因子对各城市进行分类及排序。

3 实证分析

由于从国家统计局网站下载的数据为EXCEL格式,可以将数据导入成SPSS数据,我们设置了共23个变量,分别是“城市名称”、“年末总人口”、“地区生产总值”、“第一产业”、“第二产业”、“第三产业”、“客运量”、“货运量”、“地方财政预算内收入”、“地方财政预算内支出”、“固定资产投资总额”、“城乡居民储蓄年末余额”、“在岗职工平均工资”、“年末邮政局数”、“年末固定电话用户数”、“社会商品零售总额”、“货物进出口总额”、“年末实有公共(汽)电车运营车辆数”、“剧场、影剧院数”、“普通高等学校在校学生数”、“医院、卫生院数”、“执业(助理)医师”、“三废综合利用产品总值”等。样本是中国2010年省会城市和计划单列市主要经济指标统计的相关数据。数据参见附表1。 3.1 相关分析

对于相关分析,主要有以下几个部分:

第一,对“地区生产总值”的三个组成部分:“第一产业”、“第二产业”和“第三产业”进行简单相关分析;

word 资料

.

第二,在控制“地区生产总值”的前提下,对“第一产业”、“第二产业”、“第三产业”进行偏相关分析;

第三,在控制“年末总人口”的前提下,对“客运量”和“货运量”进行偏相关分析; 第四,在控制“年末总人口”的前提下,对“地方政府预算内收入”和“地方政府预算内支出”进行偏相关分析;

第五,对“年末总人口”、“地区生产总值”、“三废综合利用产品总值”这三个变量进行简单相关分析。

3.1.1 地区生产总值的简单相关分析

通过使用主菜单分析下的相关工具条,可以获得分析结果,见表1。

表1 产业相关分析结果

相关性

Pearson 相关性

第一产业 第二产业 第三产业

1 .295 .063

第一产业 显著性(双侧)

35 .295 .085 35 .063

.085 .718

N

Pearson 相关性

第二产业

显著性(双侧) N

Pearson 相关性

35 1

35 .820** .000

35 .820** .000 35

35 1

第三产业 显著性(双侧) .718

N 35 35

word 资料

.

**. 在 .01 水平(双侧)上显著相关。

易见只有“第二产业”和“第三产业”之间具有很强的相关关系并且在0.01的显著性水平上显著。这是因为“第二产业”和“第三产业”本身就具有很大的相关性。 3.1.2 第一产业、第二产业和第三产业的偏相关分析

表2 偏相关分析结果

相关性

控制变量 第一产业 第二产业 第三产业

相关性 1.000 .321 -.517

第一产业 显著性(双侧) . .064 .002

df 0 32 32

相关性 .321 1.000 -.977

地区生产总值 第二产业 显著性(双侧) .064 . .000

df 32 0 32

相关性 -.517 -.977 1.000

第三产业 显著性(双侧) .002 .000 .

df 32 32 0

从分析结果可以看出,在控制“地区生产总值”的前提下,构成“地区生产总值”的3个组成部分中,“第二产业”和“第三产业”的相关关系依然显著。但相关系数却变成了负值,这是由于总额是一定。 3.1.3 客运量和货运量的偏相关分析

word 资料

.

表3 偏相关分析结果

相关性

控制变量

客运量

货运量

相关性 1.000 .127

客运量 显著性(双侧) . .474

df

年末总人口

相关性

0 32

.127 1.000

货运量 显著性(双侧) .474 .

df 32 0

可见在控制“年末总人口”的前提下,“客运量”和“货运量”之间的相关关系不显著。

3.1.4 地方财政预算内收入和地方财政预算内支出的偏相关分析

分析结果如表4所示:

表4 偏相关分析结果

相关性

控制变量 地方财政预算内

收入

地方财政预算内

支出

相关性 1.000 .994

年末总人口 地方财政预算内收入 显著性(双侧) . .000

df 0 32

word 资料

.

相关性 .994 1.000

地方财政预算内支出 显著性(双侧) .000 .

df 32 0

可见,在控制“年末总人口”的前提下,“地方财政预算内收入”和“地方财政预算内支出”之间的相关系数很大,而且相关关系非常显著。

3.1.5 年末总人口、地区生产总值、三废综合利用产品总值的相关分析

表5 简单相关分析结果

相关性

Pearson 相关性

年末总人口 地区生产总值 三废综合利用值

1 .524** .128

年末总人口 显著性(双侧)

35 .524** .001 35 .128

.001 .479

N

Pearson 相关性

地区生产总值

显著性(双侧) N

Pearson 相关性

35 1

33 .153 .394

35 .153 .394 33

33 1

三废综合利用值 显著性(双侧) .479

N 33 33

**. 在 .01 水平(双侧)上显著相关。

分析结果如表5所示,可见,“年末总人口”与“地区生产总值”正相关而且这种

word 资料

.

相关关系十分显著;“地区生产总值”与“三废综合利用产品总值”之间也存在显著的相关关系;“年末总人口”与“三废综合利用产品总值”之间的相关关系不显著。 3.2 回归分析

对于回归分析,以“地区生产总值”为被解释变量,“年末总人口”、“客运量”、“货运量”、“地方财政预算内收入”、“地方财政预算内支出”、“固定资产投资总额”、“城乡居民储蓄年末余额”、“在岗职工平均工资”、“年末邮政局数”、“年末固定电话用户数”、“社会商品零售总额”、“货物进出口总额”、“年末实有公共(汽)电车营运车辆数”、“剧场、影剧院数”、“普通高等学校在校学生数”、“医院、卫生院数”、“执业(助理)医师”、“三废综合利用产品总值”等为解释变量,进行多元线性回归,采用逐步回归法。得到输出结果参见表6—表8所示。

表6 模型拟合情况表

模型汇总h 模型 R R 方 调整 R 方 标准 估计的误差 837.3241 288.4556 Durbin-Watson 1 7 .975a .998g .951 .995 .949 .994 1.595 a. 预测变量: (常量), 社会商品零售总额。 g. 预测变量: (常量), 社会商品零售总额, 剧场、影剧院, 高等学校学生数, 国内资产投资总额, 货物进出口, 客运量, 三废综合利用值。 h. 因变量: 地区生产总值 word 资料

.

表7 方差分析表

Anovaa 模型 平方和 df 均方 F Sig. 回归 417501904.583 1 417501904.583 701111.606 595.486 .000b 1 残差 21734459.782 31 32 7 750.552 .000h 总计 回归 439236364.364 437156198.448 62450885.493 83206.637 7 残差 2080165.917 25 32 总计 439236364.364 a. 因变量: 地区生产总值 b. 预测变量: (常量), 社会商品零售总额。 h. 预测变量: (常量), 社会商品零售总额, 剧场、影剧院, 高等学校学生数, 国内资产投资总额, 货物进出口, 客运量, 三废综合利用值。

表8 回归系数表

word 资料

.

模型 非标准化系数 标准系数 t Sig. B 标准 误差 238.711 .000 113.567 .000 试用版 (常量) 1 社会商品零售总额 (常量) -107.524 -.450 .656 .000 16.834 .975 24.403 .148 .000 .883 社会商品零售总额 .000 .723 8.873 .000 剧场、影剧院 -14.768 3.067 -.137 -4.815 .000 高等学校学生数 7 国内资产投资总额 -.001 .000 -.058 -2.430 .023 5.243E-005 .000 .241 7.273 .000 货物进出口 .000 .000 .302 6.098 .000 客运量 -.007 .002 -.071 -3.952 .001 三废综合利用值 .001 .000 .052 3.666 .001 a. 因变量: 地区生产总值 综上所述,我们可以得到:

(1)最终模型的表达式为:地区生产总值=16.834+0.000*社会商品零售总额-14.768*剧场、影剧院-0.001*高等学校学生数+0.00005*固定资产投资总额+0.000*货物进出口+0.001*三废综合利用产品产值-0.007*客运量;

(2)最终模型的拟合优度较好,修正后可决系数近乎1;

(3)模型中各自变量系数的显著性p值都小于0.05,回归方程的线性关系显著;

word 资料

.

(4)分析结论:经过以上多元线性回归分析,可以发现我国城市的地区生产总值与社会商品零售总额、剧场、影剧院、普通高等学校在校学生数、固定资产投资总额、货物进出口总额、三废综合利用产品产值、客运量有显著关系,与其他变量之间的关系并不显著。

表9 残差统计表

残差统计量a 预测值 残差 标准 预测值 标准 残差 极小值 极大值 均值 标准 偏差 N 419.710 -767.9445 -1.105 -2.662 17058.145 547.0401 3.396 1.896 4505.619 .0000 .000 .000 3696.0968 254.9611 1.000 .884 33 33 33 33 a. 因变量: 地区生产总值 表9给出了回归分析的残差统计结果,可以看出预测值及标准化的预测值、残差及残差预测值的最小值、最大值、均值、标准差和样本数。这些数据中无离群值,可以认为模型是健康的。

除了分析残差统计外,还可以直接做出标准残差的直方图和正态P-P图来观察其是否服从正态分布。从图1和图2可以看出残差具有正态分布的趋势,因此可以认为回归模型是恰当的。

word 资料

.

图1 标准化残差直方图

图2 标准化残差正态P-P图

3.3 因子分析

word 资料

.

上一部分我们利用线性回归来对各城市地区生产总值的影响因素进行相关和回归分析,获知各种影响指标,以及影响程度和方向,但是由于各种变量的多重共线性问题,不太利于具体经济意义解释,因此我们可以利用因子分析对构成城市综合经济实力的各个变量提取公因子,对数据进行降维处理。

首先利用主菜单分析中的降维工具条进行因子分析。在对话框中,依次将“年末总人口”、“地区生产总值”、“客运量”、“货运量”、“地方财政预算内收入”、“地方财政预算内支出”、“固定资产投资总额”、“城乡居民储蓄年末余额”、“在岗职工平均工资”、“年末邮政局数”、“年末固定电话用户数”、“社会商品零售总额”、“货物进出口总额”、“年末实有公共(汽)电车运营车辆数”、“剧场、影剧院数”、“普通高等学校在校学生数”、“医院、卫生院数”、“执业(助理)医师”、“三废综合利用产品总值”添加到“变量”列表中。

接着在相应的按钮中选中输出相关系数矩阵和KMO和Bartlett的球形度检验的复选框,并且设置特征根大于1为提取公因子的要求,利用最大方差法进行因子旋转,最后保存因子得分变量,并显示因子得分系数矩阵,输出结果参见表10-表16。

(1)KMO 和 Bartlett 的检验,如表10所示,KMO的取值为0.844,表明变量间有较强的相关性,数据很适合做因子分析。Bartlett检验的Sig.值为0.000,说明数据来自正态总体,适合进一步分析。

表10 KMO 和 Bartlett 的检验结果

KMO and Bartlett's Test

Kaiser-Meyer-Olkin Measure of Sampling Adequacy. Bartlett's Test of Sphericity

Approx. Chi-Square

.844 1123.563

word 资料

.

df 171

Sig. .000

(2)变量共同度,指的是按照所选标准提取相应数量主成分后,各变量中信息分别被提取的比例。如表11所示,除了“三废综合利用值”的共同度较低之外,大多数变量共同度都在90%以上,所以提取这几个公因子对各变量的解释力还可以。

表11 变量共同度

Communalities 年末总人口 地区生产总值 客运量 货运量 地方财政预算内收入 地方财政预算内支出 国内资产投资总额 城乡居民储蓄 在岗职工平均工资 年末邮政局数 年末固定电话用户 word 资料

Initial Extraction 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 .948 .962 .697 .735 .957 .951 .835 .969 .876 .865 .970 .

社会商品零售总额 货物进出口 年末实有公共汽 剧场、影剧院 高等学校学生数 医院、卫生院 执业助理医生 三废综合利用值 1.000 1.000 1.000 1.000 1.000 1.000 1.000 1.000 .974 .962 .859 .673 .633 .922 .844 .341 Extraction Method: Principal Component Analysis.

(3)解释的总方差,由表12中可以看出,“初始特征值”一栏显示只有前三个特征值大于1,所以只选取了前三个公因子;“提取平方和载入”一栏显示第一公因子的方差贡献率是63.754%,前三个公因子的方差总和占所有主成分方差的84.067%,可见选取前三个因子已足够替代原来的变量。

表12 解释总方差

Total Variance Explained Extraction Sums of Squared Initial Eigenvalues % of Component 1 2 3 4 5 Total 12.113 2.659 1.201 .933 .775 Variance Cumulative % 63.754 13.994 6.319 4.910 4.077 Total Loadings % of Variance Cumulative % Total 63.754 13.994 6.319 63.754 8.967 77.748 5.540 84.067 1.466 Rotation Sums of Squared Loadings % of Variance Cumulative % 47.193 29.158 7.716 47.193 76.351 84.067 63.754 12.113 77.748 84.067 88.977 93.054 2.659 1.201 word 资料

.

6 7 8 9 10 11 12 13 14 15 16 17 18 19 .546 .231 .137 .118 .083 .071 .052 .026 .021 .015 .010 .006 .002 .001 2.874 1.216 .722 .623 .437 .373 .273 .137 .109 .077 .055 .033 .011 .006 95.928 97.144 97.867 98.490 98.927 99.300 99.573 99.710 99.819 99.895 99.950 99.983 99.994 100.000 Extraction Method: Principal Component Analysis. (4)碎石图,是按照特征根大小排列的主成分散点图。如图3所示,我们可以看到有三个成分的特征值超过1。

图3 碎石图

word 资料

.

(5)成分矩阵,如表13可见,在所有变量中打*号的三个变量归为哪一因子不是很明确,因此有必要进行因子旋转。我们利用最大方差法进行因子旋转得到的旋转成分矩阵如表14所示。

word 资料

表13 成分矩阵

Component Matrixa Component 1 2 3 年末固定电话用户 .980 -.093 .026 社会商品零售总额 .970 -.137 .123 地方财政预算内支出 .967 -.120 -.029 地区生产总值 .965 -.165 .056 城乡居民储蓄 .949 -.248 .078 地方财政预算内收入 .944 -.254 .035 执业助理医生 .909 .129 .036 年末实有公共汽 .810 -.387 -.231 国内资产投资总额 .810 .409 .113 在岗职工平均工资 .790 -.469 .177 货物进出口 .777 -.570 -.181 货运量 .762 .392 .022 剧场、影剧院 .759 -.182 .252 年末邮政局数 .711 .475 -.366

word 资料 .

客运量 .669 .054 -.497 医院、卫生院* .647 .697 -.130 年末总人口* .676 .697 -.073 三废综合利用值 .154 .084 .557 高等学校学生数*

.420

.438

.514

.

表14 旋转成分矩阵

Rotated Component Matrixa

word 资料Component

1

2

3

货物进出口 .961 .032 -.192 城乡居民储蓄 .920 .317 .151 在岗职工平均工资 .918 .029 .178 地方财政预算内收入 .918 .320 .107 地区生产总值 .884 .397 .149 年末实有公共汽 .882 .207 -.197 社会商品零售总额 .873 .405 .221 地方财政预算内支出 .859 .455 .077 年末固定电话用户 .855 .470 .138 剧场、影剧院 .729 .218 .308 执业助理医生 .668 .602 .185 年末总人口 .150 .947 .169 医院、卫生院 .124 .945 .111 年末邮政局数 .302 .866 -.156 国内资产投资总额 .427 .748 .306 货运量 .397 .731 .208 客运量 .508 .543 -.379 高等学校学生数

.097 .451 .648 三废综合利用值

.085

.012

.578

.

这样每个因子就很明确了。第一因子上包括地区生产总值、地方财政预算内收入、地方财政预算内支出、城乡居民储蓄年末余额、在岗职工平均工资、年末固定电话用户数、社会商品零售总额、货物进出口总额、年末实有公共(汽)电车营运车辆数、剧场、影剧院、执业(助理)医师,可命名为存量因子;第二因子包括年末总人口、客运量、货运量、固定资产投资总额、年末邮政局(所)数、医院、卫生院,可命名为流量因子;第三因子包括普通高等学校在校学生数和三废综合利用产品产值,可命名为可持续因子。

(6)成分得分系数矩阵

表15 成分得分系数矩阵

Component Score Coefficient Matrix Component 1 2 3 年末总人口 地区生产总值 客运量 货运量 地方财政预算内收入 地方财政预算内支出 国内资产投资总额 城乡居民储蓄 在岗职工平均工资 word 资料

-.106 .101 .028 -.033 .119 .091 -.033 .119 .157 .253 -.016 .151 .147 -.039 .015 .135 -.046 -.140 .005 .043 -.389 .058 .018 -.022 .133 .054 .114 .

年末邮政局数 年末固定电话用户 社会商品零售总额 货物进出口 年末实有公共汽 剧场、影剧院 高等学校学生数 医院、卫生院 执业助理医生 三废综合利用值

-.059 .087 .096 .174 .136 .094 -.061 -.109 .034 -.002

.251 .012 -.022 -.095 -.029 -.072 .041 .264 .073 -.085

-.249 .025 .099 -.183 -.208 .197 .454 -.041 .049 .457

通过表15,可知F1(存量因子)=-0.106*年末总人口+0.101*地区生产总值+0.028*客运量-0.033*货运量+0.119*地方财政预算内收入+0.091*地方财政预算内支出-0.033*固定资产投资总额+0.119*城乡居民储蓄年末余额+0.157*在岗职工平均工资-0.059*年末邮政局数+0.087*年末固定电话用户数+0.096*社会商品零售总额+0.174*货物进出口总额+0.136*年末实有公共汽车数+0.094*剧场、影剧院-0.061*普通高等学校学生数-0.109*医院、卫生院+0.034*执业(助理)医师-0.002*三废综合利用值。F2和F3的得分也可类似求出。

通过表16可见,各因子之间是正交的,即相互之间彼此独立。

表16 成分得分协方差矩阵

成份得分协方差矩阵

成份

1

2

3

word 资料

.

1 2 3 1.000 .000 .000 .000 1.000 .000 .000 .000 1.000 提取方法 :主成份。 旋转法 :具有 Kaiser 标准化的正交旋转法。

3.4 因子分析后续分析

当我们获得了各城市在三个公因子的得分后,就可以利用因子得分进行分类和排序。我们可以利用计算变量和排序来进行各城市的经济综合得分计算和排血,具体操作步骤如下:

【1】打开数据文件,依次单击“转换”→“计算变量”命令,弹出如图4所示的对话框。

图4 “计算变量”对话框

在“目标变量”一栏中输入“综合得分”,这一变量将最终代表各个城市的综合经

word 资料

.

济实力。综合得分=0.47193*FAC1_1+0.29158*FAC2_1+0.07716*FAC3_1,其中FAC1_1、FAC2_1和FAC3_1是在做因子分析时提取的公因子保存变量,前面的系数是各个公因子的方差贡献率。单击“确定”,返回数据文件可以看到“综合得分”这一变量。

【2】在数据文件中,在“综合得分”单元格上单击右键,在弹出的菜单中选择“降序”排列,对数据进行整理,得到综合排名,参见图5。

word 资料

.

图5 整理后的数据

观察“综合得分”一列,可以看出,北京、上海一枝独秀,是综合实力得分超

word 资料

.

过1的城市。重庆、深圳和天津得分为介于0.5—1之间,综合经济实力很强,与北京、上海构成前五强。成都、杭州、武汉、南京和沈阳的得分在0—0.5之间,综合经济实力较强。其他为负值,综合经济实力较弱。 3.5 研究结论

经过以上研究,我们可以从一种宏观的视野下对我国的城市综合经济实力有一个比较全面的了解,这对于我国城市以后的发展有重要的借鉴和指导意义。同时,对于我们个人来说也是工作地选择的重要参考。比如根据回归分析部分可知,为提高地区生产总值,我国各城市必须积极扩大运货量;再如,因子分析表明,排序靠前的大多是东部城市,武汉作为中部崛起的中心城市,近年来发展迅速,但靠后的基本是中西部城市,所以为了促进我国经济的均衡发展,加强中西部建设非常非常重要。

4 结论

本文利用了多种统计学的方法对各地区进行了统计分析,加入了偏相关分析,这样有利于控制其他变量的影响。利用逐步回归法对各种指标进行了筛选,但是异方差和多重共线性没有统筹考虑,又利用因子分析对经济综合指标进行了降维处理,这样就可以大大降低共线性的问题,并且利用各因子得分可以计算综合成绩,进而对各地区进行综合排名,但是由于数据的不完整,所以易见呼和浩特、广州和拉萨没有参与排名和计算,这点事本文的不足,有望在以后的数据分析中搜集更全面的数据,并且可以利用聚类分析和多重对应分析对各地区的经济联系和区别进行更多信息的提取。

参考文献

[1] 孙玉环.35所省会城市及计划单列市的经济效益综合评价[J].统计与信息论

word 资料

.

坛,2001,48:14-18.

[2] 谢龙汉,尚涛.SPSS统计分析与数据挖掘[M].电子工业出版社,2012.1.

word 资料

因篇幅问题不能全部显示,请点此查看更多更全内容