五 中部地区装备制造业发展水平聚类分析
(一)变量及聚类方法的选择
本章对中部地区装备制造业发展水平的聚类分析采用表2-14中得到的“创新因子f1”“环境因子f2”“竞争力因子f3”“技术因子f4”“资源因子f5”“经济贡献因子f6”数据,由表2-13中6因子相关系数矩阵可知,6个因子基本不存在相关性,高度满足聚类分析变量的选择准则。
本章选择层次聚类法进行聚类分析,即视每一个观测案例为独立的“组”,最接近的两组被合并,重复这一过程直至一个设定的停止点。然后采用加权平均联结法(Weighted-average Linkage)进行聚类分析,即使用两个组之间观测案例的平均相异性进行聚类,产生的属性居于最短联结法与最长联结法之间。聚类过程从相异性(或相似性)定义入手,相异性反映两个观测案例在设定的一套变量中的差异或距离,两个相同的观测案例间的相异性为0,而两个最大的观测案例间的相异性为1。
(二)聚类结果分析
图2-6的系统树状图提供了层次聚类分析的主要解释工具,是一个从每个观测案例作为自身的聚类到顶部的所有观测案例聚合成一个聚类的聚集过程。湖南与湖北是最少相异或最为相似的一对,两省首先聚集,在高度相异处(1左右)形成了最早的观测案例聚类;河南与湖北、湖南,以及安徽与江西在相异性约为2处聚集;河南与湖北、湖南,安徽与江西这两个聚类在更高相异处(6左右)前仍保持稳定,直到6处最后聚合;在相异性超过8的水平时,山西与其他省份最终聚合。
图2-6 中部六省装备制造业发展水平聚类分析树状图
就装备制造业发展水平而言,中部六省最终可划分为几个类型取决于我们能接受每一类型内有多大相异性。图2-6上部的三聚类与四聚类间长长的垂线表明有三种不同的类型。我们可以将此减少到两种,仅聚合与其同组中的其他省份极不相似的观测案例(如山西)。我们还可以将其拓展到五种类型,只需要画出这些省份组(如河南与湖南、湖北)间的差别,但作为中部六省,其间差别并不是很大,因此,图2-6系统树状图提供了一个三类型方案。
表2-15聚类结果表明,第一类为河南、湖南与湖北,三省装备制造业发展水平较相似,且处于较为先进水平。三省装备制造业起步较早,发展基础良好,整体经济实力和制造业整体竞争力在中部中较强,装备制造业作为制造业的战略性支撑产业在中部也居领先地位。第二类包括安徽、江西两省,发展水平相似且属于第二档次,与河南、湖南、湖北差距甚微。第三类为山西,装备制造业发展水平相对滞后。
表2-15 中部六省装备制造业发展水平聚类分析结果