数学建模模拟题,图论,回归模型,聚类分析,因子分析等(105) 联系客服

发布时间 : 星期一 文章数学建模模拟题,图论,回归模型,聚类分析,因子分析等(105)更新完毕开始阅读fee4405b2a160b4e767f5acfa1c7aa00b52a9d83

城市规模结构分析

摘要

本文解决的是用聚类分析的方法解决城市规模结构。城市规模结构主要由城市规模,城市首位度,基尼系数等构成,故分析便从这几个方面入手。

聚类分析是一种建立分类的多元统计分析方法,它能够将一批样本数据根据其诸多特征,按照在性质上的亲属程度在没有先验知识的情况下进行自动分类,产生多个分类结果。

问题是要将这些省,自治区进行分类,我们将数据整理,导入SPSS13.0软件中,进行聚类分析,而聚类分析的结果使得城市规模得以分类。 关键词:聚类分析

1

Ⅰ 问题重述

表49 是1999 年中国省、自治区的城市规模结构特征的一些数据,试通过聚类分析将这些省、自治区进行分类。

表49 城市规模结构特征数据

Ⅱ 问题分析

城市规模结构主要由城市规模,城市首位度,基尼系数等构成,故分析便从这几个方面入手。

聚类分析是一种建立分类的多元统计分析方法,它能够将一批样本数据根据其诸多特征,按照在性质上的亲属程度在没有先验知识的情况下进行自动分类,产生多个分类结果。

问题是要将这些省,自治区进行分类,我们将数据整理,导入SPSS13.0软件中,进行聚类分析。

Ⅲ 模型假设

1. 假设城市规模只由城市规模,城市首位度,基尼系数等这5个因素决定; 2. 假设不考虑其他因素对数据的影响;

2

Ⅳ 符号说明

1. 2. 3. 4. 5.

x:城市规模(万人) x:城市首位度 x:城市指数 x:基尼指数

x:城市规模中位值(万人)

12345Ⅴ 模型的建立与求解

聚类分析:验证城市规模,城市首位度,城市指数,基尼系数,城市规模中位数之间的相关系数,看是否存在相关性。将数据导入到SPSS13.0软件中,得到这五者的相关性,如下:

Correlationsx1x1Pearson CorrelationSig. (2-tailed)Sum of Squares andCross-productsCovarianceNPearson CorrelationSig. (2-tailed)Sum of Squares andCross-productsCovarianceNPearson CorrelationSig. (2-tailed)Sum of Squares andCross-productsCovarianceNPearson CorrelationSig. (2-tailed)Sum of Squares andCross-productsCovarianceNPearson CorrelationSig. (2-tailed)Sum of Squares andCross-productsCovarianceN1107435641321.36627.033.871337.93412.99727.340.0831022.70939.33527.374.055200.7477.72127.404*.03712034.856462.87927x2.033.871337.93412.99727198.3053.78127.704**.00020.260.77927.468*.0142.405.09227-.226.257-64.469-2.48027x3.340.0831022.70939.33527.704**.00020.260.7792718.429.32427.223.263.336.01327-.075.710-6.266-.24127x4.374.055200.7477.72127.468*.0142.405.09227.223.263.336.013271.269.01027-.336.087-5.008-.19327x5.404*.03712034.856462.87927-.226.257-64.469-2.48027-.075.710-6.266-.24127-.336.087-5.008-.193271827.35331.82127x2x3x4x5*. Correlation is significant at the 0.05 level (2-tailed).**. Correlation is significant at the 0.01 level (2-tailed). 图1 五者的相关性 从图1的数据中可以看出,某些指标之间确实有较强的相关性,可以选取其中的有代表性的几个指标进行聚类分析:

3

Descriptive StatisticsNStatistic272727272727MinimumStatistic11.81.0018.3417.37987.32MaximumStatistic923.28.26952.4413.809827.38MeanStatistic219.1162.9745261.152174.52841515.7009Std.DeviationStatistic203.27661.9444688.5693925.10164585.64103KurtosisStatisticStd. Error5.362.8721.247.872.140.8721.906.872-.715.872x1x2x3x4x5Valid N (listwise) 图2

从图2可以看出,城市首位度,城市指标这两个指标之间具有较大相关性,最先被聚到一起,其次,城市规模与城市规模中位值也具有一定的相关性,被聚为第二类,基尼指数单独为一类。

根据这五个指标对27个地区进行聚类分析。得到: Vertical IcicleCase6:黑龙江3:内蒙古1:京津冀23:陕西14:湖北16:广东19:川渝22:西藏25:青海26:宁夏18:海南24:甘肃20:云南13:河南27:新疆11:江西21:贵州15:湖南17:广西10:福建12:山东4:辽宁8:浙江9:安徽5:吉林2:山西7:苏沪 Number of clusters1234567891011121314151617181920212223242526XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXX 图3

由图4的数据可知,城市规模可分为多种,按三类分:第一类:京津冀,苏沪;第二类:青海;第三类:其他地区。

Ⅶ 模型评价与改进

1. 数据较多,不容易理解; 2. 题中所给的数据可靠性不能保证;

4