数学建模模拟题，图论，回归模型，聚类分析，因子分析等(105) 南京廖华

数学建模模拟题，图论，回归模型，聚类分析，因子分析等(105) 联系客服

发布时间 : 2024/4/29 6:31:35 星期一文章数学建模模拟题，图论，回归模型，聚类分析，因子分析等(105)更新完毕开始阅读fee4405b2a160b4e767f5acfa1c7aa00b52a9d83

城市规模结构分析

摘要

本文解决的是用聚类分析的方法解决城市规模结构。城市规模结构主要由城市规模，城市首位度，基尼系数等构成，故分析便从这几个方面入手。

聚类分析是一种建立分类的多元统计分析方法，它能够将一批样本数据根据其诸多特征，按照在性质上的亲属程度在没有先验知识的情况下进行自动分类，产生多个分类结果。

问题是要将这些省，自治区进行分类，我们将数据整理，导入SPSS13.0软件中，进行聚类分析，而聚类分析的结果使得城市规模得以分类。关键词：聚类分析

Ⅰ 问题重述

表49 是1999 年中国省、自治区的城市规模结构特征的一些数据，试通过聚类分析将这些省、自治区进行分类。

表49 城市规模结构特征数据

Ⅱ 问题分析

城市规模结构主要由城市规模，城市首位度，基尼系数等构成，故分析便从这几个方面入手。

问题是要将这些省，自治区进行分类，我们将数据整理，导入SPSS13.0软件中，进行聚类分析。

Ⅲ 模型假设

1. 假设城市规模只由城市规模，城市首位度，基尼系数等这5个因素决定； 2. 假设不考虑其他因素对数据的影响；

Ⅳ 符号说明

1. 2. 3. 4. 5.

x：城市规模（万人） x：城市首位度 x：城市指数 x：基尼指数

x：城市规模中位值（万人）

12345Ⅴ 模型的建立与求解

聚类分析：验证城市规模，城市首位度，城市指数，基尼系数，城市规模中位数之间的相关系数，看是否存在相关性。将数据导入到SPSS13.0软件中，得到这五者的相关性，如下：

Correlationsx1x1Pearson CorrelationSig. (2-tailed)Sum of Squares andCross-productsCovarianceNPearson CorrelationSig. (2-tailed)Sum of Squares andCross-productsCovarianceNPearson CorrelationSig. (2-tailed)Sum of Squares andCross-productsCovarianceNPearson CorrelationSig. (2-tailed)Sum of Squares andCross-productsCovarianceNPearson CorrelationSig. (2-tailed)Sum of Squares andCross-productsCovarianceN1107435641321.36627.033.871337.93412.99727.340.0831022.70939.33527.374.055200.7477.72127.404*.03712034.856462.87927x2.033.871337.93412.99727198.3053.78127.704**.00020.260.77927.468*.0142.405.09227-.226.257-64.469-2.48027x3.340.0831022.70939.33527.704**.00020.260.7792718.429.32427.223.263.336.01327-.075.710-6.266-.24127x4.374.055200.7477.72127.468*.0142.405.09227.223.263.336.013271.269.01027-.336.087-5.008-.19327x5.404*.03712034.856462.87927-.226.257-64.469-2.48027-.075.710-6.266-.24127-.336.087-5.008-.193271827.35331.82127x2x3x4x5*. Correlation is significant at the 0.05 level (2-tailed).**. Correlation is significant at the 0.01 level (2-tailed). 图1 五者的相关性从图1的数据中可以看出，某些指标之间确实有较强的相关性，可以选取其中的有代表性的几个指标进行聚类分析：

Descriptive StatisticsNStatistic272727272727MinimumStatistic11.81.0018.3417.37987.32MaximumStatistic923.28.26952.4413.809827.38MeanStatistic219.1162.9745261.152174.52841515.7009Std.DeviationStatistic203.27661.9444688.5693925.10164585.64103KurtosisStatisticStd. Error5.362.8721.247.872.140.8721.906.872-.715.872x1x2x3x4x5Valid N (listwise) 图2

从图2可以看出，城市首位度，城市指标这两个指标之间具有较大相关性，最先被聚到一起，其次，城市规模与城市规模中位值也具有一定的相关性，被聚为第二类，基尼指数单独为一类。

根据这五个指标对27个地区进行聚类分析。得到： Vertical IcicleCase6:黑龙江3:内蒙古1:京津冀23:陕西14:湖北16:广东19:川渝22:西藏25:青海26:宁夏18:海南24:甘肃20:云南13:河南27:新疆11:江西21:贵州15:湖南17:广西10:福建12:山东4:辽宁8:浙江9:安徽5:吉林2:山西7:苏沪 Number of clusters1234567891011121314151617181920212223242526XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXXXXX XXXXXXXXXXXXXXXXXXXXXXXXXX 图3

由图4的数据可知，城市规模可分为多种，按三类分：第一类：京津冀，苏沪；第二类：青海；第三类:其他地区。

Ⅶ 模型评价与改进

1. 数据较多，不容易理解； 2. 题中所给的数据可靠性不能保证；

Word文档下载：数学建模模拟题，图论，回归模型，聚类分析，因子分析等(105.doc

搜索更多:数学建模模拟题，图论，回归模型，聚类分析，因子分析等(105