地理要素的多要素回归分析及预测预报基本方法
- 知识体系
- 2007-10-27
- 60热度
- 0评论
某一地理要素往往受多种因素影响,而且每一个因素的影响程度不同。如人口分布与海陆位置、地形、交通、土地垦殖率等众多因素密切相关;流域的年径流量与流域降水、地表形态、岩性、土壤含水量、流域植被状况等因素有关等。各因素的影响程度具有时空分异的特点,同时,对同一地区、时期不同因素的影响程度也有很大的差别。
人们试图用逐步回归分析法替换多元回归分析。逐步回归分析法是在所考虑的全部自变量中,按其对因变量作用的显著程度大小,挑选一个最重要的变量,建立只包含这个变量的回归方程,接着对其他变量计算偏回归平方和,再引入一个显著性的变量,建立具有两个变量的回归方程。然后反复进行下述两步:第一,对已在回归方程中的变量作显著性检验,显著的保留,不显著的剔除;第二,对不在回归方程中的变量,挑选最重要的进入回归方程,直至回归方程既不能剔除,也不能引入变量为止。
在地图分析中,已知因变量、自变量的数据都是通过地图量算从地图中获取(采样)的,并建立数据表格,必要时还需进行标准化处理,然后可上机运行获得逐步回归方程。根据建立的逐步回归模型,就可结合实际情况进行地理解释和预测预报。下面以逐步回归分析法揭示影响福建省人口分布的主要因素为例,说明逐步回归分析在地图分析中的应用。
1. 利用目视分析法揭示影响福建人口分布的主要因素
首先在《福建人口密度图》上,通过目视观察分析,发现离海岸线近的沿海地带人口密度大,离海岸远的闽西一带人口密度小;接着用不同类型的地图进行目视比较分析,首先将福建省地形图与人口密度图比较,发现山区人口密度小,平原地区人口密度大;再将福建交通图与人口密度图比较,发现交通网稠密地区人口密度大,交通网稀疏地区人口密度小;最后用福建省耕地占土地面积百分比图与福建人口密度图比较,发现耕地比例大,垦殖率高的人口密度大,反之人口密度小。通过单幅图观察分析,多幅图比较分析可获得初步结论:福建人口分布与海陆位置、地势起伏、交通网密度及耕地所占比例(垦殖率)等有明显关系。
2. 利用地图量测获得采样点变量数据,建立数据表格
本例共选择了103个样点,采用传统方法进行量算,量算结果见表9—5。
3. 建立逐步回归数学模型,检验显著性
将以上数据输入计算机中,应用逐步回归程序计算,其回归方程为:
y=-334.092778+2.3889924x3+26.290581x4
相关系数 R=0.899318422; 显著性检验值 F=211.470206;
标准差 S=124.658803;拟合百分比 j=57.3% 。
由逐步回归模型知,福建人口正向交通发达、垦殖率高的东南沿海和河谷盆地聚集区,其人口密度受交通条件、垦殖率影响较大。通过检验,回归效果较好。
4. 预测分析
应用逐步回归数学模型对1—20号点进行预测,其预测值与实际人口密度列入表9—6。
从上表可知,预测值的绝对数量与实际人口密度相差较大,但基本反映了实际各地人口分布的疏密对比,有助于分析人口分布规律及人口迁移趋势。实际预测时,可将预测值作适度调整。
为进一步检验上例中剔除的两要素是否合理,可用多元线性回归检验,经上机运算获得多元线性回归方程:
y-234.096765-0.231806223x1-0.042331755x2+2.19792695x3+23.731987x4
R=0.90231303; F1=107.340081; F2=0.79410079
S=124.135309; j=56.3%
式中,F1、F2分别为x1、x2系数的显著性检验值。
利用多元线性回归数学模型对前10个样点进行预测,将其与逐步回归模型预测值和实际值列表比较,从表9-7中可以看出,除第7号点外,逐步回归预测值均接近实际值,说明剔除x1、x2是完全正确的。