SAS学习系列23.多元线性回归 联系客服

发布时间 : 星期三 文章SAS学习系列23.多元线性回归更新完毕开始阅读7b075092ec630b1c59eef8c75fbfc77da36997fd

实用标准文档

23. 多元线性回归

一、多元线性回归

1. 模型为

Y= 0+ 1X1+…+ NXN+ε

其中 X1, …, XN是自变量,Y是因变量, 0, 1…, N是待求的未知参数,ε是随机误差项(残差),若记

多元线性回归模型可写为矩阵形式:

Y=Xβ+ε

通常要求:矩阵X的秩为k+1(保证不出现共线性), 且k

用最小二乘法原理,令残差平方和

最小,得到

为β的最佳线性无偏估计量(高斯-马尔可夫定理)。

文案大全

实用标准文档

2. 2的估计和T检验 选取 2的估计量:

假如t值的绝对值相当大,就可以在适当选定的置信水平上否定原假设,参数的1-α置信区间可由下式得出:

其中tα/2为与α%显著水平有关的t分布临界值。

3. R2和F检验

若因变量不具有0平均值,则必须对R2做如下改进:

随着模型中增添新的变量,R2的值必定会增大,为了去掉这种增大的

文案大全

实用标准文档

干扰,还需要对R2进行修正(校正拟合优度对自由度的依赖关系):

R2?1?ESS/(N?k?1)N?1?1?(1?R2)

TSS/(N?1)N?k?1做假设检验:

H0: 1=…= N=0; H1: 1…, N至少有一个≠0; 使用F统计量做检验,

若F值较大,则否定原假设。

二、PROC REG过程步

基本语法:

PROC REG data = 数据集;

MODEL 因变量 = 自变量列表 ; < restrict 自变量的等式约束;>

说明:MODEL语句用来指定因变量和自变量;

restrict语句示例:restrict a1+a2=1;

常用的输出可选项:

STB——输出标准化偏回归系数矩阵 CORRB——输出参数估计矩阵

COLLINOINT——对自变量进行共线性分析

P——输出个体观测值、预测值及残差 (R/CLM/CLI包含P)

文案大全

实用标准文档

R——输出每个个体观测值、残差及标准误差 CLM——输出因变量均值95%的置信界限的上下限 CLI——对各预测值输出95%的置信界限的上下限

?2 MSE——要求输出随机扰动项方差 2的估计?

与残差分析有关的可选项

VIF——输出变量间相关性的方差膨胀系数,VIF越大,说明

由于共线性存在,使方差变大;

——输出条件数,它表示最大的特征值与每个自变量

特征值之比的平方根。一般情况下,条件数越大越可能存在共线性;

——表示共线性水平的容许值,TOL越小说明其可用别的

自变量解释的部分多,自然可能与别的自变量存在共线性关系;

——输出Durbin-Watson统计量;

influence——对异常点进行诊断,对每一观测点输出统计量(Cook’s D > 50%, defits/debetas > 2说明该点影响较大)。

交互式语句

绘制回归分析的图形

文案大全

add——向模型中增加变量;

delete——删除原拟合模型中的有关变量; refit——重新拟合模型;

print——输出有关模型的相关信息。