发布时间 : 星期三 文章SAS学习系列23.多元线性回归更新完毕开始阅读7b075092ec630b1c59eef8c75fbfc77da36997fd
实用标准文档
23. 多元线性回归
一、多元线性回归
1. 模型为
Y= 0+ 1X1+…+ NXN+ε
其中 X1, …, XN是自变量,Y是因变量, 0, 1…, N是待求的未知参数,ε是随机误差项(残差),若记
多元线性回归模型可写为矩阵形式:
Y=Xβ+ε
通常要求:矩阵X的秩为k+1(保证不出现共线性), 且k 用最小二乘法原理,令残差平方和 最小,得到 为β的最佳线性无偏估计量(高斯-马尔可夫定理)。 文案大全 实用标准文档 2. 2的估计和T检验 选取 2的估计量: 则 假如t值的绝对值相当大,就可以在适当选定的置信水平上否定原假设,参数的1-α置信区间可由下式得出: 其中tα/2为与α%显著水平有关的t分布临界值。 3. R2和F检验 若因变量不具有0平均值,则必须对R2做如下改进: 随着模型中增添新的变量,R2的值必定会增大,为了去掉这种增大的 文案大全 实用标准文档 干扰,还需要对R2进行修正(校正拟合优度对自由度的依赖关系): R2?1?ESS/(N?k?1)N?1?1?(1?R2) TSS/(N?1)N?k?1做假设检验: H0: 1=…= N=0; H1: 1…, N至少有一个≠0; 使用F统计量做检验, 若F值较大,则否定原假设。 二、PROC REG过程步 基本语法: PROC REG data = 数据集; MODEL 因变量 = 自变量列表 可选项>; < restrict 自变量的等式约束;> 说明:MODEL语句用来指定因变量和自变量; restrict语句示例:restrict a1+a2=1; 常用的输出可选项: STB——输出标准化偏回归系数矩阵 CORRB——输出参数估计矩阵 COLLINOINT——对自变量进行共线性分析 P——输出个体观测值、预测值及残差 (R/CLM/CLI包含P) 文案大全 实用标准文档 R——输出每个个体观测值、残差及标准误差 CLM——输出因变量均值95%的置信界限的上下限 CLI——对各预测值输出95%的置信界限的上下限 ?2 MSE——要求输出随机扰动项方差 2的估计? 与残差分析有关的可选项 VIF——输出变量间相关性的方差膨胀系数,VIF越大,说明 由于共线性存在,使方差变大; ——输出条件数,它表示最大的特征值与每个自变量 特征值之比的平方根。一般情况下,条件数越大越可能存在共线性; ——表示共线性水平的容许值,TOL越小说明其可用别的 自变量解释的部分多,自然可能与别的自变量存在共线性关系; ——输出Durbin-Watson统计量; influence——对异常点进行诊断,对每一观测点输出统计量(Cook’s D > 50%, defits/debetas > 2说明该点影响较大)。 交互式语句 绘制回归分析的图形 文案大全 add——向模型中增加变量; delete——删除原拟合模型中的有关变量; refit——重新拟合模型; print——输出有关模型的相关信息。