主题:【翻译】概率随机及编程 (一) -- 东方射日
共:💬21 🌺99
复 向您请教个问题
我的一点理解
在一元线性回归和多元线性回归中,通常都要求回归后的残差服从正态分布,与原始数据的分布关系没有那么紧密。
也就是说,你有一个数据,都可以做一元线性回归和多元线性回归。做完回归后,检查残差。如果残差服从正态分布,就没问题。
另外,广义来讲,线性回归是针对参数的线性。如果方程是Y=sum_a_i*X_i,a_i是参数,那么线性回归是对a_i的线性,X_i可以是原始独立变量的任意组合。
复 讨论
感谢您的回答!
复 讨论
一般情况下,如果样本比较大,不需要残差服从正态分布。只需要残差没有序列相关和异方差,就可以保证估计值的渐进正态分布了。
如果残差有序列相关和异方差,则一般用Newey-West方法来估计方差协方差矩阵。
复 一点浅见
自己也复习一下,百度的结果 http://zhidao.baidu.com/question/80037761.html
1、随机误差项是一个期望值或平均值为0的随机变量;
2、对于解释变量的所有观测值,随机误差项有相同的方差;
3、随机误差项彼此不相关;
4、解释变量是确定性变量,不是随机变量,与随机误差项彼此之间相互独立;
5、解释变量之间不存在精确的(完全的)线性关系,即解释变量的样本观测值矩阵是满秩矩阵;
6、随机误差项服从正态分布。
听说有不少人做残差的分析研究
复 一点浅见
stata journal中有一个文献:
Instrumental variables and GMM: Estimation and Testing。
Christopher F. Baum, Boston College
Mark E. Schaffer, Heriot–Watt University
Steven Stillman, New Zealand Department of Labour