您的当前位置:首页正文

stata数据分析

来源:小奈知识网


合肥学院

《计量经济与实证分析》实验报告

题 目: 地区财政收入影响因素

学生姓名: 朱盈超 学号:23

系 别: 管理系 专业:财务管理

提交时间: 2015 年 11

地区财政收入影响因素

一、实验目的

研究地区财政收入影响的因素有哪些,判断这些因素是否存在多重共线性,并提出解决

二、实验内容

1.用软件计算回归结果

2.根据回归结果判断是否存在多重共线性,提出解决多从共线性的方法

3.判断是否存在其他未被纳入模型的因素

三、实验过程与结论

第一步:构建模型

以财政收入为被解释变量,固定资产投资总额、工业总产值、农林牧渔总产值、社会消费品零售总额以及地区总人口为解释变量建立线性回归模型。

Y=β0 + β1*X1 + β2*X2 + β3*X3 + β4*X4 + β5*X5 + u

其中:

Y----财政收入 X1----固定资产投资总额

X2----工业总产值 X3----农林牧渔总产值

X4----社会消费品零售总额 X5----地区总人口

β0、β1、β2、β3、β4、β5----表示待定系数

u----表示随机误差项

第二步:利用stata软件计算回归结果,结果如下:

F值, R-square 5个变量由 T值看均没有通过显著性检验,R平方很大,所以可能存在多重共线性这时的模型方程为Y=+第二步进行多重共线性的检验

判断VIF值大小

从结果看出vif=大于10,所以存在多重共线性。

下面开始采取补救措施

进行主成分分析

多重共线性检验修正

进行逐步回归剔除X1X2X5变量留下X3X4

从VIF值可以看出多重共线性不存在了

(3)可能还有地区发展不平衡,国际环境不稳定,国家对经济发展的结构性调整等因素影响地区财政收入。

合肥学院

《计量经济与实证分析》实验报告

题 目: 美国维吉尼亚州公立中小学教师工资

学生姓名: 朱盈超 学号:23

系 别: 管理系 专业:财务管理

提交时间: 2015 年 11

美国维吉尼亚州公立中小学教师工资

一、实验目的

研究美国维吉尼亚州公立中小学教师工资的情况

二、实验内容

1将2008-2009年度抽样学校教师平均工资对2008年县平均教师工资描点

2利用数据估计模型

3观察是否存在异方差,如果存在异方差的话列出补救措施

三、实验过程与结论

第一步:构建模型进行描点

以2008~2009年度抽样学校教师平均工资为被解释变量,2008年县平均教师工资为解释变量建立现行回归模型,进行描点

Y=β1+ β2*X1+μ

其中:Y为2008—2009年度抽样学校教师平均工资

X1为2008年县平均教师工资

β1、β2为待定系数

μ为随机误差项

第二步:将2008—2009年度抽样学校教师平均工资对2008年县平均教师工资进行描点,结果如下:

3000040000500006000070000抽样学校教师平均工资对县平均教师工资拟合图400005000060000抽样学校教师平均工资县平均教师工资Fitted values70000

第三步:进行回归分析,估计数据模型,结果如下:

Y=++μ

第四步:侦察是否存在异方差性

① BP检验,结果如下:

从上述BP检验中不难看出,回归方程存在异方差.

② 怀特检验,结果如下:

根据怀特检验的结果,回归方程存在异方差性问题。

根据BPG检验结果,回归方程存在异方差性问题。

综上所述,基于帕克检验、BP检验、怀特检验、BPG检验来看,在回归方程所做的OLS回归中遇到了异方差性问题。

第五步:补救措施

为了纠正异方差性问题,对进行对数变换。得到如下回归方程:

ln Y=β0 + β1*lnX1+μ ()

运用stata对回归方程()进行回归,结果如下:

从怀特检验中可以看出,进行对数变换后的回归方程不存在异方差问题,因为Prob > chi2 = 。

合肥学院

《计量经济与实证分析》实验报告

题 目: 虚拟的时间序列数据

学生姓名: 朱盈超 学号:23

系 别: 管理系 专业:财务管理

提交时间: 2015 年 11

虚拟的时间序列数据

一、实验的目的

进行测算数据的回归方程;建立杜宾沃森的检验检查自相关:再进行广义差分对方程进行重新估计

二、具体的实验步骤

(一)实验过程

1、对y、x进行回归。

. reg y x Source SS df MS Number of obs = 19 F( 1, 17) = 260.59 Model 130875.369 1 130875.369 Prob > F = 0.0000 Residual 8537.87337 17 502.227845 R-squared = 0.9388 Adj R-squared = 0.9352 Total 139413.242 18 7745.18014 Root MSE = 22.41 y Coef. Std. Err. t P>|t| [95% Conf. Interval] x .2451553 .0151867 16.14 0.000 .2131142 .2771964 _cons -261.1365 32.19819 -8.11 0.000 -329.0688 -193.2043

由上表的估计模型:得到回归方程Y=,

2、计算DW统计量。

03、利用DW检验是否存在自相关,并利用d值估算自相关系数。

当n=20、=1、=时,查表可得。根据d检验的决策规则可得存在正自相关,根据d与之间的关系 可得P=0. 。

4、运用广义最小二乘法重新估量模型

. gen y_1=y[_n-1](1 missing value generated). gen x_1=x[_n-1](1 missing value generated). gen p=1-0.5785807/2. gen GDy= y- p* y_1(1 missing value generated). gen GDx= x- p* x_1(1 missing value generated)

根据GDy=y-p*y_1

构建GDx=x-p*x_1

然后对GDx和GDy进行回归

重新估量的模型的DW值为,当n=20、=1、=时,查表可得。DW的值在与2之间,由德宾-沃森d检验的决策规则可得不存在自相关,重新估量模型为:Y=(二)结论

这组时间存在自相关,通过广义最小二乘法重新估计后的模型Y=

因篇幅问题不能全部显示,请点此查看更多更全内容