计量经济面板数据模型及EVIEWs软件的实现
-
面板数据模型的分析及
Eviews
实现
一、
面板数据和模型概述
在经济学研究和实际应用中,我们经常需要同时
分析和比较横截面观察值和时间序
列观察值结合起来的数据,
即
:
数据集中的变量同时含有横截面和时间序列的信息。
这种数<
/p>
据被称为面板数据
(panel
dat
a)
,
它与我们以前分析过的纯粹的横截面数据和时间序列数据
有着不同的特点。
简单地讲,
面板数据
因同时含有时间序列数据和截面数据,
所以其统计质
既带有时间
序列的性质,又包含一定的横截面特点。因而,以往采用的计量模型和估计
方法就需要有所调整。
例
1
表<
/p>
1
中展示的数据就是一个面板数据的例子。
上海
江苏
浙江
安徽
福建
江西
表
1
华东地区各省市
GDP
历史数据
单位:亿元
1995
1996
1997
1998
1999
2462.57
5155.25
3524.79
2003.66
2191.27
1244.04
2902.20
6004.21
4146.06
2339.25
2583.83
1517.26
3360.21
6680.34
4638.24
2669.95
3000.36
1715.18
3688.20
7199.95
4987.50
2805.45
3286.56
1851.98
4034.96
7697.82
5364.89
2908.59
3550.24
1962.98
4996.87
5960.42
6650.02
7162.20
7662.10
山东
数据
来源:中国统计年鉴
1996-2000
。
其他类似的例子还有:
历次人口普查中有关不同年龄段的
受教育状况;
同行业不同公司在不
同
时间节点上的产值等。这里,不同的年龄段和公司代表不同的截面,而不同时间节点数据反映
了数据的时间序列性。
研究和分析面板数据的模型被称为面板数据模型(
panel
data
model
)
。它的变量取值都带有
时间序列和横截面的两重性。一般的线性模型只单独处理横截面数据或时间序列数据,而
不能
同时分析和对比它们。面板数据模型,相对于一般的线性回归模型,其长处在于它既
考虑到了
横截面数据存在的共性,又能分析模型中横截面因素的个体特殊效应。当然,我
们也可以将横
截面数据简单地堆积起来用回归模型来处理,但
这样做就丧失了分析个体特殊效应的机会。
二、一般面板数据模型介绍
但是由
于面板数据中含有横截面数据,有时需要考虑个体可能存在的特殊效应及对模型
估计方法
的影响。
例如在不同个体误差项存在不同分布的情况下,
OLS
估计量虽然是
一致
的,
但不再是
有效估计量
,因此
往往需要采用
GLS
。
一般为了分析每个个体的特殊效应,对随机误差项
it
的设定是
其中对应的
i
是横截面
i
和时间
t
时随机误差项。再记
< br>
符号介绍:
y
p>
it
——因变量在横截面
i
和时间
t
上的数值;
x
it
j
——第
p>
j
个解释变量在横截面
i
< br>和时间
t
上的数值;
j
1
,
2
,
,
< br>K
;
有
N
个横截
面,即
i
1
,
2
,
,<
/p>
N
;
时间指标
t
1
,
2
,<
/p>
,
T
。
假设:有
K
个解释
变量,即
记第
i
个横截面的数据为
p>
x
i
1
1
x
i
2
1
y
< br>i
1
1
x
i
2
x
i
p>
2
2
y
i
2
y
i
< br>;
X
i
p>
y
x
1
x
2
iT
iT
iT
x
i
K
i
1
1
K<
/p>
x
i
2
i
2
;
i
K<
/p>
x
iT
iT
y
1
X
1
1
1
<
/p>
y
2
X
2
2
2
y
<
/p>
;
X
;
;
p>
< br>
y
X
p>
N
N
K
< br>N
这样,
y
< br>是一个
N
T
< br>
1
的向量;
X
是一个
N
T
K
的矩阵;而
μ
是一个
N
T
1
的向量。
针对这样的
数据,有以下以矩阵形式表达的面板数据模型:
y
X
(
1
)
p>
方程(
1
)代表一个最基本的面板数据模型
。基于对系数
β
和随机误差项
μ
的不同假设,
从这个基本模型可以衍生出各种不同的面板数据模型。最
简单的模型就是忽略数据中每个横
截面个体所可能有的特殊效应,如假设
~
iid
(
0
,
)
,而简单地将模型视为横截面数据堆
积的模型。
2
it<
/p>
i
it
(
2
)
p>
其中
i
代表个体
的特殊效应,它反映了不同个体之间的差别。
数,这种模型被称为
固定效应模型<
/p>
(
fixed effect model
)
,另一种假设假定
i
不是固定的,而
是随机的,这种模型被称为
p>
随机效应模型
(
random
effect model
)
。
p>
最常见的两种面板数据模型是建立在
i<
/p>
的不同假设基础之上。一种假设假定
i
是固定的常
三、检验的方法
p>
Greene
(
1997
< br>)介绍了两种检验方法。一种是由
Breush
和
Pagan
(
1980
)提出
的拉格朗日检验法
(
LM <
/p>
test
)
。
另
一种是
Hausman
(
1978
p>
)
提出的
Hausman
< br>检验方法
(
Hausman
t
est
)
,
Hausman
检验量其实是一种
Wald
检验法(
Wald
test
)
。这
两种方法均可以用于验面
板数据模型的设定应该是固定效应还是随机效应。
2. Hausman
test
Hausman
检验的前提是如果模型包含随机效应,
它应与解释变量相关。
因此在原假设
H
0
:
p>
均是一致的,但是内部估计量不是有效的;在备择假设
H
1
:随机效应与解释变量相关的假定
test
的基本步骤:
第一,建立原假设和备择假设:
2<
/p>
H
0
:
0
(
或者
Cov
[
it
,
is
]
0
;
t
s
)
< br>
2
H
p>
1
:
0
第二,检验统计量及其分布
2
ˆ
it
NT
<
/p>
i
t
1
~
2
(
1
)
(34)
LM
<
/p>
2
ˆ
it
p>
2
(
T
1
)
i
t
ˆ
it
为
OLS
的误差项。
其中
2
<
/p>
随机效应与解释变量不相关的假定下,内部估计量(对虚拟变量模型)和
< br>GLS
得出的估计量
ˆ
与
ˆ
之间的绝
p>
下,
GLS
不再是一致的,而内部估计量仍
是一致的。因此在原假设下,
w
GL
S
点不成立。
Hausman
利用这个统计特点建立了以下检验统计量:
对值差距应该不大,而且应该随样本的增加而缩小,并渐进趋近于
0
。而在备择假设下,这一
ˆ
p>
ˆ
)
1
(
ˆ
< br>ˆ
)
(
35
)
<
/p>
W
(
w
GLS
w
GLS
注意
:这里
的
与前面提到的
< br>Σ
有所不同,这里
表示
β
的两种估计量协方差矩阵之差
面板数据模型数据估计的
Eviews
实现
ˆ
ˆ
)
)的
(
< br>Hausman
的一个基本结论就是有效估计量和其与非有效估计量之差(即:<
/p>
(
w
G
LS
ˆ
ˆ
)
var
ˆ
var
ˆ
)
协方差等于
p>
0
,所以
p>
var(
w<
/p>
GLS
w
GLS
,
即:
ˆ
var
ˆ
(
36
)
<
/p>
var<
/p>
w
GLS
Ha
usman
统计量即
Wald
统计量渐
进服从自由度为
K
的
分布:
W
p>
(
K
)
(
37
)
d
2
2