本站分享:AI、大数据、数据分析师培训认证考试,包括:Python培训Excel培训Matlab培训SPSS培训SAS培训R语言培训Hadoop培训Amos培训Stata培训Eviews培训

一个stata案例_研究中国货币供给量M1和M2,影响货币供给的因素,并预测未来的中国货币供给量

stata培训 cdadata 6671℃

本文的主要研究对象为中国货币供给量M1和M2,试图需求主要的影响货币供给的因素,并预测未来的中国货币供给量。本文分析所采用的计量软件为STATA,该软件在经济与非经济领域的运用都十分广泛。

一、数据搜集和整理:

Year名义GDPrM1M2P实际GDP
19804517.85.0414.4318.431064262.075
19814862.45.2217.1122.35108.5444479.658
19825294.76.4419.1425.9110.606344786.977
19835934.56.4821.8330.75112.265435286.133
198471716.4829.3241.46115.408866213.561
19858964.47.2332.6248.84125.564847139.26
198610202.27.5640.2462.62133.098737665.137
198711962.57.5645.9176.65142.814948376.224
198814928.37.9854.8792.89169.235718821.011
198916909.211.1357.73109.2199.359668481.756
199018547.910.0468.75139.09203.546219112.378
199121617.88.3684.46175.56209.4490510321.27
199226638.18.1113.17229.99220.759312066.58
199334634.49.62162.8348.8249.8995313859.33
199446759.410.98205.41469.24304.1277315374.92
199558478.111.25239.87607.51349.1386316749.25
199667884.610.07285.15760.95370.4360918325.59
199774462.68.44348.26909.95373.3995819941.8
199878345.26.29389.541044.99363.6911921541.68
199982067.464.52458.371198.98352.7804523263.04
200089468.14.05531.471346.1347.4887525747.05
200197314.84.05598.721583.02344.7088428231.01
2002105172.343.7708.821850.07340.2276230912.35
2003117251.93.6584118.6221222.8339.8873934497.28

其中,GDP取自《2004年中国统计年鉴》,r是按照时间加权的存贷款利率平均值,M1、M2取自易刚《中国货币化进程》,物价指数采用零售业物价指数。

二、回归模型处理

1、模型:

利用stata软件进行回归,得出的结论为:

由此可以看出,当我们对M1和M2进行估计时,所有的解释变量在5%的显著性水平下都能通过t检验和F检验,调整后的R平方也高达0.99以上,说明模型很强的解释力。

我们先对M1作为被解释变量的模型进行分析:

正态性检验:首先,我们用predict命令生成残差项u1和u2,分别对应于m1和m2。下面,我们分别作出u1和u2的概率密度图,如下所示:

由此我们可以直观的看出,u1和u2比较接近正态性假设。
现在利用两种不同的方法来检验正态性。

正态性检验单位三个命令

swilk  变量名   ;               sktest 变量名;       mvtest normal  变量名。

kdensity   ;画出正态图

(1)首先是Shapiro-Wilk检验:

命令为   swilk 变量名
结论如下:
Shapiro-Wilk Wtest for normal data
VariableObsWVzProb>z
u1240.945221.4780.7960.21299

因此,我们在5%的显著性水平下不能拒绝正态性假设。

(2)然后是Jacque-Bera统计量,

sktest  变量名

结论如下:
Jarque-Beranormality test:1.342Chi(2) 0.5112
Jarque-Beratest for Ho: normality:

由于JB统计量为1.342,因此我们有理由接受正态性的假设。

t检验、F检验:这在最初的分析中已经得出结论,该模型出色的通过了这两项传统检验。

异方差检验:首先,我们仍然采用图示法来观察残差项:

从图中我们可以观察出,残差项的异方差特性并不明显。下面,我们进行数值检验:

(1) Breusch-Pagan检验:

Breusch-Pagan / Cook-Weisberg test for heteroskedasticity
Ho: Constant variance
Variables: fitted values of m1

chi2(1)= 0.03
Prob > chi2= 0.8700

因为Prob>chi2=0.87,所以无法拒绝原假设,即残差项符合同方差标准。

(2)White检验

White’s general test statistic :14.51349Chi-sq( 9)P-value =0.1052

因此,在5%的显著性水平下,White检验同样无法拒绝异方差假设。

多重共线性检验:在stata中,有两种方法来检验多重共线性:

(1)一个是采用variance inflation factor指标,如果vif指标大于10,则需要对模型作进一步修正。在该模型中,结论如下:

Variable VIF1/VIF

gdp26.830.0373
p23.070.0434
r4.310.2318

Mean VIF18.07

可以看出,GDP和P之间存在着很强的相关性。原因很简单,因为我们在这里采用的是名义GDP量,其中已经包含了价格因素。所以,我们必须进一步修正模型。在这里,我采用的方法是直接去掉价格指数P,重新建立模型(*):
用原始数据对(*)回归,结果如下:

可以看出,虽然R平方的值比最初我们所选用的模型略小,但是仍然达到了97%以上的解释力,所以可以接受。当我们重新进行多重共线性检验时,vif的输出结果变为:
VariableVIF1/VIF

gdp1.160.859
r1.160.859

Mean VIF1.16

由于Vif值远远小于10,因此多重共线性被消除了。

(2)stata所带的另外一种检验是collin命令,与vif不同的是,该命令可以在不进行回归之前就数据相关性进行检验。

当采用gdp、p、r三个解释变量时,结果如下:

CollinearityDiagnostics
SQRTR-
VariableVIF VIFToleranceSquared
gdp26.835.180.03730.9627
p23.074.800.04340.9566
r4.312.080.23180.7682

Mean VIF18.07

可以看出,gdp与p之前存在着很强的相关关系,容忍度非常低,所以采用同(1)的方式去掉p,得出结论:

CollinearityDiagnostics
SQRTR-
VariableVIF VIFToleranceSquared

gdp1.161.080.8590.141
r1.161.080.8590.141

Mean VIF1.16

同样,多重共线性被解决。

现在,我们在对(*)式重新做正态性检验和异方差检验。计算得JB=3.656,不能拒绝正态分布假定。但是,当我们进行异方差检验时,输出如下:

Breusch-Pagan / Cook-Weisberg test for heteroskedasticity
Ho: Constant variance
Variables: fitted values of m1

chi2(1)=15.78
Prob > chi2= 0.0001
White’s general test statistic :16.47866Chi-sq( 5)P-value =.0056

我们发现,当采用去掉p来消除多重共线性时,又导致了异方差的出现。现在,我将暂时搁置这一问题,以继续下面的检验,最后再来考虑模型的重新设定。

模型设定检验:现在,我们试图检查模型中是否忽视了一些重要的解释变量,或者是否添加了不必要的解释变量。

Reset检验:结果如下,

Ramsey RESET test using powers of the fitted values of m1
Ho:model has no omitted variables
F(3, 18) = 203.64
Prob > F =0.0000

证明存在忽略变量,或者模型设定有误。

序列相关性检验:

Durbin-Watson检验:d-statistic ( 3, 24) = 0.4564375,存在正的序列相关。

所以,按照1的思路设定模型存在一定的问题。为了进一步分析,我将在下面的分析中改用实际GDP,并对模型进行重新设定。

2、模型:

对于模型2,如果采用实际GDP进行估算,回归结果如下:

正态性检验:JB统计量为0.4222,说明残差项符合正态分布假定。

T检验F检验:每一个解释变量都很好的通过了t检验,F统计量为6141.94,调整后的R平方为0.9988,说明模型对因变量的解释能力很强。

多重共线性检验:利用stata中的vif命令,发现即便是采用了实际GDP,实际GDP与价格指数之间仍然存在着很强的相关性,多重共线性不能忽视。

序列相关检验:此时,DW统计量为1.455,虽然仍无法拒绝序列相关性的存在,但比模型1已经有了较大幅度的改善。
3、模型:根据Fisher等式MV=PY,可以推出
为了检验Fisher等式所得出的模型,我们重新整理数据如下:

Year
0.0762760.1857240.2126970.0240.0510510.0357141981
0.0889070.1186440.1588370.0190.0686030.2337161982
0.1208380.1405430.1872590.0150.1042740.0062111983
0.2083580.3431060.3482930.0280.17544501984
0.2500910.1125510.1780030.0880.148980.1157411985
0.138080.2335990.2821460.060.073660.0456431986
0.1725410.1409050.224050.0730.09276901987
0.2479250.1951640.2118720.1850.0531010.0555561988
0.1326940.0521230.1755840.178-0.038460.3947371989
0.0969120.1908890.2737180.0210.07435-0.097931990
0.1655120.2285090.2622040.0290.132665-0.167331991
0.232230.3399240.3100360.0540.169099-0.03111992
0.3001830.4385440.5165880.1320.1485710.1876541993
0.3500850.2617320.3452980.2170.1093550.1413721994
0.2506170.1677620.2946680.1480.0893880.024591995
0.1608550.1887690.2525720.0610.094114-0.104891996
0.09690.2213220.1958080.0080.088194-0.161871997
0.0521420.1185320.148404-0.0260.080228-0.254741998
0.0475110.1766960.14736-0.030.079908-0.28141999
0.0901780.1594780.122704-0.0150.106779-0.103982000
0.0877040.1265360.176005-0.0080.09647602001
0.0807440.1838920.168697-0.0130.094978-0.086422002
0.114855117.6741118.5754-0.0010.115971-0.013512003

我们利用模型进行回归,结论如下:

可以看出,由Fisher公式所构造的这两个模型连基本正态性检验、t检验和F检验都无法通过,存在很大的缺陷。

模型的最终修订:

在利用stata进行了一系列修正之后,我们选择了以下模型作为货币供给量的预测模型:

在该模型中,M1、M2均为名义货币供给量,GDP选用了名义GDP(原因是,价格和实际GDP都会影响到货币供给量,但是如果将二者分别作为解释变量纳入模型中,由于共同的变化趋势,导致多重共线性影响仍然存在。鉴于此,我们采用名义GDP作为二者的加权平均值,起到了很好的效果)、加权平均的年名义利率。在模型中,我们并没有考虑滞后项,原因是各期观察量之间存在很强的相关性,在各种检验中模型均表现良好。

为了解决各期变量之间的序列相关,我们采用了广义差分法,其中 由Hildreth-Lu方法经过十次迭代后得出( =0.5019),然后再进行估计,得到
 (**)
其中

正态性检验:JB统计量为2.538,无法拒绝正态分布假定。

t检验、F检验:从回归可以看出,模型很好的满足了t检验与F检验。

异方差检验:Breusch-Pagan检验所得(1)=0.07,无法拒绝同方差假定;White检验所得(5)=2.073,结论仍然可接受同方差假定。

序列相关检验: Durbin-Watson d-statistic( 3, 22) = 2.154946,比较接近2,序列相关已被消除到了可以接受的范围内。

模型设定检验:利用Ramsey Reset检验得出,模型没有遗失变量或者设定误差。

多重共线性检验:平均的VIF为1.09,远远小于10,因此多重共线性可以忽略不计。

同样,我们可以对M2进行类似方法的估计。在比较以后,我们采用Cochrane-Orcutt计算法估计 ,得出 =0.2782。在通过加权最小二乘法,输出结果如下:
(**)

正态性检验:JB统计量为0.2424,无法拒绝正态分布假定。

t检验、F检验:从回归可以看出,模型很好的满足了t检验与F检验。

异方差检验:由于采用了加权(稳健)的最小二乘法,所以异方差已被消除。

序列相关检验: Durbin-Watson d-statistic( 3, 22) = 2.020675,相当接近2,序列相关已被消除到了可以接受的范围内。

模型设定检验:利用Ramsey Reset检验得出,模型没有遗失变量或者设定误差。

多重共线性检验:平均的VIF为1.11,远远小于10,因此多重共线性可以忽略不计。

二、模拟与预测:

对2003年以及2004年进行模拟,结论是:

2003年的模拟M1= 782.5445,M2= 2119.44;与真实值的误差分别为6%和4%。
2004年的模拟M1= 949.5175,M2= 2633.26;与真实值的误差分别为1%和4%。

之所以出现一定量的误差,可能与2003、2004年由于外汇储备急剧增加所引起的货币政策改变有关。由于样本容量太小,如果进行chow test可能意义不大。

转载请注明:数据分析 » 一个stata案例_研究中国货币供给量M1和M2,影响货币供给的因素,并预测未来的中国货币供给量

喜欢 (2)or分享 (0)