一个stata案例_研究中国货币供给量M1和M2，影响货币供给的因素，并预测未来的中国货币供给量-数据分析

本文的主要研究对象为中国货币供给量M1和M2，试图需求主要的影响货币供给的因素，并预测未来的中国货币供给量。本文分析所采用的计量软件为STATA，该软件在经济与非经济领域的运用都十分广泛。

一、数据搜集和整理：

Year名义GDPrM1M2P实际GDP
19804517.85.0414.4318.431064262.075
19814862.45.2217.1122.35108.5444479.658
19825294.76.4419.1425.9110.606344786.977
19835934.56.4821.8330.75112.265435286.133
198471716.4829.3241.46115.408866213.561
19858964.47.2332.6248.84125.564847139.26
198610202.27.5640.2462.62133.098737665.137
198711962.57.5645.9176.65142.814948376.224
198814928.37.9854.8792.89169.235718821.011
198916909.211.1357.73109.2199.359668481.756
199018547.910.0468.75139.09203.546219112.378
199121617.88.3684.46175.56209.4490510321.27
199226638.18.1113.17229.99220.759312066.58
199334634.49.62162.8348.8249.8995313859.33
199446759.410.98205.41469.24304.1277315374.92
199558478.111.25239.87607.51349.1386316749.25
199667884.610.07285.15760.95370.4360918325.59
199774462.68.44348.26909.95373.3995819941.8
199878345.26.29389.541044.99363.6911921541.68
199982067.464.52458.371198.98352.7804523263.04
200089468.14.05531.471346.1347.4887525747.05
200197314.84.05598.721583.02344.7088428231.01
2002105172.343.7708.821850.07340.2276230912.35
2003117251.93.6584118.6221222.8339.8873934497.28

其中，GDP取自《2004年中国统计年鉴》，r是按照时间加权的存贷款利率平均值，M1、M2取自易刚《中国货币化进程》，物价指数采用零售业物价指数。

二、回归模型处理：

1、模型：

利用stata软件进行回归，得出的结论为：

由此可以看出，当我们对M1和M2进行估计时，所有的解释变量在5%的显著性水平下都能通过t检验和F检验，调整后的R平方也高达0.99以上，说明模型很强的解释力。

我们先对M1作为被解释变量的模型进行分析：

正态性检验：首先，我们用predict命令生成残差项u1和u2，分别对应于m1和m2。下面，我们分别作出u1和u2的概率密度图，如下所示：

由此我们可以直观的看出，u1和u2比较接近正态性假设。
现在利用两种不同的方法来检验正态性。

正态性检验单位三个命令：

swilk 变量名； sktest 变量名； mvtest normal 变量名。

kdensity x ；画出正态图

（1）首先是Shapiro-Wilk检验：

命令为 swilk 变量名
结论如下：
Shapiro-Wilk Wtest for normal data
VariableObsWVzProb>z
u1240.945221.4780.7960.21299

因此，我们在5%的显著性水平下不能拒绝正态性假设。

（2）然后是Jacque-Bera统计量，

sktest 变量名

结论如下：
Jarque-Beranormality test:1.342Chi(2) 0.5112
Jarque-Beratest for Ho: normality:

由于JB统计量为1.342，因此我们有理由接受正态性的假设。

t检验、F检验：这在最初的分析中已经得出结论，该模型出色的通过了这两项传统检验。

异方差检验：首先，我们仍然采用图示法来观察残差项：

从图中我们可以观察出，残差项的异方差特性并不明显。下面，我们进行数值检验：

（1） Breusch-Pagan检验：

Breusch-Pagan / Cook-Weisberg test for heteroskedasticity
Ho: Constant variance
Variables: fitted values of m1

chi2(1)= 0.03
Prob > chi2= 0.8700

因为Prob>chi2=0.87，所以无法拒绝原假设，即残差项符合同方差标准。

（2）White检验：

White’s general test statistic :14.51349Chi-sq( 9)P-value =0.1052

因此，在5%的显著性水平下，White检验同样无法拒绝异方差假设。

多重共线性检验：在stata中，有两种方法来检验多重共线性：

（1）一个是采用variance inflation factor指标，如果vif指标大于10，则需要对模型作进一步修正。在该模型中，结论如下：

Variable VIF1/VIF

gdp26.830.0373
p23.070.0434
r4.310.2318

Mean VIF18.07

可以看出，GDP和P之间存在着很强的相关性。原因很简单，因为我们在这里采用的是名义GDP量，其中已经包含了价格因素。所以，我们必须进一步修正模型。在这里，我采用的方法是直接去掉价格指数P，重新建立模型（*）：
用原始数据对（*）回归，结果如下：

可以看出，虽然R平方的值比最初我们所选用的模型略小，但是仍然达到了97%以上的解释力，所以可以接受。当我们重新进行多重共线性检验时，vif的输出结果变为：
VariableVIF1/VIF

gdp1.160.859
r1.160.859

Mean VIF1.16

由于Vif值远远小于10，因此多重共线性被消除了。

（2）stata所带的另外一种检验是collin命令，与vif不同的是，该命令可以在不进行回归之前就数据相关性进行检验。

当采用gdp、p、r三个解释变量时，结果如下：

CollinearityDiagnostics
SQRTR-
VariableVIF VIFToleranceSquared
gdp26.835.180.03730.9627
p23.074.800.04340.9566
r4.312.080.23180.7682

Mean VIF18.07

可以看出，gdp与p之前存在着很强的相关关系，容忍度非常低，所以采用同（1）的方式去掉p，得出结论：

CollinearityDiagnostics
SQRTR-
VariableVIF VIFToleranceSquared

gdp1.161.080.8590.141
r1.161.080.8590.141

Mean VIF1.16

同样，多重共线性被解决。

现在，我们在对（*）式重新做正态性检验和异方差检验。计算得JB=3.656，不能拒绝正态分布假定。但是，当我们进行异方差检验时，输出如下：

Breusch-Pagan / Cook-Weisberg test for heteroskedasticity
Ho: Constant variance
Variables: fitted values of m1

chi2(1)=15.78
Prob > chi2= 0.0001
White’s general test statistic :16.47866Chi-sq( 5)P-value =.0056

我们发现，当采用去掉p来消除多重共线性时，又导致了异方差的出现。现在，我将暂时搁置这一问题，以继续下面的检验，最后再来考虑模型的重新设定。

模型设定检验：现在，我们试图检查模型中是否忽视了一些重要的解释变量，或者是否添加了不必要的解释变量。

Reset检验：结果如下，

Ramsey RESET test using powers of the fitted values of m1
Ho:model has no omitted variables
F(3, 18) = 203.64
Prob > F =0.0000

证明存在忽略变量，或者模型设定有误。

序列相关性检验：

Durbin-Watson检验：d-statistic ( 3, 24) = 0.4564375，存在正的序列相关。

所以，按照1的思路设定模型存在一定的问题。为了进一步分析，我将在下面的分析中改用实际GDP，并对模型进行重新设定。

2、模型：

对于模型2，如果采用实际GDP进行估算，回归结果如下：

正态性检验：JB统计量为0.4222，说明残差项符合正态分布假定。

T检验、F检验：每一个解释变量都很好的通过了t检验，F统计量为6141.94，调整后的R平方为0.9988，说明模型对因变量的解释能力很强。

多重共线性检验：利用stata中的vif命令，发现即便是采用了实际GDP，实际GDP与价格指数之间仍然存在着很强的相关性，多重共线性不能忽视。

序列相关检验：此时，DW统计量为1.455，虽然仍无法拒绝序列相关性的存在，但比模型1已经有了较大幅度的改善。
3、模型：根据Fisher等式MV=PY，可以推出
为了检验Fisher等式所得出的模型，我们重新整理数据如下：

Year
0.0762760.1857240.2126970.0240.0510510.0357141981
0.0889070.1186440.1588370.0190.0686030.2337161982
0.1208380.1405430.1872590.0150.1042740.0062111983
0.2083580.3431060.3482930.0280.17544501984
0.2500910.1125510.1780030.0880.148980.1157411985
0.138080.2335990.2821460.060.073660.0456431986
0.1725410.1409050.224050.0730.09276901987
0.2479250.1951640.2118720.1850.0531010.0555561988
0.1326940.0521230.1755840.178-0.038460.3947371989
0.0969120.1908890.2737180.0210.07435-0.097931990
0.1655120.2285090.2622040.0290.132665-0.167331991
0.232230.3399240.3100360.0540.169099-0.03111992
0.3001830.4385440.5165880.1320.1485710.1876541993
0.3500850.2617320.3452980.2170.1093550.1413721994
0.2506170.1677620.2946680.1480.0893880.024591995
0.1608550.1887690.2525720.0610.094114-0.104891996
0.09690.2213220.1958080.0080.088194-0.161871997
0.0521420.1185320.148404-0.0260.080228-0.254741998
0.0475110.1766960.14736-0.030.079908-0.28141999
0.0901780.1594780.122704-0.0150.106779-0.103982000
0.0877040.1265360.176005-0.0080.09647602001
0.0807440.1838920.168697-0.0130.094978-0.086422002
0.114855117.6741118.5754-0.0010.115971-0.013512003

我们利用模型进行回归，结论如下：

可以看出，由Fisher公式所构造的这两个模型连基本正态性检验、t检验和F检验都无法通过，存在很大的缺陷。

模型的最终修订：

在利用stata进行了一系列修正之后，我们选择了以下模型作为货币供给量的预测模型：

在该模型中，M1、M2均为名义货币供给量，GDP选用了名义GDP（原因是，价格和实际GDP都会影响到货币供给量，但是如果将二者分别作为解释变量纳入模型中，由于共同的变化趋势，导致多重共线性影响仍然存在。鉴于此，我们采用名义GDP作为二者的加权平均值，起到了很好的效果）、加权平均的年名义利率。在模型中，我们并没有考虑滞后项，原因是各期观察量之间存在很强的相关性，在各种检验中模型均表现良好。

为了解决各期变量之间的序列相关，我们采用了广义差分法，其中由Hildreth-Lu方法经过十次迭代后得出（ =0.5019），然后再进行估计，得到
 （**）
其中

正态性检验：JB统计量为2.538，无法拒绝正态分布假定。

t检验、F检验：从回归可以看出，模型很好的满足了t检验与F检验。

异方差检验：Breusch-Pagan检验所得（1）=0.07，无法拒绝同方差假定；White检验所得（5）=2.073，结论仍然可接受同方差假定。

序列相关检验： Durbin-Watson d-statistic( 3, 22) = 2.154946，比较接近2，序列相关已被消除到了可以接受的范围内。

模型设定检验：利用Ramsey Reset检验得出，模型没有遗失变量或者设定误差。

多重共线性检验：平均的VIF为1.09，远远小于10，因此多重共线性可以忽略不计。

同样，我们可以对M2进行类似方法的估计。在比较以后，我们采用Cochrane-Orcutt计算法估计，得出 =0.2782。在通过加权最小二乘法，输出结果如下：
（**）

正态性检验：JB统计量为0.2424，无法拒绝正态分布假定。

t检验、F检验：从回归可以看出，模型很好的满足了t检验与F检验。

异方差检验：由于采用了加权（稳健）的最小二乘法，所以异方差已被消除。

序列相关检验： Durbin-Watson d-statistic( 3, 22) = 2.020675，相当接近2，序列相关已被消除到了可以接受的范围内。

模型设定检验：利用Ramsey Reset检验得出，模型没有遗失变量或者设定误差。

多重共线性检验：平均的VIF为1.11，远远小于10，因此多重共线性可以忽略不计。

二、模拟与预测：

对2003年以及2004年进行模拟，结论是：

2003年的模拟M1= 782.5445，M2= 2119.44；与真实值的误差分别为6%和4%。
2004年的模拟M1= 949.5175，M2= 2633.26；与真实值的误差分别为1%和4%。

之所以出现一定量的误差，可能与2003、2004年由于外汇储备急剧增加所引起的货币政策改变有关。由于样本容量太小，如果进行chow test可能意义不大。

转载请注明：数据分析 » 一个stata案例_研究中国货币供给量M1和M2，影响货币供给的因素，并预测未来的中国货币供给量