四 河南固定资产投资预测

(一)宏观经济预测模型方法

1.时间序列分析法

时间序列指按时间顺序排列起来的一组数据,时间序列预测法建立在事物运行具有连续性的原理之上,它假定时间因素包含了各种因素对预测变量的综合影响。时间序列预测模型主要包括移动平均法、指数平滑法、随机时间序列预测法等。

2.回归预测模型

回归预测是一种因果分析方法,反映事物之间的相互依存又相互联系。回归预测模型通常采用线性模型,模型假设解释变量为因,被解释变量为果,因果之间存在密切的相关关系,模型给出的被解释变量估计值与实际值的偏差满足正态分布。由于这样的假设前提存在,在用最小二乘法等估计模型参数之后,模型并不能立即运用于预测,必须通过一系列统计检验,如R检验、T检验、F检验、DW检验等,这些检验的目的在于证实假设前提的正确性。

3.计量经济模型

计量经济模型是研究经济结构及其变动趋势的预测方法,以经济理论为依据,运用数理统计的方法,对实际经济运行的统计资料进行计量分析,建立模型。模型变量分为两大类:一类是外生变量,即由模型外部给定的;另一类是内生变量,是由模型结构决定的,可由模型求出其值。

此外,常用的还有投入产出模型、系统动力学模型等数量分析模型。在定量分析的基础上,预测还需要以定性分析作指导。数量分析是从量的方面把握经济现象、相互关系及其变化发展的,通过一定的数量分析方法,把握经济中的内在联系,而理论分析更进一步解释了经济关系的基本性质。只有把两者结合起来,才能对经济现象整体有一个全面认识。

(二)ARIMA模型

经济运行过程从较长时间序列看,由于市场机制的作用,呈现一定的规律,这对预测提供了依据。目前,预测经济运行时间序列的理论与方法较多,而ARIMA模型在经济预测过程中既考虑了经济现象在时间序列上的依存性,又考虑了随机波动的干扰性,对经济运行短期趋势的预测准确率较高,是近年应用比较广泛的方法之一。固定资产投资不仅能够在总体上度量投资需求、产出和规模,也能够在整体上预测经济波动和经济周期状态,因此,对固定资产投资进行精确的拟合和分析,对分析一国的宏观经济发展趋势具有重要意义。

1.研究方法

ARIMA模型又称为B-J模型,该模型是由美国统计学家G.E.P.Box和英国统计学家G.M.Jenkins于20世纪70年代创立的一类随机时间序列模型。该方法通过时间序列的历史数据揭示现象随时间变化的规律,并将这种规律延伸到未来,从而进行短期预测。ARIMA模型的基本思想是将预测对象随时间推移而形成的数据序列视为一个随机序列,即除去个别的因偶然原因引起的观测值外,时间序列是一组依赖于时间的随机序列,虽然构成这个序列的单个序列值具有不确定性,但整个序列的变化却有一定的规律性,并且可以通过这种规律性建立数学模型,从而利用过去值和现在值预测未来值。

然而,当时间序列中有明显的时间趋势和季节性变化时,单纯使用ARIMA模型进行分析往往会使预测结果不理想。这时只有将ARIMA模型和随机季节模型(Stochastic Seasonal Model)组合成季节时间序列模型(又称乘积时间序列模型)即SARIMA(Seasonal ARIMA Model)模型,才能较好地描述该时间序列。

其中ARIMA(pdq)模型可以记为:

式(1)中t表示时间,α表示位移量,B为滞后算子,▽d=(1-Bd,▽dyt表示对yt进行了d阶差分,ΦB)和θB)表示p阶自回归和q阶移动平均算子。

若原时间序列yt进行d阶逐期差分和D阶长度为s的差分后才平稳,则建立季节时间序列模型ARIMA(pdq)(PDQs,表示为:

式(2)中P是季节自回归阶数,Q是季节移动平均阶数,▽d=(1-Bd表示d阶逐期差分,▽Ds=(1-BsD表示D阶季节差分,ΦpBs)和ΘQBs)为季节P阶自回归算子和Q阶移动平均算子。当P=D=Q=0时,SARIMA模型变为一般的ARIMA模型。

2.随机时间序列模型的建立

随机时间序列模型ARIMA(pdq)(PDQs可以描述任何齐次非平稳时间序列,它包括AR(p),MA(q),ARIMA(pq),ARIMA(pdq),ARIMA(PDQs以及各种组合模型。为预测对象建立随机时间序列模型主要有以下几个步骤。

(1)模型的识别。

这是建模的第一步。要建立一个描述预测对象的随机时间序列模型,首先要利用有关样本数据和产生该时间序列的有关信息,提出一组值得考虑的模型,包括模型的类型及相应的pdqPDQ阶的数值。模型识别的基本工具是相关分析,通过检验它们的截尾性、拖尾性以及周期性,判断时间序列采用何种模型拟合比较合适。

这一过程可细分为三步。首先,如果该序列为非平稳序列,这时应对该时间序列进行差分,同时分析差分序列的相关图以判断差分序列的平稳性,直至得到一个平稳序列。在实际中应该防止过度差分,过度差分不但会使序列样本容量减少还会使序列的方差变大。其次,在平稳时间序列基础上识别ARIMA模型阶数pq,在建立ARIMA模型时,时间序列的相关图和偏相关图为识别模型阶数pq提供了信息,选择模型原则见表2-13。最后,为季节数据选择PQ识别的基本原则和方法与识别pq相同,只是分析k=12(或4),24(或8),…时的情况。

表2-13 模型ARIMA(pq)选择

估计的模型形式并不是唯一的时间序列,在建立模型阶段应多选择几种模型形式,再根据Akaike提出的AIC准则和Schwatz提出的SC准则评判拟合模型的优劣,选取AIC和SC值达最小的模型。

(2)模型参数的估计。

这一步主要是利用有关的样本数据,对已选出的模型参数进行估计,也就是要估计出p个自回归参数φ1,φ2,…,φpq个移动平均参数θ1,θ2,…,θqP个季节自回归参数Φ1,Φ2,…,ΦP,以及Q个季节移动平均参数Θ1,Θ2,…,ΘQ的数值。

(3)模型的检验。

这一步主要是通过检验模型残差序列μt是不是白噪声,以考核所建模型的优劣。如果经检验发现μt是白噪声序列,则模型是合理的,可用于预测;否则,说明残差序列中还有某种信息,即还有规律,所建立的模型不合适,应进一步改进模型。所谓白噪声序列,就是各项之间互不相干的纯随机序列。

(4)模型预测

根据最后所选方程模型对将来数据进行预测,由于手工计算步骤繁多且容易出错,故本书利用Eviews 8.0的预测功能对将来数据进行预测,得出将来数据的趋势。

(三)河南固定资产投资预测

1.数据初步处理

由于河南省固定资产投资统计口径于2011年进行了修改,所以无法利用年度数据进行预测,本书根据《河南统计月报》选择2011~2016年河南省固定资产投资的月度数据X进行分析。各年1月份数据未上报,且收集的数据为累积数据,为了适应ARIMA模型,对数据进行插值处理和月度化,见表2-14。

表2-14 河南固定资产投资月度数

为了使原数据更统一,对原序列取对数,记做lnX。对河南省2011年1月~2016年12月固定资产投资数据作图观察,发现序列呈线性增长趋势,同时含有季节变化。由图2-10可以看出,序列带有很强的趋势成分,在每年的12月达到峰值,在年初(1~2月)再次降到谷底,每年6月有所提升。

图2-10 lnX序列趋势

(1)模型识别

我们的目的主要是利用ARIMA模型对其周期成分进行分析,因此需要先对此类的数据进行消除趋势性与季节性的处理,然后建立ARIMA模型。

a.差分阶数的确定。由于序列有很强的趋势性,对其进行一阶逐期差分,差分后序列记做DX,其时间序列趋势见图2-11。

图2-11 一阶差分序列曲线

差分后变为没有趋势性且均值不为0的序列,对一阶差分后的序列进行ADF检验,结果见图2-12。

图2-12 ADF检验结果

可以看出在显著性水平0.05下,拒绝存在单位根的原假设,说明序列X的一阶差分序列是平稳序列,因此d=1。计算序列的自相关系数,如图2-13所示。可以看出,序列的趋势基本消除,但有周期性变化。

图2-13 一阶差分序列自相关

由图2-13可以看出,序列确实没有明显趋势,这表明通过一阶差分趋势基本消除,但自相关系数在k为6、12、18、24时显著不为零,序列存在周期为一年的季节变化。对该序列进行一阶季节差分,将差分后序列记做DLX,序列曲线如图2-14所示,自相关系数如图2-15所示。

图2-14 季节差分后序列曲线

图2-15 一阶季节差分和序列自相关

两个图均显示序列的季节性基本消除,序列平稳,这表明,该序列是一阶逐期差分、一阶季节差分平稳序列,故d=1,D=1。

b.非季节(pq)的选择。根据图2-15平稳序列的自相关和偏自相关图,初步选择(pq)。由图看,在时滞k=12以内,明显不为零的偏自相关系数的个数为1个(k=1),k=2没有趋于零,可以考虑p为1,显著不为零的自相关系数也为1个(k=1),同时看到k=12时,γ有增大,考虑q=2。

c.季节(PQ)的选择。由图2-15可知,P=1,Q=1。

(2)根据上述分析结果,初选模型为:

ARIMA(2,1,1)(1,1,1)12,ARIMA(1,1,1)(1,1,1)12,ARIMA(1,1,2)(1,1,1)12和ARIMA(2,1,2)(1,1,1)12

(3)参数估计

从模型定阶准则看,ARIMA(2,1,1)(1,1,1)12的AIC最小,且各参数满足参数的约束,因此选择ARIMA(2,1,1)(1,1,1)12,采用最大似然估计法对初选模型分别进行估计,结果如下:

D(X,1,12)=0+[AR(1)=0.347231944072,SAR(12)=-0.012097779402,MA(1)=-0.665008735662,SMA(12)=-0.969531377958,BACKCAST=2013M03,ESTSMPL=2013M03 2016M12]

(4)残差检验

对所选模型进行残差序列的X2检验,计算残差序列的自相关系数和Q统计量,结果如图2-16所示。结果显示,概率均大于0.05,说明所有Q值都小于检验水平为0.05的分布临界值,因此随机误差序列是一个白噪声序列。

图2-16 残差序列自相关

(5)ARIMA(2,1,1)(1,1,1)12预测

根据对2016年11月~2017年12月河南省固定资产投资趋势模型的分析,得到河南省固定资产投资对数的实际值与模型预测值的序列曲线图,见图2-17。

图2-17 河南省固定资产投资对数实际值与预测值序列曲线图

由图可以看出,样本期内的拟合效果不错。基于SARIMA模型构建的平稳的季节时间序列显示,河南省固定资产投资自2017年1月以来随着时间推移呈现波动性趋增势头。分析结果表明,所建立的SARIMA模型能较好地揭示河南省固定资产投资变化趋势中的季节性波动特征。根据模型趋势往外推预测2020年数值,预计2020年河南省固定资产投资累计值为71180亿元。SARIMA模型预测本身的最大价值在于向决策者提供了如果按照2017年1月以来的变化规律发展下去,河南省固定资产投资序列将出现何种结果。但是,基于SARIMA的预测并不能消除未来时期的不确定性。

在该模型样本外预测出现高估现象,根据Eviews 8.0输出结果可得2017年1~2月固定资产投资额为2276.38亿元,但根据河南统计局公布的数据显示,河南省2017年1~2月固定资产投资完成额为2257.04亿元,预测误差约为0.0085。模型出现近1%的高估,原因在于自金融危机以来,为刺激经济增长,政府在投资资源配置中的作用增强,需要考虑到货币政策收紧、财政政策时滞,以及房地产调控政策的严厉实施等因素。这种对经济形势的人为干预和政策取向的调整是SARIMA模型本身不能涵盖的。