石油期货价格影响因素实证分析(2)

(整期优先)网络出版时间:2009-09-08
/ 1
 三、石油期货价格影响因素实证分析
  
  1.偏最小二乘基本原理。设有多元线性回归模型
  式中Y为因变量,X为自变量观测值构成的矩阵(设计矩阵);为回归系数向量;为误差向量。
  当数据总体满足高斯一马尔可夫假设条件时,的最小二乘解为: (2)
  从上式容易看出,正规矩阵必须是可逆矩阵,但当X变量中存在多重相关性时接近奇异,回归系数的值可能失效。但偏最小二乘回归分析可避免这个问题。它的基本思想是:分别在X和Y中提取成分t1和u1,t1是x1,x2,…xp的线性组合,u1是y1,y2,…yp的线性组合。在提取这两个成分时为了回归分析的需要有下列两个要求:t1和u1应尽可能多地携带各自数据表中的变异信息;t1和u1的相关程度应最大。这表明,t1和u1能够尽可能好地代表数据表x和Y。同时t1和u1又有最强的解释能力。在第一个成分t1和u1被提取后,偏最小二乘回归分别实施X对t1的回归以及Y对t1的回归,如果回归方程已经达到了满意的精度,则算法终止。否则,将利用X被t1解释后的残余信息以及Y被t1解释后的残余信息进行第二轮的成分提取,如此往复,直到能达到一个较满意的精度。若最终对X共提取了m个成分t1,t1,…,tm。偏最小二乘回归分析将通过实施yk对t1,t2,…,tm的回归方程,然后再表示为yk与对x1,x2,…xp的回归方程,即偏最小二乘回归方程。
  2.基本算法。本文以因变量向量仅有一个的偏最小二乘回归为例,简单介绍偏最小二乘回归的基本算法。
  假设F0是因变量y的标准化变量,是自变量x的标准化矩阵。
  第一步:首先从E0中提取一个成分;
  于是:
  第二步:实施E0在t1上的回归和F0在t1上的回归,即
  回归系数为:(7)
  E1、F1是第一次回归的残差矩阵。用E1代替E0,F1代替F0,用同样的方法重复第一步的工作,从而建立E1、F1对t2的回归:
  如此类推,至第h步,依据一定的原则(一般是依据交叉有效性)确定h的个数,h的个数应小于P,到h步建立:
  由于均为的线性组合。所以,最终可得到回归模型:
  交叉有效性是用来确定:,这里误差平方和为SSh,预测误差平方和为:PRESSh一般认为:当0.0975时终止计算,取h-1个成分。
  
  四、石油期货价格影响因素实证分析
  
  1.变量与数据选取。本文在对影响石油期货价格的诸多因素分析后,选取布伦特石油期货价格为因变量y(future),影响石油期货价格的因子(自变量)有美元兑欧元汇率(rate)、世界石油需求量(demand)与供应量(supply)、石油现货价格(price)以及美国GDP增长率(由于美国GDP占全球GDP20%,所以用美国GDP增长率代替全球GDP增长率)。用2000年~2005年的数据进行建模。原始数据来源国际能源总署、路透社。
  为了研究的方便,考虑对各时序数据取对数以后并不影响变量之间的关系,且所得到的数据容易得到平稳序列。我们对各变量数据作对数处理,处理后的时序变量分别记为:Y=log(future),x1=log(rate),x1=log(demand),x3=log(supply),x4=log(price),=log(GDP)。