关于回归统计学论文
回归分析是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法。下文是学习啦小编为大家整理的关于回归统计学论文的范文,欢迎大家阅读参考!
关于回归统计学论文篇1
广西CPI指数统计数据多元回归分析
摘要:本文针对目前大众所最关心的物价问题,通过多元回归分析模型,结合广西1999~2009年消费品零售价格和服务项目价格变动相关数据,分析价格波动对居民消费的影响程度,给出影响广西CPI指数上涨的主要因素,并提出相应的措施。
关键词:CPI指数;多元回归;主成分分析
物价与日常生活息息相关,居民消费物价指数(CPI)主要包括食品、工业消费品、服务类(教育、医疗、交通等)的价格,是根据与居民生活有关的产品及劳务价格统计出来的物价变动指标。在广西,居民消费支出是消费的主体且相对薄弱,价格总水平低位运行,但2007年以来居民消费物价指数增长速度产生了显著的波动。针对目前大众所最关心的物价问题,分析消费品零售价格和服务项目价格变动的相关数据,了解CPI变化规律和价格波动对居民消费的影响程度,为采取相应的措施提供依据,具有十分重要的意义。
一、建立居民消费价格指数回归分析模型
在实际问题的研究和分析中,往往涉及多个变量,国家统计局将构成中国CPI指标的200多种商品和服务分为8个主要的类别。其中,中国CPI中食品的权重占到34%,食品价格的变动对于CPI的变动有很大的影响。下面根据收集的数据建立数学模型做具体的分析。
由中国统计年鉴和广西统计年鉴,收集广西1999~2009年来居民消费价格指数的有关数据。设Y为居民消费价格总指数,考虑的主要因素有:食品x1,烟酒及其用品x2,衣着x3,家庭设备用品和维修服务x4,医疗保健和个人用品x5,交通和通讯x6,娱乐教育文化用品和服务x7,居住x8。建立多元线性回归模型。其表达式为:Y=b0+ bixi,式中b0,…,b8为回归系数。建模数据,见表1。
二、用SPSS求回归系数及分析
使用SPSS软件对表1的因变量与所有自变量做相关分析,可得回归方程:
Y=-8.399+0.282x1+0.191x2+0.111x3+0.071x4+0.015x5+0.089x6+0.118x7+0.21x8(1)
由此可知,所定义的各自变量对居民消费价格指数Y的影响都比较显著,且能通过检验(F=612.780)。
关于模型是否成立的方差分析结果,可以看出,自变量对因变量有解释作用,所建立的线性回归模型具有合理性。
三、模型的检验与分析
建立多元线性回归数学模型后,还需要进行检验处理,使得到的数学模型更加完善。
1、拟合优度检验。
系数R2=0.998,测度了回归直线对数据的拟合程度,即回归方程中的8个自变量可以对价格指数Y进行99.8%的解释。说明回归方程的拟合度不错,模型较好地反映了8个自变量对CPI变动的共同影响。回归估计的标准误差S=0.1478,它是衡量回归直线代表性大小的统计分析指标,说明样本回归效果较好。
2、共线性检验与分析。
在实际问题的分析中,往往涉及的自变量个数较多,这样在建立模型时就可能会出现严重的共线性,也给合理分析问题和解决问题带来困难。因此,需要对回归方程中的变量进行共线性诊断,并且确定它们对参数估计的影响。当变量的方差膨胀因子(VIF)值大于2被认为有共线性问题。由用SPSS软件分析的共线性诊断表得知,各指标的VIF值都较大,条件指数大于30,特征根为0或接近于0,表示这些自变量存在多重共线性;常量与烟酒用品、家庭设备及维修这三项的方差比例值均很高,分别为0.94、0.91、0.81,表示三者高度相关。
3、主成分分析。
下面用主成分分析法对模型的原变量进行处理。(表4)表4中前4个主成分特征值的累积贡献率为90.158%,反映了原指标90.158%的信息,后面的特征值贡献越来越少,因此,也可用前4个主成分来代替原来的8个指标变量。Z1、Z2、Z3、Z4表示主成分。
成分得分系数表示某个主成分中,各变量所起作用的大小,其绝对值越大表示主成分对该变量的代表性也越大。其中,第一主成分主要与食品、家庭设备用品及维修服务相关;第二主成分主要与衣着、交通和通讯、娱乐教育文化用品及服务相关;第三主成分主要与烟酒及用品、医疗保健和个人用品相关;第四主成分与居住呈现高度相关。每个主成分都可由它的特征向量给出主成分方程。用SPSS将得到的4个主成分因子作为自变量建立多元线性回归方程:Y=101.648+2.878Z1+1.103Z2+0.673Z3+0.619Z4,带入4个主成分方程可得:Y=101.648+0.9371X1+0.6391X2+0.42X3+0.7054X4+0.0153X5+0.7445X6+0.5489X7+1.0236X8,这里的Xi(i=1,…,8)为标准指标变量。
分析主成分回归结果,R2=0.964,方差分析p=0.000,模型拟合较好。
将标准自变量还原为原自变量,得到消除共线影响后的Y与原自变量之间的线性回归方程:
Y=-78.5485+0.11805x1+0.52518x2+0.22392x3+0.35219x4+0.00609x5+0.20905x6+0.12291x7+0.24395x8(2)
经过上述分析可知所得方程(2)比方程(1)更加合理。
四、结论及建议
通过对模型的分析可知,各自变量均对广西居民消费价格指数有正向推动作用。
首先,中国CPI中食品的权重占到34%,食品价格的上涨对于CPI上涨有很大的推动作用。食品价格指数每提高1%会导致居民消费指数增长0.282%,标准化回归系数Beta=0.685,说明具有非常强的影响效果。广西第一产业的发展较落后,农业生产效率较低,造成农产品供求失衡。2009年广西农业增加值占生产总值比重首次降到20%以下,2010年的西南大旱使得粮食总产量同比下降3.9%,而游资炒作更加推高了广西部分农产品价格。因此,应大力推动现代农业发展,推广节本高效农业技术,保障农产品有效供给。政府部门可制定相关的措施抑制主要农资价格的上扬,加强农业生产资料和主要农产品的市场调控,稳定食品价格。
其次,CPI持续上涨的主要驱动因素中居住的上涨趋势也非常明显。近年来,广西北部湾经济区开发建设和城镇化建设快速推进,环境的改善吸引了外来购买力,从而扩大了对房地产市场的需求。房地产价格的一路攀升,对整体物价的上涨具有很大的刺激作用,成为居民消费的主要支出和生活负担。建议继续加强和改善房地产调控,采取长效措施遏制房价过快上涨,同时在引导商品房产业健康发展的同时,结合旧城改造大力建设保障性住房,增加住房有效供应,打击投资投机。
参考文献:
[1]宋志刚,谢蕾蕾,何旭洪.SPSS16实用[M].北京:科技出版社,2004.
[2]杨凌云,王凡彬,潘瑞,梁杰.CPI指数预测的统计回归模型.重庆文理学院学报(自然科学版),2010.2.
[3]李毛侠.安徽省消费需求影响因素的主成分回归分析.现代物业,2010.2.
关于回归统计学论文篇2
对统计中相关分析与回归分析的论述
摘要:客观事物之间存在一定的依存关系,对这种关系的分析具有重要意义。本文阐述了相关分析与回归分析的概念,提出了分析中应注意的问题。
关键词:依存关系;相关分析;回归分析;
一切客观事物都是互相联系的。而且每一事物的运动都和它的周围其它事物相联系互相影响。客观现象间的互相联系,可以通过一定的数量关系反映出来。例如气温与降雨量之间,消费品需求量与居民收入水平之间,劳动生产率与产品成本之间,投入与产出之间等等,都存在着一定的依存关系。
一、相关分析与回归分析的概念。
(一)客观现象之间存在的互相依存关系叫相关关系,对现象之间相关关系密切程度的研究,叫相关分析。相关分析具有如下两个特点。
1.现象之间确实存在着数量上的依存关系。
如果一个现象发生数量上的变化,则另一个现象也会相应地发生数量上的变化。例如商品流通费增加,一般商品销售额也会增加,反过来,如果商品销售额增加,一般商品流通费也要增加。身材较高的人,一般体重也较重。反过来,体重较重的人,一般身材也较高。再如,年龄与血压、播种量与粮食收获量之间等等都有数量上的依存关系。
2.现象之间数量上的关系不是确定的。
相关关系的全称为统计相关关系,它属于变量之间的一种不完全确定的关系。这意味着一个变量虽然受另一个(或一组)变量影响,却并不由这一个(或一组)变量完全确定。例如,身高1.7米的人其体重有许多个值;体重为60公斤的人,其身高也有许多个值。身高与体重之间没有完全严格确定的数量关系存在。再如产品单位成本和劳动生产率的变动之间存在着一定的依存关系,但是除了劳动生产率的变动以外,还会受到材料消耗、设备折旧、能源耗用以及管理费用等诸因素变动的影响。
由此可见,相关关系是现象间确实存在的,但相关关系数值是不完全确定的相互依存关系。
(二)回归分析的概念。相关关系说明现象间有关系,但它不能说明一个现象发生一定量的变化。也就是说,它不能说明两个变量之间的一般关系值。
回归分析是指对具有相关关系的现象,根据其关系形态,选择一个适合的数学模型(称为回归方程式),用来近似的表示变量间的平均变化关系的一种统计分析方法。它实际上是相关现象间不确定、不规则的数量关系一般化、规则化。
二、相关分析与回归分析的区别与联系
(一)、相关分析与回归分析的区别:
1.相关分析所研究的两个变量是对等关系,回归分析所研究的两个变量不是对等关系,必须根据研究目的,先确定其中一个是自变量,另一个是因变量。
2.对两个变量x和y来说,相关分析只能计算出―个反映出一个反映两个变量间相关密切程度的相关系数,计算中改变x和y的地位不影响相关系数的数值;回归分析有时可以根据研究目的不同分别建立两个不同的回归方程。以x自变量,y为因变量,可以得出y对x的回归方程。以y为自变量,x为因变量,可得出x对y的回归方程。
3.相关分析对资料的要求是,两个变量都必须是随机变量,而回归分析对资料的要求是,自变量是可以控制的变量(给定的变量),因变量是随机变量。
(二)、相关分析与回归分析的联系
1.相关分析是回归分析的基础和前提。如果缺少相关关系,没有从定性上说明现象间是否具有相关关系,没有对相关关系的密切程度作出判断,就不能进行回归分析,即便勉强进行了回归分析,也是没有实际意义的。
2.回归分析是相关分析的深入和继续。仅仅说明现象具有密切的相关关系是不够的,只有进行了回归分析,拟合了回归方程,才可能进行有关分析的回归预测,相关分析才有实际的意义。因此,如果仅有回归分析而缺少相关分析,将会因为缺乏必要的基础和前提而影响回归分析的可靠性;如果仅有相关分析而缺少回归分析,就会降低相关分析的意义。只有把两者结合起来,才能达到统计分析的目的。
三、应用相关分析与回归分析应注意的问题
(一)在定性分析的基础上进行定量分析
在定性分析的基础上进行定量分析,是保证正确运用相关分析和回归分析的必要条件。也就是在确定哪些变量作自变量,哪些变量作因变量之前,必须对所研究的问题有充分正确的认识。相关分析的方法解释不了相关关系产生的原因,它本身不能判断现象之间是否存在相关关系。
(二)要注意现象质的界限及相关关系作用的范围
在进行相关分析和回归分析时要注意现象质的界限及相关关系作用的范围。超出了这个范围,分析结果就会歪曲事实。我们用数学模型得到的回归方程,一般都是根据一定范围内的有限资料来计算的,其有效性,一般只适用于该范围内,不适宜用于该范围外。也就是说利用回归方程,一般只适宜用于内插预测,不宜用于外推预测。这是因为最小平方法指的是对现有资料范围配合一条“最佳”线,如果外推到范围以外,就不一定是“最佳”线了。根据样本数据所建立的回归方程的代表了经济变量之间的数量关系,这种关系是在一定条件下建立的,因此也只能在一定的条件下才能够成立,忽视了相关关系建立的条件,把这种关系无限制地向外推广是不正确的,由此得到的结论是值得怀疑的。例如施肥量和农作物生产量只在一定的范围内才具有正相关关系。
(三)要具体问题具体分析
回归方程是根据实际统计资料计算的,一般是一种经验公式。因此在分析时一定要注意具体问题具体分析。若条件发生变化,不能机械照搬,以免造成失误。利用回归方程对经济现象进行分析,最后得到的经济变量之间的数量关系是一种统计关系,要使我们所得到的这种关系具有真实性、可靠性,排除偶然性,一定要注意对具体问题分析,并注意对经济现象的观察必须是大量的。
(四)要考虑社会经济现象的复杂性
社会经济现象之间的关系比较自然技术现象之间的关系复杂得多。影响社会经济现象之间关系的不仅有自然技术因素,而且有政治的,经济的,道德的甚至心理的因素等等。而且社会条件的变化比较多和比较快,因此,在推广应用是要注意社会经济现象的复杂性。
(五)对回归模型中计算出来的参数的有效性应进行检验
在回归分析中对回归模型计算出来的参数(包括常数项及回归系数)的有效性应进行显著性检验,以判断回归预测的有效性。经过检验,如发现某回归系数的数值没有显著意义,或某些自变量间存在着多重共线性,则具有这种情况的自变量应从回归方程中剔除出去,以保证回归预测的有效性。