回归分析

2024-05-17

1. 回归分析


回归分析

2. 什么是回归分析

回归分析(regression analysis)是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。运用十分广泛,回归分析按照涉及的自变量的多少,可分为一元回归分析和多元回归分析;按照自变量和因变量之间的关系类型,可分为线性回归分析和非线性回归分析。如果在回归分析中,只包括一个自变量和一个因变量,且二者的关系可用一条直线近似表示,这种回归分析称为一元线性回归分析。如果回归分析中包括两个或两个以上的自变量,且因变量和自变量之间是线性关系,则称为多元线性回归分析。
 
回归分析是应用极其广泛的数据分析方法之一。它基于观测数据建立变量间适当的依赖关系,以分析数据内在规律,并可用于预报、控制等问题。

3. 什么是回归分析

所谓回归分析,就是根据相关关系的具体形态,选择一个合适的数学模型,来近似地表达变量间的依赖关系。回归分析与相关分析的联系是什么:回归分析和相关分析有着密切的联系,它们不仅具有共同的研究对象,而且在具体应用时,常常必须互相补充。相关分析需要依靠回归分析来表明现象数量相关的具体形式,而回归分析则需要依靠相关分析来表明现象数量变化的相关程度。只有当变量之间存在着高度相关时,进行回归分析寻求其相关的具体形式才有意义。

什么是回归分析

4. 什么是回归分析?

科普中国·科学百科:回归分析

5. 回归的回归分析的应用

相关分析研究的是现象之间是否相关、相关的方向和密切程度,一般不区别自变量或因变量。而回归分析则要分析现象之间相关的具体形式,确定其因果关系,并用数学模型来表现其具体关系。比如说,从相关分析中我们可以得知“质量”和“用户满意度”变量密切相关,但是这两个变量之间到底是哪个变量受哪个变量的影响,影响程度如何,则需要通过回归分析方法来确定。一般来说,回归分析是通过规定因变量和自变量来确定变量之间的因果关系,建立回归模型,并根据实测数据来求解模型的各个参数,然后评价回归模型是否能够很好的拟合实测数据;如果能够很好的拟合,则可以根据自变量作进一步预测。例如,如果要研究质量和用户满意度之间的因果关系,从实践意义上讲,产品质量会影响用户的满意情况,因此设用户满意度为因变量,记为Y;质量为自变量,记为X。根据图8-3的散点图,可以建立下面的线性关系:Y=A+BX+§式中:A和B为待定参数,A为回归直线的截距;B为回归直线的斜率,表示X变化一个单位时,Y的平均变化情况;§为依赖于用户满意度的随机误差项。在SPSS软件里可以很容易地实现线性回归,回归方程如下:y=0.857+0.836x回归直线在y轴上的截距为0.857、斜率0.836,即质量每提高一分,用户满意度平均上升0.836分;或者说质量每提高1分对用户满意度的贡献是0.836分。上面所示的例子是简单的一个自变量的线性回归问题,在数据分析的时候,也可以将此推广到多个自变量的多元回归,具体的回归过程和意义请参考相关的统计学书籍。此外,在SPSS的结果输出里,还可以汇报R2,F检验值和T检验值。R2又称为方程的确定性系数(coefficient of determination),表示方程中变量X对Y的解释程度。R2取值在0到1之间,越接近1,表明方程中X对Y的解释能力越强。通常将R2乘以100%来表示回归方程解释Y变化的百分比。F检验是通过方差分析表输出的,通过显著性水平(significant level)检验回归方程的线性关系是否显著。一般来说,显著性水平在0.05以下,均有意义。当F检验通过时,意味着方程中至少有一个回归系数是显著的,但是并不一定所有的回归系数都是显著的,这样就需要通过T检验来验证回归系数的显著性。同样地,T检验可以通过显著性水平或查表来确定。在上面所示的例子中,各参数的意义如表8-2所示。表8-2 线性回归方程检验  指标  值  显著性水平  意义R  0.89    “质量”解释了89%的“用户满意度”的变化程度  F  276.82  0.001  回归方程的线性关系显著  T  16.64  0.001  回归方程的系数显著

回归的回归分析的应用

6. 什么是回归分析>???

所谓回归分析法,是在掌握大量观察数据的基础上,利用烽理统计方法建立因变量与自变量之间的回归关系函数表达式(称回归方程式)。回归分析中,当研究的因果关系只涉及因变量和一个自变量时,叫做一元回归分析;当研究的因果关系涉及因变量和两个或两个以上自变量时,叫做多元回归分析。此外,回归分析中,又依据描述自变量与因变量之间因果关系的函数表达式是线性的还是非线性的,分为线性回归分析和非线性回归分析。通常线性回归分析法是最基本的分析方法,遇到非线性回归问题可以借助数学手段化为线性回归问题处理。 

回归分析法� 
这是一种从事物因果关系出发进行预测的方法。在操作中,根据统计资料求得因果关系的相关系数,相关系数越大,因果关系越密切。通过相关系数就可确定回归方程,预测今后事物发展的趋势。通常,求一个变量对另一个变量的因果关系,叫一元回归分析;而求多个变量之间的因果关系,叫多元回归分析。

7. 回归分析的定义

回归分析是应用极其广泛的数据分析方法之一。它基于观测数据建立变量间适当的依赖关系,以分析数据内在规律,并可用于预报、控制等问题。方差齐性线性关系效应累加变量无测量误差变量服从多元正态分布观察独立模型完整(没有包含不该进入的变量、也没有漏掉应该进入的变量)误差项独立且服从(0,1)正态分布。现实数据常常不能完全符合上述假定。因此,统计学家研究出许多的回归模型来解决线性回归模型假定过程的约束。研究一个或多个随机变量Y1 ,Y2 ,…,Yi与另一些变量X1、X2,…,Xk之间的关系的统计方法,又称多重回归分析。通常称Y1,Y2,…,Yi为因变量,X1、X2,…,Xk为自变量。回归分析是一类数学模型,特别当因变量和自变量为线性关系时,它是一种特殊的线性模型。最简单的情形是一个自变量和一个因变量,且它们大体上有线性关系,这叫一元线性回归,即模型为Y=a+bX+ε,这里X是自变量,Y是因变量,ε是随机误差,通常假定随机误差的均值为0,方差为σ^2(σ^2大于0)σ^2与X的值无关。若进一步假定随机误差遵从正态分布,就叫做正态线性模型。一般的情形,它有k个自变量和一个因变量,因变量的值可以分解为两部分:一部分是由于自变量的影响,即表示为自变量的函数,其中函数形式已知,但含一些未知参数;另一部分是由于其他未被考虑的因素和随机性的影响,即随机误差。当函数形式为未知参数的线性函数时,称线性回归分析模型;当函数形式为未知参数的非线性函数时,称为非线性回归分析模型。当自变量的个数大于1时称为多元回归,当因变量个数大于1时称为多重回归。回归分析的主要内容为:①从一组数据出发,确定某些变量之间的定量关系式,即建立数学模型并估计其中的未知参数。估计参数的常用方法是最小二乘法。②对这些关系式的可信程度进行检验。③在许多自变量共同影响着一个因变量的关系中,判断哪个(或哪些)自变量的影响是显著的,哪些自变量的影响是不显著的,将影响显著的自变量入模型中,而剔除影响不显著的变量,通常用逐步回归、向前回归和向后回归等方法。④利用所求的关系式对某一生产过程进行预测或控制。回归分析的应用是非常广泛的,统计软件包使各种回归方法计算十分方便。在回归分析中,把变量分为两类。一类是因变量,它们通常是实际问题中所关心的一类指标,通常用Y表示;而影响因变量取值的的另一类变量称为自变量,用X来表示。回归分析研究的主要问题是:(1)确定Y与X间的定量关系表达式,这种表达式称为回归方程;(2)对求得的回归方程的可信度进行检验;(3)判断自变量X对因变量Y有无影响;(4)利用所求得的回归方程进行预测和控制。

回归分析的定义

8. 回归分析的概念

回归的解释(1) [regress]∶发生倒退或表现倒退;常指趋于接近或退回到中间 状态 (2) [return]∶归回 实现 台湾 回归祖国,完成祖国统一的大业 详细解释 (1).回还,返回。 元 关汉卿 《裴度还带》 第二折:“认不的个来往回归。” 《 水浒传 》 第七一回:“话说 宋公明 一打 东平 ,两打 东昌 ,回归山寨 忠义堂 上,计点大小头领共有一百八员,心中大喜。” 郭沫若 《 浪漫 主义和现实主义》 :“﹝ 屈原 ﹞他是完全由现实出发而又回归到现实,并完全把自己的生死都置诸度外的。” (2).后退,倒退。 毛 * 《在省市自治区党委 书记 会议上的讲话》 :“ 当然 ,如果我们搞得不好,历史走一点回头路,有点回归,这还是很可能的。” 返回。 《敦煌曲子词· 菩萨蛮 》 :“何日却回归,玄穹知 不知 ?” 《敦煌变文集·太子成道经》 :“ 夫人 能行三从,我纳为妻;不能行者,回归亦得。” 词语分解 回的解释  回 (③回) í 还,走向原来的地方: 回家 。 掉转: 回首 (回头看)。 回顾 。回眸。回暧。妙手 回春 。 曲折 , 环绕 , 旋转 :回旋。回肠。回廊(曲折回环的走廊)。 答复,答报:回信。回话。回绝。 量词, 指事 件的 归的解释  归 (归) ī 返回,回到本处:归国。归程。归侨。 归宁 (回娘家 看望 父母)。归省(媙 )(回家探亲)。归真反璞。 还给: 归还 。物归原主。 趋向,去往:归附。 众望所归 。 合并,或集中于一类,或集中于一地: