一元线性回归方程是用来描述一个自变量和一个因变量之间的线性关系的数学模型。
在一元线性回归中,我们可以使用最小二乘法来拟合出一条直线,该直线可以最好地代表自变量和因变量之间的关系。
而 r平方(R-squared)是用来衡量一元线性回归模型对观测数据的拟合程度的统计指标。
它的取值范围在0到1之间。
具体来说,r平方表示因变量的方差能够被回归模型解释的比例。
换句话说,它衡量了因变量的变异中有多少可以通过自变量来解释。
当 r平方接近于1时,表示线性回归模型能够很好地拟合数据,即自变量能够解释因变量的大部分变异;
当 r平方接近于0时,表示线性回归模型对数据的拟合程度较差,即自变量解释因变量的变异较少。
需要注意的是,r平方并不代表回归模型的准确性或有效性,它只是用来衡量模型对观测数据的拟合程度。
对于一元线性回归来说,还需要考虑其他统计指标和假设检验等来评估模型的可靠性和显著性。
R平方,判定系数。
判定系数,又叫决定系数,是指在线性回归中,回归可解释离差平方和与总离差平方和之比值,其数值等于相关系数R的平方。
决定系数
中文名决定系数
外文名coefficient of determination
概念(变异比率)
表依变数Y的变异中有多少百分比,可由控制的自变数X来解释[2]
含义相关系数的平方叫决定系数,决定系数表示因变量Y的变异中有多少百分比,可由控制的自变量X来解释;本题的决定系数为081,说明因变量Y的变异中有81%可由控制的自变量X来解释。
相关系数是描述两个随机变量之间的相关程度的指标,相关系数在-1~+1之间,绝对值越接近1表示两个变量之间的相关程度越高,接近0表示相关性越差,0表示没有相关性。
本题的决定系数为081,所以相关系数为09,说明两变量间的相关关系强度较大。
当|r|=1时,X与Y完全相关,X与Y变成函数关系;散点图中全部的观察点都排列在一条直线上。
作用判定系数只是说明列入模型的所有解释变量对因变量的联合的影响程度,不说明模型中单个解释变量的影响程度。
对时间序列数据,判定系数达到09以上是很平常的;但是,对截面数据而言,能够有05就不错了。
用例判定系数达到多少为宜?
没有一个统一的明确界限值;
若建模的目的是预测因变量值,一般需考虑有较高的判定系数。
若建模的目的是结构分析,就不能只追求高的判定系数,而是要得到总体回归系数的可信任的估计量。判定系数高并不一定每个回归系数都可信任。