R语言:summary()函数解读 summary():描述性统计量,可以提供最小值、最大值、四分位数和数值型变量的均值,以及因子向量和逻辑型向量的频数统计等。结果解读如下: 1. 调用:Call 2. 残差统计量:Residuals 3. 系数:Coefficients 4. Multiple R-squared和Adjusted R-squared 5. F-statistic
1. 调用:Call lm(formula = DstValue ~ Month + RecentVal1 + RecentVal4 + RecentVal6 + RecentVal8 + RecentVal12, data = trainData) 当创建模型时,以上代码表明lm是如何被调用的。 2. 残差统计量:Residuals Min 1Q Median 3Q Max -4806.5 -1549.1 -171.8 1368.7 6763.3 残差第一四分位数(1Q)和第三分位数(Q3)有大约相同的幅度,意味着有较对称的钟形分布。 3. 系数:Coefficients Estimate Std. Error t value Pr(>|t|) (Intercept) 1.345e+06 5.659e+05 2.377 0.01879 * Month 8.941e+02 2.072e+02 4.316 3.00e-05 * 分别表示: 估值 标准误差 T值 P值 Intercept:表示截距 Month:影响因子/特征 Estimate的列:包含由普通最小二乘法计算出来的估计回归系数。Std. Error的列:估计的回归系数的标准误差。P值估计系数不显著的可能性,有较大P值的变量是可以从模型中移除的候选变量。t 统计量和P值:从理论上说,如果一个变量的系数是0,那么该变量是无意义的,它对模型毫无贡献。然而,这里显示的系数只是估计,它们不会正好为0。因此,我们不禁会问:从统计的角度而言,真正的系数为0的可能性有多大?这是t统计量和P值的目的,在汇总中被标记为t value和Pr(>|t|)。 其 中,我们可以直接通过P值与我们预设的0.05进行比较,来判定对应的解释变量的显著性,我们检验的原假设是:该系数显著为0;若P<0.05,则拒绝原假设,即对应的变量显著不为0。可以看到Month、RecentVal4、RecentVal8都可以认为是在P为0.05的水平下显著不为0,通过显著性检验;Intercept的P值为0.26714,不显著。 4. Multiple R-squared和Adjusted R-squared 这两个值,即
,常称之为“拟合优度”和“修正的拟合优度”,指回归方程对样本的拟合程度几何,这里我们可以看到,修正的拟合优 度=0.8416,表示拟合程度良好,这个值当然是越高越好。当然,提升拟合优度的方法很多,当达到某个程度,我们也就认为差不多了。具体还有很复杂的判定内容,有兴趣的可以看看:http://baike.baidu.com/view/657906.htm 5. F-statistic F-statistic,是我们常说的F统计量,也成为F检验,常常用于判断方程整体的显著性检验,其值越大越显著;其P值为p-value: < 2.2e-16,显然是<0.05的,可以认为方程在P=0.05的水平上还是通过显著性检验的。 简单总结: T检验:检验解释变量的显著性; R-squared:查看方程拟合程度; F检验:是检验方程整体显著性。 如果是一线性回归方程,T检验的值和F检验的检验效果是一样的,对应的值也是相同的。
2024最新激活全家桶教程,稳定运行到2099年,请移步至置顶文章:https://sigusoft.com/99576.html
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请联系我们举报,一经查实,本站将立刻删除。 文章由激活谷谷主-小谷整理,转载请注明出处:https://sigusoft.com/26756.html