Data Mining: SSE,MSE,RMSE,R-square指标讲解
转载自:http://blog.csdn.net/l18930738887/article/details/50629409
SSE(和方差、误差平方和):The sum of squares due to error
MSE(均方差、方差):Mean squared error
RMSE(均方根、标准差):Root mean squared error
R-square(确定系数):Coefficient of determination
Adjusted R-square:Degree-of-freedom adjusted coefficient of determination
一、SSE(和方差)
该统计参数计算的是拟合数据和原始数据对应点的误差的平方和,计算公式如下
SSE越接近于0,说明模型选择和拟合更好,数据预测也越成功。接下来的MSE和RMSE因为和SSE是同出一宗,所以效果一样
二、MSE(均方差)
该统计参数是预测数据和原始数据对应点误差的平方和的均值,也就是SSE/n,和SSE没有太大的区别,计算公式如下
三、RMSE(均方根)
该统计参数,也叫回归系统的拟合标准差,是MSE的平方根,就算公式如下
在这之前,我们所有的误差参数都是基于预测值(y_hat)和原始值(y)之间的误差(即点对点)。
四、R-square(确定系数)
在讲确定系数之前,我们需要介绍另外两个参数SSR和SST,因为确定系数就是由它们两个决定的
(1)SSR:Sum of squares of the regression,即预测数据与原始数据均值之差的平方和,公式如下
(2)SST:Total sum of squares,即原始数据和均值之差的平方和,公式如下
可以观察到,SST=SSE+SSR,而我们的“确定系数”是定义为SSR和SST的比值,故
其实“确定系数”是通过数据的变化来表征一个拟合的好坏。由上面的表达式可以知道“确定系数”的正常取值范围为[0 1],越接近1,表明方程的变量对y的解释能力越强,这个模型对数据拟合的也较好
相关文章
- [Docker] Storing Container Data in AWS S3
- [Typescript] Create Type From Any Given Data in TypeScript
- [React Testing] Use Generated Data in Tests with tests-data-bot to Improve Test Maintainability
- [Javascript] Classify JSON text data with machine learning in Natural
- [Javascrip] Logging Timing Data to the Console
- [Ramda] Declaratively Map Data Transformations to Object Properties Using Ramda evolve
- [Javascrip] Logging Timing Data to the Console
- 使用 ABAP 手动解析包含二进制文件的 multipart/form-data 数据时遇到的问题
- Android kotlin 系列讲解(基础篇) 枚举类(enum)、数据类(data)和密封类(sealed)与java的写法差异
- ML:MLOps系列讲解之《基于ML的软件的三个层次之01 Data: Data Engineering Pipelines》解读
- 成功解决PermissionError: [Errno 13] Permission denied: ‘F:Filedata123.csv‘
- 成功解决ValueError: DataFrame.dtypes for data must be int, float or bool.Did not expect the data types
- pandas入门10分钟——serries其实就是data frame的一列数据
- Mysql load data infile 导入数据出现:Data truncated for column