zl程序教程

您现在的位置是:首页 >  硬件

当前栏目

【机器学习】准确率、精确率、召回率、误报率、漏报率概念及公式

机器概念学习 公式 精确 召回 准确率
2023-09-14 09:13:09 时间

阳性(正)样例P和阴性(负)样例N,将正样本预测为正样本的为True positive(TP),正样本预测为负样本的为False negativ(FN),负样本预测为正样本的为False positive(FP),负样本预测为负样本的为True negative(TN)。所以有:
P = T P + F N N = F P + T N P = TP+FN \\ N =FP+TN P=TP+FNN=FP+TN
1、准(正)确率accuracy
反映分类器或者模型对整体样本判断正确的能力,即能将阳性(正)样本positive判定为positive和阴性(负)样本negative判定为negative的正确分类能力。值越大,性能performance越好
A C C = T P + T N T P + T N + F P + F N ACC = \frac{TP +TN}{TP+TN+FP+FN} ACC=TP+TN+FP+FNTP+TN

这里注意,在负样本占绝对多数的场景中,不能单纯追求准确率,因为将所有样本都判定为负样本,这种情况下准确率也是非常高的。
2、精确率precision
反映分类器或者模型正确预测正样本精度的能力,即预测的正样本中有多少是真实的正样本。值越大,性能performance越好
p r e c i s i o n = T P T P + F P precision = \frac{TP}{TP+FP} precision=TP+FPTP

这里注意,单纯追求精确率,会造成分类器或者模型少预测为正样本,这时FP低,即精确率就会很高。
3、召回率recall,也称为真阳率、命中率(hit rate)
反映分类器或者模型正确预测正样本全度的能力,增加将正样本预测为正样本,即正样本被预测为正样本占总的正样本的比例。值越大,性能performance越好
r e c a l l = T P R = T P T P + F N = T P P recall =TPR= \frac{TP}{TP+FN} = \frac{TP}{P} recall=TPR=TP+FNTP=PTP
这里注意,单纯追求召回率,会造成分类器或者模型基本都预测为正样本,这时FN低,即召回率就会很高。
4、误报率false alarm,也称为假阳率、虚警率、误检率
反映分类器或者模型正确预测正样本纯度的能力,减少将负样本预测为正样本,即负样本被预测为正样本占总的负样本的比例。值越小,性能performance越好
f a l s e a l a r m = F P R = F P F P + T N = F P N falsealarm = FPR=\frac{FP}{FP+TN} =\frac{FP}{N} falsealarm=FPR=FP+TNFP=NFP

5、漏报率miss rate,也称为漏警率、漏检率
反映分类器或者模型正确预测负样本纯度的能力,减少将正样本预测为负样本,即正样本被预测为负样本占总的正样本的比例。值越小,性能performance越好
m i s s r a t e = F N R = F N T P + F N = F N P missrate = FNR = \frac{FN}{TP+FN} = \frac{FN}{P} missrate=FNR=TP+FNFN=PFN
6、特异度specificity
反映分类器或者模型正确预测负样本全度的能力,增加将负样本预测为负样本,即负样本被预测为负样本占总的负样本的比例。值越大,性能performance越好
s p e c i f i c i t y = T N R = T N F P + T N = T N N specificity = TNR = \frac{TN}{FP+TN} = \frac{TN}{N} specificity=TNR=FP+TNTN=NTN