您现在的位置是：首页 >

当前栏目

AIC和BIC准则详解

详解准则 AIC BIC

2023-06-13 09:11:44 时间

大家好，又见面了，我是你们的朋友全栈君。

很多参数估计问题均采用似然函数作为目标函数，当训练数据足够多时，可以不断提高模型精度，但是以提高模型复杂度为代价，同时带来一个机器学习中非常普遍的问题——过拟合。所以，模型选择问题在模型复杂度与模型对数据集描述能力（即似然函数）之间寻求最佳平衡。人们提出许多信息准则，通过加入模型复杂度的惩罚项来避免过拟合问题，此处我们介绍一下常用的两个模型选择方法：

1. 赤池信息准则（Akaike Information Criterion，AIC）

AIC是衡量统计模型拟合优良性的一种标准，由日本统计学家赤池弘次在1974年提出，它建立在熵的概念上，提供了权衡估计模型复杂度和拟合数据优良性的标准。

通常情况下，AIC定义为： A I C = 2 k − 2 l n ( L ) AIC = 2k-2ln(L) AIC=2k−2ln(L) 其中k是模型参数个数，L是似然函数。从一组可供选择的模型中选择最佳模型时，通常选择AIC最小的模型。

当两个模型之间存在较大差异时，差异主要体现在似然函数项，当似然函数差异不显著时，上式第一项，即模型复杂度则起作用，从而参数个数少的模型是较好的选择。

一般而言，当模型复杂度提高（k增大）时，似然函数L也会增大，从而使AIC变小，但是k过大时，似然函数增速减缓，导致AIC增大，模型过于复杂容易造成过拟合现象。

目标是选取AIC最小的模型，AIC不仅要提高模型拟合度（极大似然），而且引入了惩罚项，使模型参数尽可能少，有助于降低过拟合的可能性。

贝叶斯信息准则（Bayesian Information Criterion，BIC）

BIC（Bayesian InformationCriterion）贝叶斯信息准则与AIC相似，用于模型选择，1978年由Schwarz提出。训练模型时，增加参数数量，也就是增加模型复杂度，会增大似然函数，但是也会导致过拟合现象，针对该问题，AIC和BIC均引入了与模型参数个数相关的惩罚项，BIC的惩罚项比AIC的大，考虑了样本数量，样本数量过多时，可有效防止模型精度过高造成的模型复杂度过高。

B I C = k l n ( n ) − 2 l n ( L ) BIC = kln(n)-2ln(L) BIC=kln(n)−2ln(L)

其中，k为模型参数个数，n为样本数量，L为似然函数。kln(n)惩罚项在维数过大且训练样本数据相对较少的情况下，可以有效避免出现维度灾难现象。

AIC与BIC比较

AIC和BIC的公式中前半部分是一样的，后半部分是惩罚项，当 n ≥ 1 0 2 n≥10^2 n≥102时，kln(n)≥2k，所以，BIC相比AIC在大数据量时对模型参数惩罚得更多，导致BIC更倾向于选择参数少的简单模型。

发布者：全栈程序员栈长，转载请注明出处：https://javaforall.cn/142570.html原文链接：https://javaforall.cn

猜你喜欢

Linux 必备技能：25个复制命令，助你快速操作系统（linux下复制命令）
jdbcDriverMySQL数据库驱动程序jdbc驱动的使用（com.mysql.）
mssql转义之单引号：一次避免语句错误的学习（mssql 转义单引号）
MySQL源码分析，掌握MySQL核心技术（mysql源码学习）
3-操作系统的发展与分类
如何发布一个 TypeScript 编写的 npm 包
Oracle数据库优化工具大集合（oracle数据库优化工具）
MySQL查询优化：提升匹配度（mysql匹配度）
简单理解JS中的this关键字 - wuuconix's blog
Oracle数据库中的视图技术简介（oracle的view）
Linux下4G网卡强劲加速，提升上网体验（linux4g网卡）
ChatGPT API 今日正式发布，中国厂商往何处去？
kubernetes和docker有什么区别
性能优化MySQL达到1万并发性能优化指南（mysql1万并发）
测试人员需要掌握的Linux命令
使用windows也能上架你的ipa到苹果
快速上手如何创建Redis实例（创建redis实例）
首届学生开源年会 SOSCON 将于 6 月在重庆大学举办
新手快速玩转CVI操作Mysql（cvi操作mysql）
textarea是块元素吗
考研（大学）数学多元函数微分学（1）
浅析PHP的静态成员函数效率更高的原因
用mysql内存表来代替phpsession的类

zl程序教程

当前栏目

AIC和BIC准则详解

相关文章