您现在的位置是：首页 > 硬件

当前栏目

【机器学习】为什么会产生过拟合，有哪些方法可以预防或克服过拟合？(面试回答)

机器方法学习面试为什么可以哪些产生

2023-09-14 09:13:09 时间

为什么会产生过拟合，有哪些方法可以预防或克服过拟合？

原因

一些假设条件（如样本独立同分布）可能是不成立的；训练样本过少不能对整个空间进行分布估计

判断依据

一般而言训练误差很低，但是测试误差较高，过拟合的概率较大，如果训练误差和测试误差都很高，一般是欠拟合。

解决方法

（1）数据集角度

增加样本量，数据集扩增
原有数据加随机噪声
重采样

（2）特征角度

特征选择
特征降维

（3）模型角度

降低模型复杂度
正则化，正则化正是通过在损失函数上添加额外的参数稀疏性惩罚项（正则项），来限制网络的稀疏性，以此约束网络的实际容量，从而防止模型出现过拟合。L1正则化是将权值的绝对值之和加入损失函数，使得权值中0值比重增大，因此得到的权值较为稀疏。L2正则化是将权重的平方之和加入损失函数，使得权值分布更加平均，所以权值较为平滑。
Dropout舍弃，在深度学习网络的训练过程中，对于神经网络单元，按照一定的概率将其暂时从网络中丢弃，使得每次训练的网络结构多样。

（4）训练角度

早停止，如在训练中多次迭代后发现模型性能没有显著提高就停止训练
交叉验证

猜你喜欢

Oracle中求两数之和的技巧（oracle两数据求和）
Java高效编程之三【类和接口】详解编程语言
大公司落地基于Redis的架构之路（大公司的redis架构）
MSSQL服务器连接测试：安全性不容忽视（mssql 连接测试）
Fusion Linux：打破界限的操作系统（fusionlinux）
Linux系列之添加和删除软件命令
数据库本地电脑上架设SQLserver数据库的方法（本地电脑建立SQLserver）
IDEA内网搭建环境
剑指offer No.18 二叉树的镜像
【Android 内存优化】Java 引用类型 ( 强引用 | 软引用 | 弱引用 | 虚引用 )
React面试：谈谈虚拟DOM，Diff算法与Key机制
水果编曲软件FL Studio 21中文版功能介绍/下载/安装/激活图文教程及配置要求
让开源协作超越编码：Assembly获290万美元融资
五万字总结,深度学习基础。「建议收藏」

相关主题

机器学习的方法
机器学习-决策树
[机器学习] 集成学习
机器学习---聚类算法
机器学习-线性回归
机器学习笔记（一）
机器学习数学基础
机器学习和统计学习
机器学习_knn算法_2
机器学习之深度学习
【机器学习】2、SVM
机器学习算法总结
Python 7步机器学习
机器学习优化算法

zl程序教程

当前栏目

【机器学习】为什么会产生过拟合，有哪些方法可以预防或克服过拟合？(面试回答)

为什么会产生过拟合，有哪些方法可以预防或克服过拟合？

相关文章