机器学习笔记 - 机器学习调优指南
2023-09-14 09:01:36 时间
机器学习中最有价值的部分是预测建模。 这是对历史数据进行训练并对新数据进行预测的模型的开发。 当涉及到预测建模时,首要的问题是:怎样才能获得更好的结果?
这份备忘单包含我从多年来我自己的应用程序和研究顶级机器学习从业者和竞赛获胜者中提炼出的最佳建议。 使用本指南,您不仅可以提升性能,甚至可以在预测问题上获得世界一流的结果。
指南分为 4 个子主题:
1. 用数据提高性能。
2. 用算法提高性能。
3. 通过调优提高性能。
4. 使用集成提高性能。
列表中越往下,收益通常越小。 例如,问题的新框架或更多数据通常比调整性能最佳算法的参数会给您带来更多收益。 虽然并非总是如此,但一般而言是这样的。
1、使用数据提高性能
通过更改训练数据和问题定义,您可以获得巨大的成功。 也许即使是最大的胜利。
策略:为您的数据创建新的和不同的观点,以便最好地将潜在问题的结构暴露给学习算法。
获取更多数据:你能得到更多或更好质量的数据吗? 像深度学习这样的现代非线性机器学习技术在处理更多数据的情况下继续提高性能。
发明更多数据: 如果无法获取更多数据,是否可以生成新数据? 也许您可以增加或置换现有数据或使用概率模型来生成新数据。
清理您的数据: 你能改善数据中的信号吗? 也许存在可以固定或删除的缺失或损坏的观察值,或者可以固定或删除以提高数据质量的合理范围之外的异常值。<
相关文章
- 机器学习笔记 – 自动编码器autoencoder
- Python机器学习笔记:不得不了解的机器学习面试知识点(1)[通俗易懂]
- 机器学习:应用示例–图片OCR.md
- 《零基础学机器学习》笔记-第1课-新手快速上路路径
- 论文阅读:《基于机器学习的企业定价算法研究》
- 297个机器学习彩图知识点(12)
- 图机器学习无处不在! 用 Transformer 可缓解 GNN 限制
- 吴恩达机器学习IV
- 代替Git进行机器学习实验管理的工具推荐
- 用户画像--《美团机器学习实践》笔记
- A.机器学习入门算法(五):基于企鹅数据集的决策树分类预测
- 机器学习在精神病学研究中的应用
- 优化Linux机器内存优化:从零到千(linux机器内存)
- Redis远程连接简单配置,实现跨机器访问Redis数据库(redis远程连接配置)