zl程序教程

您现在的位置是:首页 >  硬件

当前栏目

机器学习笔记 - 机器学习调优指南

机器笔记学习 指南 调优
2023-09-14 09:01:36 时间

        机器学习中最有价值的部分是预测建模。 这是对历史数据进行训练并对新数据进行预测的模型的开发。 当涉及到预测建模时,首要的问题是:怎样才能获得更好的结果?

        这份备忘单包含我从多年来我自己的应用程序和研究顶级机器学习从业者和竞赛获胜者中提炼出的最佳建议。 使用本指南,您不仅可以提升性能,甚至可以在预测问题上获得世界一流的结果。

        指南分为 4 个子主题:
        1. 用数据提高性能。
        2. 用算法提高性能。
        3. 通过调优提高性能。
        4. 使用集成提高性能。
        列表中越往下,收益通常越小。 例如,问题的新框架或更多数据通常比调整性能最佳算法的参数会给您带来更多收益。 虽然并非总是如此,但一般而言是这样的。

        1、使用数据提高性能

        通过更改训练数据和问题定义,您可以获得巨大的成功。 也许即使是最大的胜利。
        策略:为您的数据创建新的和不同的观点,以便最好地将潜在问题的结构暴露给学习算法。

        获取更多数据:你能得到更多或更好质量的数据吗? 像深度学习这样的现代非线性机器学习技术在处理更多数据的情况下继续提高性能。

        发明更多数据: 如果无法获取更多数据,是否可以生成新数据? 也许您可以增加或置换现有数据或使用概率模型来生成新数据。

        清理您的数据: 你能改善数据中的信号吗? 也许存在可以固定或删除的缺失或损坏的观察值,或者可以固定或删除以提高数据质量的合理范围之外的异常值。<