zl程序教程

您现在的位置是:首页 >  后端

当前栏目

Python视觉深度学习系列教程 第二卷 第5章 使用神经网络集成提高准确性

2023-09-14 09:01:35 时间

         第二卷 第五章 使用神经网络集成提高准确性

        在本章中,我们将探讨集成方法的概念,即采用多个分类器并将它们聚合为一个大分类器的过程。通过将多个机器学习模型平均在一起,我们可以通过仅使用随机选择的单个模型来超越(即获得更高的准确性)。事实上,您阅读的几乎所有参加ImageNet挑战赛的最先进出版物都报告了他们对卷积神经网络集合的最佳发现。

        我们将从本章开始讨论Jensen不等式——理论集成方法所依赖的。从那里我将演示如何从单个脚本训练多个CNN并评估它们的性能。然后我们将这些CNN组合成一个单一的元分类器,并注意到准确性的提高。

        一、集成方法

        术语“集成方法”通常是指训练“大量”模型(其中“大”的确切值取决于分类任务),然后通过投票或平均组合它们的输出预测以提高分类精度。事实上,集成方法不是深度学习和卷积神经网络所特有的。我们多年来一直在使用集成方法。AdaBoost和随机森林等技术是集成方法的典型例子。

        在随机森林中,我们训练多个决策树并使用我们的森林进行预测。从图(左)可以看出,我们的随机森林由聚合在一起的多个决策树组成。每个决策树都对它认为最终分类应该是什么进行“投票”。这些投票由元分类器制成表格,并选择得票最多的类别作为最终分类。