zl程序教程

您现在的位置是:首页 >  后端

当前栏目

机器学习笔记 - 基于CNN+OpenCV的图像着色

Opencv机器笔记学习 基于 图像 CNN 着色
2023-09-14 09:01:35 时间

一、论文简读

1、概述

        在 ECCV 2016 中,Richard Zhang、Phillip Isola 和 Alexei A. Efros 发表了一篇题为“彩色图像着色”的论文,其中他们提出了一种用于对灰色图像进行着色的卷积神经网络。他们使用 ImageNet 训练集中的 130 万张图像训练网络。作者还公开了一个经过训练的基于 Caffe 的模型。

        目标不是恢复实际的地面真实颜色,而是产生可能欺骗人类观察者的合理着色,对灰度图像的语义和纹理及其颜色版本之间的统计依赖关系进行足够多的建模,以产生视觉上引人注目的结果。

        给定亮度通道 L,在CIE Lab颜色空间中预测图像对应的 a 和 b 颜色通道。用作训练示例,将图像的 L 通道作为输入,将其 ab 通道作为监督信号。预测每个像素的可能颜色分布。此外在训练时重新加权损失以强调稀有颜色。这鼓励我们的模型充分利用大规模数据的多样性。 最后通过退火-分布的均值。 最终结果是色彩更加鲜艳并且比以前的方法在感知上更真实。

         为了简化计算,Lab 颜色空间的ab空间被量化为 313 个 bin。不是为每个像素找到 a 和 b 值,因为这种量化,我们只需要找到一个介于 0 之间的 bin 编号和 312。另一种思考问题的方式是,我们已经有了取值从 0 到 255 的 L 通道,我们需要找到取值在 0 到 312 之间的ab通道。所以颜色预测任务现在是变成了一个多项分类问题,其中每个灰色像素有 313 个类别可供选择。

2、