【图像分类】卷积神经网络之VGG网络模型结构详解
2023-04-18 14:12:53 时间
写在前面:
首先感谢兄弟们的关注和订阅,让我有创作的动力,在创作过程我会尽最大能力,保证作品的质量,如果有问题,可以私信我,让我们携手共进,共创辉煌。
1. 前言
VGG全称是Visual Geometry Group,因为是由Oxford的Visual Geometry Group提出的。
VGG网络是卷积神经网络中的一种,在 2014 的 ImageNet 竞赛中,获得了定位任务第一名和分类任务第二名的好成绩。总结起来就是它使用了更小的滤波器,同时使用了更深的结构,AlexNet只有8层网络,而VGG有16层–19层网络,也不像AlexNet网络使用11×11那么大的滤波器,它只使用3×3的滤波器和2×2的池化层。
它之所以使用很多小的滤波器,是因为层叠很多小的滤波器的感受野和一个大的滤波器的感受野是相同的,还能减少参数,同时有更深的网络结构。
VGG只是对网络层进行不断的堆叠,并没有进行太多的创新,而增加深度确实可以一定程度改善模型效果。
2. VGG网络
卷积网络的输入是224×224的RGB图像,整个网络的组成是非常格式化的,基本上都用的是3×3的卷积核以及 2×2的池化,少部分网络加入了1×1的卷积核。
解释两个关键问题:
- 作者用的是多个3×3卷积叠加,而不是例如7×7、11×11的单个卷积,原因如下:
3个3×3卷积叠加得到的理论感受野和一个7×7卷积的理论感受野是相同的。
相关文章
- 【技术种草】cdn+轻量服务器+hugo=让博客“云原生”一下
- CLB运维&运营最佳实践 ---访问日志大洞察
- vnc方式登陆服务器
- 轻松学排序算法:眼睛直观感受几种常用排序算法
- 十二个经典的大数据项目
- 为什么使用 CDN 内容分发网络?
- 大数据——大数据默认端口号列表
- Weld 1.1.5.Final,JSR-299 的框架
- JavaFX 2012:彻底开源
- 提升as3程序性能的十大要点
- 通过凸面几何学进行独立于边际的在线多类学习
- 利用行动影响的规律性和部分已知的模型进行离线强化学习
- ModelLight:基于模型的交通信号控制的元强化学习
- 浅谈Visual Source Safe项目分支
- 基于先验知识的递归卡尔曼滤波的代理人联合状态和输入估计
- 结合网络结构和非线性恢复来提高声誉评估的性能
- 最佳实践丨云开发CloudBase多环境管理实践
- TimeVAE:用于生成多变量时间序列的变异自动编码器
- 具有线性阈值激活的神经网络:结构和算法
- 内网渗透之横向移动 -- 从域外向域内进行密码喷洒攻击