您现在的位置是：首页 > 其它

当前栏目

GoogLeNet模型的微调

模型微调 GoogleNet

2023-09-14 08:58:39 时间

我从零开始训练了GoogLeNet模型。但它没有给我带来希望的结果。
作为替代，我想对我的数据集中的GoogLeNet模型进行微调。有谁知道我应该遵循什么步骤？

采纳答案：

假设你正在尝试做图像分类。这些应该是微调模型的步骤：

1.分类层

原始分类层"loss3/classifier"输出1000个类的预测（它的mum_output设置为1000）。您需要将其替换为具有适当num_output的新图层。替换分类层：

更改图层的名称（以便当您从caffemodel文件读取原始权重时，不会与此图层的权重发生冲突）。
将num_output更改为您尝试预测的正确数量的输出类。
请注意，您需要更改所有分类图层。通常只有一个，但是GoogLeNet碰巧有三个： "loss1/classifier" ， "loss2/classifier"和"loss3/classifier" 。

2.数据

您需要创建一个新的训练数据集，其中包含您想要调整的新标签。例如，请参阅这篇文章，了解如何制作lmdb数据集。

3.你想要进行多少广泛的调谐？

微调模型时，可以训练所有模型的权重，或者选择修正一些权重（通常是较低/较深层次的过滤器），并仅训练最顶层的权重。这个选择取决于你，它通常取决于可用的训练数据量（更多的例子你可以承受更多的权重，可以进行微调）。
每个图层（包含可训练参数）都有param { lr_mult: XX } 。这个系数决定了这些权重对SGD更新的敏感程度。设置param { lr_mult: 0 }意味着你修改这个图层的权重，并且在训练过程中它们不会被改变。
相应地编辑您的train_val.prototxt 。

4.运行咖啡

运行caffe train但提供caffemodel的重量作为初始重量：

~$ $CAFFE_ROOT/build/tools/caffe train -solver /path/to/solver.ptototxt -weights /path/to/orig_googlenet_weights.caffemodel

更多答案请参考GoogLeNet模型的微调。版权归stackoverflow所有，转载请保留此链接 GoogLeNet模型的微调

更多关于caffe 的细节，关注徐其华大神的系列博客，写得非常详细。

链接：http://www.cnblogs.com/denny402/tag/caffe/

猜你喜欢

时间设置Java操作Redis设置过期时间（redisjava过期）
MySQL 5.0安装指南（mysql 5.0 安装）
写给flutter开发者的vscode快捷键、插件和设置
Redis同步锁实现系统安全的利器（什么是redis同步锁）
快速搭建Redis集群地址池实现高可用（redis集群地址池）
添加超级用户的.asp代码[蓝屏的原创,凯文改进,Ms未公布的漏洞]
管理MySQL在文献管理中的应用（mysql文献）
linux 动态库加载_linux默认动态库加载路径
工业以太网杂谈（二）
Linux 黑话解释：什么是 Linux 中的 GUI、CLI 和 TUI？
JavaScript学习笔记（一）js基本语法
【剑指offer|3.合并两个有序的数组】
改变趋势地区数据迁移至Redis（地区数据存放redis）
javascript混合的构造函数和原型方式，动态原型方式
初识AngularJS

相关主题

Java线程模型
CSS 盒模型
应用模型
OSI七层模型
Java内存模型JMM
从M-P模型到神经网络
SAP OData 的 V2 模型
Python 10 训练模型
6. 盒模型
盒子模型
JMM模型
测试的W模型
测试模型
CSS-盒子模型
java内存模型3
盒模型
树模型总结
IO模型(1)
I/O模型