您现在的位置是：首页 > 其他

当前栏目

pytorch（8）– resnet101 迁移学习记录

迁移学习 PyTorch 记录 resnet101

2023-06-13 09:14:47 时间

一、前言

本篇记录使用 pytorch 官方 resnet101 实现迁移学习，迁移学习是当前深度学习领域的一系列通用的解决方案，而不是一个具体的算法模型。Pre-training + fine-tuning（预训练+调参）的迁移学习方式是现在深度学习中一个非常流行的迁移学习方式，有以下3步

（1）把预训练模型当做特征提取器： TensorFlow或者Pytorch都有ImageNet上预训练好的模型，将最后一层全连接层（原始的是1000个类别或者更多）改成你自己的分类任务的种类进行输出，或者把最后一层直接去掉换成自己的分类器，剩下的全部网络结构当做一个特征提取器。（2）fine-tuning：通常来说，直接把预训练模型来用效果不一定足够好，因此需要进行fine-tuning（微调）。fine-tuning需要冻结网络的前几层参数，只更新网络结构的后面几层和最后的全连接层，这样效果会更好。（3） Learning rate：在迁移学习的微调过程中一般不建议使用过大的学习率，通常来说1e-5是比较合适的选择

二、代码

resnet101 官网定义

import torch
from torchvision.models.resnet import ResNet, Bottleneck
 
def resnet101(pretrained=False, **kwargs):
    """Constructs a ResNet-101 model.
    Args:
        pretrained (bool): If True, returns a model pre-trained on ImageNet
    """
    model = ResNet(Bottleneck, [3, 4, 23, 3], **kwargs)
    if pretrained:
        checkpoint = torch.load('resnet101-5d3b4d8f.pth', map_location='cpu')  # 加载模型文件，pt, pth 文件都可以
        model.load_state_dict( checkpoint )
    return model

然后使用resnet101，加载官方预训练模型，再修改最后全连接层，训练过程只对最后全连接层做训练

    #初始化net,训练和验证都需要net
    
    net = resnet101(pretrained=True)
    net.fc = torch.nn.Sequential(torch.nn.Linear(2048, 1024),
                                       torch.nn.ReLU(),
                                       torch.nn.Dropout(p=0.5),
                                       torch.nn.Linear(1024, 1024),
                                       torch.nn.ReLU(),
                                       torch.nn.Dropout(p=0.5),
                                       torch.nn.Linear(1024, 257 ))  

    net = net.to(device)   
    
    #初始化optimizer，只有train时使用
    optimizer = optim.SGD( net.fc.parameters(), lr=1e-5, momentum=0.9)
    scheduler = torch.optim.lr_scheduler.StepLR(optimizer, 20 , gamma=0.5)

发布者：全栈程序员栈长，转载请注明出处：https://javaforall.cn/185265.html原文链接：https://javaforall.cn

猜你喜欢

拍卖风云：eBay与Oracle同台竞技（ebayoracle）
安全脚本程序的编写V1.0
破解MySQL远程连接秘密（r远程连接mysql）
Intellij IDEA 查找接口实现类的快捷键「建议收藏」
Oracle的分页技术：一探究竟（oracle是怎样分页的）
jQuery截取指定长度字符串的实现原理及代码
【CSS】CSS 复合选择器 ③ ( 并集选择器 | 并集选择器与后代选择器示例 )
如何配置解压版Redis（解压版redis如何配置）
信息Linux内核：获取最新版本信息（linux内核获取版本）
【愚公系列】待定。。。。。。。
疑难杂症MySQL权限设置受阻（mysql不能设置权限）
Python 进阶 — Flake8 静态代码检查工具
MySQL学籍管理系统：管理你的学业水平（mysql学籍管理系统）
构建Linux系统：USB无线网卡支持纳入（支持linux的usb无线网卡）
市场Oracle公司正式宣布退出中国市场（oracle公司退出中国）
【Rust日报】2022-12-14 - 每个 Rust 开发人员都应该了解 IDE 中的宏支持
CentOS下firewalld的简单使用
【Android 逆向】Android 进程注入工具开发 ( Visual Studio 开发 Android NDK 应用 | VS 自带的 Android 平台应用创建与配置 )
与MSSQL对比学习MYSQL的心得（三）--查看字段的长度
腾讯云 Docker 镜像加速和 Docker Compose 的安装
bioRxiv｜用可解释性深度学习架构改善药物反应预测，神话还是现实？
日入百万，靠“信任”赚钱，这门生意要翻车？
使用Oracle日期截取函数实现日期转换（oracle日期截取函数）

zl程序教程

当前栏目

pytorch（8）– resnet101 迁移学习记录

相关文章