您现在的位置是：首页 > 其它

当前栏目

【第25篇】力压Tramsformer，ConvNeXt成了CNN的希望

25 CNN 希望

2023-09-14 09:05:41 时间

论文链接：https://arxiv.org/pdf/2201.03545.pdf
代码链接：https://github.com/facebookresearch/ConvNeXt
如果github不能下载，可以使用下面的连接：
https://gitcode.net/hhhhhhhhhhwwwwwwwwww/ConvNeXt
在这里插入图片描述

视觉识别的“咆哮的 20 年代”始于 Vision Transformers (ViTs) 的引入，它迅速取代了 ConvNets，成为最先进的图像分类模型。另一方面，普通的 ViT 在应用于目标检测和语义分割等一般计算机视觉任务时面临困难。正是分层 Transformers（例如，Swin Transformers）重新引入了几个 ConvNet 先验，使 Transformers 作为通用视觉骨干实际上可行，并在各种视觉任务上表现出卓越的性能。然而，这种混合方法的有效性在很大程度上仍归功于 Transformer 的内在优势，而不是卷积固有的归纳偏差。在这项工作中，我们重新检查了设计空间并测试了纯 ConvNet 所能达到的极限。我们逐渐将标准 ResNet “现代化”为视觉 Transformer 的设计，并在此过程中发现了导致性能差异的几个关键组件。这一探索的结果是一系列纯 ConvNet 模型，称为 ConvNeXt。 ConvNeXts 完全由标准 ConvNet 模块构建，在准确性和可扩展性方面与 Transformer 竞争，实现 87.8% ImageNet top-1 准确率，在 COCO 检测和 ADE20K 分割方面优于 Swin Transformers，同时保持标准 C

猜你喜欢

如何在Ubuntu18.04系统安装Nvidia显卡驱动教程(图文)
node+express+jade制作简单网站指南
【Groovy】xml 序列化 ( 使用 MarkupBuilder 生成 xml 数据 | 标签闭包下创建子标签 | 使用 MarkupBuilderHelper 添加 xml 注释 )
MSSQL2005：简单却强大！（简易mssql2005）
HTML <td> 标签
SpringBoot整合thymeleaf
Linux nmap命令详解
「Linux环境下12306服务体验」（linux12306）
c语言中getchar的运用_c语言中gets和getchar
使用bedtools进行gwas基因注释
docker-跨宿主机容器网络互联
一步步教你在Linux上安装YUM桌面（linux安装桌面yum）
原创二进制-1
精准的嵌入式Linux地图：改变市场轨迹（嵌入式linux地图）
用Windows XP的系统提示音做成的音乐
红色集群单台服务器上的挑战（redis集群单数台）
「Linux下的打字软件：超越期待」（打字软件linux）
使用Redis有效获取内部数据（redis获取里面的数据）
Flash插件安装了，但没有FlashHelperService服务怎么办？

相关主题

zl程序教程

当前栏目

【第25篇】力压Tramsformer，ConvNeXt成了CNN的希望

相关文章