CrossFormer: A Versatile Vision Transformer Hinging on Cross-scale Attention
2023-04-18 15:43:58 时间
https://arxiv.org/abs/2108.00154
https://github.com/cheerss/CrossFormer
这是视觉的Transformer
演进过程:VIT---PVT---CrossFormer
- VIT没有考虑多尺度信息
- PVT通过特征下采样集成了多尺度信息
- CrossFormer基于跨尺度注意力机制的视觉Transformer
相关资料:
- 【ICLR2022】CrossFormer: A versatile vision transformer - 高峰OUC的文章 - 知乎
https://zhuanlan.zhihu.com/p/468485931 - Transformers系列--浅谈CrossFormer - FlyEgle的文章 - 知乎
https://zhuanlan.zhihu.com/p/397792653
相关文章
- 借助 5G 和原生 AI 为工业 4.0 做好准备
- 5天用户破百万,ChatGPT背后有何玄机?
- 使用 Hippo 进入 WebAssembly
- 宫廷玉液酒减小锤?OpenAI最新语言模型能当客服能写代码,连这篇文章也是它写的!
- 云原生安全架构设计最佳实践
- Gartner总结三大云安全实施建议 附重要安全工具及风险评估方法
- 5G 和边缘AI:解决交通管理问题
- K8s中的Pod和容器设计模式
- CloudOps:优化云运维的新兴框架
- 家大墙少 全屋WiFi覆盖试试Mesh组网
- 人工智能在工业4.0中的作用有多重要?
- ChatGPT的火爆背后,人工智能发展未来路向何方?
- 2022年的多云市场将如何发展?
- 万亿赛道大爆发,are you ready? “2022首届AIGC共创共建论坛”来了!
- 腾讯犀牛鸟开源人才培养计划发布,助力国产开源生态发展
- chatGPT代码写的有点好啊,程序员要失业了?
- VXLAN:云时代的虚拟化数据中心网络
- 众邦银行云原生技术研究与探索
- 实现实时制造可视性优势有哪些?
- 自动化的未来:2023年加速云的采用