AI之Transformer:Transformer在CV计算机视觉领域的简介、代表性算法、案例应用之详细攻略
AI之Transformer:Transformer在CV计算机视觉领域的简介、代表性算法、案例应用之详细攻略
目录
Transformer在CV计算机视觉领域的简介、代表性算法
Transformer在CV计算机视觉领域的简介、代表性算法
思维导图
源自网络
代表性算法(持续更新)
Task | Papers |
|
Pretraining |
|
|
relationship with cnn | 2020/1/10 On Therelationship Eetween Self-Attention And Convolutional Layers | 2020/1/10 关于自注意力和卷积层之间的关系
|
classfication | 2020/4/28 Exploring Self-Attention For Image Recognition 2020/10/ 22 An Image Is Worth 16x16 Words: Transformers For Image Recognition At Scale | 2020/4/28 探索图像识别的自注意力 2020/10/ 22 一张图像值 16x16 字:大规模图像识别的变形金刚
|
object detection | 2020/5/28 End-To-End Object Detecti On With Adaptive Clustering Transformer 2020/10/8 Deformable Detr: Deformable Transformers For End-To-End Object Detection 2020/11/18 Act(Endto-End Object Detection With Adaptive Clustering Transformer) | 2020/5/28 使用自适应聚类变换器进行端到端对象检测 2020/10/8 Deformable detr:用于端到端物体检测的可变形变压器 2020/11/18 Act(使用自适应聚类变换器进行端到端对象检测)
|
image gpt | 2018/6/15 Image Transf Ormer 2019/4/23 Generating Long Sequences With Sparse Transformers 2020/1/10 Generative Pretraining From Pixels | 2018/6/15 图像转换器 2019/4/23 使用稀疏变换器生成长序列 2020/1/10 从像素生成预训练
|
segmentation | 2020/9/23 Hamming Ocr:A Locality Sensitive Hashing Neural Network For Scene Text Recognition 2020/11/14 Actbert:Learning Global-Local Video-Text Representations 2020/12/1 Max-Deeplab:End-To-End Panoptic Segmentation With Mask Transformers | 2020/9/23 Hamming ocr:一种用于场景文本识别的局部敏感哈希神经网络 2020/11/14 Actbert:学习全局-本地视频-文本表示 2020/12/1 Max-deeplab:使用掩模转换器的端到端全景分割
|
video | Cvpr2018 End-To-End Dense Video Captioning With Masked Transformer 2020/11/4 Foley Music: Learning To Generate Music From Videos 2020/12/4 End-To-End Video Instance Segmentation With Transformers | CVPR2018 带掩码转换器的端到端密集视频字幕 2020/11/4 拟音音乐:学习从视频中生成音乐2020/12/4 使用转换器的端到端视频实例分割
|
lane detection | 2020/7/14 Polylanenet: Lane Estimation Via Deep Polynomial Regression | 2020/7/14 Polylanene:通过深度多项式回归进行车道估计 |
vision model |
|
|
相关文章
- 数据挖掘案例:基于 ReliefF和K-means算法的应用
- 一步步教你轻松学支持向量机SVM算法之案例篇2
- 数据挖掘案例:基于 ReliefF和K-means算法的应用
- CV:人工智能之计算机视觉方向的简介(CV发展史+传统方法对比CNN类算法+CV类会议/期刊、主要研究方向)、计算机视觉四大研究方向以及十大具体应用领域(知识导图+经典案例)之详细攻略
- DL之YoloV3:Yolo V3算法的简介(论文介绍)、各种DL框架代码复现、架构详解、案例应用等配图集合之详细攻略
- DL之MaskR-CNN:Mask R-CNN算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略
- CV之FR之MTCNN:基于TF框架利用MTCNN算法检测并对齐人脸图像进(人脸识别/人脸相似度)而得出人脸特征向量从而计算两张人脸图片距离案例应用之详细攻略
- CV之NS之VGG16:基于TF Slim库利用VGG16算法的预训练模型实现七种不同快速图像风格迁移设计(cubist/denoised_starry/mosaic/scream/wave)案例
- DL之YoloV2:Yolo V2算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略
- DL之PanopticFPN:Panoptic FPN算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略
- ML之PySpark:基于PySpark框架针对adult人口普查收入数据集结合Pipeline利用LoR/DT/RF算法(网格搜索+交叉验证评估+特征重要性)实现二分类预测(年收入是否超50k)案例
- ML之LoR&Bagging&RF:依次利用LoR、Bagging、RF算法对titanic(泰坦尼克号)数据集 (Kaggle经典案例)获救人员进行二分类预测(最全)
- NLP之TEA:自然语言处理之文本情感分析的简介、算法、应用、实现流程方法、案例应用之详细攻略
- ML之CatBoost:CatBoost算法的简介、安装、案例应用之详细攻略
- ML之kNN:k最近邻kNN算法的简介、应用、经典案例之详细攻略
- ML之DR之SVD:SVD算法相关论文、算法过程、代码实现、案例应用之详细攻略
- ML之KG:基于MovieLens电影评分数据集利用基于知识图谱的推荐算法(networkx+基于路径相似度的方法)实现对用户进行Top电影推荐案例
- DL之LeNet-5:LeNet-5算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略
- DL之FastR-CNN:Fast R-CNN算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略
- DL之SPP-Net:SPP-Net算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略
- DL之SSD:SSD算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略
- DL之GoogleNet:GoogleNet(InceptionV1)算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略
- DL之ShuffleNet:ShuffleNet算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略
- DL之ShuffleNetV2:ShuffleNetV2算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略
- DL之SqueezeNet:SqueezeNet算法的简介(论文介绍)、架构详解、案例应用等配图集合之详细攻略
- Python 实操案例:一文详解10种聚类算法