计算机视觉与OpenMMLab开源算法体系
2023-06-13 09:17:11 时间
文章目录
计算机视觉是一门让计算机学会"看"的学科,研究如何自动理解图像和视频中的内容
计算机视觉的任务
- 分类
- 检测:关键点检测(输出若干个点的坐标)
- 分割:语义分割,示例分割
- lmage classification:输出有哪些类别。
- object Detection:框出物体并且显示分类。
- Semantic segmentation:根据图像的语义来进行分割,不管重合的物体。
- lnstance segmentation:实例分割区分每一个物体。
可以从实例层面,像素层面进行分析对比这四种。
OpenMMLab
底层仍是PyTorch框架
至今已经包含众多算法库。
此外可以通过MMDeploy部署在各大厂商支持的硬件上。
算法框架
- MMDetection:目标检测/实例分割/全景分割
- MMDetection3D:3D目标检测
- MMClassification
- MMSegmentation:无人驾驶/汽车遥感/医疗影像分析
- MMPose & MMHuman3D:
- 2D/3D
- 图像/视频
- 形状/关键点
- 全身/人脸/人手
- MMTracking:视频目标检测/单目标跟踪/多目标跟踪
- MMAction2:行为识别/时序动作检测/时空动作检测
- MMOCR:文本检测/文本识别/关键信息提取
- MMEditing:图像修复/抠图/图像生成/超分辨率
通用:强大的训练器
统一:模块抽象
OpenMMLab 1.0 抽象:
- 抽象模块数量少
- 存在非常多函数式定义,无法重载
- 缺少统一的数据接口定义/协议
OpenMMLab 2.0 抽象:
- 抽象模块数量丰富
- 清理函数式定义,增加模块或者模块方法
统一:训练流程
OpenMMLab 2.0 统一20 多个算法任务的训练流程,支持自监督、半监督、少样本学习。
统一:数据接口
OpenMMLab 1.0: 一个算法库,一套接口定义
OpenMMLab 2.0: N 个算法库,一套接口定义。多模态、多任务训练的统一接口。半监督、自监督、少样本学习的统一接口。
灵活:训练流程控制
统一的信息枢纽:所有模块交流的渠道
优化和数据增强策略动态调整参照:迭代数、loss、评测结果
可实现功能:Early stopping、ReduceLROnPlateau
获取任意位置信息,进行可视化分析:数据集输出、模型特征图、模型输出、评测结果、难易样本分析
内容
以下截取部分有启发的内容:
异或问题
线性分类器与非线性分类器中:
异或(XOR)是一个基本的布尔函数,是线性不可分的线性分类器的"capacity"很弱
异或函数可以由一个两层的计算图实现:第一层由输入x到隐变量h,第二层由由h到输出y。
卷积神经网络的整体结构
参考:
相关文章
- 【NLP基础】英文关键词抽取RAKE算法
- 录屏回放+代码开源|2022江苏气象AI算法挑战赛
- ☆打卡算法☆LeetCode 218. 天际线问题 算法解析
- 树:二叉树的层序遍历算法(超简洁实现及详细分析)
- 人工智能:智能优化算法
- 算法解剖系列-Canny边缘检测原理及实现「建议收藏」
- java 滤波算法_双边滤波算法
- 支持向量回归(SVR)的详细介绍以及推导算法
- 秀到起飞!LeetCode官方推出算法面试指导手册(代码版)限时开源
- 外网疯传!字节大佬闭关三月撰写的数据结构与算法笔记遭恶意开源
- 深度解析开源推荐算法框架EasyRec的核心概念和优势
- nginx负载均衡配置详解_负载均衡算法实现
- 【SLAM】开源 | 基于RGB-D摄像机与高效实时导航算法的开源低成本移动机器人系统
- 百度升级蓝天算法加强“站点构造目录发布低质内容”识别能力
- GitHub 上最大的算法开源库,确定不了解?
- C++ 不知算法系列之初识动态规划算法思想
- 虾皮一道面试算法题
- 简洁易用,更多算法,快来开箱新一代视频目标感知开源工具箱
- 初探富文本之OT协同算法
- 常用排序算法介绍与实现详解程序员
- MapReduce中的Join算法详解大数据
- Scalaz(31)- Free :自由数据结构-算式和算法的关注分离详解编程语言
- PHP快速排序算法详解
- VC++实现选择排序算法简单示例
- C语言位图算法详解