计算机视觉三大经典应用,你学废了吗?
计算机视觉研究的最终目标是使计算机能通过视觉观察和理解世界,具有自主适应环境的能力,在深度学习发展起来后,卷积神经网络被广泛应用到图像定位、目标检测、目标分割、目标跟踪、行为识别等应用方面。
在深度学习进入CV后,CV的学习越来越变得“扁平快”。网络上随处可见的学习经验,各类的计算资源和开源代码,研究成果也不需要像以前死磕到底,就能够做出优秀的成绩。
但出现的更大问题是,很多人没有时间和动力去研究计算机视觉的核心思想,更不会耗费精力去挖掘计算机视觉的本质。深度学习的算法缺乏可解释性,并且在算法冷启动时,数据量及其缺少,深度学习的应用更是难上加难。因此,CV的经典算法与精髓就显得尤为重要,能够帮助我们在现实任务中,可以从容地进行设计、诊断和调试。
以下列举几个经典应用的实践项目的学习目标,主要包括图像分割。目标跟踪。检测识别三个部分。
经典应用的实践项目
1
Graph Cuts
理解交互式图像分割的基本思想。掌握图的建立和图割过程,并完成代码实现。学习图论的基本知识,BFS,DFS图搜算法,以及求解Max flow问题的Ermond Karp算法。学习Graph- Cut算法的改进方法,以及求解思路。
2
基于GMM的运动分割
学习运动目标检测的主要难点,相关的解决思路。掌握用EM算法进行时序数据的参数估计。掌握GMM算法的核心思想和处理思路,并且完成代码实现。
3
基于光流的目标跟踪
学习目标跟踪的主要难点。以及目标的表示方式,自底向上,自顶向下的解决思路。理解光流概念,光流计算的核心:光流约束方程。光流计算的问题和相应的解决思路。掌握光流目标跟踪的处理流程,并完成代码实现。
4
基于粒子滤波的目标跟踪
学习用递归贝叶斯后验估计求解自顶向下跟踪问题。理解 Monte Carlo的核心思路:将问题转换为某事件出现的概率,解决方法。完成求解常数π,高斯分布的p阶距的代码实现。掌握粒子滤波目标跟踪算法的整体流程,并且完成代码实现。
5
分类器
学习分类,回归问题的基本思想。掌握SVM的理论推导,借助lib-svm库,用交叉验证实现基于SVM的分类任务。学习 Adaboost的核心思想,即通过对弱分类器加权组合,提升为强分类器。学习Haar feature,体会用动态规划的思想实现积分图像的计算,进而实现一个简单的弱分类器。
6
基于模型拟合的目标检测
利用霍夫变换,将图像变换到霍夫空间,极大值处即为直线对应的参数。学习Ransac的核心思想,多次随机采样中内点最多的模型,作为直线的估计模型。分析距离阈值和采样次数对结果的影响。
以上是深蓝学院第三期《计算机视觉应用基础》的课程实践部分,课程通过讲解图像的底层信息,能帮助大家掌握计算机视觉核心算法的基本流程和代码实践过程,并且配合实践项目,更好的在任务进行设计和调试。
课程就业方向:计算机视觉算法工程师、图像算法工程师、目标检测算法工程师
课程适合人群
☆ 准备系统化深入学习计算机视觉的研究者及工程师
☆ 只了解深度学习方法的计算机视觉从业者
☆ 对计算机视觉感兴趣的爱好者
全方位伴学
☆ 讲师微信群答疑
☆ 助教1V1批改作业,定期点评&讲解作业
相关文章
- 在 Go 里用 CGO?这 7 个问题你要关注!
- 9款优秀的去中心化通讯软件 Matrix 的客户端
- 求职数据分析,项目经验该怎么写
- 在OKR中,我看到了数据驱动业务的未来
- 火山引擎云原生大数据在金融行业的实践
- OpenHarmony富设备移植指南(二)—从postmarketOS获取移植资源
- 《数据成熟度指数》报告:64%的企业领袖认为大多数员工“不懂数据”
- OpenHarmony 小型系统兼容性测试指南
- 肯睿中国(Cloudera):2023年企业数字战略三大趋势预测
- 适用于 Linux 的十大命令行游戏
- GNOME 截图工具的新旧截图方式
- System76 即将推出的 COSMIC 桌面正在酝酿大变化
- 2GB 内存 8GB 存储即可流畅运行,Windows 11 极致精简版系统 Tiny11 发布
- 迎接 ecode:一个即将推出的具有全新图形用户界面框架的现代、轻量级代码编辑器
- loongarch架构介绍(三)—地址翻译
- Go 语言怎么解决编译器错误“err is shadowed during return”?
- 敏捷:可能被开发人员遗忘的部分
- Denodo预测2023年数据管理和分析的未来
- 利用数据推动可持续发展
- 在 Vue3 中实现 React 原生 Hooks(useState、useEffect),深入理解 React Hooks 的