zl程序教程

您现在的位置是:首页 >  工具

当前栏目

《计算机视觉:模型、学习和推理》一1.1 本书结构

学习计算机 模型 结构 视觉 1.1 推理 本书
2023-09-27 14:22:33 时间
本节书摘来华章计算机《计算机视觉:模型、学习和推理》一书中的第1章 ,第1.1节, [英]西蒙J. D. 普林斯(Simon J. D. Prince)著苗启广 刘凯 孔韦韦 许鹏飞 译 译更多章节内容可以访问云栖社区“华章计算机”公众号查看。
1.1 本书结构

本书分为六部分,如图1-2所示。
本书的第一部分涵盖概率方面的背景知识。全书中所有的模型都是用概率的术语表示,概率是计算机视觉应用中一门很有用的语言。具有扎实工程数学背景的读者或许对这部分知识比较熟悉,但仍需要浏览这些章节以确保掌握相关的符号。那些尚不具备该背景的读者应该仔细阅读这些章节。这些知识相对比较简单,但它们是本书其余部分的基础。在正式提到计算机视觉知识前被迫阅读三十多页的数学虽然令人沮丧,但请相信我,这些基础知识将为后续的学习提供坚实的基础。
2017_09_19_101119

图1-2 章节依赖关系。本书分为六部分。第一部分是概率综述,是所有后续章节的基础。第二部分涉及机器学习和推理,主要描述生成模型和判别模型。第三部分讨论图模型,主要是大的模型中变量之间概率依赖关系的可视化表示方式。第四部分介绍预处理方法。第五部分涉及几何与变换。第六部分提出几个重要的视觉模型
本书第二部分介绍计算机视觉中的机器学习。这些章节讲述机器视觉的核心原理,帮助读者巩固从图像中提取有用信息的方法。建立统计模型,建立图像数据和期望获取信息之间的关系。掌握这些后,读者应该了解如何建立一个模型来解决视觉领域的几乎所有问题,即使这种模式可能还不是很实用。
本书第三部分介绍计算机视觉的图模型。图模型为简化图像数据和期望评估的属性间关系提供一个框架。当这些量都是高维时,它们之间的统计关系变得相当复杂。即使如此,我们仍可以定义相关的模型,但我们可能缺乏使其有用的训练数据或计算能力。图模型提供了一个有原则的方式来推测数据和世界属性之间的统计关系。
本书第四部分讨论图像预处理。对于理解本书中的大部分模型这不是必需的,但并不是说这部分就不重要。预处理策略的选择至少跟模型的选择一样至关重要,这决定了一个计算机视觉系统最终的性能。虽然图像处理不是本书的主题,但是这部分提供了最为重要和实用的技术总结。
本书第五部分致力于几何计算机视觉;它介绍针孔摄像机——一个用来描述三维空间中给定点在相机像素阵列中成像的数学模型。跟这个模型相关的是寻找特定场景的相机位置和重建物体三维模型的一整套技术。
最后,本书第六部分基于前面的原理,给出几组视觉模型。这些模型致力于计算机视觉最为核心的若干问题,包括人脸识别、跟踪和目标识别。
本书最后是附录。其简述书中使用的符号约定,并概括线性代数和优化技术。虽然这些知识在其他文献也能找到,但是这些内容会使得本书更加完备,并且保证在正文以统一的术语来讨论。
每章末尾有一个简短的备注。这提供了相关研究文献的详细信息。该部分倾向于提供最近、最有用的文献,可能并不能准确反映各个领域的所有相关内容。每章末尾也有配套的一些习题。在某些情况下,本书将正文中一些重要但是繁琐的衍生问题留作习题,以便继续本书主要问题的论述。习题答案将会发布在网站上(http://www.computervisionmodels.com) 关于本书教辅资源,用书教师可向剑桥大学出版社北京代表处申请,电子邮件:solutions@cambridge.org。——编辑注。每章末尾也会列出一系列应用(除了只包含理论知识的)。第1~5章、第10章之外,总之,这是关于过去十年里机器视觉重要论文的一个缩影。
最后,本文涉及的七十多种算法的伪代码,打包在一个单独的文件里面,可以从相关网站(http://www.computervisionmodels.com)下载。本书通篇使用符号表示有与这部分文字相关的伪代码。伪代码也使用相同的符号,使它很容易实现许多模型。伪代码不放在书中主要是因为它会降低本书的可读性。然而,我鼓励本书所有的读者尽可能多实现这本书里涉及的模型。计算机视觉是一门实践性的工程学科,通过尝试编写真实的代码,你将受益良多。


一文尽览 | 计算机视觉中的鱼眼相机模型及环视感知任务汇总!(下) 环视鱼眼摄像机通常用于自动驾驶中的近距离感知,车辆四面的四个鱼眼摄像头足以覆盖车辆周围的360°范围,捕捉整个近距离区域。一些应用场景包括自动泊车、交通拥堵辅助等
一文尽览 | 计算机视觉中的鱼眼相机模型及环视感知任务汇总!(上) 环视鱼眼摄像机通常用于自动驾驶中的近距离感知,车辆四面的四个鱼眼摄像头足以覆盖车辆周围的360°范围,捕捉整个近距离区域。一些应用场景包括自动泊车、交通拥堵辅助等
计算机视觉中的transformer模型创新思路总结 本文回顾了ViT的结构,总结了计算机视觉中的transformer的主要改进思路:改进分块,改进位置编码,改进Encoder,增加Decoder。每个思路下都介绍了相关的论文,介绍了这些论文的提出出发点和改进思路。 本文的目的不在于介绍transformer现在有哪些模型,而在于学习借鉴别人发现问题并改进的思路,从而在自己方向上提出合适且合理的改进。
【动手学计算机视觉】第九讲:传统目标检测之DPM模型 DPM模型在我心里的印象一直都非常深刻,不仅是因为它非常经典,此外,它是我进入CV领域看的第一篇文章。还记得当初开始做项目时,老师就发给我一篇文章,并反复声明,要认真研究,好好学习。我反复把这篇文章看了很多遍,也把源码看了几遍,真是深深的被这个神作惊叹到了。真不愧为传统目标识别领域的经典之作,虽然时间过去很多年,特征提取加机器学习这一套在效率上远不如深度学习,但是DPM的影响力和思想依然非常有生命力,从后面深度学习模型中经常可以看到DPM的身影,DPM的原文从2009年至今引用已经超过8000次,它的价值可见一斑,下面就来介绍一下这个经典的目标检测模型。
《计算机视觉:模型、学习和推理》一3.3分类分布 本节书摘来华章计算机《计算机视觉:模型、学习和推理》一书中的第3章 ,第3.3节, [英]西蒙J. D. 普林斯(Simon J. D. Prince)著苗启广 刘凯 孔韦韦 许鹏飞 译 译更多章节内容可以访问云栖社区“华章计算机”公众号查看。
《计算机视觉:模型、学习和推理》一导读 计算机视觉是一门工程学科,机器在现实世界中捕获的视觉信息可以激发我们的积极性。因此,我们通过使用计算机视觉解决现实问题来对我们的知识进行分类。
《计算机视觉:模型、学习和推理》一3.8 正态逆维希特分布 本节书摘来华章计算机《计算机视觉:模型、学习和推理》一书中的第3章 ,第3.8节, [英]西蒙J. D. 普林斯(Simon J. D. Prince)著苗启广 刘凯 孔韦韦 许鹏飞 译 译更多章节内容可以访问云栖社区“华章计算机”公众号查看。
《计算机视觉:模型、学习和推理》一3.6 正态逆伽马分布 本节书摘来华章计算机《计算机视觉:模型、学习和推理》一书中的第3章 ,第3.6节, [英]西蒙J. D. 普林斯(Simon J. D. Prince)著苗启广 刘凯 孔韦韦 许鹏飞 译 译更多章节内容可以访问云栖社区“华章计算机”公众号查看。
《计算机视觉:模型、学习和推理》一2.5 贝叶斯公式 本节书摘来华章计算机《计算机视觉:模型、学习和推理》一书中的第2章 ,第2.5节, [英]西蒙J. D. 普林斯(Simon J. D. Prince)著苗启广 刘凯 孔韦韦 许鹏飞 译 译更多章节内容可以访问云栖社区“华章计算机”公众号查看。
《计算机视觉:模型、学习和推理》一第3章 总结 本节书摘来华章计算机《计算机视觉:模型、学习和推理》一书中的第3章 , [英]西蒙J. D. 普林斯(Simon J. D. Prince)著苗启广 刘凯 孔韦韦 许鹏飞 译 译更多章节内容可以访问云栖社区“华章计算机”公众号查看。