您现在的位置是：首页 > 其它

当前栏目

相机标定(Camera calibration)

相机 Camera 标定 calibration

2023-06-13 09:11:45 时间

大家好，又见面了，我是你们的朋友全栈君。

简介

摄像机标定(Camera calibration)简单来说是从世界坐标系换到图像坐标系的过程，也就是求最终的投影矩阵 P P P 的过程，下面相关的部分主要参考UIUC的计算机视觉的课件（网址Spring 2016 CS543 / ECE549 Computer vision）。

基本的坐标系：

世界坐标系(world coordinate system)；
相机坐标系(camera coordinate system)；
图像坐标系(image coordinate system)；

一般来说，标定的过程分为两个部分：

第一步是从世界坐标系转换为相机坐标系，这一步是三维点到三维点的转换，包括 R R R， t t t （相机外参）等参数；
第二部是从相机坐标系转为图像坐标系，这一步是三维点到二维点的转换，包括 K K K（相机内参）等参数；

相机坐标系转换到图像坐标系##

坐标系介绍

如上图所示（图片来自UIUC计算机视觉课件），是一个小孔成像的模型，其中：

C C C 点表示camera centre，即相机的中心点，也是相机坐标系的中心点；
Z Z Z 轴表示principal axis，即相机的主轴；
p p p 点所在的平面表示image plane，即相机的像平面，也就是图片坐标系所在的二维平面；
p p p 点表示principal point，即主点，主轴与像平面相交的点；
C C C 点到 p p p 点的距离，也就是右边图中的 f f f 表示focal length，即相机的焦距；
像平面上的 x x x 和 y y y 坐标轴是与相机坐标系上的 X X X 和 Y Y Y 坐标轴互相平行的；
相机坐标系是以 X X X， Y Y Y， Z Z Z（大写）三个轴组成的且原点在 C C C 点，度量值为米（m）；
像平面坐标系是以 x x x， y y y（小写）两个轴组成的且原点在 p p p 点，度量值为米（m）；
图像坐标系一般指图片相对坐标系，在这里可以认为和像平面坐标系在一个平面上，不过原点是在图片的角上，而且度量值为像素的个数（pixel）；

相机转换到像平面

知道上面的简单知识后，如果知道相机坐标系中的一个点 X X X（现实三维世界中的点），在像平面坐标系对应的点是 x x x，要求求从相机坐标系转为像平面坐标系的转换，也就是从 X X X 点的 ( X , Y , Z ) \begin{pmatrix}X, & Y, & Z \end{pmatrix} (X,Y,Z)通过一定的转换变为 x x x 点的

可以表示为矩阵计算为（在这里用的是齐次坐标的表示方式，关于齐次坐标文章最下面有介绍）： ( X Y Z 1 ) ↦ ( f X f Y Z ) = [ f 0 f 0 1 0 ] ( X Y Z 1 ) \begin{pmatrix} X \\ Y \\ Z \\ 1 \\ \end{pmatrix} \mapsto \begin{pmatrix} fX \\ fY\\ Z \\ \end{pmatrix} =\begin{bmatrix} f & & & 0 \\ & f & & 0 \\ & & 1 & 0 \\ \end{bmatrix} \begin{pmatrix} X \\ Y \\ Z \\ 1 \\ \end{pmatrix} ⎝⎜⎜⎛XYZ1⎠⎟⎟⎞↦⎝⎛fXfYZ⎠⎞=⎣⎡ff1000⎦⎤⎝⎜⎜⎛XYZ1⎠⎟⎟⎞

可以简写为（ P P P 就是所谓的投影矩阵，当然现在还不完整）： x = P X x=PX x=PX

加入偏移量

通过上面，可以把相机坐标系转换到像平面坐标系，但是像平面坐标系和图像坐标系虽然在同一个平面上，但是原点并不是同一个，而目标是要转换到图像坐标系下，所以还需要一步操作，如下图：

如上图所示（图片来自UIUC计算机视觉课件），其中主点 p p p 是像平面坐标系的原点，但在图像坐标系中的位置为\begin{pmatrix} p_x, & p_y \end{pmatrix}

相当于在上面的基础上加了一个p点坐标的偏移量，同时可以表示为矩阵计算为（在这里用的是齐次坐标的表示方式）： ( X Y Z 1 ) ↦ ( f X + Z p x f Y + Z p y Z ) = [ f p x 0 f p y 0 1 0 ] ( X Y Z 1 ) \begin{pmatrix} X \\ Y \\ Z \\ 1 \\ \end{pmatrix} \mapsto \begin{pmatrix} fX+Zp_x \\ fY+Zp_y \\ Z \\ \end{pmatrix} =\begin{bmatrix} f & & p_x & 0 \\ & f & p_y & 0 \\ & & 1 & 0 \\ \end{bmatrix} \begin{pmatrix} X \\ Y \\ Z \\ 1 \\ \end{pmatrix} ⎝⎜⎜⎛XYZ1⎠⎟⎟⎞↦⎝⎛fX+ZpxfY+ZpyZ⎠⎞=⎣⎡ffpxpy1000⎦⎤⎝⎜⎜⎛XYZ1⎠⎟⎟⎞

整理一下得： ( f X + Z p x f Y + Z p y Z ) = [ f p x f p y 1 ] [ 1 0 1 0 1 0 ] ( X Y Z 1 ) \begin{pmatrix} fX+Zp_x \\ fY+Zp_y \\ Z \\ \end{pmatrix} =\begin{bmatrix} f & & p_x \\ & f & p_y \\ & & 1 \\ \end{bmatrix} \begin{bmatrix} 1 & & & 0 \\ & 1 & & 0\\ & & 1 & 0\\ \end{bmatrix} \begin{pmatrix} X \\ Y \\ Z \\ 1 \\ \end{pmatrix} ⎝⎛fX+ZpxfY+ZpyZ⎠⎞=⎣⎡ffpxpy1⎦⎤⎣⎡111000⎦⎤⎝⎜⎜⎛XYZ1⎠⎟⎟⎞

所以最后可以得到 K K K，也就是平时所说的相机内参（Intrinsic parameters）： K = [ f p x f p y 1 ] K=\begin{bmatrix} f & & p_x \\ & f & p_y \\ & & 1 \\ \end{bmatrix} K=⎣⎡ffpxpy1⎦⎤ 以及投影矩阵 P P P（在这里可以认为旋转矩阵 R R R 为单位矩阵 I I I，平移矩阵 t t t 都为0，这也是为什么要拆成这种方式），为： P = K [ I 0 ] P=K\left[ \begin{array}{c|c} I&0 \end{array} \right] P=K[I0]

像素坐标

前面也提到了在图像坐标系中用的不是现实生活中的m来度量，而是用的 pixel 的个数，所以在上面转换到图像坐标系中还有个问题，就是坐标的表示还是m，并没有转换到像素坐标系统；在这里需要引入一个新概念就是：

m x m_x mx 表示在水平方向1m的长度包含的像素的个数；
m y m_y my 表示在竖直方向1m的长度包含的像素的个数；

可能有人奇怪为啥不是一个值，还需要分别指定 m x m_x mx 和 m y m_y my 呀，这是因为通过上面可以得到一个像素点的大小（m度量）为： 1 m x × 1 m y \frac{1}{m_x}\times\frac{1}{m_y} mx1×my1

但是需要说明的是像素并不一定是一个正方形，有时候可能也是一个矩形，所以要分别指定。所以可以把上面相机内参 K K K 变为更新为，转换公式把 K K K 替换即可，其他不变： K = [ m x m y 1 ] [ f p x f p y 1 ] = [ α x β x α y β y 1 ] K=\begin{bmatrix} m_x & & \\ & m_y & \\ & & 1 \\ \end{bmatrix} \begin{bmatrix} f & & p_x \\ & f & p_y \\ & & 1 \\ \end{bmatrix} =\begin{bmatrix} α_x & & β_x \\ & α_y & β_y \\ & & 1 \\ \end{bmatrix} K=⎣⎡mxmy1⎦⎤⎣⎡ffpxpy1⎦⎤=⎣⎡αxαyβxβy1⎦⎤

一般来说，在使用相机内参K计算坐标系转换时，提供的都是已经变换后的值；例如会提供 f x f_x fx， f y f_y fy ， c x c_x cx， c y c_y cy 四个值代表相机内参 K K K，其实 f x f_x fx 就是这里的 α x α_x αx，同理 f y f_y fy 是 α y α_y αy， c x c_x cx 是 β x β_x βx， c y c_y cy 是 β y β_y βy。

世界坐标系转换到图像坐标系##

坐标系介绍

如上图所示（图片来自UIUC计算机视觉课件），从世界坐标系转换到相机坐标系是三维空间到三维空间的变换，一般来说需要一个平移操作和一个旋转操作就可以完成这个转换，用公式表示如下（可以理解为世界坐标系原点先平移到相机坐标系的位置然后在做一次坐标系旋转，使坐标轴对齐。）： X ~ c a m = R ( X ~ − C ~ ) \widetilde X_{cam}=R(\widetilde X – \widetilde C) X cam=R(X −C )

R R R 表示旋转矩阵；
X ~ \widetilde X X 表示 X X X 点在世界坐标系中的位置；
C ~ \widetilde C C 表示相机原点 C C C 在世界坐标系中的位置；
X ~ c a m \widetilde X_{cam} X cam 表示 X X X 点在相机坐标系中的位置；

世界转换到相机

根据上面的公式可以得到从一个三维点从世界坐标系转换到相机坐标的变换公式如下（也是用的齐次坐标的表示方式）： X c a m = ( X ~ c a m 1 ) = [ R − R C ~ 0 1 ] ( X ~ 1 ) = [ R − R C ~ 0 1 ] X X_{cam}=\begin{pmatrix} \widetilde X_{cam} \\ 1 \\ \end{pmatrix} =\begin{bmatrix} R & -R \widetilde C \\ 0 & 1 \\ \end{bmatrix} \begin{pmatrix} \widetilde X \\ 1 \\ \end{pmatrix} =\begin{bmatrix} R & -R \widetilde C \\ 0 & 1 \\ \end{bmatrix}X Xcam=(X cam1)=[R0−RC 1](X 1)=[R0−RC 1]X

世界转换到图像

根据上面的讨论知道了怎样从世界坐标系转换到相机坐标系（平移和旋转）以及从相机坐标系转换到图像坐标系（相机内参变换），所以带入上面的矩阵计算，可以得到： x = K [ I 0 ] X c a m = K [ R − R C ~ ] X x=K\left[ \begin{array}{c|c} I&0 \end{array} \right]X_{cam} =K\left[ \begin{array}{c|c} R & -R \widetilde C \end{array} \right]X x=K[I0]Xcam=K[R−RC ]X

这样就得到了最终的投影矩阵 P P P ： P = K [ R t ] P=K\left[ \begin{array}{c|c} R & t \end{array} \right] P=K[Rt]

其中： t = − R C ~ t=-R \widetilde C t=−RC

在这里， K K K 一般称为相机内参（intrinsic parameters），描述了相机的内部参数，包括焦距 f f f、主点 p p p 的位置、以及像素与真实环境的大小比例等，这个是固有属性，是提供好的； R R R 和 t t t 称为相机外参（extrinsic parameters）， R R R 在这里是旋转矩阵，可以转换为三维的旋转向量，分别表示绕 x x x， y y y， z z z 三个轴的旋转角度， t t t 目前就是一个平移向量，分别表示在 x x x， y y y， z z z 三个方向上的平移量。

畸变参数(`distortion parameters`)

在几何光学和阴极射线管(CRT)显示中，畸变（distortion）是对直线投影（rectilinear projection）的一种偏移。简单来说直线投影是场景内的一条直线投影到图片上也保持为一条直线。那畸变简单来说就是一条直线投影到图片上不能保持为一条直线了，这是一种光学畸变（optical aberration）。可能由于摄像机镜头的原因，这里不讨论，有兴趣的可以查阅光学畸变的相关的资料。畸变一般可以分为两大类，包括径向畸变和切向畸变。主要的一般径向畸变有时也会有轻微的切向畸变。

径向畸变（`Radial distortion`）###

径向畸变的效应有三种，一种是桶形畸变（barrel distortion），另一种是枕形畸变（pincushion distortion），还有一种是两种的结合叫做胡子畸变（mustache distortion），从图片中可以很容易看出区别，具体见下图(图片来自wikipedia)：

径向畸变可以用如下公式修正： x c o r r = x d i s ( 1 + k 1 r 2 + k 2 r 4 + k 3 r 6 ) x_{corr}=x_{dis}(1+k_1r^2+k_2r^4+k_3r^6) xcorr=xdis(1+k1r2+k2r4+k3r6)

y c o r r = y d i s ( 1 + k 1 r 2 + k 2 r 4 + k 3 r 6 ) y_{corr}=y_{dis}(1+k_1r^2+k_2r^4+k_3r^6) ycorr=ydis(1+k1r2+k2r4+k3r6)

切向畸变（`tangential distortion`）###

切向畸变是由于透镜与成像平面不严格的平行，其可以用如下公式修正： x c o r r = x d i s + [ 2 p 1 x y + p 2 ( r 2 + 2 x 2 ) ] x_{corr}=x_{dis} + [2p_1xy+p_2(r^2+2x^2)] xcorr=xdis+[2p1xy+p2(r2+2x2)]

y c o r r = y d i s + [ p 1 ( r 2 + 2 y 2 ) + 2 p 2 x y ] y_{corr}=y_{dis} + [p_1(r^2+2y^2)+2p_2xy] ycorr=ydis+[p1(r2+2y2)+2p2xy]

其中：

x d i s x_{dis} xdis 和 y d i s y_{dis} ydis 表示有畸变的坐标；
x c o r r x_{corr} xcorr 和 y c o r r y_{corr} ycorr 表示修复后的坐标；
k 1 k_1 k1， k 2 k_2 k2， k 3 k_3 k3 表示径向畸变参数；
p 1 p_1 p1， p 2 p_2 p2 表示切向畸变参数；

所以最终得到5个畸变参数： D = ( k 1 , k 2 , p 1 , p 2 , k 3 ) D=\begin{pmatrix} k_1, & k_2, & p_1, & p_2, & k_3 \end{pmatrix} D=(k1,k2,p1,p2,k3)

相机标定

那么可以利用这些来进行最终的任务相机标定，简单的过程可以描述为通过标定板，如下图，可以得到n个对应的世界坐标三维点 X i X_i Xi 和对应的图像坐标二维点 x i x_i xi，这些三维点到二维点的转换都可以通过上面提到的相机内参 K K K，相机外参 R R R 和 t t t，以及畸变参数 D D D 经过一系列的矩阵变换得到。现在就用这些对应关系来求解这些相机参数。最后就是用线性方法求解方程式，这里就不做讨论了。

那为什么要做相机标定呢？每个镜头的畸变程度各不相同，通过相机标定可以校正这种镜头畸变。其实可以认为用这种标定的方式来求解相机内参和畸变参数，相当于一种相机校准，然后这些参数就可以用于后面的求解。例如求解新拍的两幅图片相对的 R R R 和 t t t，求解这个外参用到就是标定得到的相机内参和畸变参数。

齐次坐标就是将一个原本是n维的向量用一个n+1维向量来表示。许多图形应用涉及到几何变换，主要包括平移、旋转、缩放。以矩阵表达式来计算这些变换时，平移是矩阵相加，旋转和缩放则是矩阵相乘，综合起来可以表示为 x = R ∗ X + t x = R*X+ t x=R∗X+t（注：因为习惯的原因，实际使用时一般使用变化矩阵左乘向量）( R R R 旋转缩放矩阵， t t t 为平移矩阵， X X X 为原向量， x x x 为变换后的向量)。引入齐次坐标的目的主要是合并矩阵运算中的乘法和加法，表示为 x = P ∗ X x = P*X x=P∗X 的形式。即它提供了用矩阵运算把二维、三维甚至高维空间中的一个点集从一个坐标系变换到另一个坐标系的有效方法。和上面的计算过程是对应的。

发布者：全栈程序员栈长，转载请注明出处：https://javaforall.cn/140128.html原文链接：https://javaforall.cn

猜你喜欢

NVIDIA黄仁勋：生成式AI为元宇宙带来无限潜能
云时代：利用MSSQL版云数据库进行数据管理（云数据库mssql版）
泛微数字化安全管理，实现标准化、智能化管理，数据可视化分析
gpx4抑制剂-靶向癌症耐药治疗的新方法 | MedChemExpress
C#中委托的+=和-=深入研究
ASP.NET开发者使用jQuery应该了解的几件事情
Oracle数据库中的所有序列号查询方法（oracle所有序列号）
奇怪的直线-怎么也删除不掉
「芯片法案」下周签署！台积电沉默以对佩洛西，三星、SK海力士谨慎观望
Idea卸载及安装
CA周记 - 在 Azure ML 上用 .NET 跑机器学习
基于html5 localStorage的购物车JS脚本详解编程语言
AES加密详解编程语言
计算机负数补码_负数用补码表示如何理解
jquery表单取值常用代码
Linux经典之旅：免费PDF版（经典linuxpdf）
ioLinux系统的强大之处：基于BLKIO的I/O调度管理（linuxblk）
重新开始清空Redis缓存（清空redis缓存好了）
MySQL如何进行两个表的关联查询（mysql两表关联怎么查）
微软、谷歌合作， Chrome/Edge 浏览器虚拟键盘将迎来重大更新
jQuery筛选器children()案例详解(图文)
Web3.0革命已经开始，中小型企业如何保护企业数据安全？
rcnn算法详解_rcnn目标检测

zl程序教程

当前栏目

相机标定(Camera calibration)

简介

相机坐标系转换到图像坐标系##

坐标系介绍

相机转换到像平面

加入偏移量

像素坐标

世界坐标系转换到图像坐标系##

坐标系介绍

世界转换到相机

世界转换到图像

畸变参数(`distortion parameters`)

径向畸变（`Radial distortion`）###

切向畸变（`tangential distortion`）###

相机标定

相关文章

当前栏目

相机标定(Camera calibration)

简介

相机坐标系 转换到 图像坐标系##

坐标系介绍

相机 转换到 像平面

加入偏移量

像素坐标

世界坐标系 转换到 图像坐标系##

坐标系介绍

世界 转换到 相机

世界 转换到 图像

畸变参数(distortion parameters)

径向畸变（Radial distortion）###

切向畸变（tangential distortion）###

相机标定

相关文章

相机坐标系转换到图像坐标系##

相机转换到像平面

世界坐标系转换到图像坐标系##

世界转换到相机

世界转换到图像

畸变参数(`distortion parameters`)

径向畸变（`Radial distortion`）###

切向畸变（`tangential distortion`）###