您现在的位置是：首页 > 后端

当前栏目

算法学习笔记（二）：平方根倒数速算法

算法笔记学习平方根倒数

2023-06-13 09:11:25 时间

大家好，又见面了，我是你们的朋友全栈君。

序

这是一个神奇的算法！

一、介绍

起源于一篇《改变计算技术的伟大算法》文章，知道这个算法，然后google一下，维基讲的还不错，本文权当自己理清下思路。先贴源代码，为《雷神之锤III竞技场》源代码中的应用实例，剥离了C语言预处理器的指令，并附上了原有的注释。

float Q_rsqrt( float number )
{
	long i;
	float x2, y;
	const float threehalfs = 1.5F;
 
	x2 = number * 0.5F;
	y  = number;
	i  = * ( long * ) &y;                       // evil floating point bit level hacking（对浮点数的邪恶位级hack）
	i  = 0x5f3759df - ( i >> 1 );               // what the fuck?（这他妈的是怎么回事？）
	y  = * ( float * ) &i;
	y  = y * ( threehalfs - ( x2 * y * y ) );   // 1st iteration （第一次牛顿迭代）
//      y  = y * ( threehalfs - ( x2 * y * y ) );   // 2nd iteration, this can be removed（第二次迭代，可以删除）
 
	return y;
}

算法的思路：

1、计算出该浮点数的平方根倒数的首次近似值，见源代码中的8-11行；

2、利用牛顿法迭代以加强精度，得到要求精度内的值（迭代次数根据精度要求调整，源代码中一次迭代就满足精度要求）。

算法的巧妙之处在于代码中的四行蓝色代码，大致过程是：将表示浮点数的字节序列用来表示整数（i = * ( long * ) &y;），然后通过一个巧妙的整数运算得到一个新的整数（i = 0x5f3759df – ( i >> 1 );），最后将表示整数的字节序列换回表示浮点数。所以弄清算法关键障碍是：在计算机中是如何表示浮点数和整数的、整数运算又怎能算出浮点数的平方根倒数的近似值、0x5f3759df怎么来的。

二、浮点数和整数的表示方法

浮点数和整数存储位数一定是相同的。这里浮点数和整数都占4字节，32位。

一个浮点数是由32位二进制位表示的有理数，分为三部分。其中符号占1位，表示正负，记为Si；指数占接下来的8位，表示经过偏移处理后的指数，即实际表示E（如图中为124），需要偏移B（图中为2的8次方减1,127。B为一个固定值），最后得指数值为E-B；有效数字（除最高位以外）占剩下的23位，记为m（0<m<1）,图中的

。

所以浮点数的结构公式为：

，图中

整数的表示相对简单，符号占1位，数值占剩下的31位。如果用上图的浮点数字节序列来表示整数，那么

，即

.平方根倒数函数仅能处理正数，所以符号位均为0。

小结：对于同样的32位二进制数码，若为浮点数表示时实际数值为

，而若为整数表示时实际数值则为

，其中

，这里n=32，b=8。式子中引入的新变量为：

——-——-—–—–—–—–—–—–等式1

，其中

————等式2

三、浮点数的平方根倒数近似值

理解浮点数和整数的表示后，下面开始推导。

平方根倒数方程为：

两边取对数有：

因为浮点数可表示为：

，所以也有

，代入上式有：

再度引入新数

描述

与近似值R间的误差：由于

，有

，则在此可定义

与x的关系为

，其中

介于0到1/3，所以将

代入上式得：

将第二部分小结中等式1，等式2代入到上述方程中，有：

移项整理得：

又因为浮点规格存储的正浮点数x，若将其作为长整型表示，则示值为：

，所以x的平方根倒数的首次近似值的整数表示值为：

，其中

，

n=32，b=8。

这个式子对应着源代码中的这一行：i = 0x5f3759df – ( i >> 1 );，然后将整数表示值换回表示浮点数：y = * ( float * ) &i;。这样就得到了浮点数的平方根倒数的近似值。

四、神秘的0x5f3759df

由第三部分可知：0x5f3759df 对应着R，即3/2(B-

)L.当R为0x5f3759df时，有

“现在不仅该算法的原作者不明，人们也仍无法明确当初选择这个“魔术数字”的方法。Chris Lomont在研究中曾做了个试验：他编写了一个函数，以在一个范围内遍历选取R值的方式将逼近误差降到最小，以此方法他计算出了线性近似的最优R值0x5f37642f（与代码中使用的0x5f3759df相当接近），但以之代入算法计算并进行一次牛顿迭代后，所得近似值与代入0x5f3759df的结果相比精度却仍略微更低。……在Charles McEniry的论文中，他使用了一种类似Lomont但更复杂的方法来优化R值：他最开始使用穷举搜索，所得结果与Lomont相同；而后他尝试用带权二分法寻找最优值，所得结果恰是代码中所使用的魔术数字0x5f3759df”—维基百科

五、结束

至于最后一步牛顿法，自行google。平方根倒数速算法的神奇之处在于：1、充分利用了浮点数和整数在计算机中的表示，然后以两次转换表示和一次整数运算替换复杂的浮点数计算，最后通过牛顿法加强精度；2、R的取值。

参考资料

http://zh.wikipedia.org/wiki/%E5%B9%B3%E6%96%B9%E6%A0%B9%E5%80%92%E6%95%B0%E9%80%9F%E7%AE%97%E6%B3%95

发布者：全栈程序员栈长，转载请注明出处：https://javaforall.cn/140041.html原文链接：https://javaforall.cn

猜你喜欢

MySQL深度解析：BTree索引的优势和应用（b树mysql）
Linux大文件优化：让系统更快更强（linux大文件系统）
MySQL Jar包的优势与应用（mysqljar包）
加油站ai视觉识别系统
类型MySQL中二进制数据类型的用法（mysql二进制数据）
Linux 查看文件尾：实用技巧（linux查看文件尾）
mysqldump指定数据表导出
远程连接Linux——开启智能办公模式（远程 linux）
1 元卖子、巨亏易主，汉邦高科的 17 载创业启示录
CmakeList的编写和参数详解
ORACLE下载电影海报拥抱新时代影视趣味（ORACLE下载电影海报）
Oracle 数据库中关键词查询的新挑战（oracle关键词查询）
SSDP协议的Python示例「建议收藏」
探索原味BFF模式
Oracle DDL语句简介（oracleddl语句）
架构与微服务本质论详解架构师

zl程序教程

当前栏目

算法学习笔记（二）：平方根倒数速算法

相关文章