您现在的位置是：首页 > 其他

当前栏目

Code Inside：为什么处理已排序数组比处理未排序数组更快？

程序数组排序

2023-03-09 22:24:48 时间

很久以前在stackoverflow上看到下面这段代码，今天忍不住把它摘录过来。

#include <algorithm>  
#include <ctime>  
#include <iostream>  
   
int main()  
{  
    // Generate data  
    const unsigned arraySize = 32768;  
    int data[arraySize];  
   
    for (unsigned c = 0; c < arraySize; ++c)  
        data[c] = std::rand() % 256;  
   
    // !!! With this, the next loop runs faster  
    std::sort(data, data + arraySize);  
   
    // Test  
    clock_t start = clock();  
    long long sum = 0;  
   
    for (unsigned i = 0; i < 100000; ++i)  
    {  
        // Primary loop  
        for (unsigned c = 0; c < arraySize; ++c)  
        {  
            if (data[c] >= 128)  
                sum += data[c];  
        }  
    }  
   
    double elapsedTime = static_cast<double>(clock() - start) / CLOCKS_PER_SEC;  
   
    std::cout << elapsedTime << std::endl;  
    std::cout << "sum = " << sum << std::endl;  
}

上面的程序在保留std::sort(data, data + arraySize);语句时，程序运行时间是1.93 秒

但去掉排序语句后，程序运行时间是11.54秒

问题：为什么会出现这种情况？

解答：分支预测。

程序分支

考虑以下if语句块。对于处理器来说，就是一个分支指令，如下：

处理器每次遇到一条分支时，它都不知道该走哪一条道。这时候该怎么办？程序停下来，等待前面的指令执行完，得到确切的结果后，再接着走某一条分支。

现代处理器都支持指令并行处理和超流水线作业。因此，当处理器遇到程序分支时，都会去猜测应该走哪一条分支。

如果猜对了，程序接着流畅运行。如果猜错了，则处理器需要做一些额外的工作，再次回到那条正确的分支。

因此，如果处理器每次都猜错，那程序的运行时间就会边长。

这就是上面的代码为什么运行时间会相差那么大的原因。

对于分支语句：

if (data[c] >= 128)  
    sum += data[c];

在保留std::sort(data, data + arraySize);的情况下。数组data中的内容是这样的：

T = branch taken  
N = branch not taken  
   
data[] = 0, 1, 2, 3, 4, ... 126, 127, 128, 129, 130, ... 250, 251, 252, ...  
branch = N  N  N  N  N  ...   N    N    T    T    T  ...   T    T    T  ...  
   
       = NNNNNNNNNNNN ... NNNNNNNTTTTTTTTT ... TTTTTTTTTT  (easy to predict)

在未排序的情况下，数组data中的内容是这样的：

data[] = 226, 185, 125, 158, 198, 144, 217, 79, 202, 118,  14, 150, 177, 182, 133, ...  
branch =   T,   T,   N,   T,   T,   T,   T,  N,   T,   N,   N,   T,   T,   T,   N  ...  
   
       = TTNTTTTNTNNTTTN ...   (completely random - hard to predict)

也就是说，在已经排序的情况下，处理器便能更好的预测分支了。因此，程序也运行的更快。

关于分支预测

阅读linux源代码时，你会发现if(likely( )){}或是if(unlikely( ))这样的语句。对于条件选择语句，gcc内建了一条指令用于优化，在一个条件经常出现，或者该条件很少出现的时候，编译器可以根据这条指令对条件分支选择进行优化。而Linux内核把这条指令封装成了宏likely()和unlikely()。

因此，在编写程序时，如果一个分支条件只有在很少数的情况下才出现时，我们使用unlikely( )和likely( )能够加快程序的运行,这也是一种优化程序的手段。

比如这样：

if ( unlikely(statement) ) { //这里便是告诉编译器，这个条件只在少数情况下发生  
 
dosomething();  
 
}

原文链接：http://www.cricode.com/3347.html

猜你喜欢

鲜为人知但很有用的 HTML 属性
在 Go 里用 CGO？这 7 个问题你要关注！
数据孤岛是业务效率的无声杀手
9款优秀的去中心化通讯软件 Matrix 的客户端
翻转再翻转！有意思的水平横向溢出滚动
发现 Linux SpaceFM 文件管理器的威力
图像处理工具Python扩展库，你了解吗？
求职数据分析，项目经验该怎么写
自定义计数器小技巧！CSS 实现长按点赞累加动画
在OKR中，我看到了数据驱动业务的未来
2023展望：新的一年将给大数据分析领域带来什么？
过五关！React高频面试题指南
阿里云ADB基于Hudi构建Lakehouse的实践
火山引擎云原生大数据在金融行业的实践
OpenHarmony富设备移植指南（二）—从postmarketOS获取移植资源
《数据成熟度指数》报告：64%的企业领袖认为大多数员工“不懂数据”
OpenHarmony 小型系统兼容性测试指南
肯睿中国（Cloudera）：2023年企业数字战略三大趋势预测
适用于 Linux 的十大命令行游戏
软件开发中的十个认知偏差

zl程序教程

当前栏目

Code Inside：为什么处理已排序数组比处理未排序数组更快？

相关文章