平均查找性能提高了 715 倍,Linux 6.2 合并华为贡献的代码,华为OD火到国外!
IT之家 12 月 14 日消息,Linux 6.2 今日合并了来自华为郑磊(Zhen Lei,音译)的代码,将核心内核功能的速度提高了 715 倍。
在合并代码模块介绍中写道:“得益于 Zhen Lei 的代码,Tux(Linux 的吉祥物,这里指 Linux)在 kallsyms_lookup_name () 平均查找性能提高了 715 倍,将我们的旧实现从 O (n) 升级到 O (log (n)),同时还保留了 / proc / kallsyms 上的旧实现支持”。
IT之家了解到,kallsyms_lookup_name () 函数用于根据一个符号的名称查询其地址,并可用于内核符号表内任何符号的查询。
华为的 Zhen Lei 在之前的补丁贴中描述了对 kallsyms_lookup_name 的优化:
目前,为了搜索一个符号,我们需要将 'kallsyms_names' 中的符号逐一展开,然后使用展开后的字符串进行比较。这是 O (n)。 如果我们像地址一样将名字按升序排序,我们也可以使用二进制搜索。而这就是 O (log (n))。 为了不改变“/proc/ kallsyms”的实现,表 kallsyms_names [] 仍然以升序与地址一一对应的方式存储。 增加数组 kallsyms_seqs_of_names [],它以排序后的名字的序列号为索引,对应的内容是排序后的地址的序列号。 例如,假设 NameX 在数组 kallsyms_seqs_of_names [] 中的索引是 'i',kallsyms_seqs_of_names [i] 的内容是 'k',那么 NameX 的对应地址是 kallsyms_addresses [k]。kallsyms_names [] 中的偏移是 get_symbol_offset (k)。 注意,内存使用量将增加 (4 * kallsyms_num_syms) 字节,接下来的两个补丁将减少 (1 * kallsyms_num_syms) 字节并正确处理 CONFIG_LTO_CLANG=y 的情况。
优化前:
min=234, max=10364402, avg=5206926
min=267, max=11168517, avg=5207587
优化后:
min=1016, max=90894, avg=7272
min=1014, max=93470, avg=7293
kallsyms_lookup_name () 的平均查询性能提高了 715 倍。
于是某社交App上开始 传言 ,系统代码其中与不少OD(外包)参与开发,某部要求的OD同学转正。
脉脉社区一直有学技术就得选OD的言论, 互联网有句话: “先有华为后有天,鸿蒙代码OD编”。
相关文章
- 腾讯云稳居领导者阵营,DevOps 贡献双满分
- 向云新生,终端进化的未来进行时
- 登月、mRNA疫苗、基因编辑,Nature预测2023科学大事件!
- 一颗GPU,秒出3D模型!OpenAI重磅新作:Point-E用文本即可生成三维点云模型
- 从一个 Demo 说起 Dubbo3
- 笑死,B站英文鬼畜「宝娟,我的嗓子」!听AI大佬采访,看电竞解说,追明星直播,全靠它了
- 离谱!女生在自家厕所遭偷拍,照片全网泄露,罪魁祸首竟是萌萌的TA
- 89次实验,出错率高达40%!斯坦福首次大型调研,揭露AI写代码漏洞
- 年终重磅盘点:2022计算机科学6大突破!破解量子加密、最快矩阵乘法等榜上有名
- 干一个月就跑了!「天才黑客」George Hotz从推特离职
- Meta让150亿参数语言模型学会从头设计「全新」蛋白质!LeCun:效果惊人
- 谷歌怕了!ChatGPT狂砸搜索引擎饭碗,CEO劈柴召开大会拉响「红色警报」
- 斯坦福28岁加密女王认罪!320亿美元帝国崩塌,最高110年监禁,或将指证前男友
- 田渊栋团队发布「长故事生成器」第二版DOC:连贯性大幅提升,趣味性提升20.7%!
- 下任推特CEO是他?为马斯克工作20年,带全家睡办公室!
- Meta千亿参数大模型OPT-IML「升级版」来了,完整模型和代码公布!
- PR2019软件下载及安装方法!--Premiere全版本软件下载
- 【PR软件】 Premiere Pro 2020安装包+安装教程--Premiere全版本软件下载
- 2022年,谁在数学史上永远留下了姓名
- 【愚公系列】2023年01月 Dapr分布式应用运行时-Dapr的基本运行