您现在的位置是：首页 > 后端

当前栏目

Python高性能计算库——Numba

Python 计算高性能

2023-09-27 14:22:28 时间

最近我在观看一些SciPy2017会议的视频偶然发现关于Numba的来历--讲述了那些C 的高手们因为对Gil Forsyth和Lorena Barba失去信心而编写的一个库。虽然本人觉得这个做法有些不妥但我真的很喜欢他们所分享的知识。因为我发现自己正在受益于这个库并且从Python代码中获得了令人难以置信的表现所以我觉得应该要写一些关于Numba库的介绍性文章也可能会在将来添加一系列小的更多类似教程的文章。

1.那么到底什么是Numba

Numba是一个库可以在运行时将Python代码编译为本地机器指令而不会强制大幅度的改变普通的Python代码稍后再做说明。翻译/魔术是使用LLVM编译器完成的该编译器是相当活跃的开源社区开发的。

Numba最初是由Continuum Analytics内部开发此公司也开发了著名的Anaconda 但现在它是开源的。核心应用领域是math-heavy 密集数学重型数学和array-oriented 面向数组的功能它们在本地Python中相当缓慢。想象一下在Python中编写一个模块必须一个元素接着一个元素的循环遍历一个非常大的数组来执行一些计算而不能使用向量操作来重写。这是很不好的主意是吧所以“通常”这类库函数是用C / C 或Fortran编写的编译后在Python中作为外部库使用。Numba这类函数也可以写在普通的Python模块中而且运行速度的差别正在逐渐缩小。

2.怎么才能get到Numba呢

安装Numba的推荐方法是使用conda包管理

conda install numba

你也可以用pip来安装Numba 但是最新版本的发布才一天之久。但是只要你能够使用conda 我会推荐使用它因为它能够为你安装例如CUDA工具包也许你想让你的Python代码GPU就绪当然这也是有可能的。

3.如何使用Numba呢

使用它的要求不多。基本上你写一个自己的“普通”的Python函数然后给函数定义添加一个装饰如果你不是很熟悉装饰器读一下关于this或that 。你可以使用不同类型的装饰器但 jit可能是刚开始的选择之一。其他装饰器可用于例如创建numpy通用功能 vectorize或编写将在CUDA GPU上执行的代码 cuda。我不会在这篇文章中介绍这些装饰。现在让我们来看看基本的步骤。他们提供的代码示例是2d数组的求和函数以下是代码

from numba import jit

from numpy import arange

# jit decorator tells Numba to compile this function.# The argument types will be inferred by Numba when function is called.

jit

def sum2d(arr):

M, N arr.shape

result 0.0

for i in range(M):

for j in range(N):

result arr[i,j]

return result

a arange(9).reshape(3,3)

print(sum2d(a))

正如你所看到的 Numba装饰器被添加到函数定义中并且voilá这个函数将运行得很快。但是这里带来了很有趣的注意事项你只能使用Numpy和标准库里的函数来加快Numba速度甚至不需要开了他们所有的特性。他们有一个相当好的文档参考资料列出了所有支持的内容。见here是所支持Python的功能和here 是所支持的Numpy功能。现在支持的功能可能还不太多但我想告诉你这就够了请记住 Numba不是要加快你的数据库查询或如何强化图像处理功能。他们的目标是加快面向数组的计算我们可以使用它们库中提供的函数来解决。

4.示例和速度比较

熟练的Python用户永远不会使用上述代码实现sum功能而是调用numpy.sum。相反我将向你介绍另外一个例子为了更好地理解这个例子也许刚开始是一个小的背景故事如果你对这个例子的背景不感兴趣你可以直接跳过然后直接去看代码。

从我所学习的知识来看我会认为自己是一个水文学家我做的很多的一件事是模拟降雨径流过程。简单点来说通过时间序列数据例如雨量和空气温度然后尝试创建模型来判断一条河流的水流量有多少。这在外行看来是非常复杂。但对于我们来说很简单。我们通常使用的模块迭代输入数组并且对于每个时间步长我们会更新一些模块内部的状态例如模拟土壤水分积雪或拦截水中的树木。在每个时间段结束时计算水流量这不仅取决于在同一时间步长下的雨而且也取决于在内部模型状态或储存。在这种情况下我们就需要考虑以前时间步长的状态和输出。那么你可能会看到这个问题我们必须一段时间接一段时间的计算整个流程而对于解决这种问题Python本来就是很慢的这就是为什么大多数模块都是在Fortran或C/C 中实现的。如前所述 Python在对于这种面向数组的计算来说是慢的。但是Numba允许我们在Python中做同样的事情而且没有太多的性能损失。我认为至少对于模型的理解和发展这可能会很方便。所以我最近创建了一个名为“RRMPG ”的项目——降雨径流建模游乐场。

Okay 现在我们来看看我们get到了什么。我们将使用最简单的模块之一由MB Fiering在1967年出于教育目的开发的ABC模型并将Python代码的速度与Numba优化后Python代码和Fortran实现进行比较。请注意这个模型不是我们在现实中使用的正如名称所示但是我认为这可能是一个不错的想法来举例。

A、B、C模块是一个三个参数模块 a b c 习惯性命名它只接收下雨量为输入只有一个存储。土壤水分蒸发蒸腾损失总量参数b 另一部分通过土壤渗透到地下水储存参数a 最后一个参数c代表地下水总量离开地下变成河流。Python中的代码使用Numpy数组可能会像如下所示

import numpy as np

def abc_model_py(a, b, c, rain):

# initialize array for the stream discharge of each time step

outflow np.zeros((rain.size), dtype np.float64)

# placeholder, in which we save the storage content of the previous and

# current timestep

state_in 0

state_out 0

for i in range(rain.size):

# Update the storage

state_out (1 - c) * state_in a * rain[i]

# Calculate the stream discharge

outflow[i] (1 - a - b) * rain[i] c * state_out

state_in state_out

return outflow

接下来我们使用Numba来实现相同的功能。

jit

def abc_model_numba(a, b, c, rain):

outflow np.zeros((rain.size), dtype np.float64)

state_in 0

state_out 0

for i in range(rain.size):

state_out (1 - c) * state_in a * rain[i]

outflow[i] (1 - a - b) * rain[i] c * state_out

state_in state_out

return outflow

我用随机数字作为输入来运行这些模块这只是为了比较计算时间而且也比较了针对fortran实现的时间详见here 。我们来看看数字

py_time %timeit -r 5 -n 10 -o abc_model_py(0.2, 0.6, 0.1, rain)

6.75 s ± 11.6 ms per loop (mean ± std. dev. of 5 runs, 10 loops each)

# Measure the execution time of the Numba implementation

numba_time %timeit -r 5 -n 10 -o abc_model_numba(0.2, 0.6, 0.1, rain)

30.6 ms ± 498 µs per loop (mean ± std. dev. of 5 runs, 10 loops each)

# Measure the execution time of the Fortran implementation

fortran_time %timeit -r 5 -n 10 -o abc_model_fortran(0.2, 0.6, 0.1, rain)

31.9 ms ± 757 µs per loop (mean ± std. dev. of 5 runs, 10 loops each)

# Compare the pure Python vs Numba optimized time

py_time.best / numba_time.best

222.1521754580626

# Compare the time of the fastes numba and fortran run

numba_time.best / fortran_time.best

0.9627960721576471

通过添加一个装饰器我们的计算速度比纯Python代码快222倍甚至比Fortran也快很多。在计算能力决定未来的时代 Numba一定会被更多人接受。

以上就是我的介绍希望有人现在有动力去看看Numba库。我想在将来我会编写一系列小的Numba文章/教程并提供更多的技术信息让更多的人使用Numba 库。而本文仅作为一个开始。

本文由北邮爱可可-爱生活老师推荐阿里云云栖社区组织翻译。

文章原标题《Introduction to the Numba library》

作者 Flaire

译者一只高冷的猫审校袁虎。

文章为简译更为详细的内容请查看原原文文

猜你喜欢

WebSocket三问—腾讯三问
Unity MeshBaker -Could not compute tangents. All UVs need to form a valid triangles in UV space
20190930每日一句
neo4j 修改默认端口
java设计模式--行为型模式--模板方法
Linux下，查看网络配置（IP，Gateway，DNS）
Android SQLiteDatabase分析
iOS和Android的APP启动图标和应用商店截图尺寸
深度解读 | 阿里云新一代关系型数据库 PolarDB
数论（快速幂）
再不解决延迟不当，小心你的内存被打爆
DirectShow建立一个视频捕捉程序
NavicatPremium12连接Oracle11g报ORA-28547错误
opencv-行列式按行（列）展开

相关主题

python访问mysql
python学习03
python 读取txt
Python之helloworld
python--AES加密
python 正则表达式
python_68_迭代器
Python中模块

zl程序教程

当前栏目

Python高性能计算库——Numba

相关文章