自动添加Numba-jit修饰

今天拖延症犯了. 我的拖延症表现是狂做另一件以后可能用到, 但现在无关紧要的事情. 比如加速python的运行速度.

Numba

Numba是个很神奇的东西, 加上以后可以提高python的运行速度.

这里有一篇报道翻译, 使用NumPy、Numba和Python异步编程的高性能大数据分析与对比

直接看我在自己电脑上测试的结果:

行数 numpy numpy+numba
10^7 9.1 1.2秒
10^8 99.7 4.9秒

报道里还有22. 6分钟对40.2秒的成绩, 我可不会去测试的.

Numba在使用时几乎不用修改代码, 最简单的用法就是在每个函数之前加入@jit的修饰, 这篇报道里就是这么做的. 感觉是免费升级了电脑.

自动给每个函数加@jit

但我连给函数加@jit都懒得做, 既然是好像加错了也没有太多的坏处, 那干脆统一给所有的函数都加上这个修饰好了.

所以, 就干脆写了一段代码, 把py文件/ipynb文件当作文本处理, 用正则表达式搜索出所有的函数定义, 在前面加一句@jit好了.

复习了一下正则表达式. 之前写<序列一致性检验工具>的时候, 主要练习的是正则表达式中的查找, 这一次练习的是替换.

此处请参考Python3 cookbook, 需要小心的一个问题是, 如果用非转译的"\n"来替换字符串的时候, re.sub好像容易把\n给翻译了, 用\n也没有办法. 但用.replace还是可以的. 在处理ipynb文件的时候费了很大周折.

代码在这里

使用说明

  • 对本路径下所有的py文件添加@jit修饰, 并存入outputpath中
python3 decorate_with_jit.py --a allpy outputpath
  • 对本路径下所有的ipynb文件添加@jit修饰, 并存入outputpath中
python3 decorate_with_jit.py --a allipynb outputpath
  • 对本路径下所有的py文件去除@jit修饰, 并存入outputpath中
python3 decorate_with_jit.py --r allpy outputpath
  • 对本路径下所有的ipynb文件去除@jit修饰, 并存入outputpath中
python3 decorate_with_jit.py --r allipynb outputpath
  • 对文件A.py添加@jit修饰, 并保存为文件B.py
python3 decorate_with_jit.py --a A.py B.py
  • 对文件A.py去除@jit修饰, 并保存为文件B.py
python3 decorate_with_jit.py --r A.py B.py

EOF.