xDroid's Blog

感谢大葱刷的 GTX 1080!

老年人的标志就是换了 GTX 1080 这种事都懒得写一篇博文了(

多显示器配置

ARandR: Another XRandR GUI 配合 i3wm 自启动脚本

画面撕裂

Cuda, Pytorch

  • Start Locally | Pytorch
  • yay -S cuda
  • conda env create -f environment.yml where cat environment.yml
    name: cuda116env
    channels:
      - pytorch
      - conda-forge
    dependencies:
      - cudatoolkit=11.6
      - pytorch
      - numpy
      - scipy
      - tqdm
      - opt_einsum
      - numba
      - matplotlib
  • 注意:cudatoolkit 必须和 pytorch 包的要求对应,不然会装上 cpuonly

.cuda()

写代码的时候需要注意如下几点:

  • .cuda().cpu() 迁移 tensor 的位置
  • PyTorch Profiler 配合 chrome tracing 食用
  • optimizer 为何占用很多 cpu 时间?因为还是在 cpu 上跑的动态图
  • 解决方案:用 cuda graph 记录 gpu 上要跑的计算图 + optimizer 设为 capturable=True,见,配置正确后 profile 里应该只看见很少的 sync 和 launch graph。