AMD Yes 之深度学习

继上次坚定不移的 AMD Yes! 之后,玩游戏之余的我发现了一个大问题……那就是我要拿手上的显卡完成 Deep Learning 课程的作业……

查了一下资料,似乎 AMD 官方正在推行一个叫做 ROCm 的项目。啥意思,什么原理?我也不懂,总之赶紧完成作业就好啦(flag

尝试了一下 yay rocm-dkms ,然后看了一会儿 archlinux 的文档,然后等了一下午编译 llvm ……呃跑不起来(就很尴尬了

最终!还是划了一小块分区安装官方支持的 Ubuntu ,直接 apt 下个编译好的包就可以了ww虽然还是掉进了一堆坑里……总之想尝试的朋友们建议出门右转老老实实买老黄家的卡——毕竟连 tensorflow 都要安装一个额外的包,而像 pytorch 就根本没有 official build (摔

(于是过了一个多月我终于把报告口胡完了……享受一下最后一个暑假……


哦对了,似乎 rocm 还有不少 bug ,因为拿 cpu 和 gpu train 一个 rnn 的结果是不一样的……很明显 gpu train 出来的 loss 一直不下降(一通操作猛如虎,一看 loss 根本没变)。倒是 cnn 那块可能比较稳定(用的人多了 bug 修好了吧)。