512song 发表于 2021-12-15 10:38

katago在AutoDL几款GPU实例下的benchmark测试

本帖最后由 512song 于 2021-12-15 10:51 编辑

前几天在调试colab免费katago的时候,误打误撞注册了AutoDL,算上折扣,要比阿里云、腾讯云的gpu更为合适。
AutoDL受实例限制,暂时无法编译TensorRT Backend版本,编译的是cuda版本。在不同GPU实例下简单测试了一下katago的benchmark,权重为kata1-b40c256-s10359230464-d2525387336。

使用阿里云最低端的Tesla T4,4核cpu,15G内存服务器作为参考。

使用sabaki对弈感觉速度尚可,但经过测试,NVIDIA RTX 3060 / 12GB的成绩与阿里云的Tesla T4比想象中大不少。

NVIDIA RTX A4000 / 16GB成绩相比TeslaT4略好一点,也符合AutoDL首页算力排名。


NVIDIA RTX 3090 / 24GB成绩两倍于NVIDIA RTX A4000 / 16GB,同样符合排名。

最令人吃惊的是NVIDIA RTX 2080Ti / 11GB,成绩直逼阿里云TeslaV100 16G。katago测试过程中,第一次居然认为成绩出现误差,自动重新测试了一遍。不愧为显卡核弹。难怪黄厂长严令禁止数据商将游戏显卡用于数据服务器上。这也是性价比最高的GPU实例。
AutoDL注册链接。

hred9D 发表于 2021-12-15 14:30

2080ti民用显卡,比专业计算卡强,是程序算法的原因吗?

512song 发表于 2021-12-15 15:06

历来N厂80系列是一个bug级的存在。虽然还是比不过高端的TeslaV100,但价格在那里摆着。
页: [1]
查看完整版本: katago在AutoDL几款GPU实例下的benchmark测试