百度贴吧网友跑AI测试，2015年胡煜清10盘棋吻合度60.51%

flyingsee 发表于 2021-9-6 16:55

https://tieba.baidu.com/p/7509158489

http://tiebapic.baidu.com/forum/w%3D580/sign=2444f798658b4710ce2ffdc4f3cfc3b2/58ddf2d3572c11df3709b09a742762d0f603c2b7.jpg

闲云野鹤123 发表于 2021-9-6 16:58

本帖最后由闲云野鹤123 于 2021-9-6 17:00 编辑

前一百手一选命中率？让人质疑

三国大军师 发表于 2021-9-6 18:38

本帖最后由三国大军师于 2021-9-6 18:51 编辑

崔灿先生反复强调：ai跑谱必须用同一权重，同一计算量，同样的手数（他选的前180手）甚至同一硬件等等标准，这是最基本的前提。
围棋吧那位是典型的假装看不见，用所谓最新40b什么的跑出来胡熠清居然水平明显高于崔灿用20b跑出的李世石曹薰铉古力的数据，另外计算量也不一样，选的手数也不一样，于是得意洋洋的宣布：崔灿错了！
这是一个很好看很欢乐的喜剧小品。

flyingsee 发表于 2021-9-6 18:51

本帖最后由 flyingsee 于 2021-9-6 18:52 编辑

楼上这种就是不好好看崔老师论文，又偏偏拿崔老师说事的

几个常用的官方权重在计算量相同的情况下，虽然每盘棋在吻合度上都略有差别，但很难区分这种差异是源自权重的不同，还是围棋AI的“随机性”所致。各权重之间棋手平均值几乎没有差别，方差分析结果也证实了这一点——四组数据之间均无显著差异。

吻合度数值与计算量的高低，大致呈反比关系。原因可能是在高计算量下，不同选点之间模拟次数的差值被放大，一些局面中与一选存在“真正差异”的第二、三选点，难以实现“计算量不低于最高值20%”的要求。简而言之就是计算量的增加，让一些围棋AI初看还行，细算后又否定的选点无法蒙混过关。若将吻合度标准改为“一选”，计算量不同导致的差异将不再明显，这支持了上面的推测。

“一选吻合度”不受计算量的影响，并不意味着采用这种标准更为科学，这一现象反而暴露了吻合度的一大缺陷，即易受“必然着法”影响的问题。

lanke2021 发表于 2021-9-6 19:07

flyingsee 发表于 2021-9-6 19:09

本帖最后由 flyingsee 于 2021-9-6 19:10 编辑

lanke2021 发表于 2021-9-6 19:07
崔灿用的是20B权重，贴吧此人用的是40B权重，计算量也不一样。搞什么啊。
你们看到的只是差异

却不考虑这种差异带来的结果上的差别是否影响原作者的结论

这就是你们的悲哀的地方
（或许也不是什么悲哀，就是揣着明白装糊涂罢了）

（实际上这些问题，崔老师论文里该提的都提到了）

lanke2021 发表于 2021-9-6 19:18

jzhang 发表于 2021-9-11 20:26

他想说，吻合度没用？我在天天象棋，下完后可以免费看吻合度，优，良，中，差，对棋力评估很正确。时间会证明，至少，象棋，国际象棋都证明了吻合度的可靠性

jzhang 发表于 2021-9-11 20:27

如果围棋也按优良中差评分，绝不可能胡天王十局比柯洁还高，是评分体系要改进

页: [1]

飞扬围棋's Archiver

百度贴吧网友跑AI测试，2015年胡煜清10盘棋吻合度60.51%