flyingsee 发表于 2021-9-6 16:55

百度贴吧网友跑AI测试,2015年胡煜清10盘棋吻合度60.51%

https://tieba.baidu.com/p/7509158489


http://tiebapic.baidu.com/forum/w%3D580/sign=2444f798658b4710ce2ffdc4f3cfc3b2/58ddf2d3572c11df3709b09a742762d0f603c2b7.jpg



闲云野鹤123 发表于 2021-9-6 16:58

本帖最后由 闲云野鹤123 于 2021-9-6 17:00 编辑

前一百手一选命中率?让人质疑

三国大军师 发表于 2021-9-6 18:38

本帖最后由 三国大军师 于 2021-9-6 18:51 编辑

崔灿先生反复强调:ai跑谱必须用同一权重,同一计算量,同样的手数(他选的前180手)甚至同一硬件等等标准,这是最基本的前提。
围棋吧那位是典型的假装看不见,用所谓最新40b什么的跑出来胡熠清居然水平明显高于崔灿用20b跑出的李世石曹薰铉古力的数据,另外计算量也不一样,选的手数也不一样,于是得意洋洋的宣布:崔灿错了!
这是一个很好看很欢乐的喜剧小品。

flyingsee 发表于 2021-9-6 18:51

本帖最后由 flyingsee 于 2021-9-6 18:52 编辑

楼上这种就是不好好看崔老师论文,又偏偏拿崔老师说事的

几个常用的官方权重在计算量相同的情况下,虽然每盘棋在吻合度上都略有差别,但很难区分这种差异是源自权重的不同,还是围棋AI的“随机性”所致。各权重之间棋手平均值几乎没有差别,方差分析结果也证实了这一点——四组数据之间均无显著差异。

吻合度数值与计算量的高低,大致呈反比关系。原因可能是在高计算量下,不同选点之间模拟次数的差值被放大,一些局面中与一选存在“真正差异”的第二、三选点,难以实现“计算量不低于最高值20%”的要求。简而言之就是计算量的增加,让一些围棋AI初看还行,细算后又否定的选点无法蒙混过关。若将吻合度标准改为“一选”,计算量不同导致的差异将不再明显,这支持了上面的推测。

“一选吻合度”不受计算量的影响,并不意味着采用这种标准更为科学,这一现象反而暴露了吻合度的一大缺陷,即易受“必然着法”影响的问题。

lanke2021 发表于 2021-9-6 19:07

flyingsee 发表于 2021-9-6 19:09

本帖最后由 flyingsee 于 2021-9-6 19:10 编辑

lanke2021 发表于 2021-9-6 19:07
崔灿用的是20B权重,贴吧此人用的是40B权重,计算量也不一样。搞什么啊。
你们看到的只是差异

却不考虑这种差异带来的结果上的差别是否影响原作者的结论

这就是你们的悲哀的地方
(或许也不是什么悲哀,就是揣着明白装糊涂罢了)

(实际上这些问题,崔老师论文里该提的都提到了)

lanke2021 发表于 2021-9-6 19:18

jzhang 发表于 2021-9-11 20:26

他想说,吻合度没用?我在天天象棋,下完后可以免费看吻合度,优,良,中,差,对棋力评估很正确。时间会证明,至少,象棋,国际象棋都证明了吻合度的可靠性

jzhang 发表于 2021-9-11 20:27

如果围棋也按优良中差评分,绝不可能胡天王十局比柯洁还高,是评分体系要改进
页: [1]
查看完整版本: 百度贴吧网友跑AI测试,2015年胡煜清10盘棋吻合度60.51%