百度贴吧网友跑AI测试，2015年胡煜清10盘棋吻合度60.51%

flyingsee · 发表于 2021-9-6 16:55

https://tieba.baidu.com/p/7509158489

闲云野鹤123 · 发表于 2021-9-6 16:58

本帖最后由闲云野鹤123 于 2021-9-6 17:00 编辑

前一百手一选命中率？让人质疑

三国大军师 · 发表于 2021-9-6 18:38

本帖最后由三国大军师于 2021-9-6 18:51 编辑

崔灿先生反复强调：ai跑谱必须用同一权重，同一计算量，同样的手数（他选的前180手）甚至同一硬件等等标准，这是最基本的前提。
围棋吧那位是典型的假装看不见，用所谓最新40b什么的跑出来胡熠清居然水平明显高于崔灿用20b跑出的李世石曹薰铉古力的数据，另外计算量也不一样，选的手数也不一样，于是得意洋洋的宣布：崔灿错了！
这是一个很好看很欢乐的喜剧小品。

flyingsee · 发表于 2021-9-6 18:51

本帖最后由 flyingsee 于 2021-9-6 18:52 编辑

楼上这种就是不好好看崔老师论文，又偏偏拿崔老师说事的

几个常用的官方权重在计算量相同的情况下，虽然每盘棋在吻合度上都略有差别，但很难区分这种差异是源自权重的不同，还是围棋AI的“随机性”所致。各权重之间棋手平均值几乎没有差别，方差分析结果也证实了这一点——四组数据之间均无显著差异。

吻合度数值与计算量的高低，大致呈反比关系。原因可能是在高计算量下，不同选点之间模拟次数的差值被放大，一些局面中与一选存在“真正差异”的第二、三选点，难以实现“计算量不低于最高值20%”的要求。简而言之就是计算量的增加，让一些围棋AI初看还行，细算后又否定的选点无法蒙混过关。若将吻合度标准改为“一选”，计算量不同导致的差异将不再明显，这支持了上面的推测。

“一选吻合度”不受计算量的影响，并不意味着采用这种标准更为科学，这一现象反而暴露了吻合度的一大缺陷，即易受“必然着法”影响的问题。

lanke2021 · 发表于 2021-9-6 19:07

提示: 作者被禁止或删除内容自动屏蔽

flyingsee · 发表于 2021-9-6 19:09

本帖最后由 flyingsee 于 2021-9-6 19:10 编辑

lanke2021 发表于 2021-9-6 19:07
崔灿用的是20B权重，贴吧此人用的是40B权重，计算量也不一样。搞什么啊。

你们看到的只是差异

却不考虑这种差异带来的结果上的差别是否影响原作者的结论

这就是你们的悲哀的地方
（或许也不是什么悲哀，就是揣着明白装糊涂罢了）

（实际上这些问题，崔老师论文里该提的都提到了）

lanke2021 · 发表于 2021-9-6 19:18

提示: 作者被禁止或删除内容自动屏蔽

jzhang · 发表于 2021-9-11 20:26

他想说，吻合度没用？我在天天象棋，下完后可以免费看吻合度，优，良，中，差，对棋力评估很正确。时间会证明，至少，象棋，国际象棋都证明了吻合度的可靠性

jzhang · 发表于 2021-9-11 20:27

如果围棋也按优良中差评分，绝不可能胡天王十局比柯洁还高，是评分体系要改进

帐号		自动登录	找回密码
密码			注册

lanke2021 lanke2021 当前离线积分 2232 头像被屏蔽	5^# 发表于 2021-9-6 19:07 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
lanke2021 lanke2021 当前离线积分 2232 头像被屏蔽
	回复支持反对使用道具举报

lanke2021 lanke2021 当前离线积分 2232 头像被屏蔽	7^# 发表于 2021-9-6 19:18 \| 只看该作者提示: 作者被禁止或删除内容自动屏蔽
lanke2021 lanke2021 当前离线积分 2232 头像被屏蔽
	回复支持反对使用道具举报

百度贴吧网友跑AI测试，2015年胡煜清10盘棋吻合度60.51%

本帖子中包含更多资源