飞扬围棋论坛

 找回密码
 注册
搜索
查看: 8617|回复: 8
打印 上一主题 下一主题

百度贴吧网友跑AI测试,2015年胡煜清10盘棋吻合度60.51%

[复制链接]
跳转到指定楼层
1#
发表于 2021-9-6 16:55 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式
https://tieba.baidu.com/p/7509158489






回复

使用道具 举报

2#
发表于 2021-9-6 16:58 | 只看该作者
本帖最后由 闲云野鹤123 于 2021-9-6 17:00 编辑

前一百手一选命中率?让人质疑
回复 支持 反对

使用道具 举报

3#
发表于 2021-9-6 18:38 | 只看该作者
本帖最后由 三国大军师 于 2021-9-6 18:51 编辑

崔灿先生反复强调:ai跑谱必须用同一权重,同一计算量,同样的手数(他选的前180手)甚至同一硬件等等标准,这是最基本的前提。
围棋吧那位是典型的假装看不见,用所谓最新40b什么的跑出来胡熠清居然水平明显高于崔灿用20b跑出的李世石曹薰铉古力的数据,另外计算量也不一样,选的手数也不一样,于是得意洋洋的宣布:崔灿错了!
这是一个很好看很欢乐的喜剧小品。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有帐号?注册

x
回复 支持 反对

使用道具 举报

4#
 楼主| 发表于 2021-9-6 18:51 | 只看该作者
本帖最后由 flyingsee 于 2021-9-6 18:52 编辑

楼上这种就是不好好看崔老师论文,又偏偏拿崔老师说事的

几个常用的官方权重在计算量相同的情况下,虽然每盘棋在吻合度上都略有差别,但很难区分这种差异是源自权重的不同,还是围棋AI的“随机性”所致。各权重之间棋手平均值几乎没有差别,方差分析结果也证实了这一点——四组数据之间均无显著差异。

吻合度数值与计算量的高低,大致呈反比关系。原因可能是在高计算量下,不同选点之间模拟次数的差值被放大,一些局面中与一选存在“真正差异”的第二、三选点,难以实现“计算量不低于最高值20%”的要求。简而言之就是计算量的增加,让一些围棋AI初看还行,细算后又否定的选点无法蒙混过关。若将吻合度标准改为“一选”,计算量不同导致的差异将不再明显,这支持了上面的推测。


“一选吻合度”不受计算量的影响,并不意味着采用这种标准更为科学,这一现象反而暴露了吻合度的一大缺陷,即易受“必然着法”影响的问题。
回复 支持 反对

使用道具 举报

头像被屏蔽
5#
发表于 2021-9-6 19:07 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

6#
 楼主| 发表于 2021-9-6 19:09 | 只看该作者
本帖最后由 flyingsee 于 2021-9-6 19:10 编辑
lanke2021 发表于 2021-9-6 19:07
崔灿用的是20B权重,贴吧此人用的是40B权重,计算量也不一样。搞什么啊。

你们看到的只是差异

却不考虑这种差异带来的结果上的差别是否影响原作者的结论

这就是你们的悲哀的地方
(或许也不是什么悲哀,就是揣着明白装糊涂罢了)

(实际上这些问题,崔老师论文里该提的都提到了)

回复 支持 反对

使用道具 举报

头像被屏蔽
7#
发表于 2021-9-6 19:18 | 只看该作者
提示: 作者被禁止或删除 内容自动屏蔽
回复 支持 反对

使用道具 举报

8#
发表于 2021-9-11 20:26 来自手机 | 只看该作者
他想说,吻合度没用?我在天天象棋,下完后可以免费看吻合度,优,良,中,差,对棋力评估很正确。时间会证明,至少,象棋,国际象棋都证明了吻合度的可靠性
回复 支持 反对

使用道具 举报

9#
发表于 2021-9-11 20:27 来自手机 | 只看该作者
如果围棋也按优良中差评分,绝不可能胡天王十局比柯洁还高,是评分体系要改进
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

小黑屋|Archiver|手机版|飞扬围棋网 ( 苏ICP备11029047号-1 )

GMT+8, 2024-5-6 07:47 , Processed in 0.150032 second(s), 19 queries .

since 2003飞扬围棋论坛 Licensed

© 2001-2013 Comsenz Inc.

快速回复 返回顶部 返回列表