<tbody id='o17rsfes'></tbody>
    <i id='devy2clr'><tr id='wf1kmi2j'><dt id='0i5gt1ku'><q id='r9v4ls2o'><span id='wh11vn81'><b id='25w5kt1i'><form id='ss4bdjsb'><ins id='pb50j0hd'></ins><ul id='mjbrs8ax'></ul><sub id='xxyo9umc'></sub></form><legend id='lymbp9zw'></legend><bdo id='93075jsv'><pre id='mfkgir9m'><center id='4aikpd5n'></center></pre></bdo></b><th id='rg3iw14b'></th></span></q></dt></tr></i><div id='2be07yq9'><tfoot id='xsg4j8pm'></tfoot><dl id='lmcja5fh'><fieldset id='h3gbm0mi'></fieldset></dl></div>
      <bdo id='o4drmwf4'></bdo><ul id='xfk7za8y'></ul>

        <small id='tekoaddl'></small><noframes id='sjfw7u2e'>

        <legend id='zi08j3vi'><style id='k68cml3b'><dir id='7bf87dgl'><q id='0p6m3oiy'></q></dir></style></legend>

              <tfoot id='f82gmkxx'></tfoot>
            • 棋牌玩家qq群-CMU风头被抢新型DeepStack算法抢先攻克德州扑克图灵测试
              发布时间:2020-07-30 18:32

              CMU风头被抢新型DeepStack算法抢先攻克德州扑克图灵测试

              在国外的学术圈里,有一份论文火了。论文里进行的研究表明,人类历史上第一次,AI在德州扑克游戏上赢得了人类职业玩家。而这份论文的突破性意义在于:AI在非完整信息的博弈游戏中,赢得人类职业对手。这篇论文的名字是《DeepStack:无限下注扑克里的专棋牌游戏送30现金家级人工智能》(DeepStack:Expert-LevelArtificialIntelligenceinNo-LimitPoker),1月6号提交到了ArXiv上。

              论文作者是来自加拿大Alberta大学、捷克Charles大学、布拉格捷克理工大学的研究人员。而论文题目里的DeepStack,是一种新型的算法名称,论文里说明到“DeepStack是一种通用算法,可用于一大类非完整信息的序列博弈”。在一项涉及到数十位参与者和4.4万手扑克的研究中,DeepStack成为了世界上第一个在“一对一无限注德州扑克”上击败了职业扑克玩家的计算机程序。

              什么是“一对一无限注德州扑克”(HUNL)

              德州扑克的英文名称是“TexasHold'em”,而“一对一无限注德州扑克”(Heads-upno-limit,简称HUNL)的意思,就是有2个玩家且不限下注筹码。这篇论文里的自然就是计算机和职业玩家挨个对局。

              虽然是扑克,但跟斗地主还是很不一样的,它是“赌场”十分受欢迎的项目。这里祭出视频,帮大家理解一下德州扑克的规则和玩法。

              从上面的视频中,我们大致能了解一场德州扑克会有两类信息:玩家每人手里分到2张底牌的“私有信息”和桌子上公共牌的“公开信息”。玩家选择5张公共牌里的3张,与手里的2张底牌组合,最后以期得到最好的5张牌的组合。按照“CardRanking”决定最后的胜者。

              在中国玩德州扑克的名人,一个是汪峰老师,另一个就是李开复老师。在知乎上“扑克有哪些技巧、经验或者原则?”的提问下,排名第一的,就是李开复老师的答案,他尤其提到玩好诈唬(Bluffing,高手惯用技巧)的关键在于学好统计。

              德州扑克是新一代的图灵测试?

              德州扑克已经成为十分流行的人工智能研究测试地,每一个扑克玩家手里握着的底牌“私有信息”,是其它玩家看不到的,所以被称为是“非完整信息”(Imperfectinformation)的博弈。这跟围棋有很大不同,围棋是完整信息公开的博弈,玩家们可以看到棋盘上的每个旗子,考虑所有落子的可能性。所以德州扑克对于人工智能来说,更加具有挑战性。

              《DeepStack》这篇论文的通信作者MichaelBowling曾经在2015年初接受《NewScientist》采访时说道:“德州扑克最有趣的地方,就是你无法获得完整的信息”。

              而卡耐基梅隆大学(CMU)TuomasSandholm教授也说道:“扑克已经成为在非完整信息情况下,衡量(计算机)智能水平的标准......而它可以看做是一种超越图灵测试的存在。”

              有趣的是,这两位教授都在领导自己的团队攻克这个新型图灵测试,一位在加拿大Alberta大学,一位在美国CMU大学。

              几天前,CMU已经发出预告:由TuomasSandholm教授领导研发出的Libratus人工智能系统,将于当地时间1月11日,在宾夕法尼亚州匹兹堡的Rivers赌场,与四个顶级职业玩家玩12万手的HUNL,并角逐20万美元的奖金。早在2015年,Libratus的前身Claudico与人类玩家首次对战,在8万手的对决中完败,这次算是CMU的卷土重来。

              但是我们已经知道了结果,Alberta赶在CMU之前,把就论文发出来了。学术圈人士纷纷表达赞美,称DeepStack具有里程碑意义(当然这份论文还未通过同行审议阶段),然而跟CMULibratus提前好几天的预热盛况相比,DeepStack并没有得到等量的媒体待遇,也引发一些人的不满。

              CMU走的是当年AlphaGo的路线,在华丽的赌场搞一场秀,与人类顶尖玩家对战,还有20万美金的噱头。所以这份DeepStack论文虽然比CMU更早取得突破,但阵仗不如后金鲨银鲨赢钱游戏者大,媒体对其忽视了,也在情理。

              总之一句话,Alberta抢了先,CMU抢了热闹(学术界的竞争也是异常激烈的)。

              DeepStack总共与33位人类选手进行了4.4万手的较量,分别在2016年11月7日和12月12日之间于线上举行对局。最终获胜的前三位选手,分别有5000、2500和1250加元的奖励。以下是对局结果。结果显示,DeepStack的平均赢率为492mbb/g(一般人类玩家到50mbb/g就被认为拥有较大优势,750mbb/g就是对手每局都弃牌的赢率)。

              前面我们提到棋牌玩家qq群,一场扑克的信息可以分为“私有”和“公开”,放在桌子中间的5张公开牌形成一种动态的“公开状态”。游戏中的公开状态的可能序列构成一个公开树(Publictree),其中每一个公开状态都有一个相关的公开子树(Publicsubtree)。

              DeepStack整体架构,分为(a)(b)(c)三个部分。在(a)中棋牌玩家qq群,DeepStack在每一个公开状态里,都要重新计算它需要的动作棋牌玩家qq群,其中子树值(Subtreevalue)会通过一个训练好的深度神经网络Neuralnet(b)来计算,而训练Neuralnet的样本就是(c)。

              总的来说,DeepStack结合了递归推理(Recursivereasoning)来处理信息不对称性,还结合了分解(Decomposition)集中计算到相关决策上,并形成了一种关于任意牌的直觉(Intuition),这种直觉可以使用深度学习进行自我玩牌而自动学习到

              扑克 棋牌玩钱 棋牌盈利 网红棋牌 棋牌玩家qq群
                <tfoot id='gtjd3fph'></tfoot>
                • <bdo id='19vbsnc0'></bdo><ul id='pvioxcdv'></ul>
                    <legend id='r4lp9o1z'><style id='e92olp2l'><dir id='av32kd3o'><q id='lrka06of'></q></dir></style></legend>

                        <small id='ejdhr242'></small><noframes id='r9zvmn5u'>

                        <i id='wz44sqd8'><tr id='y71jk9ok'><dt id='u5c7f4fx'><q id='izp1l15j'><span id='egqfs9tl'><b id='bltojcwb'><form id='bnytbqzm'><ins id='dwuatv7k'></ins><ul id='6hhl97pe'></ul><sub id='kw0hwz5q'></sub></form><legend id='2egt4chu'></legend><bdo id='fsm82y8m'><pre id='6y6hk4sx'><center id='b8wjdlpj'></center></pre></bdo></b><th id='tgm4rihd'></th></span></q></dt></tr></i><div id='u7lzy22t'><tfoot id='cim0n302'></tfoot><dl id='zpart8ux'><fieldset id='bheoyyml'></fieldset></dl></div>

                          <tbody id='avuuw38m'></tbody>

                        <tfoot id='pr85leww'></tfoot>
                        • <small id='3lknun48'></small><noframes id='lumy8oqj'>

                          <legend id='barbrwnv'><style id='mwj74g0b'><dir id='m84bf6r1'><q id='y1bj0kx9'></q></dir></style></legend>
                            <tbody id='lep7o7jv'></tbody>

                            <bdo id='5qsa8xx0'></bdo><ul id='24s0ayb1'></ul>

                                1. <i id='si6t302g'><tr id='f67ju8qa'><dt id='lsq2fz0n'><q id='yb362aa5'><span id='vr740l41'><b id='4omsqp3d'><form id='8dkpe1am'><ins id='6eiqwai8'></ins><ul id='dkd7expl'></ul><sub id='er3mh9b3'></sub></form><legend id='2talcbtz'></legend><bdo id='y12lx6p9'><pre id='qz7kxzzd'><center id='tpo1mn2n'></center></pre></bdo></b><th id='izqilofi'></th></span></q></dt></tr></i><div id='wg9i9ohc'><tfoot id='kb7x4y3b'></tfoot><dl id='o9y0vapn'><fieldset id='tm3jn514'></fieldset></dl></div>