每日經濟新聞
新科技

每經網首頁 > 新科技 > 正文

德撲AI來華掀起人機大戰?化名“冷撲大師”由李開復牽線

新浪科技 2017-03-24 13:27:05

即便在AlphaGo之后,AI擊敗人類已經不再是什么新聞,但人工智能在德州撲克上擊敗人類,這其中的難度和信息量不可小覷。

新浪科技 李根

3月24日下午消息,新浪科技今日獨家獲悉,卡耐基梅隆大學(Carnegie Mellon University,以下簡稱CMU)開發的德撲人工智能程序Libratus,將在4月來到中國,與中國德撲玩家進行德撲界的“人機大戰”。

新浪科技還獲悉,這款CMU開發的名為Libratus的德撲程序,將以“冷撲大師”的譯名挑戰中國德撲高手,而這場挑戰賽的發起者,正是CMU校友、創新工場創始人李開復。

新浪科技也就此向創新工場做了進一步求證,但對方表示不予置評。

Libratus曾碾壓人類高手贏200萬美元

實際上,Libratus并非初出茅廬的毛頭“程序”。在今年春節期間,Libratus就已經在賓夕法尼亞州匹茲堡的Rivers賭場,將4位人類職業玩家挑落馬下,并且奪走了共計176萬美元的獎金。

當時,美國東部時間1月30日,CMU開發的 Libratus與四名人類職業玩家 Jason Les、Dong Kim、Daniel McAulay 和 Jimmy Chou 約戰賓夕法尼亞州匹茲堡的Rivers賭場,并在持續20天的比賽時間中,對玩 12 萬手,最后 Libratus贏走了總數200萬美元獎金中的176萬美元 。

值得注意的是,與Libratus對戰的都是德撲職業玩家中的高手。比如其中的Dong Kim,還在2年前在同一個賭場擊敗了這個人工智能的前身,但在這場為期二十天的比賽剛剛過半之時,Kim就直言:人類已經沒有真正獲勝的機會。

Libratus的這場人機大戰中的勝利,也迅速引發關注。即便在AlphaGo之后,AI擊敗人類已經不再是什么新聞,但人工智能在德州撲克上擊敗人類,這其中的難度和信息量不可小覷。

AI玩德撲為何難?

利用人工智能程序玩德撲,最大的難度在于“不完整信息博弈”。因為玩德州撲克需要推理能力,而這對于機器來說很難模仿。雖然人工智能在跳棋、象棋乃至圍棋比賽中,已經完勝人類對手,但無限注德州撲克是一個完全不同的情況。

此前據AI新媒體《量子位》報道,由于一些卡牌并沒有發出來,在德州撲克的對局里,任意時間,任何一個玩家,都只能觀察到一部分的情況。要贏,他們需要直覺:一種猜測其他玩家手上是什么牌的能力。而且還要考慮到對手每一種可能的打法,想得到理想的戰略非常困難。而

現實世界中,不完美信息才是常態,各種看不見的隱藏信息產生了大量的不確定性,而德州撲克代表的就是這種類型的博弈。在圍棋界縱橫無敵的AlphaGo,本質上處理的還是完美信息博弈,而AlphaGo無法處理德州撲克的問題,更遑論使出詐唬。

新浪科技則了解到,為了解決“不完整信息博弈”這種計算機難題,CMU 的人工智能研究者們專注于信息集,通過同時思考未知和已知變量各種可能狀態的方式來進行預測,這需要強大的計算能力。

在計算能力方面,CMU主要依賴于Bridges Super Computer超級計算機。每個牌局結束后的夜晚,匹茲堡市超級計算中心Bridges電腦執行計算,用以優化Libratus的策略。而在白天的比賽過程中,Bridges用于計算每一手的終結游戲策略,Bridges提供三種類型的計算選項,稱為節點:常規、大型和超大型。Bridges不是當今世界最大、最快、最強勁的超級計算機,但它可能是面向公眾開放的,最大、最快、最強勁的超級計算機,在Bridges的幫助下,原本在個人電腦上耗時數月的計算,僅僅幾個小時就搞定。

此外,在計算能力保障的基礎上,CMU在具體技術應用方面,用到了區別于AlphaGo的方法。CMU方面曾披露稱,Libratus沒有用到專業的牌局進行神經網絡的訓練,不同于AlphaGo用了大量的棋局做訓練,這個模型用的是隨機生成的牌局(隨機產生公共牌、底池籌碼、玩家拿牌概率)和嘗試性的動作帶來的結果(在隨機生成的輸入情況下模擬玩家跟牌后的結果)作為訓練數據。

Libratus 還利用了博弈論,與AlphaGo不同,Libratus系統不通過分析大量可能的下一步完成任務,這個 CMU 構建的新系統通過平衡風險與收益來決定自己的下一步,在納什均衡定義中的完美游戲狀態。

最后,在具體操作上,Libratus分三步走。第一階段,Libratus通過名為反事實遺憾最小化(counterfactual regret minimization)的算法,在經過訓練之后獨立于人的玩法形成自己的策略。第二階段,第二個系統屬于一種“殘局解算器”。它可以分析游戲狀態并聚焦于第一套系統的注意力,使人工智能在比賽過程中也能進行學習。第三階段,Libratus會借助Brown,運用一個算法來識別出那些被玩家利用的機器玩法,然后從策略中剔除掉。

贏了人類又怎樣?

當然,人工智能程序Libratus在德撲贏了人類,還不止于會改變德州撲克發展歷程這么簡單。跟AlphaGo一樣,它很容易應用到其他領域,并且更加有效且快速地解決人類難題。

因為玩德州撲克需要推理能力和心理戰術,而這對于機器來說很難模仿。在圍棋界縱橫無敵的DeepMind AlphaGo本質上處理的還是完美信息博弈,無法處理德州撲克的不完美信息問題,更遑論使出詐唬(Bluffing)。

而Libratus的例子說明,AI在面臨不完全或誤導信息時,已經有進行推論的能力。現實世界中,不完美信息才是常態,各種看不見的隱藏信息產生了大量的不確定性,而德州撲克代表的就是這種類型的博弈。

所以在未來,Libratus這樣的AI,可以用于商業談判、網絡安全、醫療方案制定等領域。

而人工智能發展的終極目標,很可能會產生一個通用人工智能(AGI)。通用人工智能可以解決任何一個問題,而不是像Libratus或者AlphaGo這樣只能專注于撲克或者圍棋。想要實現AGI就得讓人工智能學會解決不確定性問題,這也是Libratus讓科技界、科學界興奮不已的最主要原因。

為何還要在中國掀起“人機大戰”?

不過,既然Libratus已經在正式比賽中戰勝了頂級職業玩家,為何還要專門來到中國掀起“人機大戰”?更何況德州撲克跟圍棋還不一樣,中國并非德撲的華山之巔。

新浪科技希望就此向創新工場咨詢,但對方并未對此作出回應。

不過新浪科技有可靠渠道和可信資料證明,把CMU的德撲程序Libratus帶進中國的,正是CMU的知名校友、現創新工場創始人:李開復。

值得一提的是,李開復還專門為“Libratus”取了中文名——冷撲大師。

新浪科技獨家獲悉的資料顯示,李開復作為發起人,將在海南舉辦一場“人機撲克華人巔峰表演賽”,人類代表方面將由前人人網高管、2016德州撲克賽冠軍,WSOP鏈獲得者杜悅領攜,取名“龍之隊”。與在匹茲堡進行的人機德撲大戰一樣,本次比賽也有專門獎金,總額200萬元。

至于為何是李開復和創新工場作為主辦方?有接近創新工場方面的人士向新浪科技分析稱,首先CMU是李開復的母校,也是CMU在中國最為知名的代表;其次創新工場主辦此事,可能還與其目前在人工智能領域的布局有關,去年年底,創新工場正式成立了創新工場人工智能工程院,并且希望進一步提升知名度攬獲更多的AI人才;值得一提的是,李開復是創投圈內知名的德撲選手,之前先后發起并參與了首屆投資界撲克賽和中國創投名人賽,甚至還吸引了娛樂明星汪峰等參加。

此外,新浪科技還獲悉,在此次人機撲克大賽期間,Libratus開發者卡內基 (CMU) 學教授也將同步來華進行交流。

有趣的是,在新浪科技獲悉的資料上,表演賽選手名單中包括李開復、沈南鵬、倪正東、吳世春、王小川、許朝軍等科技創投人士,也有許家印、朱曄等企業家,還包括王思聰、汪峰、和華少等娛樂圈焦點人物。

然而截至發稿前,創新工場方面并未對此發表回應和說明。

責編 盧祥勇

特別提醒:如果我們使用了您的圖片,請作者與本站聯系索取稿酬。如您不希望作品出現在本站,可聯系我們要求撤下您的作品。

新浪科技李根 3月24日下午消息,新浪科技今日獨家獲悉,卡耐基梅隆大學(CarnegieMellonUniversity,以下簡稱CMU)開發的德撲人工智能程序Libratus,將在4月來到中國,與中國德撲玩家進行德撲界的“人機大戰”。 新浪科技還獲悉,這款CMU開發的名為Libratus的德撲程序,將以“冷撲大師”的譯名挑戰中國德撲高手,而這場挑戰賽的發起者,正是CMU校友、創新工場創始人李開復。 新浪科技也就此向創新工場做了進一步求證,但對方表示不予置評。 Libratus曾碾壓人類高手贏200萬美元 實際上,Libratus并非初出茅廬的毛頭“程序”。在今年春節期間,Libratus就已經在賓夕法尼亞州匹茲堡的Rivers賭場,將4位人類職業玩家挑落馬下,并且奪走了共計176萬美元的獎金。 當時,美國東部時間1月30日,CMU開發的Libratus與四名人類職業玩家JasonLes、DongKim、DanielMcAulay和JimmyChou約戰賓夕法尼亞州匹茲堡的Rivers賭場,并在持續20天的比賽時間中,對玩12萬手,最后Libratus贏走了總數200萬美元獎金中的176萬美元。 值得注意的是,與Libratus對戰的都是德撲職業玩家中的高手。比如其中的DongKim,還在2年前在同一個賭場擊敗了這個人工智能的前身,但在這場為期二十天的比賽剛剛過半之時,Kim就直言:人類已經沒有真正獲勝的機會。 Libratus的這場人機大戰中的勝利,也迅速引發關注。即便在AlphaGo之后,AI擊敗人類已經不再是什么新聞,但人工智能在德州撲克上擊敗人類,這其中的難度和信息量不可小覷。 AI玩德撲為何難? 利用人工智能程序玩德撲,最大的難度在于“不完整信息博弈”。因為玩德州撲克需要推理能力,而這對于機器來說很難模仿。雖然人工智能在跳棋、象棋乃至圍棋比賽中,已經完勝人類對手,但無限注德州撲克是一個完全不同的情況。 此前據AI新媒體《量子位》報道,由于一些卡牌并沒有發出來,在德州撲克的對局里,任意時間,任何一個玩家,都只能觀察到一部分的情況。要贏,他們需要直覺:一種猜測其他玩家手上是什么牌的能力。而且還要考慮到對手每一種可能的打法,想得到理想的戰略非常困難。而 現實世界中,不完美信息才是常態,各種看不見的隱藏信息產生了大量的不確定性,而德州撲克代表的就是這種類型的博弈。在圍棋界縱橫無敵的AlphaGo,本質上處理的還是完美信息博弈,而AlphaGo無法處理德州撲克的問題,更遑論使出詐唬。 新浪科技則了解到,為了解決“不完整信息博弈”這種計算機難題,CMU的人工智能研究者們專注于信息集,通過同時思考未知和已知變量各種可能狀態的方式來進行預測,這需要強大的計算能力。 在計算能力方面,CMU主要依賴于BridgesSuperComputer超級計算機。每個牌局結束后的夜晚,匹茲堡市超級計算中心Bridges電腦執行計算,用以優化Libratus的策略。而在白天的比賽過程中,Bridges用于計算每一手的終結游戲策略,Bridges提供三種類型的計算選項,稱為節點:常規、大型和超大型。Bridges不是當今世界最大、最快、最強勁的超級計算機,但它可能是面向公眾開放的,最大、最快、最強勁的超級計算機,在Bridges的幫助下,原本在個人電腦上耗時數月的計算,僅僅幾個小時就搞定。 此外,在計算能力保障的基礎上,CMU在具體技術應用方面,用到了區別于AlphaGo的方法。CMU方面曾披露稱,Libratus沒有用到專業的牌局進行神經網絡的訓練,不同于AlphaGo用了大量的棋局做訓練,這個模型用的是隨機生成的牌局(隨機產生公共牌、底池籌碼、玩家拿牌概率)和嘗試性的動作帶來的結果(在隨機生成的輸入情況下模擬玩家跟牌后的結果)作為訓練數據。 Libratus還利用了博弈論,與AlphaGo不同,Libratus系統不通過分析大量可能的下一步完成任務,這個CMU構建的新系統通過平衡風險與收益來決定自己的下一步,在納什均衡定義中的完美游戲狀態。 最后,在具體操作上,Libratus分三步走。第一階段,Libratus通過名為反事實遺憾最小化(counterfactualregretminimization)的算法,在經過訓練之后獨立于人的玩法形成自己的策略。第二階段,第二個系統屬于一種“殘局解算器”。它可以分析游戲狀態并聚焦于第一套系統的注意力,使人工智能在比賽過程中也能進行學習。第三階段,Libratus會借助Brown,運用一個算法來識別出那些被玩家利用的機器玩法,然后從策略中剔除掉。 贏了人類又怎樣? 當然,人工智能程序Libratus在德撲贏了人類,還不止于會改變德州撲克發展歷程這么簡單。跟AlphaGo一樣,它很容易應用到其他領域,并且更加有效且快速地解決人類難題。 因為玩德州撲克需要推理能力和心理戰術,而這對于機器來說很難模仿。在圍棋界縱橫無敵的DeepMindAlphaGo本質上處理的還是完美信息博弈,無法處理德州撲克的不完美信息問題,更遑論使出詐唬(Bluffing)。 而Libratus的例子說明,AI在面臨不完全或誤導信息時,已經有進行推論的能力。現實世界中,不完美信息才是常態,各種看不見的隱藏信息產生了大量的不確定性,而德州撲克代表的就是這種類型的博弈。 所以在未來,Libratus這樣的AI,可以用于商業談判、網絡安全、醫療方案制定等領域。 而人工智能發展的終極目標,很可能會產生一個通用人工智能(AGI)。通用人工智能可以解決任何一個問題,而不是像Libratus或者AlphaGo這樣只能專注于撲克或者圍棋。想要實現AGI就得讓人工智能學會解決不確定性問題,這也是Libratus讓科技界、科學界興奮不已的最主要原因。 為何還要在中國掀起“人機大戰”? 不過,既然Libratus已經在正式比賽中戰勝了頂級職業玩家,為何還要專門來到中國掀起“人機大戰”?更何況德州撲克跟圍棋還不一樣,中國并非德撲的華山之巔。 新浪科技希望就此向創新工場咨詢,但對方并未對此作出回應。 不過新浪科技有可靠渠道和可信資料證明,把CMU的德撲程序Libratus帶進中國的,正是CMU的知名校友、現創新工場創始人:李開復。 值得一提的是,李開復還專門為“Libratus”取了中文名——冷撲大師。 新浪科技獨家獲悉的資料顯示,李開復作為發起人,將在海南舉辦一場“人機撲克華人巔峰表演賽”,人類代表方面將由前人人網高管、2016德州撲克賽冠軍,WSOP鏈獲得者杜悅領攜,取名“龍之隊”。與在匹茲堡進行的人機德撲大戰一樣,本次比賽也有專門獎金,總額200萬元。 至于為何是李開復和創新工場作為主辦方?有接近創新工場方面的人士向新浪科技分析稱,首先CMU是李開復的母校,也是CMU在中國最為知名的代表;其次創新工場主辦此事,可能還與其目前在人工智能領域的布局有關,去年年底,創新工場正式成立了創新工場人工智能工程院,并且希望進一步提升知名度攬獲更多的AI人才;值得一提的是,李開復是創投圈內知名的德撲選手,之前先后發起并參與了首屆投資界撲克賽和中國創投名人賽,甚至還吸引了娛樂明星汪峰等參加。 此外,新浪科技還獲悉,在此次人機撲克大賽期間,Libratus開發者卡內基(CMU)學教授也將同步來華進行交流。 有趣的是,在新浪科技獲悉的資料上,表演賽選手名單中包括李開復、沈南鵬、倪正東、吳世春、王小川、許朝軍等科技創投人士,也有許家印、朱曄等企業家,還包括王思聰、汪峰、和華少等娛樂圈焦點人物。 然而截至發稿前,創新工場方面并未對此發表回應和說明。
德州撲克 人工智能 冷撲大師 李開復

歡迎關注每日經濟新聞APP

每經經濟新聞官方APP

0

0

国产午夜精品理伦片,亚洲手机在线人成网站播放,欧美一级一级a做性视频,亚洲国产色精品三区二区一区
日韩A级亚洲A级欧美A级 | 午夜欧美精品久久 | 中文字幕乱偷顶级在线 | 色婷婷亚洲六月婷婷中文字幕 | 日韩欧美一区二区三区久久婷婷 | 亚洲中文字幕5g在线 |