国产成人一区二区三区久久精品 , 如果爱有天意在线观看免费完整版 , 香港战役电影完整版在线看未删减 , 夺冠电影在线观看完整版1080,国产少妇国语对白污,国产最新视频,久久色网站

每日經(jīng)濟新聞
推薦

每經(jīng)網(wǎng)首頁 > 推薦 > 正文

阿爾法狗的“弟弟”出道:人類1:10慘敗,5分鐘崩盤!

每日經(jīng)濟新聞 2019-01-25 14:21:11

僅僅5分鐘,谷歌旗下的人工智能公司DeepMind開發(fā)的全新AI程序AlphaStar就讓《星際爭霸2》職業(yè)選手MaNa投降。“AlphaStar在每局游戲中采用的操作和不同策略令人印象十分深刻,近乎人類選手般的游戲策略出乎我的意料,”職業(yè)選手MaNa說,“我們很期待未來的無限可能?!?/p>

每經(jīng)記者|謝陶    每經(jīng)編輯|李凈翰    

圖片來源:DeepMind博客

繼圍棋之后,強大的人工智能(AI)在北京時間25日凌晨再次震撼世界:

僅僅5分鐘,谷歌旗下的人工智能公司DeepMind開發(fā)的全新AI程序AlphaStar就讓《星際爭霸2》(以下簡稱星際2)職業(yè)選手MaNa投降。

DeepMind當天公布的錄像顯示,去年12月,AlphaStar分別以5-0戰(zhàn)勝星際2的兩位職業(yè)選手TLO和MaNa,成為第一個打敗電競職業(yè)選手的人工智能。在比賽之前,AlphaStar的訓練量,相當于打了200年的星際2。

但在之后的現(xiàn)場比賽中,MaNa因為發(fā)現(xiàn)了AI操作上的缺陷,才成功為人類扳回一局。這同樣也創(chuàng)造了歷史——AlphaStar首次成為職業(yè)選手的手下敗將。

每日經(jīng)濟新聞(微信號:nbdnews)記者注意到,盡管10戰(zhàn)連敗,人類職業(yè)高手仍然對AlphaStar不吝稱贊。

“AlphaStar在每局游戲中采用的操作和不同策略令人印象十分深刻,近乎人類選手般的游戲策略出乎我的意料,”MaNa說,“我這才意識到,自己之前的策略過分依賴對手失誤和人類的反應力,因此這場比賽讓我對游戲有了全新的認識。我們很期待未來的無限可能。”

而TLO的說法跟李世石輸給AlphaGo后很像。他說:相信我,和AlphaStar比賽很難。不像和人在打,有種手足無措的感覺。他還說,每局比賽都是完全不一樣的套路。

賽后,DeepMind在其官方博客上表示, 實現(xiàn)最高水平的星際2對弈代表了人工智能在有史以來最復雜電子游戲中取得的重大突破。AlphaStar背后的技術可以用來解決其他的問題, 比如天氣預報、氣候建模、語言理解等。

讓AI玩星際爭霸有多難?

暴雪出品的星際2近年來已被公認為AI研究的“大挑戰(zhàn)(grand challenge)”。與下圍棋相比,星際2可難得多——在圍棋世界,動作空間只有361種,而星際2大約是10的26次方。

DeepMind也在其官方博客上解釋了人工智能玩星際2的難點:

游戲理論:星際2是個游戲,就想剪刀石頭布一樣,沒有單一最佳戰(zhàn)略。因此人工智能訓練過程中需不斷探索和擴展最戰(zhàn)略知識前沿。

瑕疵信息:不同于國際象棋或圍棋那種一覽無余的狀態(tài),星際玩家無法直接觀察到重要信息,必須積極探索“探路”。

長期規(guī)劃:和許多現(xiàn)實世界中的問題并非是從“因”立即生“果”一樣,游戲是可以從任何一個地方開始,需要1個小時時間出結果,這意味著在游戲開始時的行動可能在很長一段時間不會有收效。

即時性:不像傳統(tǒng)桌面游戲,玩家輪流行動,星際玩家必須在游戲時間內(nèi)持續(xù)排兵布陣。

龐大的行動空間:要同時控制上百個單位及建筑,這就導致了大量的可能性,行動是分級別的,可以被修改和擴張。我們將游戲參數(shù)化后,每個時間步驟平均約有10到26個合理行為。

AlphaStar是如何做到跟星際2職業(yè)選手對戰(zhàn)的呢?

DeepMind表示,對決時,AlphaStar借助原始界面與星際2游戲引擎交流,也就是說,它可以直接觀察地圖上的我方單位和敵方可見單位,不需要移動攝像頭。如果是人類玩家,注意力有限,必須調整攝像頭,讓它瞄準應該關注的地方。分析AlphaStar游戲能發(fā)現(xiàn),它有一個隱藏的注意力焦點。平均來說,游戲代理每分鐘會切換環(huán)境約30次,和MaNa、TLO的頻率差不多。

AlphaStar玩星際2的過程(圖片來源:DeepMind博客)

事實證明,AlphaStar與MaNa和TLO對決時之所以占據(jù)上風,主要是因為它的宏觀戰(zhàn)略、微觀戰(zhàn)略決策能力更強,靠的并不是超級點擊率、超快響應時間。

AlphaStar在APM和延遲方面與人類玩家的比較(圖片來源:DeepMind博客)

DeepMind還表示,團隊的一些訓練方法或可有助于研究開發(fā)安全穩(wěn)定的人工智能。人工智能的一大挑戰(zhàn)是,系統(tǒng)出錯的方式各種各樣。先前,星際2的職業(yè)玩家可以通過各種新穎方式誘導代理失誤,輕易擊敗AI系統(tǒng)。AlphaStar采用的基于league模式的創(chuàng)新訓練方式,可以找到最可靠、最不容易出錯的方式。這一創(chuàng)新方式對改進整體AI系統(tǒng)(尤其是在諸如能源等安全至上、且解決復雜邊緣案例十分關鍵的領域)的安全性和穩(wěn)定性的前景亦值得期待。

DeepMind去年虧損27億元

DeepMind取得的成績,是大把大把的鈔票“燒”出來的。

2018年10月,DeepMind在英國“工商局”CompaniesHouse上公布的財務報告顯示,DeepMind在上一個財年(2017年)虧損了3.02億英鎊,相當于人民幣27億元,相比去年同期9395萬英鎊的虧損額,增長了221%。

DeepMind的賺錢能力并未同步增加。財報顯示,DeepMind 2017年的營業(yè)收入僅為5442萬英鎊,相比2016年的4028萬英鎊,只增長了35%。

據(jù)Business Insider透露,DeepMind的收入全部來自于其為母公司谷歌旗下部門所提供的服務,而非外部客戶,比如用人工智能幫谷歌其它部門提高效率等,DeepMind和英國NHS合作的醫(yī)療業(yè)務還沒賺錢。

DeepMind之所以遭受巨額虧損,除了營收不振之外,主要是因為員工成本和相關支出(staff costs and other related costs)這個名目,僅這一項支出就高達2.01億英鎊,占到全年總虧損的三分之二。

據(jù)英國招聘網(wǎng)站e Financial Careers估算,已知DeepMind一共700名員工,其中400個博士,可以大致折算出DeepMind員工平均年收入:約為28萬英鎊,折合人民幣超過250萬元。

對于大規(guī)模虧損可能帶來的質疑,DeepMind也在報告中透露,其母公司谷歌會在未來12個月內(nèi),繼續(xù)向他們提供充足的資金,去招募人工智能人才。

燒了這么多錢的DeepMind對谷歌有何意義?

每日經(jīng)濟新聞(微信號:nbdnews)記者注意到, 《經(jīng)濟學人》曾寫過一篇文章討論此事:

首先就是品牌,DeepMind一直走在人工智能的最前沿,圍棋事件更被認為是新一輪人工智能發(fā)展的里程碑。這一品牌效應幫助谷歌吸引到了最頂級的AI人才,同時也讓投資方對谷歌AI的研究實力有了更多的信心。

其次是技術合作和應用。谷歌可以直接將DeepMind的技術加入到旗下產(chǎn)品中,并快速向全球消費者輸出。最新的案例是,DeepMind的語音合成系統(tǒng)WaveNet的升級版本正被用于在各個平臺上生成谷歌語音助手(Google Assistant)的聲音。

此外,DeepMind此前也宣布,通過使用其最新的算法,為谷歌數(shù)據(jù)中心節(jié)能了15%——這相當于節(jié)省了數(shù)百萬美元的開銷。

而Deepmind可以稱得上是英美合作案例,結合了英國的研究實力和美國的資本與市場;也可以說是英國人燒美國人的錢做研究,最后共享成果。

如需轉載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

人工智能 星際爭霸

歡迎關注每日經(jīng)濟新聞APP

每經(jīng)經(jīng)濟新聞官方APP

0

0