亚洲全黄无码一级在线看_国产剧情久久久性色_无码av一区二区三区无码_亚洲成a×人片在线观看

當前位置: 首頁 > 科技新聞 >

在 AI 戰(zhàn)勝電競選手后,美國開始提取腦電波訓練

時間:2020-02-07 13:15來源:網(wǎng)絡(luò)整理 瀏覽:
如同前陣子美軍使用無人機對伊朗的斬首行動證明現(xiàn)代戰(zhàn)爭即將進入無人時代一樣。美國在軍事技術(shù)和思想上,一直都走在世界的最前沿。日前,被稱為互聯(lián)網(wǎng)

如同前陣子美軍使用無人機對伊朗的斬首行動證明現(xiàn)代戰(zhàn)爭即將進入無人時代一樣。美國在軍事技術(shù)和思想上,一直都走在世界的最前沿。

日前,被稱為互聯(lián)網(wǎng)發(fā)源地的美國 DARPA(國防高級研究計劃局)已經(jīng)開始了關(guān)于 AI 在軍事決策領(lǐng)域的研究。

▲ 布法羅大學研究現(xiàn)場 圖片來自:digitaltrends

用策略游戲培訓 AI

通過外媒的報道,我們得知來自紐約布法羅大學人工智能學院的工程師已經(jīng)獲得了 DARPA 的資助。他們通過創(chuàng)造一個類似星際爭霸或者 Stellaris(群星)的游戲,并采集玩家在其中的大腦活動和反應,并用這些數(shù)據(jù)訓練 AI 。

▲ Deep Mind 決策過程

與 Alpha Go 下圍棋不同,類似星際爭霸的 RTS 游戲在策略和操作的復雜度上要更高,這類游戲需要玩家協(xié)調(diào)采集資源、建造建筑、選擇進攻策略,甚至還要操控每一個士兵的進行精細運動,而且這一切都是在擁有「戰(zhàn)爭迷霧」,也就是不完全信息的條件下進行的。

▲ 布法羅大學 圖片來自:digitaltrends

很顯然,此類游戲比起簡單的棋類策略,與真實的戰(zhàn)場環(huán)境更加接近。在這種信息不對稱的環(huán)境中訓練出來的 AI ,更容易在信息錯綜復雜的戰(zhàn)場中做出合理的判斷。

監(jiān)測腦波,向 AI 展示人類決策過程

可能有人要問,這和之前 Google 團隊針對星際爭霸 2 開發(fā)的 Deep Mind 有什么區(qū)別。與 Deep Mind 目的是獲得勝利不同。DARPA 想觀察人類在類似場景中的判斷和決策,并用機器學習算法進行梳理,訓練出可以相互協(xié)調(diào)的機器人。

▲ Deep Mind 眼中的游戲

為了達成這個目的,DARPA 要求所有在布法羅大學玩的新策略游戲的玩家佩戴檢測腦電圖(EEG)的頭盔。在觀察玩家在游戲中策略操作的同時,研究者可以對照腦電圖,觀察玩家在策略選擇時的大腦活動。

與此同時,研究人員還配置了特殊的超高速攝像頭用來追蹤玩家的眼球運動。配合游戲畫面,觀察人類在決策時的直覺反應。

為什么 DARPA 要做這樣的研究?

對于 DARPA 來說,他們并不想要一個只會執(zhí)行任務(wù)的機器人,他們需要一群機器人互相配合,自己根據(jù)當前掌握的信息進行規(guī)劃,并有策略的完成任務(wù)。

▲ DAPRA 想要組建空天一體的作戰(zhàn)能力 圖片來自:知乎

如果在策略執(zhí)行中遇到阻礙,也能適時改變策略。比如說在高度復雜的環(huán)境中(天氣、地理環(huán)境、敵我動態(tài))開展多達 250 個單位(空中與地面機器人)的任務(wù)協(xié)作。這時突然出現(xiàn)煙霧導致可見性喪失,AI 控制的機器人同樣能改變策略,繼續(xù)完成任務(wù)。

▲ 未來的無人機蜂群作戰(zhàn)

只有達到了這樣的水平,AI 在軍事領(lǐng)域的應用才能排上用處。

但從目前來看,當前的 AI 都是在相對確定的環(huán)境下訓練的,但真實環(huán)境往往是復雜而信息缺乏的。在這種環(huán)境中決策,AI 需要根據(jù)已知的信息進行推理。目前,AI 在這方面還處于新生狀態(tài)。

▲ 美軍微型無人機「蜂群」演示 圖片來自:美國國防部視頻截圖

這個研究的意義就是讓人類成為老師,在游戲中向 AI 展現(xiàn)人類長期演化而來的直覺,并通過監(jiān)測腦電波,向 AI 展示人類如何對接受的信息進行處理,從而讓 AI 產(chǎn)生上下文推理的能力,并最終學會總體策略的制定。

▲ 完成任務(wù)后「蜂群」繞圈飛行 圖片來自:美國國防部視頻截圖

我們知道,人類之所以在進化路上生存下來,就是因為人類不僅有個體決策,還有指導人類完成任務(wù)的總體策略。所以如果想要 AI 完成人類的工作,指導 AI 相互配合并制定總體決策就勢在必行。

結(jié)語

過去,機器是輔助人類工作的工具,必須由人來操控。

后來,人類為工具編好了執(zhí)行流程,讓工具可以按照流程自動工作。

現(xiàn)在,機器通過機器學習和神經(jīng)網(wǎng)絡(luò)算法,能夠執(zhí)行簡單的判斷和決策任務(wù)。

未來,人類將賦予機器群體策略能力,人類下達任務(wù)不再需要給每個機器具體任務(wù),我們只需要給定一個目標,AI 將會制定整體策略,并將任務(wù)分配給每一臺由獨立 AI 控制的機器,通過協(xié)作完成任務(wù)。

從總體來看,這是人類的一大技術(shù)進步。只是從歷史角度看,這種技術(shù)通常都會先用在軍事行動中。

還是那句老話:技術(shù)不分善惡,只在用途。如果這種技術(shù)成為現(xiàn)實,希望它永遠不要用于戰(zhàn)爭。

推薦內(nèi)容