跳到主要內容

心理學帶來曙光,DeepMind要像理解人一樣理解模型

心理學帶來曙光,DeepMind要像理解人一樣理解模型

 2018-02-25
前言:人類對各種深度學習模型最常見的不滿之一就是難以解釋、無法理解,即便可以查看訓練好的網絡的每個連接的權重,也說不清網絡利用的數據模式是哪些,以及網絡目前的運行狀況裏有哪些問題。
心理學帶來曙光,DeepMind要像理解人一樣理解模型
不過,人類從不懷疑自己可以理解另一個人類:我們可以通過各種方法瞭解並描述別人的訴求、觀念和當下的想法,可以推測別人知道哪些信息,可以猜測別人的未來行動,我們同時也就以此爲基礎考慮如何和別人互動。其實絕大多數情況下我們都不會嘗試重建別人的腦神經結構,不會嘗試估計別人的腦神經元的活動狀況如何、前額葉的連接性如何、海馬體的工作狀況如何。這時候我們所談的理解,就是對別人的心理狀況的高層次抽象,不再嘗試描述細碎的內部運行機理。這種注重於預測和計劃理解能力被稱爲「心智理論 Theory of Mind」。(注:心智理論,心理學術語,是一種能夠理解自己以及周圍人類的心理狀態的能力,這些心理狀態包括情緒、信仰、意圖、慾望、假裝與知識等)
在近期新發表的論文《Machine Theory of Mind》中,DeepMind 就以心智理論的視角重新研究瞭如何理解另一個模型的問題。他們的目標是讓環境中的觀察者在有限的數據下自動學習如何對新遇到的智能體建模——不是嘗試學出一個模仿的算法,而是學習如何像人理解人一樣地預測另一個智能體的行爲,甚至發現別的智能體的觀念和實際環境狀況之間的矛盾。他們把這種新理論稱爲「Machine Theory of Mind」(機器心智理論),爲此建立的模型稱爲 ToMnet。在 DeepMind 的研究人員們看來,這還可以是一種新的改進深度學習的可解釋性的方法,可以不用再像以往那樣嘗試設計能表述自己內在狀態的系統,而是作爲新的中轉系統、人機接口,縮小原系統的行爲空間大小,把難以理解的神經網絡以人類好理解的形式轉述出來。
DeepMind 的研究人員們把這個機器心智理論問題形式化爲一個元學習問題,讓觀察者智能體學習如何在環境中遇到一個新智能體之後收集數據對它進行建模,瞭解它的隱含特點和心理狀態,從而更好地預測它的未來行爲。
這個觀察者要學習的內容也需要分爲兩個層次,一個層次是基於網絡學習到的權重的總體理論,它是對訓練集中所有智能體的共有行爲的隱式描述;另一個層次是在測試階段觀察單個智能體,嘗試描述它獨有的特徵和心理狀態。而這兩個層次也就分別構成了對智能體行爲的先驗和後驗判斷。
心理學帶來曙光,DeepMind要像理解人一樣理解模型
ToMnet 架構:character net 從一組部分可觀察的馬爾可夫決策過程(POMDP)中解析一個智能體的過往行動軌跡,形成特徵嵌入 echar;mental state net 根據智能體當前的行爲解析出它當前的心理狀態嵌入 emental。這些嵌入會作爲 prediction net 的輸入,它查詢當前狀態之後形成對未來預測的三個輸出:下一步行動的可能性心理學帶來曙光,DeepMind要像理解人一樣理解模型,某個對象是否會被使用掉的可能性心理學帶來曙光,DeepMind要像理解人一樣理解模型,以及預測的後續的表徵心理學帶來曙光,DeepMind要像理解人一樣理解模型
在論文中,DeepMind 的研究人員們圍繞提出的 ToMnet 進行了一系列難度遞增的實驗,逐步介紹 ToMnet 的設計思路、展示它的應用典型的人類心理理論技巧對其它各種各樣的模型建模的能力。
  • 對於簡單、隨機的智能體,ToMnet 可以學到對智能體特點的最優層次化貝葉斯推理的近似;
  • 對於基於算法的智能體,ToMnet 可以通過小樣本反向強化學習找到它們的目標,以及理解它們如何在成本和反饋中找到平衡;
  • ToMnet 可以找到成羣的強化學習智能體之間的多種變量的關鍵值,從而把它們分爲不同的類別,並給智能體生成抽象嵌入。ToMnet 也可以給行爲空間生成新的抽象;
  • 用部分可觀察馬爾可夫決策過程中的深度強化學習智能體訓練的 ToMnet 可以隱式地發現這些智能體持有的對環境的錯誤觀念,而這正是人類的心理理論中的重要部分;
  • ToMnet 還可以訓練用於預測別的智能體的觀念狀態,顯式地揭露出別的智能體的錯誤觀念。DeepMind 的研究人員們還表明 ToMnet 僅僅根據別的智能體的行爲就可以能夠推知它們觀察到了哪些東西、接下來會傾向於相信什麼。
心理學帶來曙光,DeepMind要像理解人一樣理解模型
帶有子任務的環境,其中的智能體可能會抱有對環境的錯誤認識。
  • 圖 (a) :智能體尋找子目標(星星)的軌跡(紅色箭頭)。智能體只能觀察到環境的一部分:深灰色的區域還沒有觀察到,淺灰色的區域之前觀察過,但在獲得子目標之後就觀察不到了。
  • 圖 (b):當智能體獲得子目標後,所有其它的物體有一個很小的可能性會立即交換位置。(b) 左:交換髮生在智能體視野之內;(b) 右:交換髮生在智能體視野之外
  • 圖 (c):交換位置對智能體緊接着的策略產生的影響
  • 圖 (d):交換位置對智能體的經驗後續表徵產生的影響
DeepMind 的這一系列實驗內容還比較簡單,主要爲了展示這樣的系統的主要思路和能力。要拓展它的能力和領域、與人類共同評比還有很長的路要走。不過,這種思路對於人類這樣依賴社交性思考的人物確實有着重要意義。
未來 DeepMind 打算在其中繼續增加 ToMnet 需要做出的預測的數量、在建模其它智能體的行爲過程中加入輕微的總結偏倚,以及如何根據自己的經驗和認識把自己的模型告訴別的智能體。這些都是可能的多智能體合作研究中的重要課題。
另外值得一提的是,ICLR 2017 最佳論文獎得主之一的張馳原也是這篇論文的作者之一。

相關文章:

文章來源:雷鋒網

留言

這個網誌中的熱門文章

2017通訊大賽「聯發科技物聯網開發競賽」決賽團隊29強出爐!作品都在11月24日頒獎典禮進行展示

2017通訊大賽「聯發科技物聯網開發競賽」決賽團隊29強出爐!作品都在11月24日頒獎典禮進行展示 LIS   發表於 2017年11月16日 10:31   收藏此文 2017通訊大賽「聯發科技物聯網開發競賽」決賽於11月4日在台北文創大樓舉行,共有29個隊伍進入決賽,角逐最後的大獎,並於11月24日進行頒獎,現場會有全部進入決賽團隊的展示攤位,總計約為100個,各種創意作品琳琅滿目,非常值得一看,這次錯過就要等一年。 「聯發科技物聯網開發競賽」決賽持續一整天,每個團隊都有15分鐘面對評審團做簡報與展示,並接受評審們的詢問。在所有團隊完成簡報與展示後,主辦單位便統計所有評審的分數,並由評審們進行審慎的討論,決定冠亞季軍及其他各獎項得主,結果將於11月24日的「2017通訊大賽頒獎典禮暨成果展」現場公佈並頒獎。 在「2017通訊大賽頒獎典禮暨成果展」現場,所有入圍決賽的團隊會設置攤位,總計約為100個,展示他們辛苦研發並實作的作品,無論是想觀摩別人的成品、了解物聯網應用有那些新的創意、尋找投資標的、尋找人才、尋求合作機會或是單純有興趣,都很適合花點時間到現場看看。 頒獎典禮暨成果展資訊如下: 日期:2017年11月24日(星期五) 地點:中油大樓國光廳(台北市信義區松仁路3號) 我要報名參加「2017通訊大賽頒獎典禮暨成果展」>>> 在參加「2017通訊大賽頒獎典禮暨成果展」之前,可以先在本文觀看各團隊的作品介紹。 決賽29強團隊如下: 長者安全救星 可隨意描繪或書寫之電子筆記系統 微觀天下 體適能訓練管理裝置 肌少症之行走速率檢測系統 Sugar Robot 賽亞人的飛機維修輔助器 iTemp你的溫度個人化管家 語音行動冰箱 MR模擬飛行 智慧防盜自行車 跨平台X-Y視覺馬達控制 Ironmet 菸消雲散 無人小艇 (Mini-USV) 救OK-緊急救援小幫手 穿戴式長照輔助系統 應用於教育之模組機器人教具 這味兒很台味 Aquarium Hub 發展遲緩兒童之擴增實境學習系統 蚊房四寶 車輛相控陣列聲納環境偵測系統 戶外團隊運動管理裝置 懷舊治療數位桌曆 SeeM智能眼罩 觸...
opencv4nodejs Asynchronous OpenCV 3.x Binding for node.js   122     2715     414   0   0 Author Contributors Repository https://github.com/justadudewhohacks/opencv4nodejs Wiki Page https://github.com/justadudewhohacks/opencv4nodejs/wiki Last Commit Mar. 8, 2019 Created Aug. 20, 2017 opencv4nodejs           By its nature, JavaScript lacks the performance to implement Computer Vision tasks efficiently. Therefore this package brings the performance of the native OpenCV library to your Node.js application. This project targets OpenCV 3 and provides an asynchronous as well as an synchronous API. The ultimate goal of this project is to provide a comprehensive collection of Node.js bindings to the API of OpenCV and the OpenCV-contrib modules. An overview of available bindings can be found in the  API Documentation . Furthermore, contribution is highly appreciated....
2019全台精選3+個燈會,週邊順遊景點懶人包 2019燈會要去哪裡看?全台精選3+個燈會介紹、週邊順遊景點整理給你。 東港小鎮燈區-鮪鮪到來。 2019-02-15 微笑台灣編輯室 全台灣 各縣市政府 1435 延伸閱讀 ►  元宵節不只看燈會!全台元宵祭典精選、順遊景點整理 [屏東]2019台灣燈會在屏東 2/9-3/3:屏東市 · 東港鎮 · 大鵬灣國家風景區 台灣燈會自1990年起開始辦理,至2019年邁入第30週年,也是首次在屏東舉辦,屏東縣政府與交通部觀光局導入創新、科技元素,融入在地特色文化設計,在東港大鵬灣國家風景區打造廣闊的海洋灣域燈區,東港鎮結合漁港及宗教文化的小鎮燈區,及屏東市綿延近5公里長的綵燈節河岸燈區,讓屏東成為璀璨的光之南國,迎向國際。 詳細介紹 ►  2019台灣燈會在屏東 第一次移師國境之南 大鵬灣燈區 主題樂園式燈會也是主燈所在區,區內分為農業海洋燈區、客家燈區、原住民燈區、綠能環保燈區、藝術燈區、宗教燈區、競賽花燈及317個社區關懷據點手作的萬歲光廊等。 客家燈籠隧道。 平日:周一~周四14:00-22:30(熄燈) 假日:周五~周六10:00-22:30(熄燈)  屏東燈區: 萬年溪畔 屏東綵燈節藍區-生態。 綵燈節--每日17:30 - 22:00(熄燈) 勝利星村--平日:14:00 - 22:30(熄燈) 假日:10:00 - 22:30(熄燈) 燈區以「彩虹」為主題,沿著蜿蜒市區的萬年溪打造近5公里長的光之流域,50組水上、音樂及互動科技等不同類型燈飾,呈現紅色熱情、橙色活力、黃色甜美、綠色雄偉、藍色壯闊、靛色神祕、紫色華麗等屏東風情。勝利星村另有懷舊風的燈飾,及屏東公園聖誕節燈飾。 東港小鎮燈區 東港小鎮燈區-鮪鮪到來。 小鎮燈區以海的屏東為主題,用漁港風情及宗教文化內涵規劃4個主題區,分別為張燈結綵趣、東津好風情、神遊幸福海、延平老街區。每日17:00~22:30(熄燈) 以上台灣燈會資料來源: 2019台灣燈會官網 、 i屏東~愛屏東 。 >> 順遊行程 小吃旅行-東港小鎮 東港小吃和東港人一樣,熱情澎湃...