跳到主要內容

心理學帶來曙光,DeepMind要像理解人一樣理解模型

心理學帶來曙光,DeepMind要像理解人一樣理解模型

 2018-02-25
前言:人類對各種深度學習模型最常見的不滿之一就是難以解釋、無法理解,即便可以查看訓練好的網絡的每個連接的權重,也說不清網絡利用的數據模式是哪些,以及網絡目前的運行狀況裏有哪些問題。
心理學帶來曙光,DeepMind要像理解人一樣理解模型
不過,人類從不懷疑自己可以理解另一個人類:我們可以通過各種方法瞭解並描述別人的訴求、觀念和當下的想法,可以推測別人知道哪些信息,可以猜測別人的未來行動,我們同時也就以此爲基礎考慮如何和別人互動。其實絕大多數情況下我們都不會嘗試重建別人的腦神經結構,不會嘗試估計別人的腦神經元的活動狀況如何、前額葉的連接性如何、海馬體的工作狀況如何。這時候我們所談的理解,就是對別人的心理狀況的高層次抽象,不再嘗試描述細碎的內部運行機理。這種注重於預測和計劃理解能力被稱爲「心智理論 Theory of Mind」。(注:心智理論,心理學術語,是一種能夠理解自己以及周圍人類的心理狀態的能力,這些心理狀態包括情緒、信仰、意圖、慾望、假裝與知識等)
在近期新發表的論文《Machine Theory of Mind》中,DeepMind 就以心智理論的視角重新研究瞭如何理解另一個模型的問題。他們的目標是讓環境中的觀察者在有限的數據下自動學習如何對新遇到的智能體建模——不是嘗試學出一個模仿的算法,而是學習如何像人理解人一樣地預測另一個智能體的行爲,甚至發現別的智能體的觀念和實際環境狀況之間的矛盾。他們把這種新理論稱爲「Machine Theory of Mind」(機器心智理論),爲此建立的模型稱爲 ToMnet。在 DeepMind 的研究人員們看來,這還可以是一種新的改進深度學習的可解釋性的方法,可以不用再像以往那樣嘗試設計能表述自己內在狀態的系統,而是作爲新的中轉系統、人機接口,縮小原系統的行爲空間大小,把難以理解的神經網絡以人類好理解的形式轉述出來。
DeepMind 的研究人員們把這個機器心智理論問題形式化爲一個元學習問題,讓觀察者智能體學習如何在環境中遇到一個新智能體之後收集數據對它進行建模,瞭解它的隱含特點和心理狀態,從而更好地預測它的未來行爲。
這個觀察者要學習的內容也需要分爲兩個層次,一個層次是基於網絡學習到的權重的總體理論,它是對訓練集中所有智能體的共有行爲的隱式描述;另一個層次是在測試階段觀察單個智能體,嘗試描述它獨有的特徵和心理狀態。而這兩個層次也就分別構成了對智能體行爲的先驗和後驗判斷。
心理學帶來曙光,DeepMind要像理解人一樣理解模型
ToMnet 架構:character net 從一組部分可觀察的馬爾可夫決策過程(POMDP)中解析一個智能體的過往行動軌跡,形成特徵嵌入 echar;mental state net 根據智能體當前的行爲解析出它當前的心理狀態嵌入 emental。這些嵌入會作爲 prediction net 的輸入,它查詢當前狀態之後形成對未來預測的三個輸出:下一步行動的可能性心理學帶來曙光,DeepMind要像理解人一樣理解模型,某個對象是否會被使用掉的可能性心理學帶來曙光,DeepMind要像理解人一樣理解模型,以及預測的後續的表徵心理學帶來曙光,DeepMind要像理解人一樣理解模型
在論文中,DeepMind 的研究人員們圍繞提出的 ToMnet 進行了一系列難度遞增的實驗,逐步介紹 ToMnet 的設計思路、展示它的應用典型的人類心理理論技巧對其它各種各樣的模型建模的能力。
  • 對於簡單、隨機的智能體,ToMnet 可以學到對智能體特點的最優層次化貝葉斯推理的近似;
  • 對於基於算法的智能體,ToMnet 可以通過小樣本反向強化學習找到它們的目標,以及理解它們如何在成本和反饋中找到平衡;
  • ToMnet 可以找到成羣的強化學習智能體之間的多種變量的關鍵值,從而把它們分爲不同的類別,並給智能體生成抽象嵌入。ToMnet 也可以給行爲空間生成新的抽象;
  • 用部分可觀察馬爾可夫決策過程中的深度強化學習智能體訓練的 ToMnet 可以隱式地發現這些智能體持有的對環境的錯誤觀念,而這正是人類的心理理論中的重要部分;
  • ToMnet 還可以訓練用於預測別的智能體的觀念狀態,顯式地揭露出別的智能體的錯誤觀念。DeepMind 的研究人員們還表明 ToMnet 僅僅根據別的智能體的行爲就可以能夠推知它們觀察到了哪些東西、接下來會傾向於相信什麼。
心理學帶來曙光,DeepMind要像理解人一樣理解模型
帶有子任務的環境,其中的智能體可能會抱有對環境的錯誤認識。
  • 圖 (a) :智能體尋找子目標(星星)的軌跡(紅色箭頭)。智能體只能觀察到環境的一部分:深灰色的區域還沒有觀察到,淺灰色的區域之前觀察過,但在獲得子目標之後就觀察不到了。
  • 圖 (b):當智能體獲得子目標後,所有其它的物體有一個很小的可能性會立即交換位置。(b) 左:交換髮生在智能體視野之內;(b) 右:交換髮生在智能體視野之外
  • 圖 (c):交換位置對智能體緊接着的策略產生的影響
  • 圖 (d):交換位置對智能體的經驗後續表徵產生的影響
DeepMind 的這一系列實驗內容還比較簡單,主要爲了展示這樣的系統的主要思路和能力。要拓展它的能力和領域、與人類共同評比還有很長的路要走。不過,這種思路對於人類這樣依賴社交性思考的人物確實有着重要意義。
未來 DeepMind 打算在其中繼續增加 ToMnet 需要做出的預測的數量、在建模其它智能體的行爲過程中加入輕微的總結偏倚,以及如何根據自己的經驗和認識把自己的模型告訴別的智能體。這些都是可能的多智能體合作研究中的重要課題。
另外值得一提的是,ICLR 2017 最佳論文獎得主之一的張馳原也是這篇論文的作者之一。

相關文章:

文章來源:雷鋒網

留言

這個網誌中的熱門文章

2017通訊大賽「聯發科技物聯網開發競賽」決賽團隊29強出爐!作品都在11月24日頒獎典禮進行展示

2017通訊大賽「聯發科技物聯網開發競賽」決賽團隊29強出爐!作品都在11月24日頒獎典禮進行展示 LIS   發表於 2017年11月16日 10:31   收藏此文 2017通訊大賽「聯發科技物聯網開發競賽」決賽於11月4日在台北文創大樓舉行,共有29個隊伍進入決賽,角逐最後的大獎,並於11月24日進行頒獎,現場會有全部進入決賽團隊的展示攤位,總計約為100個,各種創意作品琳琅滿目,非常值得一看,這次錯過就要等一年。 「聯發科技物聯網開發競賽」決賽持續一整天,每個團隊都有15分鐘面對評審團做簡報與展示,並接受評審們的詢問。在所有團隊完成簡報與展示後,主辦單位便統計所有評審的分數,並由評審們進行審慎的討論,決定冠亞季軍及其他各獎項得主,結果將於11月24日的「2017通訊大賽頒獎典禮暨成果展」現場公佈並頒獎。 在「2017通訊大賽頒獎典禮暨成果展」現場,所有入圍決賽的團隊會設置攤位,總計約為100個,展示他們辛苦研發並實作的作品,無論是想觀摩別人的成品、了解物聯網應用有那些新的創意、尋找投資標的、尋找人才、尋求合作機會或是單純有興趣,都很適合花點時間到現場看看。 頒獎典禮暨成果展資訊如下: 日期:2017年11月24日(星期五) 地點:中油大樓國光廳(台北市信義區松仁路3號) 我要報名參加「2017通訊大賽頒獎典禮暨成果展」>>> 在參加「2017通訊大賽頒獎典禮暨成果展」之前,可以先在本文觀看各團隊的作品介紹。 決賽29強團隊如下: 長者安全救星 可隨意描繪或書寫之電子筆記系統 微觀天下 體適能訓練管理裝置 肌少症之行走速率檢測系統 Sugar Robot 賽亞人的飛機維修輔助器 iTemp你的溫度個人化管家 語音行動冰箱 MR模擬飛行 智慧防盜自行車 跨平台X-Y視覺馬達控制 Ironmet 菸消雲散 無人小艇 (Mini-USV) 救OK-緊急救援小幫手 穿戴式長照輔助系統 應用於教育之模組機器人教具 這味兒很台味 Aquarium Hub 發展遲緩兒童之擴增實境學習系統 蚊房四寶 車輛相控陣列聲納環境偵測系統 戶外團隊運動管理裝置 懷舊治療數位桌曆 SeeM智能眼罩 觸...
opencv4nodejs Asynchronous OpenCV 3.x Binding for node.js   122     2715     414   0   0 Author Contributors Repository https://github.com/justadudewhohacks/opencv4nodejs Wiki Page https://github.com/justadudewhohacks/opencv4nodejs/wiki Last Commit Mar. 8, 2019 Created Aug. 20, 2017 opencv4nodejs           By its nature, JavaScript lacks the performance to implement Computer Vision tasks efficiently. Therefore this package brings the performance of the native OpenCV library to your Node.js application. This project targets OpenCV 3 and provides an asynchronous as well as an synchronous API. The ultimate goal of this project is to provide a comprehensive collection of Node.js bindings to the API of OpenCV and the OpenCV-contrib modules. An overview of available bindings can be found in the  API Documentation . Furthermore, contribution is highly appreciated....

完形心理學!?讓我們了解“介面設計師”為什麼這樣設計

完形心理學!?讓我們了解“介面設計師”為什麼這樣設計 — 說服客戶與老闆、跟工程師溝通、強化設計概念的有感心理學 — 情況 1 : 為何要留那麼多空白? 害我還要滾動滑鼠(掀桌) 情況 2 : 為什麼不能直接用一頁展現? 把客戶的需求塞滿不就完工啦! (無言) 情況 3: 這種設計好像不錯,但是為什麼要這樣做? (直覺大神告訴我這樣設計,但我說不出來為什麼..) 雖然世界上有許多 GUI 已經走得又長又遠又厲害,但別以為這種古代人對話不會出現,一直以來我們只是習慣這些 GUI 被如此呈現,但為何要這樣設計我們卻不一定知道。 由於 完形心理學 歸納出人類大腦認知之普遍性的規則,因此無論是不是 UI/UX 設計師都很適合閱讀本篇文章。但還是想特別強調,若任職於傳統科技公司,需要對上說服老闆,需要平行說服(資深)工程師,那請把它收進最愛;而習慣套用設計好的 UI 套件,但不知道為何這樣設計的 IT 工程師,也可以透過本文來強化自己的產品說服力。 那就開始吧~(擊掌) 完形心理學,又稱作格式塔(Gestalt)心理學,於二十世紀初由德國心理學家提出 — 用以說明人類大腦如何解釋肉眼所觀察到的事物,並轉化為我們所認知的物件。它可說是現代認知心理學的基礎,其貫徹的概念就是「整體大於個體的總合 “The whole is other than the sum of the parts.” —  Kurt Koffka」。 若深究完整的理論將會使本文變得非常的艱澀,因此筆者直接抽取個人認為與 UI 設計較為相關的 7 個原則(如下),並搭配實際案例做說明。有興趣了解全部理論的話可以另外 Google。 1. 相似性 (Similarity)  — 我們的大腦會把相似的事物看成一體 如果數個元素具有類似的尺寸、體積、顏色,使用者會自動為它們建立起關聯。這是因為我們的眼睛和大腦較容易將相似的事物組織在一起。如下圖所示,當一連串方塊和一連串的圓形並排時,我們會看成(a)一列方塊和兩列圓形(b)一排圓形和兩排三角形。 對應用到介面設計上,FB 每則文章下方的按鈕圖標(按讚 Like / 留言Comment / 分享 Share)雖然功能各不相同,但由於它們在視覺上顏色、大小、排列上的相似性,用戶會將它們視認為...