今天,OpenAI宣布了一種新算法:“一次性模仿學習”。當一個人在虛擬現實中演示一次動作時,機器可以通過學習這個動作來執行相同的結果。
OpenAI是埃隆·馬斯克于2015年12月宣布的一個非營利人工智能項目,研究人員將與開源共享大部分研究成果。主要關注強化學習和無監督學習谷歌之前著名的圍棋程序AlphaGo使用強化學習;無監督學習需要機器處理大量未標記的數據,并找到自己的方法來區分不同的數據子集、聚類或相似的圖像,這有點像嬰兒學習世界的方式,一直被視為人工智能的真正潛在釋放點。
卷積神經網絡之父Yann LeCun有一個經典的比喻:如果人工智能是一塊蛋糕,那么強化學習就是蛋糕上的櫻桃,而監督學習是蛋糕上的一層糖霜,但無監督學習本身就是蛋糕。目前,我們只知道如何制作糖霜和櫻桃,但不知道如何制作蛋糕。
一次性模擬學習
OpenAI宣布的新算法“一次性模仿學習”意味著,當人類在VR中演示一次動作時,例如將一個藍色的小盒子堆疊在一個紅色的小盒子上,機器可以通過學習這個動作來執行相同的結果,并且無論桌面盒子的放置順序如何,機器都可以準確地執行。
該學習系統由兩個神經網絡組成:視覺網絡和模仿網絡。
通過視覺網絡獲得的圖像來自機器人的攝像頭。此前,這個視覺網絡是由數十萬張模擬圖像訓練的,每張圖像都有不同的紋理、光影效果等(但從未用真實圖像訓練過)。
模仿網絡必須生成與VR演示動作一致的執行步驟,并推斷任務的意圖,以便在初始設置發生變化時(例如當盒子放置順序出錯時)仍然可以找到藍色盒子并將其堆疊在紅色盒子上。
目前,學術界和工業界都在尋找訓練機器人的方法。例如,英偉達首席執行官黃仁勛在上周的GTC會議上宣布了一款名為ISAAC的增強型學習世界模擬器,創造了一個專門為訓練機器人而構建的完全虛擬的世界。
這是一個遵循物理定律但不遵循時間定律的世界。在現實生活中,如果你想訓練一臺機器學習打冰球,你應該把這個冰球放在機器前面,一遍又一遍地教它。在虛擬世界中,機器可以在一秒鐘內多次重復這個動作,你也可以訓練一堆機器同時學習打球,然后找到最聰明的機器,復制它的“大腦”程序,創建一堆相同的機器,繼續訓練和篩選。今天,OpenAI宣布了一種新算法:“一次性模仿學習”。當一個人在虛擬現實中演示一次動作時,機器可以通過學習這個動作來執行相同的結果。
OpenAI是埃隆·馬斯克于2015年12月宣布的一個非營利人工智能項目,研究人員將與開源共享大部分研究成果。主要關注強化學習和無監督學習谷歌之前著名的圍棋程序AlphaGo使用強化學習;
無監督學習需要機器處理大量未標記的數據,并找到自己的方法來區分不同的數據子集、聚類或相似的圖像,這有點像嬰兒學習世界的方式,一直被視為人工智能的真正潛在釋放點。
卷積神經網絡之父Yann LeCun有一個經典的比喻:如果人工智能是一塊蛋糕,那么強化學習就是蛋糕上的櫻桃,而監督學習是蛋糕上的一層糖霜,但無監督學習本身就是蛋糕。目前,我們只知道如何制作糖霜和櫻桃,但不知道如何制作蛋糕。
一次性模擬學習
OpenAI宣布的新算法“一次性模仿學習”意味著,當人類在VR中演示一次動作時,例如將一個藍色的小盒子堆疊在一個紅色的小盒子上,機器可以通過學習這個動作來執行相同的結果,并且無論桌面盒子的放置順序如何,機器都可以準確地執行。
該學習系統由兩個神經網絡組成:視覺網絡和模仿網絡。
通過視覺網絡獲得的圖像來自機器人的攝像頭。此前,這個視覺網絡是由數十萬張模擬圖像訓練的,每張圖像都有不同的紋理、光影效果等(但從未用真實圖像訓練過)。
模仿網絡必須生成與VR演示動作一致的執行步驟,并推斷任務的意圖,以便在初始設置發生變化時(例如當盒子放置順序出錯時)仍然可以找到藍色盒子并將其堆疊在紅色盒子上。
目前,學術界和工業界都在尋找訓練機器人的方法。例如,英偉達首席執行官黃仁勛在上周的GTC會議上宣布了一款名為ISAAC的增強型學習世界模擬器,創造了一個專門為訓練機器人而構建的完全虛擬的世界。
這是一個遵循物理定律但不遵循時間定律的世界。在現實生活中,如果你想訓練一臺機器學習打冰球,你應該把這個冰球放在機器前面,一遍又一遍地教它。在虛擬世界中,機器可以在一秒鐘內多次重復這個動作,你也可以訓練一堆機器同時學習打球,然后找到最聰明的機器,復制它的“大腦”程序,創建一堆相同的機器,繼續訓練和篩選。
標簽:
還想通過新能源汽車取國家補貼?專家組的眼睛里可不容沙子。5月17日,工信部網站發布了“關于2016年度新能源汽車推廣應用補助資金初步審核情況的公示”以下簡稱公示。
1900/1/1 0:00:001、科技部:高比能量動力電池獲階段性進展,單體能量密度達302Whkg閱讀原文5月19日科技部獲悉,在國家重點研發計劃“新能源汽車”重點專項的支持下,
1900/1/1 0:00:00堅瑞沃能5月17日晚公告稱,全資子公司深圳市沃特瑪電池有限公司近日與成都大運汽車簽署銷售合同,擬向后者銷售磷酸鐵鋰電池組15萬組,合同金額2862億元。
1900/1/1 0:00:00最近,博世在上海召開了2017新聞發布會,公布了其2016年財報情況、其各業務板塊的發展情況、投資及合作,以及創享互聯的未來戰略方向。
1900/1/1 0:00:00本田在本田技術研究所汽車研發中心舉辦“2015HondaMeeting”,向新聞媒體介紹了正在開發的新技術。
1900/1/1 0:00:00日前,有海外媒體報道,MINI計劃推出一款全新的純電動車型,并且這款新車也將符合中國的相關法規。據悉,該車將定位緊湊型車,并有望于2019年亮相。
1900/1/1 0:00:00