面對繁重的識記任務時,你是否有想象過擁有一個能干的AI幫手替你學習?心想:若是能像AI一樣,就要沖這鋪天蓋地的學習任務輕輕一笑,然后瞬間掌握、過目不忘?墒菍嶋H上,人工智能也正面對著 “這邊學,那邊忘”噩夢,這一現(xiàn)象還有個聽起來就透著幾分窒息的名字——“災難性遺忘”。
近日,來自谷歌大腦的最新研究發(fā)現(xiàn),在街機學習環(huán)境的由多個子任務組成的單任務場景中也存在著“災難性遺忘”。特別像在蒙特祖瑪?shù)膹统疬@種探索型游戲里,場景變化較大,也會出現(xiàn)學習完當前游戲場景后,忘記上一個游戲場景知識的情況。
人工智能為什么會產(chǎn)生“災難性遺忘”?目前,解決災難性遺忘的方案有哪些?難點在哪?來看看專家怎么說!
學一個忘一個,深度學習效率低下
自從阿爾法狗相繼戰(zhàn)勝多名圍棋冠軍后,深度強化學習成為人工智能領域最耀眼的“明星”,也是各大研發(fā)機構角逐的主戰(zhàn)場。而谷歌大腦團隊這次面臨的“災難性遺忘”,正是人工智能深度學習中一個普遍且嚴重的問題。
“‘災難性遺忘’指的是人工智能系統(tǒng),如深度學習模型,在學習新任務或適應新環(huán)境時,忘記或喪失了以前習得的一些能力。”騰訊人工智能實驗室副主任俞棟博士在接受記者采訪時說,“災難性遺忘”會造成人工智能系統(tǒng)在原有任務或環(huán)境性能大幅下降。
因此,“災難性遺忘”的存在,一定程度上限制了人工智能在一些場景中的應用。
福州大學數(shù)學與計算機科學學院、福建省新媒體行業(yè)技術開發(fā)基地副主任柯逍博士舉例說,如一個AI圖像識別系統(tǒng),當需要添加一個新的類別的物體時,就不得不把原先的所有物體都再學習一次;或在文物鑒定系統(tǒng)中,當有一天發(fā)現(xiàn)原始數(shù)據(jù)中有一個文物朝代錯了,同樣沒辦法單獨對這一個錯誤的文物進行修改學習;再如,讓AI系統(tǒng)學習英語之后,再讓它學習德語,它可能會把原來學習的英語語法全部忘光。
而在谷歌大腦的最新研究的游戲場景中,“災難性遺忘”又造成了哪些影響?有何新穎的發(fā)現(xiàn)?
“除了傳統(tǒng)新知識學習會覆蓋舊知識之外,谷歌大腦還發(fā)現(xiàn),在如超級瑪麗等探索型游戲里,‘災難性遺忘’會阻礙模型對新知識的學習!睆B門大學人工智能系、科技處副處長紀榮嶸教授說。
紀榮嶸進一步解釋說,面向街機游戲學習的強化學習方法都會采用“經(jīng)驗回放”的訓練方式,就是將模型在游戲探索時候的片段進行保存,然后給模型進行“回放”訓練。而像蒙特祖瑪復仇這種游戲,游戲場景變化比較大,模型需要不間斷探索游戲場景,因此,在訓練時候就必須不斷回放早期場景的游戲經(jīng)驗,不然會因為“災難性遺忘”而忘記了早期的游戲知識。
“這也導致了,新的游戲經(jīng)驗雖然能夠被采樣到“經(jīng)驗回放”庫里,但因為學習方式的設定,導致學習效率低,同時由于不同階段的學習會互相干擾,使得AI無法一次通過該游戲的全部關卡!奔o榮嶸說。
AI“腦容量”存上限,新舊知識難共存
AI為什么會產(chǎn)生“災難性遺忘”?
“深度學習的結構一旦確定,在訓練過程中很難調(diào)整。神經(jīng)網(wǎng)絡的結構直接決定學習模型的容量!笨洛姓f,AI“腦容量”存在上限,也就導致了人工智能只能有限地處理特定任務。就像水桶一半高的地方有個洞,以至于無論怎么增加水桶的高度,這個水桶只能裝一半高的水。
中科院自動化所腦網(wǎng)絡組研究中心研究員、模式識別國家重點實驗室副主任余山指出,這還涉及到神經(jīng)網(wǎng)絡學習知識的機制。在單個任務的訓練過程中,網(wǎng)絡中各個神經(jīng)元之間的連接權重進行了專門的調(diào)整,以勝任當前的任務。而在新任務的訓練中,連接權重要針對新任務進行調(diào)整,這將“抹去”適應舊任務的原有結構,導致在舊任務上的性能大大下降。
人類的記憶能力其實是有限的,但為何出現(xiàn)“災難性遺忘”情況卻比較?“主要是人類在學習過程當中,大腦能夠主動保留些有用的知識和技巧,同時不影響新的信息獲取。” 紀榮嶸說,但現(xiàn)在的人工智能模型大部分是基于隨機梯度下降來更新模型參數(shù),這個過程主要服務于當前任務的優(yōu)化,并不會去評估哪些參數(shù)權重對舊的知識是有用的,所以就很容易出現(xiàn)知識被覆蓋的情況。
紀榮嶸也表示,當前像Siri或小愛這樣的人工智能助手產(chǎn)品,還不能算真正意義上的通用人工智能,一方面,這些人工智能助手只能在預設的知識范圍內(nèi)和人類互動,完成指令;另一方面,人類沒辦法像養(yǎng)寵物或養(yǎng)小孩一樣,通過互動去教導這些人工智能助手學習新的知識或新的指令。
解決之策有哪些?
據(jù)了解,“破解災難性遺忘”是實現(xiàn)通用人工智能的一個關鍵。解決了“災難性遺忘”問題后,模型就能具備持續(xù)學習的能力, 可以像人類一樣不斷獲取新的知識、新的技能,同時能夠最大化地保持舊的經(jīng)驗知識和技巧。
那么,目前解決“災難性遺忘”的方案有哪些?
“最常見的方式是多任務學習, 就是把所有任務的訓練數(shù)據(jù)同時放到一起,模型就可以針對多種任務進行聯(lián)合優(yōu)化!奔o榮嶸舉例說,如讓模型同時學習坦克大戰(zhàn)和超級瑪麗兩個任務,等兩個任務同時學的差不多的時候,模型才停止訓練。
但柯逍也指出,這種方式隨著任務增多,新任務樣本數(shù)量被稀釋,訓練會拖慢學習新知識的效率,并且,不是任何情況都能獲得先前任務的數(shù)據(jù)來復習的。
還有的解決方案是根據(jù)新的任務知識來擴充模型結構,保證舊的知識經(jīng)驗不被損害。此次,谷歌大腦所提出的“記憶碎片觀察”方法正是對不同任務(場景)構建多個人工智能模型來進行學習!澳P蛿U充的方式從本質(zhì)上并沒有解決災難性遺忘的問題,只是用多個模型來替代單個模型去學習多種任務,避免舊參數(shù)被覆蓋!奔o榮嶸說。
當前,解決災難性遺忘還存在著一對矛盾:在學習新任務的過程中,需要給予網(wǎng)絡足夠多的自由度進行連接權重調(diào)整,但是又要避免這樣的調(diào)整“抹去”原有的記憶。
“因此,科學家們開始設計新的學習算法解決上述矛盾,使得網(wǎng)絡在進行權重調(diào)整的時候,對已有知識的影響最小化!庇嗌奖硎,其團隊近期提出的正交權重修改算法,就屬于這類,主要通過限制權重修改只能在舊任務的解空間中進行,這一算法較好的克服了災難性遺忘,使得同一個分類器網(wǎng)絡可以連續(xù)的學習多達數(shù)千個類別的識別。
![]() |
商用機器人 Disinfection Robot 展廳機器人 智能垃圾站 輪式機器人底盤 迎賓機器人 移動機器人底盤 講解機器人 紫外線消毒機器人 大屏機器人 霧化消毒機器人 服務機器人底盤 智能送餐機器人 霧化消毒機 機器人OEM代工廠 消毒機器人排名 智能配送機器人 圖書館機器人 導引機器人 移動消毒機器人 導診機器人 迎賓接待機器人 前臺機器人 導覽機器人 酒店送物機器人 云跡科技潤機器人 云跡酒店機器人 智能導診機器人 |