蓋世汽車訊 據外媒報道,日本綜合性研究機構RIKEN腦科學中心的Andrea Benucci及其同事開發出一種創建人工神經網絡的方法,可以學習更快、更準確地識別物體。該研究重點關注未被注意到的眼球運動,并表示眼球運動在穩定識別物體方面發揮著重要作用。這些發現可以應用于機器視覺,例如,使自動駕駛汽車更容易學習識別道路上的重要特征。
圖片來源:RIKEN
頭部和眼睛一整天都在不停移動,但人類不會因此看不清物體,即使視網膜上的物理信息不斷變化。使這種感知穩定性成為可能的是運動命令的神經副本(neural copies)。 每次移動時,這些副本都會發送到整個大腦,并被認為可以讓大腦解釋自身的運動并保持感知穩定。
除了穩定的感知之外,有證據表明,眼球運動及其運動副本也可能有助于穩定地識別世界上的物體,但具體是如何發生的還不得而知。Benucci開發出一個卷積神經網絡(CNN),在眼睛移動時優化視覺場景中的對象分類,或可解決上述問題。
首先,該神經網絡經過訓練,可將60,000張黑白圖像分為10個類別。盡管該網絡在這些圖像上表現良好,但當使用模擬眼睛移動時自然改變的視覺輸入的移位圖像進行測試時,其性能急劇下降到偶然水平。然而,在使用移位圖像訓練網絡后,只要還包括導致移位的眼球運動的方向和大小,分類顯著提高。
特別的是,將眼球運動及其運動副本添加到網絡模型中,系統能夠更好地應對圖像中的視覺噪聲。Benucci表示:“這一進步將有助于避免機器視覺中的危險錯誤。憑借更高效、更強大的機器視覺,像素更改(也稱為‘對抗性攻擊’)會減少錯誤率,例如,自動駕駛汽車將停車標志標記為燈桿,或軍用無人機錯誤將醫院大樓分類為敵方目標。”
Benucci解釋說:“模仿眼球運動及其傳出副本意味著‘強制’機器視覺傳感器具有受控類型的運動,同時通知負責處理關于自生運動相關圖像的視覺網絡,將使機器視覺更加強大,并且類似于人類的視覺體驗。”
來源:蓋世汽車
作者:劉麗婷