日前,360網絡安全北美研究院負責人,360 IoT安全研究院院長李康與360智能網聯汽車安全實驗室總監張青聯合宣布360的一項全新研究成果,可為人工智能的算法測試尤其是智能汽車的測試提供了一把“尺子”,簡單理解就是人工智能算法的調試器。
這把“尺子”什么樣
李康表示,深度學習系統是基于分層統計學方法得到的結論,和傳統的計算機軟件系統不一樣,并沒有專門的測試平臺對系統進行測試和調試。
“傳統的軟件測試我們有污點跟蹤、覆蓋測試等各種方法,而對于深度學習測試來說,工程師面對的是一個黑盒。”李康說道。
人工智能時代的大數據就是過去的源代碼,而對于現階段機器學習測試來講,更多是依靠數據測試,人肉測試。所以我們也能看到Uber等無人駕駛汽車在實際道路上反復駕駛測試,但是對于測試人員來說,并不知道數據之中的邏輯,也無法判斷自己測試結果的好壞,不了解有多少神經元進行了測試,給調試帶來了困難。
360目前提供的方案可以給深度學習正確或錯誤的決策提供輸入輸出關系,并且相對量化測試的程度,從而提高深度學習黑盒測試的準確率,通過熱力圖等可視化界面,讓工程師了解哪些神經元反復執行,哪些神經元一直都沒有激活。
實際道路測試10個小時和100個小時的測試結果肯定不同,下雨天測試和太陽底下測試的效果也不同,但究竟不同的有多少,就需要李康的這把“尺子”丈量,通過量化的比對,可幫助開發人員進行深度學習系統的調試與評測工作。
把深度學習變得可解釋
“過去包括豐田剎車門等事故,可以精確地定位到哪個程序有問題,而Uber、特斯拉的事故,很難真正判斷出出錯的邏輯和原因是什么,因為深度學習大多數是經驗性的,可能更換了一個場景,測試結果就完全不對了。”李康說道。
目前360所做的被測模型全部是由英偉達官網提供的開源數據進行測試,360也希望可以和更多車廠、智能駕駛系統商合作,共同對數據進行測試以驗證這一方案的可靠性。
李康也表示,這一調試器方案設想不只是針對智能駕駛汽車,而是針對所有帶人工智能和神經元的測試系統。“我們要把不可解釋的深度學習變成可解釋的。”李康說道。
李康在安全對抗網絡方面有著豐富經驗,是Disekt、SecDawgs CTF戰隊創始人,是xCTF和藍蓮花戰隊的啟蒙老師,2016年DARPA Cyber Grand Challenge的決賽獲獎者。相信隨著越來越多的深度學習公司尤其是在自動駕駛領域,意識到測試的安全性和重要性之后,360的這一方案會得到業界認可。