日前,由GYL(全球青年領導力聯盟)主辦的“第三屆GYL創業營暨2016年全球青年大會”在北京空管科技交流中心召開,來自各界的六十余位導師、一千五百余名全球青年領導者共同出席,暢談時下熱門話題。
在31日舉行的“人工智能的未來”專題對話中,搜狗公司CTO楊洪濤、碳云智能科技創始人王俊、馭勢科技創始人兼CEO吳甘沙、出門問問創始人兼CEO李志飛等嘉賓,共同就人工智能的現狀與未來發展趨勢發表了自己的觀點。
開源時代,人工智能將得到快速發展
鑒于近期包括谷歌、Facebook等在內的多家互聯網巨頭都對各自的深度學習平臺進行了開源,數位嘉賓首先就人工智能領域的開源可能帶來的機遇與空間進行了討論。
楊洪濤認為,人工智能技術的開源將有助于機器早日在腦力層面超過人類。互聯網公司通過開源相關技術推動人工智能技術的進步,帶動更多人參與其中,“某種意義像互聯網的水和電一樣,屬于基本的通路和技術,所以每個人都要學習和使用這樣的技術和工具”。而使用者同樣在為技術本身做貢獻,對使用者和公司都非常有利。如今機器已經在體力、速度等角度戰勝了人類,未來也將在腦力上超過人類,在醫療等領域幫助人類做輔助決策。
吳甘沙表達了類似的觀點,稱人工智能、深度學習已經跨過了單純依靠數據獲得更好結果的階段,傳統的API開放、積木式創新已經無法滿足人工智能的技術發展,“這個時候最關鍵的就變成了人才,你是希望更多的人才順著這條道路做創新。”正如當年借助Android實現對蘋果逆襲的谷歌一樣,開源將帶來大量專業人才的加入,為人工智能技術發展實現更多創新,實現企業生態系統的建立和完善。
而王俊則對開源表示了更加謹慎的態度。他指出,一方面企業選擇開源本身背后存在一定的商業模式,否則將面對缺乏后續維護升級等問題;另一方面針對基因等醫療及生命數據,開源可能涉及大量隱私問題,因而需要更仔細的權衡和考量。
人工智能是腦科學與計算科學的結合
李志飛指出,深度學習領域存在腦科學觀點和計算機科學觀點互相抵觸的現象,從最初以人腦的角度分析人類語言構造,到后來專注計算機基于數據的學習,從一個極端走向另一個極端。他認為這并非科學發展的方式,腦科學和計算機科學應該是相互滲透和促進的關系。
吳甘沙表示,人工智能界里雖然有以機器的智能為研究方向和以人腦機制為研究方向的兩派,而自己相對更看好居于其中的“大腦啟發的人工智能”,即利用對大腦的進一步認識去幫助深度學習,幫助人工智能獲得下一步的突破。楊洪濤對此表示認同,稱“現在很多技術,都是在觀察自然造物的時候得到的啟發,僅靠自然的認知可能到不了同樣的高度。啟發跟自然的結合而共同進步,這是一個很自然的過程。”
下一個五年人工智能的創業方向在哪?
關于下一個五年,楊洪濤認為人工智能在醫療領域的應用將會大于在汽車領域。他說,人工智能輔助醫療在當前具有更迫切的實際需求,也更容易實現。在人工智能的輔助決策下,“醫生對醫療影像識別的精準程度可以做百分之幾十的提升,可以把醫療文獻檢索出來做更好的決策,避免因醫生專業素質差異帶來的診斷風險,這個價值不亞于自動駕駛技術的實現。”而目前的人工智能技術尚且無法完全排除自動駕駛中存在的隱患,特斯拉此前出現的事故難以避免,因此楊洪濤在未來三到五年內,智能汽車自動駕駛難以完全替代人的駕駛,只能是在封閉環境里面實現一定工業應用。
王俊也表示,輔助醫生決策是人工智能應用最近的機會。他認為醫生的專家體系和系統是相對知識經驗比較集中,也比較清晰的領域,“從人工智能本身來講,相對來說比較容易能夠達到第一個層次,達到一個醫生所應該能達到的平均水平。”
吳甘沙在這一觀點的基礎上提出,人工智能“不要考慮取代人,而是考慮現在人還缺什么”。他以智能出行為例,指出未來無人駕駛的目標是通過節省人力和能源消耗、智能規劃出行等方式,最終為城市擁堵問題找到解決方案。只是這一目標,仍然要以加強自動駕駛的人工智能和深度學習技術積累,以提升安全性和智能化為前提。
語音:自然交互的未來
在對話中主持人提出,扎克伯格曾說過,手機是觸摸操作最自然的使用場景,認為語音操作不會在手機上成什么氣候,并詢問了各位嘉賓對此的看法。
楊洪濤認為,手機采用觸摸屏最初模仿的是人對自然物體的觸摸,“模仿人的觸摸是一種非常自然的交互方式”,手機的形態、能力基本上決定了這一點。而人與人之間更自然的交互方式則是語音、視覺上的溝通。因而語音的價值發生在更垂直,不方便用手機觸摸的場景中,例如駕駛過程中的交互操作、智能家居的操控等領域,未來也會有越來越多的應用。
例如,搜狗輸入法日前推出了語音修改功能,能夠迅速理解和執行類似“弓長張換成立早章”等指令,在語音識別準確率已超過97%的基礎上突破了最后3%,真正解放了用戶雙手,進一步提升了用戶輸入體驗,為駕車等場景提供了諸多便利。
李志飛也表示,人工智能未來的應用包括設備和場景兩個角度,新的設備語音交互會用的更多,很多傳統場景也會朝著語音交互使用率提高的趨勢發展。隨著數據采集、算法和計算結構取得進展,語音未來也會有更好的識別效果和更多的應用場景。