《電子技術應用》
您所在的位置:首頁 > 嵌入式技術 > 業界動態 > 從任務角度分析深度學習硬件發展趨勢

從任務角度分析深度學習硬件發展趨勢

2017-01-04

從微小器件到海量數據中心,格外強勁的硬件將能為深度學習領域內的一切提供助力。

2016 年 3 月份,谷歌 DeepMind 的計算機在多輪圍棋比賽中擊敗了世界圍棋冠軍李世乭。這一事件標志著人工智能領域內的一個新里程碑。獲勝的 AlphaGo 借力于現在為大家所熟知的深度學習——一種人工神經網絡;在這種神經網絡里有很多計算處理層,可以用來自動尋找問題的解決方案。

那時候人們還不知道谷歌正在悄然開發為這一勝利提供助力的秘密武器——一種專用硬件,在谷歌用于擊敗世界冠軍李世石的計算機里已有這種特殊硬件。這種硬件被谷歌稱為張量處理單元(TPU/Tensor Processing Unit)。

谷歌的一位硬件工程師 Norm Jouppi 在這場圍棋大戰的兩個月后宣布了張量處理單元的存在,并解釋說谷歌的數據中心已經使用這些新型加速器一年多了。谷歌還沒有公布這些集成板上到底有什么奧妙,但毫無疑問的是,這代表著加速深度學習計算上的一個日益流行的策略:使用專用集成電路(ASIC)。

1483083903530075678.jpg


來自深度學習軟件的收入很快就將超過十億美元(單位:十億美元)

企業(主要是微軟)追求的另一個戰術是使用現場可編程門陣列(FPGA),其有可重配置的優勢,可以根據計算需求進行修改。而更常見的方法則是使用圖形處理單元(GPU),這種計算設備可以并行地同時執行大量數學運算。最知名的 GPU 提供商英偉達(NVIDIA)近段時間以來的股價飛漲也正是得益于此。

事實上,GPU 在 2009 年的時候就已經在驅動人工神經網絡了,那時候斯坦大學的一些研究者證明這種硬件使得深度神經網絡的訓練時間很適宜。

「今天所有人都在做深度學習,」斯坦福大學 Concurrent VLSI Architecture 研究組的領導者兼英偉達首席科學家 William Dally 說。他說這從他的角度來看是不足為奇的。「GPU 幾乎和你想象的一樣美好?!?/p>

Dally 解釋說有三個獨立的領域需要考慮。第一是他所說的「數據中心中的訓練」。他認為任何深度學習系統的第一步都是:調節神經元之間大約數百萬個連接以使網絡能夠完成分配給它的任務。

已被英特爾收購的公司 Nervana Systems 在這種任務的硬件開發上取得了領先。Nervana 計算機科學家 Scott Leishman 表示 Nervana Engine 是一款 ASIC 的深度學習加速器,其將在 2017 年初期到中期的時候投入生產。Leishman 指出另一個計算密集型任務——比特幣挖礦(bitcoin mining),就曾經從 CPU 實現轉向 GPU,然后轉向 FPGA 并最終轉向了 ASIC,因為定制的硬件能夠實現更優的能量效率。他說:「我認為同樣的情況正在深度學習領域發生?!?br/>

Dally 說,深度學習硬件的第二個任務(大為異于第一個任務)是「數據中心中的推理」。「推理(inference)」這個詞在這里的意思是:用于之前任務的已訓練的基于云的人工神經網絡在同樣的任務上能進行持續運算。谷歌的神經網絡每天都要執行天文數字級別的推理計算,以幫助用戶分類圖片、翻譯語言和識別口語等等。盡管外界還不能百分之百確定,但可以推理谷歌的張量處理單元應該在為這些計算提供助力。


1483083903561058531.jpg

加滿油門:谷歌的 TPU 正在該公司的服務器里加速深度學習計算

訓練和推理常常需要運用不同的技能設置。通常對訓練的設置上,機器必須能夠實施精確度相對較高的計算,常使用 32 位的浮點計算。對于推理,則可以犧牲精確度以獲取更快的速度和更低的功耗?!高@是研究領域里一個很活躍的區域,」Leishman 說道?!改隳苓_到的最低限度是多少?」

雖然 Dally 謝絕泄露英偉達的特別計劃,但他指出英偉達的 GPU 正在完成升級。英偉達的早期版本——Maxwell 的架構能夠進行雙精度(64 位)和單精度(32 位)的計算,而目前的 Pascal 架構則增加了處理 16 位運算的能力,支持雙倍輸入且效率也是之前單精度計算的兩倍。所以不難想象英偉達最終將會推出能進行 8 位運算的 GPU,這樣的 GPU 將是在云端進行推理運算的理想硬件,因為對云端推理來說能源效率是控制成本的關鍵因素。

Dally 補充說:「三個支撐深度學習關鍵任務的最后一個任務就是在嵌入式設備里進行推理,」比如智能手機、相機和平板電腦。對于這些應用,關鍵是實現低能耗的專用集成電路(ASIC)。在即將來到的一年,深度學習軟件將會越來越多的實現手機端應用,比如目前已有的手機端應用——惡意軟件檢測以及圖片中的文字翻譯。

除此之外,無人機生產商大疆(DJI)已經開始在其幽靈 4(Phantom 4)無人機中使用與專用集成電路的深度學習相類似的器件,大疆所使用的器件是一個由加州廠商 Movidius 制造的特殊視覺處理芯片,這個芯片用來識別障礙物。(Movidius 同時也是英特爾最近收購的另一家神經網絡相關的公司)。與此同時高通(Qualcomm)在其 Snapdragon 820 處理器里放置了一個特殊的電路系統來更好地執行深度學習運算。

雖然目前有很多因素促使硬件設計來加速深度神經網絡的計算,但巨大的風險依然并存:如果神經網絡的進步太快,所設計來運行過往的神經網絡的芯片在出廠時就會過時?!杆惴ㄕ苑浅?斓乃俣雀淖儯笵ally 說?!杆袕氖聵嫿ㄟ@些硬件的人都在試圖贏得這場賭注?!?/p>


本站內容除特別聲明的原創文章之外,轉載內容只為傳遞更多信息,并不代表本網站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創文章及圖片等內容無法一一聯系確認版權者。如涉及作品內容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經濟損失。聯系電話:010-82306118;郵箱:aet@chinaaet.com。
主站蜘蛛池模板: 毛片一级在线观看| 黄色三级免费电影| 成人18xxxx网站| 亚洲av日韩综合一区久热| 看亚洲a级一级毛片| 国产婷婷色综合av蜜臀av| 99久久免费国产精精品| 护士的诱惑电影| 亚洲av无码一区二区三区鸳鸯影院| 理论片中文字幕在线观看| 国产三级电影网站| 女人18毛片水真多国产| 天天看片天天操| 丹麦大白屁股hdxxxx| 棉袜足j吐奶视频| 亚洲色偷偷偷网站色偷一区| 老师吸大胸校花的奶水漫画| 国产欧美日韩中文久久| 98久久人妻无码精品系列蜜桃| 成人欧美一区二区三区的电影| 久草精品视频在线播放| 欧美特黄高清免费观看的| 全免费a级毛片免费看| 视频一本大道香蕉久在线播放| 国产精品久久久久无码av| 99视频精品全国在线观看| 情人伊人久久综合亚洲| 久久天堂夜夜一本婷婷麻豆| 欧美变态另类刺激| 亚洲综合精品香蕉久久网| 精品无码国产污污污免费网站国产| 国产在线看片网站| 二区久久国产乱子伦免费精品| 在线观看国产精美视频| 一级做a爰片久久免费| 日日摸日日碰夜夜爽亚洲| 九月婷婷人人澡人人添人人爽| 欧美最猛性xxxxx免费| 伊人色综合网一区二区三区| 网站大全黄免费| 国产人妖ts在线观看网站|