《電子技術應用》
您所在的位置:首頁 > 嵌入式技術 > 新品快遞 > Cadence發(fā)業(yè)界首款獨立完整神經(jīng)網(wǎng)絡DSP核

Cadence發(fā)業(yè)界首款獨立完整神經(jīng)網(wǎng)絡DSP核

具備1TMAC/秒計算能力的完整獨立 DSP解決方案
2017-05-04
來源:電子技術應用

    2017年5月4日,中國上海——楷登電子(美國Cadence公司,NASDAQ: CDNS)今日正式公布業(yè)界首款獨立完整的神經(jīng)網(wǎng)絡DSP —Cadence? Tensilica? Vision C5 DSP,面向對神經(jīng)網(wǎng)絡計算能力有極高要求的視覺設備、雷達/光學雷達和融合傳感器等應用量身優(yōu)化。針對車載、監(jiān)控安防、無人機和移動/可穿戴設備應用,Vision C5 DSP 1TMAC/s的計算能力完全能夠勝任所有神經(jīng)網(wǎng)絡的計算任務。如需了解更多內(nèi)容。


新聞要點:

完整獨立的DSP核心,全面支持各級神經(jīng)網(wǎng)絡層

芯片面積不到1mm2,計算速度可達每秒1 TeraMAC (TMAC)

通用的可編程解決方案,為未來而生,滿足不斷演進的技術需求

為視覺設備、雷達/光學雷達和融合傳感器應用度身優(yōu)化

sjwl2.jpg

    隨著神經(jīng)網(wǎng)絡應用的日益深入和復雜,對計算的要求也與日俱增;同時,神經(jīng)網(wǎng)絡的自身架構在不斷更新?lián)Q代,新網(wǎng)絡、新應用和新市場也層出不窮。上述趨勢之下,業(yè)界亟需一款針對嵌入式系統(tǒng)量身定制的高性能、通用型神經(jīng)網(wǎng)絡解決方案,不僅應該具備極低的功耗,還應擁有高度的可編程能力,以適應未來變化,降低風險。

神經(jīng)網(wǎng)絡DSP vs. 神經(jīng)網(wǎng)絡加速器

    基于攝像頭的視覺系統(tǒng)在汽車、無人機和安防領域最為常見,這種架構需要兩種最基礎的視覺優(yōu)化計算模式。首先,利用傳統(tǒng)視覺算法對攝像頭捕捉到的照片或圖像進行增強;其次,使用基于神經(jīng)網(wǎng)絡的認知算法對物體進行檢測和識別。現(xiàn)有的神經(jīng)網(wǎng)絡加速器解決方案皆依賴與圖像DSP連接的硬件加速器;神經(jīng)網(wǎng)絡代碼被分為兩部分,一部分網(wǎng)絡層運行在DSP上,卷積層則運行在硬件加速器上。這種架構不但效率低下,且耗能較高。

    Vision C5 DSP是專門針對神經(jīng)網(wǎng)絡進行了特定優(yōu)化的DSP,可以實現(xiàn)全神經(jīng)網(wǎng)絡層的計算加速(卷積層、全連接層、池化層和歸一化層),而不僅僅是卷積層的加速。因此,主視覺/圖像DSP能力得以釋放,獨立運行圖像增強應用,Vision C5 DSP則負責執(zhí)行神經(jīng)網(wǎng)絡任務。通過移除神經(jīng)網(wǎng)絡DSP和主視覺/圖像DSP之間的冗余數(shù)據(jù)傳輸,Vision C5 DSP的功耗遠低于現(xiàn)有的神經(jīng)網(wǎng)絡加速器。同時,Vision C5 DSP還提供針對神經(jīng)網(wǎng)絡的單核編程模型。

    “我們的很多客戶都在糾結如何選擇理想的神經(jīng)網(wǎng)絡平臺,畢竟一款產(chǎn)品的開發(fā)可能耗時數(shù)年,”Cadence公司Tensilica事業(yè)部市場高級總監(jiān)Steve Roddy表示。“隨時在線(always-on)嵌入式系統(tǒng)的神經(jīng)網(wǎng)絡處理器不僅需要低功耗和較快的圖像處理速度,靈活性和永不過時(future-proof)的前瞻性也必不可少。目前的平臺都不夠理想,客戶亟需一個全新的解決方案。Vision C5 DSP通用型神經(jīng)網(wǎng)絡DSP應運而生,它集成方便、使用靈活,功耗能效較CNN加速器、GPU和CPU也更為出色。”

    “現(xiàn)實世界中的深度學習應用數(shù)量龐大,種類繁多,對計算的要求非常苛刻,”嵌入視覺聯(lián)盟(Embedded Vision Alliance)創(chuàng)始人Jeff Bier表示。“Vision C5 DSP作為神經(jīng)網(wǎng)絡專用編程處理器,可以幫助我們在低成本、低功耗設備上應用深度學習技術。”

Vision C5 DSP的參數(shù)與性能

依托獨立引擎,Vision C5 DSP具備領先的神經(jīng)網(wǎng)絡性能:

·         不到1mm2的芯片面積可以實現(xiàn)1TMAC/秒的計算能力(吞吐量較Vision P6 DSP提高4倍),為深度學習內(nèi)核提供極高的計算吞吐量

·         1024 8-bit MAC或512 16-bit MAC 確保8-bit 和16-bit精度的出色性能

·         128路8-bit SIMD或64路16-bit SIMD的VLIW SIMD架構

·         專為多核設計打造,以極少的資源代價獲得NxTMAC的處理能力

·         內(nèi)置iDMA和AXI4總線接口

·         使用與Vision P5和P6 DSP一致的經(jīng)驗證軟件工具包

·         基于業(yè)界知名的AlexNet CNN Benchmark,Vision C5 DSP的計算速度較業(yè)界的GPU最快提高6倍;Inception V3 CNN benchmark,有9倍的性能提升。

    Vision C5 DSP是一款靈活前瞻的永不過時(future-proof)解決方案,支持各類內(nèi)核尺寸、深度和輸入規(guī)格。Vision C5 DSP采用多項系數(shù)壓縮/解壓技術,支持未來添加的新計算層。與之相反,CNN硬件加速器由于程序重編能力有限,擴展能力較差。

    Vision C5 DSP搭載Cadence神經(jīng)網(wǎng)絡Mapping工具鏈,可將Caffe和TensorFlow等映射為在Vision C5 DSP上高度優(yōu)化過的可執(zhí)行代碼,充分發(fā)揮手動優(yōu)化神經(jīng)網(wǎng)絡庫的豐富功能。

    sjwl1.jpg

卷積神經(jīng)網(wǎng)絡示意圖

本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點。轉載的所有的文章、圖片、音/視頻文件等資料的版權歸版權所有權人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無法一一聯(lián)系確認版權者。如涉及作品內(nèi)容、版權和其它問題,請及時通過電子郵件或電話通知我們,以便迅速采取適當措施,避免給雙方造成不必要的經(jīng)濟損失。聯(lián)系電話:010-82306118;郵箱:aet@chinaaet.com。
主站蜘蛛池模板: 波多野结衣加勒比| 向日葵视频app免费下载| 国产精品白丝在线观看有码| 天堂√在线中文最新版8| 好吊操这里只有精品| 好男人社区www影院在线观看| 成人看的午夜免费毛片| 成全影视免费观看大全二| 成人嘿嘿视频网站在线| 成人亚洲欧美日韩在线观看| 婷婷五月综合色中文字幕| 北条麻妃久久99精品| 国产在线播放你懂的| 天堂avtt迅雷看看| 久久久噜久噜久久gif动图| 欧美日本另类xxx乱大交| 六月丁香婷婷综合| 韩国免费三片在线视频 | 四虎1515hh永久久免费| 天天成人综合网| 中文字幕人成无码免费视频| 日韩精品无码一区二区视频| 亚洲欧洲专线一区| 男男动漫全程肉无删减有什么 | 一边摸一边叫床一边爽| 日韩一区二区三区北条麻妃| 亚洲午夜国产精品无卡| 波多野结衣第一页| 动漫人物差差差动漫网站| 韩国久播影院理论片不卡影院| 国产精品国产三级国产普通话| JIZZ成熟丰满| 性高湖久久久久久久久| 久久久久无码精品国产| 欧洲最强rapper潮水免费| 亚洲欧美色一区二区三区| 福利网址在线观看| 啦啦啦www免费视频| 超兴奋的朋…中文字幕| 国产成人免费观看| 大尺度视频网站久久久久久久久|