《電子技術(shù)應(yīng)用》
您所在的位置:首頁(yè) > 模擬設(shè)計(jì) > 業(yè)界動(dòng)態(tài) > 英偉達(dá)下一代GPU拋棄臺(tái)積電7nm?爆料稱(chēng)基于三星10nm全線(xiàn)支持光線(xiàn)追蹤 性能提升40%

英偉達(dá)下一代GPU拋棄臺(tái)積電7nm?爆料稱(chēng)基于三星10nm全線(xiàn)支持光線(xiàn)追蹤 性能提升40%

2020-03-13
來(lái)源:與非網(wǎng)

  3 月 13 日訊,昨日,有爆料消息稱(chēng)英偉達(dá)的下一代 GPU 架構(gòu)將基于三星 10nm 制程,而不是之前報(bào)道的臺(tái)積電 7nm 工藝,據(jù)稱(chēng)使用的 10nm 制程更接近于三星提供的 8LPP 技術(shù),另外新的 Tegra 芯片也將使用相同的制程。

  之前放出兩張疑似是 Ampere GPU 核心架構(gòu)圖的 Twitter 帳號(hào)@CorgiKitty 在昨天也發(fā)布了新的傳言,稱(chēng)新一代芯片將會(huì)使用三星的 10nm 節(jié)點(diǎn)工藝,而不是此前坊間傳聞中的 7nm EUV 工藝。

  外媒表示,英偉達(dá)安培架構(gòu)曝光的 GPU 有 GA102、GA103、GA104、GA106 和 GA1075 款,配置最高的是 GA102。報(bào)道還稱(chēng)英偉達(dá)新款 GPU 將全部支持 RTX(實(shí)時(shí)光線(xiàn)跟蹤),這意味著英偉達(dá)在安培架構(gòu)上對(duì) RT 核心設(shè)計(jì)進(jìn)行升級(jí),使其在性能較弱的顯卡中也能實(shí)現(xiàn)光線(xiàn)追蹤的效果。

1.png

  一、實(shí)時(shí)光線(xiàn)跟蹤

  英偉達(dá)新款 GPU 將全部支持 RTX(實(shí)時(shí)光線(xiàn)跟蹤),這意味著英偉達(dá)在安培架構(gòu)上對(duì) RT 核心設(shè)計(jì)進(jìn)行升級(jí),使其在性能較弱的顯卡中也能實(shí)現(xiàn)光線(xiàn)追蹤的效果。

  使用基于光線(xiàn)追蹤的算法(包括 ray tracing, path tracing, photon mapping, beam tracing, cone tracing 等等 )進(jìn)行圖形渲染。渲染對(duì)象是包含真實(shí)剛體及柔體物理模擬的動(dòng)態(tài)場(chǎng)景。場(chǎng)景分辨率需達(dá)到 720P,并需要允許動(dòng)態(tài)攝像機(jī)以及多光源(點(diǎn) / 面光源)。渲染幀率需不低于 30 并以 60 為目標(biāo),渲染結(jié)果應(yīng)該有較小的(肉眼難于分辨的)噪點(diǎn)。如果是 path tracing 等蒙特卡洛方法,則還需要無(wú)偏的結(jié)果(不然會(huì)出現(xiàn)局部模糊等 artifacts)。

  目前的應(yīng)用包括各類(lèi)照片級(jí)渲染應(yīng)用中場(chǎng)景設(shè)計(jì)的快速原型生成,視頻游戲中的部分場(chǎng)景渲染。未來(lái)的應(yīng)用領(lǐng)域會(huì)更加廣闊。但實(shí)時(shí)的光線(xiàn)追蹤的難點(diǎn)在于場(chǎng)景復(fù)雜度和需要的真實(shí)感渲染效果決定了遍歷和相交檢測(cè)的巨大計(jì)算量(場(chǎng)景分割數(shù)據(jù)結(jié)構(gòu)的重構(gòu)和光線(xiàn)與場(chǎng)景的相交測(cè)試是兩項(xiàng)主要計(jì)算)。這是渲染領(lǐng)域以及任何模擬計(jì)算領(lǐng)域里終極的矛盾:效率和質(zhì)量的矛盾。

  目前的解決方案有兩個(gè)方向的努力:軟件角度和硬件角度,軟件角度又可以分為自低向上和自頂向下的優(yōu)化:BVH 和其他層級(jí)結(jié)構(gòu)的場(chǎng)景分割(kd-tree, oc-tree, BSP-tree 等)是自頂向下的方法,在對(duì)場(chǎng)景進(jìn)行分割時(shí)還有一項(xiàng)十分常用的優(yōu)化算法:Surface Area Heuristic (SAH)。硬件角度的優(yōu)化又可以分為采用 GPU 和 SIMD 的優(yōu)化以及專(zhuān)門(mén)的 ray tracing 硬件。前者就是對(duì)上述軟件優(yōu)化的算法進(jìn)行針對(duì) GPU 或 SIMD 的優(yōu)化,同時(shí)一些并行環(huán)境下的數(shù)學(xué)庫(kù)函數(shù)和其他基本算法如排序等也間接起到了加速的作用。后者就是指將 ray tracing 中獨(dú)有的相交檢測(cè),場(chǎng)景分割等部分采用專(zhuān)門(mén)的硬件來(lái)優(yōu)化。此次英偉達(dá)新款 GPU 將全部支持 RTX(實(shí)時(shí)光線(xiàn)跟蹤),RT 核心方面的設(shè)計(jì)已逐步完善。

  二、NVIDIA 的新核心比上代性能提升了 40%

  在 GeekBench 5 測(cè)試數(shù)據(jù)庫(kù)里面,曝光了兩組 NVIDIA 的新核心,參數(shù)暴漲,規(guī)格相當(dāng)?shù)膹?qiáng)大,但都達(dá)不到 8192 個(gè) CUDA 核心。其中一塊核心擁有 118 組計(jì)算單元,假如每組繼續(xù)延續(xù) 64 個(gè)流處理器的規(guī)格,那么 CUDA 核心數(shù)量就是 7552 個(gè),低于在此之前爆料的 8192 個(gè) CUDA 核心。

  另一塊核心削減了 108 組計(jì)算單元,于是 CUDA 核心就只有 6912 個(gè),至于頻率在 1.01GHz 左右。這樣的參數(shù)遠(yuǎn)于 8912 個(gè) CUDA 核心。

  但我們可不可以這么認(rèn)為,128 組計(jì)算單元對(duì)應(yīng) 8192 個(gè) CUDA 核心數(shù)是這塊核心的最大規(guī)格,至于 118 組計(jì)算單元和 108 組計(jì)算單元,是閹割后的版本,分別適用于不同的領(lǐng)域。

  配置最低的 GA107 為 1280 流處理器,4GB 顯存,最高的 GA102 GPU 為 5376 流處理器,12GB 顯存,其中 GA102 比上代的 RTX 2080Ti 性能提升了 40%。

2.png

  圖片來(lái)源:GeekBench 5 測(cè)試數(shù)據(jù)庫(kù)


本站內(nèi)容除特別聲明的原創(chuàng)文章之外,轉(zhuǎn)載內(nèi)容只為傳遞更多信息,并不代表本網(wǎng)站贊同其觀點(diǎn)。轉(zhuǎn)載的所有的文章、圖片、音/視頻文件等資料的版權(quán)歸版權(quán)所有權(quán)人所有。本站采用的非本站原創(chuàng)文章及圖片等內(nèi)容無(wú)法一一聯(lián)系確認(rèn)版權(quán)者。如涉及作品內(nèi)容、版權(quán)和其它問(wèn)題,請(qǐng)及時(shí)通過(guò)電子郵件或電話(huà)通知我們,以便迅速采取適當(dāng)措施,避免給雙方造成不必要的經(jīng)濟(jì)損失。聯(lián)系電話(huà):010-82306118;郵箱:aet@chinaaet.com。
主站蜘蛛池模板: 一级做a爰片性色毛片黄书| 亚洲熟妇丰满xxxxx| 亚洲AV无码精品国产成人| 91免费播放人人爽人人快乐| 宵宫被爆3d动画羞羞漫画| 亚洲一级毛片视频| 男人让女人爽30分钟免费| 国产成人精品免费直播| 99久在线国内在线播放免费观看| 日本三级中文字版电影| 加勒比色综合久久久久久久久 | 日本五月天婷久久网站| 亚洲欧美日韩精品久久久| 绿巨人app黄| 国产成人天天5g影院| 91精品手机国产免费| 怡红院成人在线| 久久国产精品女| 欧美另类老少配hd| 俄罗斯精品bbw| 美女扒开尿口给男人桶爽视频| 国产成人免费片在线观看| 888米奇在线视频四色| 女人爽小雪又嫩又紧| 中文字幕欧美亚洲| 日韩成人精品日本亚洲| 亚洲国产日韩女人aaaaaa毛片在线| 玉蒲团2之玉女心经| 国产AV无码专区亚洲AV| 黄色一级视频免费观看| 国产精品夜间视频香蕉| 99精品视频免费在线观看| 性xxxx黑人与亚洲| 久久99热精品这里久久精品| 最近2019中文字幕mv免费看| 同桌好舒服好粗好硬| 黄无遮挡免费网站视频| 国产精品成人va在线播放| aa级女人大片喷水视频免费| 成人免费乱码大片a毛片| 久久亚洲sm情趣捆绑调教|