版本記錄
版本號(hào) | 時(shí)間 |
---|---|
V1.0 | 2018.10.05 星期五 |
前言
很多做視頻和圖像的卸夕,相信對(duì)這個(gè)框架都不是很陌生逝慧,它渲染高級(jí)3D圖形衬浑,并使用GPU執(zhí)行數(shù)據(jù)并行計(jì)算捌浩。接下來(lái)的幾篇我們就詳細(xì)的解析這個(gè)框架。感興趣的看下面幾篇文章工秩。
1. Metal框架詳細(xì)解析(一)—— 基本概覽
2. Metal框架詳細(xì)解析(二) —— 器件和命令(一)
3. Metal框架詳細(xì)解析(三) —— 渲染簡(jiǎn)單的2D三角形(一)
About GPU Family 4 - 關(guān)于GPU Family 4
了解A11功能尸饺,包括光柵順序組,平鋪著色器和圖像塊助币。
Overview - 概覽
GPU Family 4
描繪了A11芯片及其Apple設(shè)計(jì)的圖形處理器(GPU)
架構(gòu)所支持的新功能和增強(qiáng)性能浪听。
iOS和tvOS設(shè)備中的GPU實(shí)現(xiàn)了一種稱為基于圖塊的延遲渲染tile-based deferred rendering(TBDR)
的渲染技術(shù),以優(yōu)化性能和功效眉菱。 在傳統(tǒng)的立即模式(IM)
渲染器中迹栓,當(dāng)三角形被提交給GPU進(jìn)行處理時(shí),它會(huì)立即呈現(xiàn)給設(shè)備內(nèi)存俭缓。 三角形由光柵化和片段函數(shù)階段處理克伊,即使它們被稍后提交給GPU的其他基元遮擋。
Tile-Based Deferred Rendering - 基于圖塊的延遲渲染
TBDR
對(duì)IM
架構(gòu)進(jìn)行了一些重大更改华坦,在提交了所有基元后處理場(chǎng)景愿吹。屏幕被拆分為單獨(dú)處理的圖塊。同時(shí)處理與圖塊相交的所有幾何圖形季春,并在光柵化和片段著色階段之前丟棄被遮擋的圖像洗搂。將圖塊渲染到GPU上的快速本地存儲(chǔ)器中,并且僅在渲染完成后才將其寫入設(shè)備存儲(chǔ)器。
TBDR允許頂點(diǎn)和片段階段異步運(yùn)行 - 相對(duì)于IM
提供顯著的性能提高耘拇。在運(yùn)行渲染過程的片段階段時(shí)撵颊,硬件并行執(zhí)行未來(lái)渲染過程的頂點(diǎn)階段。頂點(diǎn)階段通常大量使用固定功能硬件惫叛,而片段階段則使用數(shù)學(xué)和帶寬倡勇。完全重疊它們?cè)试S設(shè)備同時(shí)使用GPU上的所有硬件模塊。
TBDR使用的圖塊存儲(chǔ)器有三個(gè)重要特征嘉涌。首先妻熊,著色器核心和圖塊存儲(chǔ)器之間的帶寬比GPU和設(shè)備存儲(chǔ)器之間的帶寬高許多倍,并且與著色器核心的數(shù)量成比例地縮放仑最。其次扔役,圖塊內(nèi)存的內(nèi)存訪問延遲比訪問設(shè)備內(nèi)存的延遲低許多倍。最后警医,圖塊內(nèi)存消耗的功率遠(yuǎn)低于設(shè)備內(nèi)存亿胸。
在基于A7
到A10
的設(shè)備上,Metal沒有明確描述這種基于圖塊的架構(gòu)预皇;相反侈玄,您使用它來(lái)提供底層實(shí)現(xiàn)的提示。例如吟温,加載和存儲(chǔ)操作控制將哪些數(shù)據(jù)加載到本地存儲(chǔ)器以及將哪些數(shù)據(jù)寫入設(shè)備存儲(chǔ)器序仙。類似地,無(wú)內(nèi)存緩沖區(qū)指定僅在渲染通道期間使用的每像素中間數(shù)據(jù)鲁豪;實(shí)際上潘悼,這些數(shù)據(jù)存儲(chǔ)在GPU的快速本地存儲(chǔ)器中。
Metal 2 on the A11 GPU - A11 GPU 中的Metal 2
A11
中Apple設(shè)計(jì)的GPU提供了幾項(xiàng)顯著增強(qiáng)TBDR
的功能呈昔。 這些功能通過Metal 2 API
提供挥等,使您的應(yīng)用和游戲能夠?qū)崿F(xiàn)更高水平的性能和功能。
這些功能包括圖像塊堤尾,圖塊著色肝劲,光柵順序組,圖像塊樣本覆蓋控制和線程組共享郭宝。 A11 GPU
上的Metal 2
還可以提高碎片丟棄性能辞槐。
從廣義上講,這些功能可以更好地控制內(nèi)存布局和存儲(chǔ)在圖塊中的數(shù)據(jù)粘室,并提供更細(xì)粒度的同步榄檬,以便在GPU上保持更多工作。 最終結(jié)果是衔统,您可以在單個(gè)渲染過程中執(zhí)行比以前更多種類的計(jì)算鹿榜,從而將計(jì)算保持在快速本地內(nèi)存中海雪。
A11上的Metal 2
還簡(jiǎn)化了諸如次表面散射,與順序無(wú)關(guān)的透明度和基于圖塊的照明算法等技術(shù)的實(shí)現(xiàn)舱殿。
Topics
1. GPU Family 4 Features - GPU系列4功能
-
- 了解
imageblocks
如何允許您在高帶寬圖塊內(nèi)存中定義和操作自定義每像素?cái)?shù)據(jù)結(jié)構(gòu)奥裸。
- 了解
-
- 了解在共享本地內(nèi)存時(shí)將渲染和計(jì)算操作組合到單個(gè)渲染過程中。
-
- 了解精確控制訪問相同像素坐標(biāo)的并行片段著色器線程的順序沪袭。
-
About Enhanced MSAA and Imageblock Sample Coverage Control
- 了解如何在圖塊著色器中訪問多重采樣跟蹤數(shù)據(jù)湾宙,啟用自定義
MSAA
解析算法的開發(fā)等。
- 了解如何在圖塊著色器中訪問多重采樣跟蹤數(shù)據(jù)湾宙,啟用自定義
-
- 了解增強(qiáng)的內(nèi)存模型冈绊,該模型允許在線程之間靈活高效地共享數(shù)據(jù)侠鳄。
后記
本篇主要講述了關(guān)于GPU Family 4,感興趣的給個(gè)贊或者關(guān)注~~~