OpenCL架構(gòu)

1. 簡(jiǎn)介


OpenCL(Open Computing Language)痒钝,即開放運(yùn)算語(yǔ)言痴昧,是一個(gè)統(tǒng)一的開放式的開發(fā)平臺(tái)帆卓。OpenCL是首個(gè)提出的并行開發(fā)的開放式的巨朦、兼容的米丘、免費(fèi)的標(biāo)準(zhǔn),它的目的是為異構(gòu)系統(tǒng)通用提供統(tǒng)一開發(fā)平臺(tái)糊啡。OpenCL最初是由蘋果公司設(shè)想和開發(fā)拄查,并在與AMD,IBM棚蓄,英特爾和NVIDIA技術(shù)團(tuán)隊(duì)的合作之下初步完善堕扶。隨后,蘋果將這一草案提交至Khronos Group梭依。


OpenCL歷史版本.png

2. 框架組成


OpenCL的框架組成可以劃分為三個(gè)部分稍算,分別為OpenCL平臺(tái)API、OpenCL運(yùn)行時(shí)API役拴,以及OpenCL內(nèi)核編程語(yǔ)言糊探。

2.1 平臺(tái)API

平臺(tái)(Platform)這個(gè)詞在OpenCL中擁有非常特定的含義,它表示的是宿主機(jī)河闰、OpenCL設(shè)備和OpenCL框架的組合科平。多個(gè)OpenCL平臺(tái)可以共存于一臺(tái)異構(gòu)計(jì)算機(jī)。舉個(gè)例子姜性,CPU開發(fā)人員和GPU開發(fā)人員可以在同一個(gè)系統(tǒng)上分別定義自己的OpenCL框架瞪慧。這時(shí)就需要一種方法來(lái)查詢系統(tǒng)中可用的OpenCL 框架,哪些OpenCL設(shè)備是可用的部念,以及這些OpenCL設(shè)備的特性弃酌。相當(dāng)于CUDA的主機(jī)和設(shè)備之間的關(guān)系
此外儡炼,為了形成一個(gè)給定的OpenCL應(yīng)用平臺(tái)妓湘,還需要對(duì)這些框架和設(shè)備所屬的子集進(jìn)行控制。這些功能都是由OpenCL平臺(tái)API中的函數(shù)來(lái)解決的射赛。此外多柑,平臺(tái)API還提供了為OpenCL創(chuàng)建上下文的函數(shù)奶是。OpenCL的上下文規(guī)定了OpenCL應(yīng)用程序的打開方式(相當(dāng)是CUDA中核函數(shù)的調(diào)用)楣责,這可以在宿主機(jī)程序代碼中得到驗(yàn)證。

2.2 運(yùn)行時(shí)API

平臺(tái)API提供函數(shù)創(chuàng)建好上下文之后聂沙,運(yùn)行時(shí)API主要提供使用上下文提供的功能滿足各種應(yīng)用需求的函數(shù)秆麸。這是一個(gè)規(guī)模龐大且內(nèi)容十分復(fù)雜的函數(shù)集。運(yùn)行時(shí)API的第一個(gè)任務(wù)是創(chuàng)建一個(gè)命令隊(duì)列及汉。命令隊(duì)列與設(shè)備相關(guān)聯(lián)沮趣,而且一個(gè)上下文中可以同時(shí)存在多個(gè)活動(dòng)的命令隊(duì)列。有了命令隊(duì)列坷随,就可以通過調(diào)用運(yùn)行時(shí)API提供的函數(shù)來(lái)進(jìn)行內(nèi)存對(duì)象的定義以及管理內(nèi)存中的對(duì)象所依賴的所有其他對(duì)象房铭。以上是內(nèi)存對(duì)象的持有操作驻龟,另外還有釋放操作,也是由運(yùn)行時(shí)API提供的缸匪。
此外翁狐,運(yùn)行時(shí)API還提供了創(chuàng)建動(dòng)態(tài)庫(kù)所需要的程序?qū)ο蟮暮瘮?shù),正是這些動(dòng)態(tài)庫(kù)實(shí)現(xiàn)了Kernel的定義凌蔬。最后露懒,運(yùn)行時(shí)層的函數(shù)會(huì)發(fā)出與命令隊(duì)列交互的命令。此外砂心,管理數(shù)據(jù)共享和對(duì)內(nèi)核的執(zhí)行加以限制同步點(diǎn)也是由運(yùn)行時(shí)API處理的懈词。

2.3 內(nèi)核編程語(yǔ)言

內(nèi)核編程語(yǔ)言是用于編寫OpenCL內(nèi)核代碼的。除了宿主機(jī)程序之外辩诞,內(nèi)核程序也十分重要坎弯,它負(fù)責(zé)完成OpenCL中的實(shí)際工作。在部分OpenCL實(shí)現(xiàn)中用戶可以跟其他語(yǔ)言編寫的原生內(nèi)核實(shí)現(xiàn)交互译暂,但多數(shù)情況下內(nèi)核是需要用戶使用內(nèi)核編程語(yǔ)言編寫實(shí)現(xiàn)的荞怒。OpenCLC編程語(yǔ)言就是OpenCL中的內(nèi)核編程語(yǔ)言,該編程語(yǔ)言是“ISO C99 標(biāo)準(zhǔn)”的一個(gè)擴(kuò)展子集秧秉,也就是說它是由 ISO C99語(yǔ)言派生而來(lái)的『肿溃現(xiàn)在的OpenCL2.1還支持C++,是基于eISO/IEC JTC1 SC22 WG21 N3690(C++14)象迎。

2.4 適合平臺(tái)

  1. AMD
    根據(jù)AMD官網(wǎng)所提供的內(nèi)容荧嵌,OpenCL在AMD顯卡中只能適用X86核心的CPU架構(gòu),而對(duì)其他PowerPC和ARM架構(gòu)則不適用砾淌;并且也不是所有的AMD顯卡都能運(yùn)行OpenCL啦撮,按其官網(wǎng)介紹只能是AMD Radeon、AMD FirePro和AMD Firestream三種類型的顯卡汪厨;但對(duì)于操作系統(tǒng)則可以是Linux或Windows的系統(tǒng)赃春,如表1所示。
    表 1 AMD OpenCL
CPU架構(gòu) 顯卡類型 操作系統(tǒng) 系統(tǒng)位數(shù)
X86 AMD Radeon Linux/ Windows 32/64
AMD FirePro Linux/ Windows 32/64
AMD Firestream Linux/ Windows 32/64
  1. NVIDIA
    NVIDIA OpenCL是一種運(yùn)行于具有CUDA能力GPU上的一種底層API劫乱,即OpenCL是運(yùn)行于CUDA之上的一種API织中,從而若適用CUDA的平臺(tái),也同樣適用OpenCL衷戈。根據(jù)NVIDIA官網(wǎng)最新版本的CUDA
    7.5適合的平臺(tái)如表 2所示狭吼。
    表 2 NVIDIA OpenCL
操作系統(tǒng) CPU架構(gòu) Distribution
Windows X86_64 10、8.1殖妇、7刁笙、Server 2012 R2、Server 2008 R2
Linux X86_64 Fedora、OpenSUSE疲吸、RHEL座每、CentOS、SLES摘悴、steamOS尺栖、Ubuntu.
ppc64le Ubuntu
Mac OSX x86_64 10.11、10.10烦租、10.9

3. 計(jì)算架構(gòu)


OpenCL 的設(shè)計(jì)目標(biāo)是為開發(fā)人員提供一套移植性強(qiáng)且高效運(yùn)行的解決方案延赌。為了更好的描述OpenCL設(shè)計(jì)的核心理念,Khronos Group官方將OpenCL的計(jì)算架構(gòu)分解成四個(gè)模型叉橱,分別平臺(tái)模型(Platform Model)挫以、內(nèi)存模型(Memory Model)、執(zhí)行模型(Execution
Model)以及編程模型(Programming Model)窃祝。

3.1 平臺(tái)模型(Platform Model)

從整體上來(lái)看掐松,主機(jī)(host)端是負(fù)責(zé)掌管整個(gè)運(yùn)算的所有計(jì)算資源,因此OpenCL 應(yīng)用程序首先是由主機(jī)端開始粪小,然后由程序?qū)⒏鱾€(gè)計(jì)算命令從主機(jī)端發(fā)送給每個(gè) GPU 設(shè)備處理單元大磺,運(yùn)行完畢之后最后由主機(jī)端結(jié)束。

OpenCL架構(gòu)的平臺(tái)模型.png

平臺(tái)模型如圖 16所示探膊。從圖中可以直觀的看到杠愧,最基本處理單位是Processing Element,簡(jiǎn)稱PE(處理單元)逞壁,而一個(gè)或多個(gè)PE組成了Compute Unit流济,簡(jiǎn)稱CU(計(jì)算單元),進(jìn)而一個(gè)或多個(gè)CU就組成了Compute Device腌闯,即OpenCL設(shè)備绳瘟。最后,一個(gè)或多個(gè)OpenCL設(shè)備連接到主機(jī)姿骏,并等待著處理主機(jī)發(fā)送的計(jì)算指令糖声,由于PE是最基本處理單位,因此每條計(jì)算指令最終都?xì)wPE進(jìn)行處理分瘦,而PE是在CU中的蘸泻。

3.2 內(nèi)存模型(Memory Model)

OpenCL將內(nèi)核程序中用到的內(nèi)存分為圖 17所示的四種不同的類型。


OpenCL內(nèi)存模型.png

其中它們的讀寫特性分別為:

  • Global memory:
    工作區(qū)內(nèi)的所有工作節(jié)點(diǎn)都可以自由的讀寫其中的任何數(shù)據(jù)擅腰。OpenCL
    C語(yǔ)言提供了全局緩存(Global buffer)的內(nèi)建函數(shù)蟋恬。
  • Constant memory:
    工作區(qū)內(nèi)的所有工作節(jié)點(diǎn)可以讀取其中的任何數(shù)據(jù)但不可以對(duì)數(shù)據(jù)內(nèi)容進(jìn)行更改翁潘,在內(nèi)核程序的執(zhí)行過程中保持不變趁冈。主機(jī)端負(fù)責(zé)分配和初始化常量緩存(Constant buffer)。
  • Local memory:
    只有同一工作組中的工作節(jié)點(diǎn)才可以對(duì)該類內(nèi)存進(jìn)行讀寫操作。它既可以為 OpenCL的執(zhí)行分配一塊私有內(nèi)存空間渗勘,也可以直接將其映射到一塊全局緩存(Global buffer)上沐绒。特點(diǎn)是運(yùn)行速度快。
  • Private memory:
    只有當(dāng)前的工作節(jié)點(diǎn)能對(duì)該內(nèi)存進(jìn)行訪問和讀寫操作旺坠。一個(gè)工作節(jié)點(diǎn)內(nèi)部的私有緩存(Private buffer)對(duì)其他節(jié)點(diǎn)來(lái)說是不可見的乔遮。
    表 3 OpenCL各種存儲(chǔ)器的分配方式和訪問權(quán)限
存儲(chǔ)器類型 主機(jī) 內(nèi)核
分配方式 訪問權(quán)限 分配方式 訪問權(quán)限
Global 動(dòng)態(tài)分配 可讀、可寫 不可分配 可讀取刃、可寫
Constant 動(dòng)態(tài)分配 可讀蹋肮、可寫 靜態(tài)分配 只讀
Local 動(dòng)態(tài)分配 不可訪問 靜態(tài)分配 可讀、可寫
Private 不可分配 不可訪問 靜態(tài)分配 可讀璧疗、可寫

3.3 執(zhí)行模型(Execution Model)

OpenCL的執(zhí)行模型是應(yīng)用程序通過主機(jī)端對(duì)OpenCL設(shè)備端上的內(nèi)核程序進(jìn)行管理坯辩,該模型分為兩個(gè)模塊:一個(gè)是在主機(jī)端執(zhí)行的管理程序,也稱為Hostprogram崩侠,另一個(gè)是主機(jī)端的Hostprogram所管理的在OpenCL上執(zhí)行的程序漆魔,也被稱作Kernels。在執(zhí)行Kernels前却音,先要建立一個(gè)索引空間改抡,來(lái)對(duì)設(shè)備里的每個(gè)節(jié)點(diǎn)進(jìn)行標(biāo)識(shí),每個(gè)節(jié)點(diǎn)都將執(zhí)行相同的kernel程序系瓢。在每個(gè)工作組中阿纤,都有一個(gè)局ID,每個(gè)節(jié)點(diǎn)在全局里還有個(gè)全局ID夷陋,OpenCL使用NDRange來(lái)定義這個(gè)索引空間阵赠。

OpenCL執(zhí)行模型.png

如圖 18所示的OpenCL執(zhí)行模型,其過程可以細(xì)分為如下的步驟完成:

  1. 查詢連接主機(jī)上的OpenCL設(shè)備肌稻;
  2. 創(chuàng)建一個(gè)關(guān)聯(lián)到OpenCL設(shè)備的context清蚀;
  3. 在關(guān)聯(lián)的設(shè)備上創(chuàng)建可執(zhí)行程序;
  4. 從程序池中選擇kernel程序爹谭;
  5. 從主機(jī)或設(shè)備上創(chuàng)建存儲(chǔ)單元枷邪;
  6. 如果需要將主機(jī)的數(shù)據(jù)復(fù)制到OpenCL設(shè)備上的存儲(chǔ)單元上;
  7. 執(zhí)行kernel程序執(zhí)行诺凡;
  8. 從OpenCL設(shè)備上復(fù)制結(jié)果到主機(jī)上东揣。

3.4 編程模型(Programming Model)

OpenCL支持兩種編程模型,分別為數(shù)據(jù)并行編程模型和任務(wù)并行編程模型腹泌,并支持上面由這兩種編程模型混合的混合編程模型嘶卧。

  1. 數(shù)據(jù)并行編程模型
    OpenCL提供一個(gè)分層的數(shù)據(jù)并行編程模型,即典型的SIMD計(jì)算模型凉袱,其特點(diǎn)是每個(gè)數(shù)據(jù)經(jīng)由同樣的指令序列處理芥吟,而處理數(shù)據(jù)的次序是不確定的侦铜,并且每個(gè)數(shù)據(jù)的處理是不相干的,即任一線程的計(jì)算不得依賴于其它線程的結(jié)果(包括中間結(jié)果)钟鸵。
  2. 任務(wù)并行編程模型
    任務(wù)并行模型中的每個(gè)內(nèi)核是在一個(gè)獨(dú)立的索引空間中執(zhí)行的钉稍,也就是說,執(zhí)行內(nèi)核的計(jì)算機(jī)單元內(nèi)只有一個(gè)工作組棺耍,其中只有一個(gè)工作項(xiàng)贡未。在這樣的模型中,每個(gè)線程都可以執(zhí)行不同的帶啊蒙袍,著相當(dāng)于MIMD的計(jì)算模型俊卤,適合多核心CPU。
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
  • 序言:七十年代末害幅,一起剝皮案震驚了整個(gè)濱河市瘾蛋,隨后出現(xiàn)的幾起案子,更是在濱河造成了極大的恐慌矫限,老刑警劉巖哺哼,帶你破解...
    沈念sama閱讀 222,681評(píng)論 6 517
  • 序言:濱河連續(xù)發(fā)生了三起死亡事件,死亡現(xiàn)場(chǎng)離奇詭異叼风,居然都是意外死亡取董,警方通過查閱死者的電腦和手機(jī),發(fā)現(xiàn)死者居然都...
    沈念sama閱讀 95,205評(píng)論 3 399
  • 文/潘曉璐 我一進(jìn)店門无宿,熙熙樓的掌柜王于貴愁眉苦臉地迎上來(lái)茵汰,“玉大人,你說我怎么就攤上這事孽鸡□逦纾” “怎么了?”我有些...
    開封第一講書人閱讀 169,421評(píng)論 0 362
  • 文/不壞的土叔 我叫張陵彬碱,是天一觀的道長(zhǎng)豆胸。 經(jīng)常有香客問我,道長(zhǎng)巷疼,這世上最難降的妖魔是什么晚胡? 我笑而不...
    開封第一講書人閱讀 60,114評(píng)論 1 300
  • 正文 為了忘掉前任缺谴,我火速辦了婚禮槐脏,結(jié)果婚禮上姊氓,老公的妹妹穿的比我還像新娘未玻。我一直安慰自己,他們只是感情好患亿,可當(dāng)我...
    茶點(diǎn)故事閱讀 69,116評(píng)論 6 398
  • 文/花漫 我一把揭開白布品姓。 她就那樣靜靜地躺著谈跛,像睡著了一般攀细。 火紅的嫁衣襯著肌膚如雪箫踩。 梳的紋絲不亂的頭發(fā)上爱态,一...
    開封第一講書人閱讀 52,713評(píng)論 1 312
  • 那天,我揣著相機(jī)與錄音班套,去河邊找鬼肢藐。 笑死故河,一個(gè)胖子當(dāng)著我的面吹牛吱韭,可吹牛的內(nèi)容都是我干的。 我是一名探鬼主播鱼的,決...
    沈念sama閱讀 41,170評(píng)論 3 422
  • 文/蒼蘭香墨 我猛地睜開眼理盆,長(zhǎng)吁一口氣:“原來(lái)是場(chǎng)噩夢(mèng)啊……” “哼!你這毒婦竟也來(lái)了凑阶?” 一聲冷哼從身側(cè)響起猿规,我...
    開封第一講書人閱讀 40,116評(píng)論 0 277
  • 序言:老撾萬(wàn)榮一對(duì)情侶失蹤,失蹤者是張志新(化名)和其女友劉穎宙橱,沒想到半個(gè)月后姨俩,有當(dāng)?shù)厝嗽跇淞掷锇l(fā)現(xiàn)了一具尸體,經(jīng)...
    沈念sama閱讀 46,651評(píng)論 1 320
  • 正文 獨(dú)居荒郊野嶺守林人離奇死亡师郑,尸身上長(zhǎng)有42處帶血的膿包…… 初始之章·張勛 以下內(nèi)容為張勛視角 年9月15日...
    茶點(diǎn)故事閱讀 38,714評(píng)論 3 342
  • 正文 我和宋清朗相戀三年环葵,在試婚紗的時(shí)候發(fā)現(xiàn)自己被綠了。 大學(xué)時(shí)的朋友給我發(fā)了我未婚夫和他白月光在一起吃飯的照片宝冕。...
    茶點(diǎn)故事閱讀 40,865評(píng)論 1 353
  • 序言:一個(gè)原本活蹦亂跳的男人離奇死亡张遭,死狀恐怖,靈堂內(nèi)的尸體忽然破棺而出地梨,到底是詐尸還是另有隱情菊卷,我是刑警寧澤,帶...
    沈念sama閱讀 36,527評(píng)論 5 351
  • 正文 年R本政府宣布宝剖,位于F島的核電站洁闰,受9級(jí)特大地震影響,放射性物質(zhì)發(fā)生泄漏万细。R本人自食惡果不足惜渴庆,卻給世界環(huán)境...
    茶點(diǎn)故事閱讀 42,211評(píng)論 3 336
  • 文/蒙蒙 一、第九天 我趴在偏房一處隱蔽的房頂上張望雅镊。 院中可真熱鬧襟雷,春花似錦、人聲如沸仁烹。這莊子的主人今日做“春日...
    開封第一講書人閱讀 32,699評(píng)論 0 25
  • 文/蒼蘭香墨 我抬頭看了看天上的太陽(yáng)卓缰。三九已至计呈,卻和暖如春砰诵,著一層夾襖步出監(jiān)牢的瞬間,已是汗流浹背捌显。 一陣腳步聲響...
    開封第一講書人閱讀 33,814評(píng)論 1 274
  • 我被黑心中介騙來(lái)泰國(guó)打工茁彭, 沒想到剛下飛機(jī)就差點(diǎn)兒被人妖公主榨干…… 1. 我叫王不留,地道東北人扶歪。 一個(gè)月前我還...
    沈念sama閱讀 49,299評(píng)論 3 379
  • 正文 我出身青樓理肺,卻偏偏與公主長(zhǎng)得像,于是被迫代替她去往敵國(guó)和親善镰。 傳聞我的和親對(duì)象是個(gè)殘疾皇子妹萨,可洞房花燭夜當(dāng)晚...
    茶點(diǎn)故事閱讀 45,870評(píng)論 2 361

推薦閱讀更多精彩內(nèi)容

  • 1. 簡(jiǎn)介 官網(wǎng)在這里 OpenCL(Open Computing Language),即開放運(yùn)算語(yǔ)言炫欺,是一個(gè)統(tǒng)一...
    王偵閱讀 1,874評(píng)論 0 1
  • Spring Cloud為開發(fā)人員提供了快速構(gòu)建分布式系統(tǒng)中一些常見模式的工具(例如配置管理乎完,服務(wù)發(fā)現(xiàn),斷路器品洛,智...
    卡卡羅2017閱讀 134,716評(píng)論 18 139
  • Android 自定義View的各種姿勢(shì)1 Activity的顯示之ViewRootImpl詳解 Activity...
    passiontim閱讀 172,328評(píng)論 25 707
  • 暮落之夜閱讀 213評(píng)論 2 1
  • 今天和閨蜜聊了很多她相親的趣事树姨,有個(gè)很深的體會(huì)。你是怎么樣的女子桥状,就值得什么樣的男生來(lái)追求帽揪。你的生活邋遢,事業(yè)懶惰...
    organnn閱讀 367評(píng)論 1 2