? ?人工智能對于芯片和軟硬件系統(tǒng)的架構(gòu)定義筋遭,設(shè)計理論和流程方法將會產(chǎn)生前所未有的沖擊,在這二十年的芯片設(shè)計長河中出現(xiàn)了很多璀璨閃耀的方法學(xué)籽懦,包括
1.? ?架構(gòu)級/結(jié)構(gòu)級建模
2.? ?算法/硬件劃分映射
3.? ?軟硬件系統(tǒng)協(xié)同設(shè)計驗證
4.? ?PPA(性能/功耗/面積)平衡優(yōu)化??等等
這些著名的在歷史中沉浮的方法學(xué)終于在AI時代的芯片設(shè)計中大放異彩于个,釋放出了前所未有的活力。究其原因暮顺,是因為AI的系統(tǒng)設(shè)計難以比擬的獨特性和挑戰(zhàn)性厅篓。
1.? ? 系統(tǒng)架構(gòu)的重要性前所未有。從芯片架構(gòu)捶码,包括計算架構(gòu)羽氮,存儲架構(gòu),互聯(lián)架構(gòu)惫恼;到軟件架構(gòu)档押,包括應(yīng)用架構(gòu),編譯架構(gòu)祈纯,調(diào)度架構(gòu)令宿,驅(qū)動架構(gòu);每一個因素都決定系統(tǒng)設(shè)計的成敗和效能盆繁。
2.? ?軟硬件結(jié)合的生態(tài)系統(tǒng)是重中之重掀淘。AI已經(jīng)不是單純芯片的概念,也不是單純軟件應(yīng)用的概念油昂。軟硬件聯(lián)合設(shè)計革娄,驗證倾贰,優(yōu)化和后續(xù)開發(fā)是系統(tǒng)決勝的關(guān)鍵。芯片的理論規(guī)格不再是紙面的參數(shù)拦惋,是需要系統(tǒng)和軟件聯(lián)合設(shè)計才能獲取的目標(biāo)匆浙。生態(tài)系統(tǒng)建立的高效性和開發(fā)者的易用性是系統(tǒng)驥芯片部署成功的根本之一。
3.? ? 性能功耗比(Performance/Watt), 性能成本比(Performance/$)厕妖, 功耗成本比(Watt/$)在AI的不同應(yīng)用方向有著不同的優(yōu)先級首尼。在性能,功耗言秸,面積软能,可靠性,安全性举畸,快速響應(yīng)性等各個維度的取舍讓高質(zhì)量的AI芯片設(shè)計成為更大的挑戰(zhàn)查排。
4.? ? AI算法當(dāng)前的靈活性和未來的多變性,以及軟件框架的多樣化給系統(tǒng)設(shè)計帶來了很大的挑戰(zhàn)抄沮。如何面向未來進(jìn)行設(shè)計跋核,面向端云進(jìn)行延伸,讓現(xiàn)在的軟硬件系統(tǒng)有更強(qiáng)的靈活性和擴(kuò)展性叛买,也是目前設(shè)計領(lǐng)域一個較大的挑戰(zhàn)砂代。
綜合這些,如何設(shè)計高效能率挣,高性價比的“算力架構(gòu)”和與之相關(guān)的軟硬件優(yōu)化系統(tǒng)刻伊,是當(dāng)前AI芯片設(shè)計的主要原則。以此為中心难礼,結(jié)合這些年的設(shè)計方法學(xué)娃圆,作為AI芯片設(shè)計者需要考慮如何把握以下設(shè)計規(guī)則:
1.? ? 在最初的架構(gòu)設(shè)計下最大的功夫,架構(gòu)級建模流程的引入必不可少蛾茉。
對于算力引擎的有效性,數(shù)據(jù)帶寬和吞吐撩鹿,片內(nèi)外互聯(lián)結(jié)構(gòu)的QOS谦炬,基本的調(diào)度方法,高效的編程模型等等节沦;必須進(jìn)行有效的評估键思,并對于芯片設(shè)計的后面階段產(chǎn)生指導(dǎo)作用。
2.? ? 從建模(modeling)甫贯,到邏輯仿真(Simulation)吼鳞,到物理仿真(Emulation),到FPGA的每一個階段叫搁,軟硬件的聯(lián)合設(shè)計調(diào)優(yōu)都要貫穿于其中赔桌。
從一開始提供模型保證軟硬件的分離開發(fā)供炎,到開發(fā)中后期軟硬件整合的聯(lián)調(diào),再到芯片回來的測試再調(diào)優(yōu)疾党;如何按階段的保證軟硬件設(shè)計優(yōu)化的充分音诫,是這個流程必須要重視的問題。另外雪位,對于軟件各層竭钝,包括調(diào)度模型,編譯效率雹洗,驅(qū)動硬件調(diào)優(yōu)以及開發(fā)易用性的考量香罐,以及對于Benchmarking和Test Stimulus的制定,都是軟硬件協(xié)作中不可缺少的步驟时肿。
3.? ? 根據(jù)芯片的不同定位和方向庇茫,設(shè)置PPA(性能,功耗,面積)的優(yōu)先級和平衡策略。
解決好以下幾個熱點問題:
? ? ? a)? ? 系統(tǒng)級(System/Platform)對于性能嗜侮,功耗港令,成本,穩(wěn)定性锈颗,安全性的綜合考慮
? ? ? b)? ? ?編程的靈活性和晶體管消耗(面積功耗的代價)的平衡
? ? ? c)? ? ?理論算力峰值與實際應(yīng)用性能之前的差距彌補(bǔ)
? ? ? d)? ? ?性能線性提升和功耗非線性增加之間的平衡
? ? ? ?e)? ? ?工藝的步進(jìn)對于性能功耗的優(yōu)化以及量產(chǎn)成本的提升之間的權(quán)衡 等等
成為PPA平衡設(shè)計的關(guān)鍵顷霹。
4.? ? 前瞻性定義開發(fā)。
根據(jù)AI算法的未來步進(jìn)击吱,市場競爭產(chǎn)品的出現(xiàn)淋淀,新技術(shù)的出現(xiàn)和準(zhǔn)備曲線等等,所有產(chǎn)品的定義必須充分考慮未來的不確定性和競爭力覆醇。對于新興算法和算子的調(diào)研朵纷,對于新興軟件框架的調(diào)研,對于新工藝永脓,IP的出現(xiàn)袍辞,更重要的,對于主要客戶未來需求的采集和分析常摧,才能對于產(chǎn)品的未來定位有更加清晰的策略搅吁,對于開發(fā)路線有更加清楚的判斷。
5.? ? 強(qiáng)大的軟硬件項目管理流程落午。
以里程碑和質(zhì)量檢查為驅(qū)動的芯片開發(fā)流程谎懦;以迭代敏捷為代表的軟件開發(fā)流程,必須有效的結(jié)合和同步溃斋,才能達(dá)到完美的系統(tǒng)開發(fā)效果界拦。
分享這些,是希望有更多的中國AI設(shè)計團(tuán)隊能夠崛起梗劫,中國芯片的戰(zhàn)場需要更多的中國人享甸,也需要更多有情懷截碴,有決心,有抱負(fù)的工程化團(tuán)隊枪萄。
乘風(fēng)破浪會有時隐岛,直掛云帆濟(jì)滄海!