盡管在傳統(tǒng)硬件仿真領(lǐng)域,“可編程邏輯門陣列”(FPGA)的名氣要更高一些。但近期一些成功的 FPGA 光追游戲運算演示,再次吸引了許多人的目光,因為這通常是圖形處理器(GPU)的優(yōu)勢領(lǐng)域。TechSpot 報道稱,來自兩位開發(fā)者的新工作流工具,使得一枚普通的 FPGA、能夠?qū)崿F(xiàn)較傳統(tǒng) x86 處理器更驚人的效率提升,為多個行業(yè)的節(jié)能運營開辟了新經(jīng)驗。
Arty A7 FPGA 開發(fā)板資料圖
本次演示選擇了一個在棋盤上彈跳的閃亮球形物體,且它用到了實時光線追蹤功能 —— 之前沒人指望過一款中型 FPGA 芯片能夠輕松應(yīng)對此類應(yīng)用。
不過更值得稱道的,還是 FPGA 運行游戲所消耗的能量,遠(yuǎn)低于功能更強(qiáng)大的 AMD 筆記本電腦處理器。
在 Artix 7 100T 硬件上,Victor Suarez Rovere 和 Julian Kemmerer 借助他們的 CflexHDL / PipelineC 工具,用 C 語言構(gòu)建了這一演示所需的 FPGA 固件代碼。
作為比較,兩位開發(fā)者搬來了 AMD 銳龍 R9-4900H 平臺、并編譯了基于 CPU 軟解(不使用集成的核顯)的相同演示。
兩者均在 1080p 下以大約 60 FPS 的幀速率運行游戲,但需要截然不同的性能配置文件來完成任務(wù)。
據(jù)悉,Artix 平臺采用了 28nm 節(jié)點工藝的 FPGA 芯片,主頻為 148 MHz、具有約 10 萬個邏輯元件。
相比之下,銳龍 R9-4900H 是一款 8C / 16T 的 7nm 處理器。開發(fā)人員在 4.2 GHz 的加速頻率附近,調(diào)用了該芯片的所有核心線程。
Rovere 和 Kemmerer 估計,Artix 的晶體管數(shù)量,大約只有這枚銳龍移動芯片的 1 / 15 。
盡管硬件規(guī)模上存在相當(dāng)大的差距,但 FPGA 演示僅消耗了 660 mW 的功率。而且就算沒用到主動式散熱解決方案,該芯片仍“幾乎沒有發(fā)熱”。
另一方面,x86 架構(gòu)的銳龍 R9-4900H 的功耗達(dá)到了 33 W —— 不僅 50 倍于 FPGA,風(fēng)扇也在 88℃ 的高溫下猛轉(zhuǎn)以實現(xiàn)相同的性能。
Rovere 和 Kemmerer 據(jù)此推測,7nm FPGA 芯片可進(jìn)一步將能效差距擴(kuò)大至 6 倍、同時功耗低至銳龍 R9-4900H 的 1/300 。
當(dāng)然,我們不該徹底無視 APU 上的核芯顯卡、或在搭配專用獨顯(GPU 加速卡)下可實現(xiàn)的更高效能。
但這么做仍無法消除與 Artix 平臺的差距,更別提采用更先進(jìn)的 FPGA 解決方案來發(fā)起挑戰(zhàn)了。
最后,感興趣的朋友,可移步至 PipelineC-Graphics 的 GitHub 項目主頁(白皮書),以獲知更多細(xì)節(jié)。
EP2S130F1020I4N
EP3SL340F1517I4
EP3SL340F1517C4N
EP3SL340F1517C3N
EP1S40F1508I6
EP1S40F1508I6N
EP1S40F1508C6N
EP2S180F1020C4
EP2S180F1020I5
EP2S180F1020I4
EP2S180F1020C3
EP2S180F1020I5N
EP2S180F1508C4N
EP2S180F1020C4N
EP2S180F1020I3N
EP2S180F1020C5N
文章來源:cnBeta.COM