基于img2col的2D卷積算子在DCU加速器上的并行優(yōu)化研究
摘要:深度學(xué)習(xí)中,因卷積巨大的計(jì)算需求,經(jīng)常成為限制大型卷積神經(jīng)網(wǎng)絡(luò)性能的瓶頸,為此,提出使用并行技術(shù)來(lái)優(yōu)化卷積運(yùn)算的策略。對(duì)傳統(tǒng)2D卷積算子進(jìn)行重構(gòu),使其轉(zhuǎn)換為通用矩陣乘法;使用共享內(nèi)存和數(shù)據(jù)預(yù)取等技術(shù),降低訪存次數(shù);針對(duì)加速器的硬件架構(gòu),調(diào)整算法的并行方案以提高計(jì)算性能。實(shí)驗(yàn)結(jié)果表明,相較傳統(tǒng)的計(jì)算方式,該優(yōu)化策略將運(yùn)算速度提升了近7.5倍,提高了卷積運(yùn)算效率。(剩余9317字)
-
-
- 青島大學(xué)學(xué)報(bào)(自然科學(xué)版)
- 2024年04期
目錄
- 一種用于動(dòng)脈粥樣硬化靶向治療的...
- DNA損傷應(yīng)答中DEAD-bo...
- 粗糙表面滑動(dòng)軸承潤(rùn)滑性能研究...
- 三相旋流混合器的仿真與流場(chǎng)特性...
- SDN中基于強(qiáng)化學(xué)習(xí)的路由算法...
- 基于img2col的2D卷積算...
- 國(guó)際原油與股票市場(chǎng)風(fēng)險(xiǎn)聯(lián)動(dòng)效應(yīng)...
- 基于Fuzzy-Pid的物流車...
- 電商供應(yīng)鏈網(wǎng)絡(luò)均衡直播模式研究...
- 基于深度學(xué)習(xí)的生鮮電商物流服務(wù)...
- 回收品質(zhì)量不確定下考慮信息不對(duì)...
- 低碳背景下基于四方演化博弈的航...
- 數(shù)字金融視角下內(nèi)外雙循環(huán)協(xié)同的...
- 企業(yè)數(shù)字化轉(zhuǎn)型的碳減排效應(yīng)研究...
- 政府綠色采購(gòu)對(duì)企業(yè)綠色技術(shù)創(chuàng)新...
- 跨境電商與長(zhǎng)三角地區(qū)城市創(chuàng)新...
- 煙草消費(fèi)稅改革對(duì)煙民負(fù)面情緒的...
- 住房財(cái)富對(duì)商業(yè)人身保險(xiǎn)參與的影...
- 安徽省城鄉(xiāng)融合發(fā)展水平及其影響...
- 中國(guó)城鄉(xiāng)融合發(fā)展水平:統(tǒng)計(jì)測(cè)度...