基于高效調(diào)優(yōu)方法的統(tǒng)一高效微調(diào)架構(gòu)及應(yīng)用
摘 要:為解決大規(guī)模參數(shù)調(diào)優(yōu)問題,一系列高效微調(diào)方法誕生,但是在整合不同高效微調(diào)方法形成有效統(tǒng)一整體方面還存在挑戰(zhàn)。此外,統(tǒng)一調(diào)優(yōu)思想在視覺任務(wù)中的應(yīng)用仍然不足。因此,提出統(tǒng)一參數(shù)高效微調(diào)架構(gòu)ETTA(efficient Transformer tuning architecture)。首先通過適配器與前綴調(diào)優(yōu)工作原理的相似性,得出兩種方法整合形成統(tǒng)一調(diào)優(yōu)架構(gòu)的合理性;其次,在適配器選擇上,選用效果更好的并行適配器,同時對前綴調(diào)優(yōu)引入可調(diào)標(biāo)量得到縮放前綴調(diào)優(yōu)變體;然后將兩種方法整合形成統(tǒng)一調(diào)優(yōu)架構(gòu)ETTA,把并行適配器作用于Transformer前饋神經(jīng)網(wǎng)絡(luò)層并設(shè)置較大瓶頸維數(shù),縮放前綴調(diào)優(yōu)作用于多頭注意力層并設(shè)置較小可調(diào)前綴向量數(shù);最后將ETTA用于6個圖像分類或目標(biāo)檢測任務(wù),并與三種調(diào)優(yōu)策略進行性能比較。(剩余17326字)
-
-
- 計算機應(yīng)用研究
- 2025年03期
- 異構(gòu)聯(lián)邦學(xué)習(xí)在無人系統(tǒng)中的研究...
- 基于生成對抗網(wǎng)絡(luò)的人臉屬性合成...
- 基于深度學(xué)習(xí)的前沿視頻異常檢測...
- TSD-PBFT:基于信譽和標(biāo)...
- S-Raft:一種增強拜占庭和...
- 基于區(qū)塊鏈的動態(tài)多用戶可搜索加...
- 基于多粒度增強和答案驗證的法律...
- 基于問題導(dǎo)向式提示調(diào)優(yōu)小樣本文...
- 一種面向知識圖譜多跳問答的分層...
- 結(jié)合對比學(xué)習(xí)和雙流網(wǎng)絡(luò)融合知識...
- 多關(guān)系和時間增強的知識追蹤模型...
- 基于能量聚焦和改進變分模態(tài)分解...
- 背景圖增強的社交網(wǎng)絡(luò)重要節(jié)點自...
- 基于自適應(yīng)噪聲和動態(tài)加權(quán)的聯(lián)邦...
- 基于序列圖時空增強與地理關(guān)系的...
- 基于判別增強大語言模型微調(diào)的醫(yī)...
- 大規(guī)模符號網(wǎng)絡(luò)劃分的學(xué)習(xí)驅(qū)動型...
- 基于Boosting優(yōu)先經(jīng)驗重...
- 求解分布式約束優(yōu)化問題的鄰居忽...
- 一種帶有三重選擇機制的多種群多...
- 融合人工勢場的改進RRT*機械...
- 融合Wi-Fi與激光的機器人室...
- 多目標(biāo)雙元閉環(huán)供應(yīng)鏈回收連鎖店...
- 考慮非鄰近節(jié)點空間相關(guān)性的交通...
- 基于事后篩選經(jīng)驗回放的機器人深...
- 基于脈搏波信號相空間重構(gòu)與時間...
- 基于小樣本和隨機化的跨域人體動...
- 基于高效調(diào)優(yōu)方法的統(tǒng)一高效微調(diào)...
- 以目的地為導(dǎo)向的基于成本優(yōu)化的...
- 基于交通路網(wǎng)權(quán)重學(xué)習(xí)的城市機動...
- 基于信任度累積的聯(lián)邦協(xié)作頻譜感...
- 高速飛行器自組網(wǎng)快速高效加權(quán)分...
- 水聲網(wǎng)絡(luò)基于優(yōu)先級與可Zigz...
- 基于改進3D ResNet18...
- 基于蝗蟲視覺神經(jīng)的人群匯流行為...
- 一種改進的快速深度圖像先驗降噪...
- 融合雙向感知Transform...
- 聯(lián)合時空差異注意力與層級細節(jié)增...
- DepthMamba:多尺度V...
- 基于韋伯定律的彼得森圖局部人臉...
- 復(fù)合因素影響下嫌疑人發(fā)型變化的...