基于組稀疏優(yōu)化的強化學(xué)習(xí)稀疏表征
摘要:強化學(xué)習(xí)由于具有出色的數(shù)據(jù)效率和快速學(xué)習(xí)的能力,開始應(yīng)用于許多實際問題以學(xué)習(xí)復(fù)雜策略。但是高維環(huán)境中的強化學(xué)習(xí)常常受限于維度災(zāi)難或者災(zāi)難性干擾,性能表現(xiàn)不佳甚至導(dǎo)致學(xué)習(xí)失敗。圍繞表征學(xué)習(xí),提出了一種符合Lasso 類型優(yōu)化的稀疏卷積深度強化學(xué)習(xí)方法。首先,對稀疏表征的理論和優(yōu)勢進行綜述,將稀疏卷積方法引入深度強化學(xué)習(xí)中,提出了一種新的稀疏表征方法;其次,對由稀疏卷積編碼定義的可微優(yōu)化層進行了數(shù)學(xué)推導(dǎo)并給出了優(yōu)化算法,為了驗證新的稀疏表征方法的有效性,將其應(yīng)用于相關(guān)文獻常見的基準(zhǔn)環(huán)境中進行測試。(剩余8514字)
試讀結(jié)束
-
-
- 華東理工大學(xué)學(xué)報(自然科學(xué)版)
- 2024年06期
目錄
- 碳/氮化鈦粉體制備技術(shù)...
- 三聚甲醛-甲醛-水-[BMIM...
- 基于三氧化硫磺化的丹參酮ⅡA ...
- 立方型與PC-SAFT EoS...
- 阿魏酸-煙酰胺共晶的氫鍵作用及...
- 聚硅氧烷/納米二氧化鈦超疏水光...
- 基于迭代進化的腸出血性大腸桿菌...
- 人工神經(jīng)網(wǎng)絡(luò)和響應(yīng)面法優(yōu)化黑曲...
- Cu2+對水體中氧氟沙星光化學(xué)...
- 基于自上而下注意力機制的零樣本...
- 基于多目標(biāo)生物地理學(xué)優(yōu)化算法的...
- 基于物理信息深度學(xué)習(xí)算法的Fl...
- 一種基于StyleGAN 生成...
- 基于局部和全局特征提取及多級特...
- 平衡信息與動態(tài)更新的原型表示聯(lián)...
- 基于組稀疏優(yōu)化的強化學(xué)習(xí)稀疏表...
- 基于改進注意力機制的CNN 的...
- 基于數(shù)據(jù)庫方法的離子輻照用小沖...