異步策略的強(qiáng)化因果發(fā)現(xiàn)方法
摘要:研究和發(fā)掘事物之間的因果關(guān)系是數(shù)據(jù)科學(xué)的核心問題之一。針對(duì)因果發(fā)現(xiàn)面臨著搜索空間超指數(shù)量級(jí)增長、評(píng)價(jià)指標(biāo)低、收斂速度慢且效果差等問題,本文提出一種基于異步策略的強(qiáng)化因果發(fā)現(xiàn)方法。首先采用自注意力機(jī)制的編碼器和單層解碼器模型探索數(shù)據(jù)之間的因果關(guān)系;其次,改進(jìn)強(qiáng)化學(xué)習(xí)模型中的結(jié)構(gòu)約束,并基于異步優(yōu)勢(shì)算法更新網(wǎng)絡(luò)模型參數(shù);最后,搜索、輸出最大獎(jiǎng)勵(lì)的有向無環(huán)圖。(剩余23837字)
-
-
- 燕山大學(xué)學(xué)報(bào)
- 2024年04期