基于對(duì)比學(xué)習(xí)的文本生成圖像
摘 要:針對(duì)在多目標(biāo)文本生成圖像和語義相關(guān)度高的情況下,于CUB數(shù)據(jù)集中進(jìn)行實(shí)驗(yàn)時(shí),發(fā)現(xiàn)生成的鳥圖像中有許多“多頭”“多腳”情況,文章在MA-GAN(多階段注意力機(jī)制的生成對(duì)抗網(wǎng)絡(luò))模型上加入對(duì)比學(xué)習(xí)以優(yōu)化圖像生成。同時(shí),采用特征插值方法增強(qiáng)圖像的某些特征,從而提高語義一致性和文本辨識(shí)度。通過在CUB和COCO數(shù)據(jù)集上的實(shí)現(xiàn)驗(yàn)證,改進(jìn)后模型的IS(InceptionScore)指標(biāo)分別提高了0.11和2.58,而R 分?jǐn)?shù)(Rprecision)指標(biāo)分別提高了1.98和1.37,證明了改進(jìn)后的模型能夠解決圖像質(zhì)量和語義一致性問題。(剩余7123字)
目錄
- 基于Fairmot的交通違法行...
- 基于內(nèi)容和上下文的敏感個(gè)人信息...
- 基于坐標(biāo)注意力機(jī)制與Focal...
- 基于LSTM-CGAN 的風(fēng)電...
- 基于異構(gòu)圖卷積網(wǎng)絡(luò)的隱式信任和...
- 基于神經(jīng)網(wǎng)絡(luò)與注意力的任意圖像...
- 基于深度學(xué)習(xí)的咖啡果實(shí)成熟度檢...
- 基于對(duì)比學(xué)習(xí)的文本生成圖像...
- 一種基于Transformer...
- 基于改進(jìn)YOLOv8的百合地雜...
- 基于網(wǎng)絡(luò)重構(gòu)的改進(jìn)GhostN...
- 基于字段信息和覆蓋率反饋的協(xié)議...
- 社交網(wǎng)絡(luò)中基于信任的社區(qū)謠言傳...
- 基于APSIM 模型的不同降水...
- 基于主從圖神經(jīng)網(wǎng)絡(luò)的拓?fù)湟恢履?..