基于特征對(duì)齊融合的雙波段圖像描述生成方法
摘 要: 為了獲得更準(zhǔn)確、全面的現(xiàn)場(chǎng)信息,采用紅外和可見(jiàn)光同步成像探測(cè)復(fù)雜場(chǎng)景已成為常態(tài),但現(xiàn)有圖像描述研究仍集中于可見(jiàn)光圖像,無(wú)法全面而準(zhǔn)確地描述已探測(cè)到的場(chǎng)景信息。為此,文中提出一種基于特征對(duì)齊融合的可見(jiàn)光?紅外雙波段圖像描述生成方法。首先,利用Faster?RCNN分別提取可見(jiàn)光圖像的區(qū)域特征和紅外圖像的網(wǎng)格特征;其次,以Transformer為基本架構(gòu),在可見(jiàn)光?紅外圖像對(duì)齊融合(VIIAF)編碼器中引入位置信息做橋接,進(jìn)行可見(jiàn)光?紅外圖像特征的對(duì)齊與融合;接著,將融合得到的視覺(jué)信息輸入Transformer解碼器中得到粗粒度文本的隱藏狀態(tài);最后將編碼器輸出的視覺(jué)信息、解碼器得到的隱藏狀態(tài)與經(jīng)訓(xùn)練的Bert輸出的語(yǔ)言信息輸入所設(shè)計(jì)的自適應(yīng)模塊,使視覺(jué)信息和語(yǔ)言信息參與文本預(yù)測(cè),實(shí)現(xiàn)文本由粗到細(xì)的圖像描述。(剩余13201字)
-
-
- 現(xiàn)代電子技術(shù)
- 2025年07期
- 基于特征過(guò)濾法和Stackin...
- 基于分布式共形陣列天線的和、差...
- 基于改進(jìn)OSELM算法的煤礦緊...
- 基于虛擬陣元自適應(yīng)波束合成超聲...
- 基于改進(jìn)HRNet和PPM的圖...
- 基于RT?BiSeNet的蘋(píng)果...
- 選擇性坐標(biāo)注意力下紅外圖像無(wú)人...
- 基于改進(jìn)的YOLOv8檢測(cè)網(wǎng)絡(luò)...
- 基于CWGAN?ABiLSTM...
- 基于特征對(duì)齊融合的雙波段圖像描...
- 基于多路徑動(dòng)態(tài)卷積的YOLOv...
- 基于特征融合與RCB?Effc...
- 聯(lián)合可信度學(xué)習(xí)的雙向相關(guān)GCN...
- 基于改進(jìn)K?shell的復(fù)雜網(wǎng)...
- 商用車考慮防側(cè)翻的軌跡跟蹤控制...
- 基于改進(jìn)PID和擴(kuò)張狀態(tài)觀測(cè)器...
- 基于YOLOv7?tiny的血...
- 基于改進(jìn)YOLO的礦卡駕駛員疲...
- 避障聲吶接收端分段頻域匹配濾波...
- 基于模糊熵的單木骨架重建方法...
- 一種用于fMRI的快速動(dòng)態(tài)因果...
- 基于邊緣計(jì)算的在途危險(xiǎn)品姿態(tài)識(shí)...
- 混合改進(jìn)的蜜獾優(yōu)化算法...
- 基于邏輯模型的多偏好旅游路線規(guī)...
- 混合文化基因算法求解帶容量約束...