融合注意力機制的深度哈希圖像檢索方法
摘要:傳統(tǒng)的基于深度哈希圖像檢索方法在獲取圖像的特征信息時,會關注到部分冗余信息,影響最終的圖像檢索精度。針對上述問題,提出一種應用于卷積神經(jīng)網(wǎng)絡中的融合跨維度交互注意力機制模塊,該模塊可以提高網(wǎng)絡的性能,學習到更多有利于圖像檢索的特征信息。在深度哈希圖像檢索任務中,選用VGG16與ResNet18兩種經(jīng)典模型作為圖像檢索的基礎模型,加入注意力模塊并且重新設計哈希碼目標損失函數(shù)后,在CIFAR-10和NUS-WIDE數(shù)據(jù)集上進行了對比實驗,實驗結果表明添加了注意力機制后的圖像檢索精度有較大提高,驗證了所提出方法的有效性。(剩余11293字)