當(dāng)前位置:首頁 > 實用文檔 > 計算機軟件及計算機應(yīng)用 > 正文

融合注意力機制的IETM細粒度跨模態(tài)檢索算法

系統(tǒng)工程與電子技術(shù) 頁數(shù): 9 2022-08-23
摘要: 交互式電子手冊是提高各類裝備保障信息化、智能化的關(guān)鍵技術(shù)之一,針對其檢索模態(tài)單一的問題,以其數(shù)據(jù)中圖文描述為研究對象,提出一種融合注意力機制的細粒度跨模態(tài)檢索算法。針對數(shù)據(jù)中圖像簡圖較多、色彩單一等特點,特征提取模塊使用Vision Transformer模型和Transformer編碼器分別獲得圖文的全局和局部特征;使用注意力機制在圖文模態(tài)間及模態(tài)內(nèi)部挖掘細粒度信息,加入文本...

開通會員,享受整站包年服務(wù)立即開通 >