基于多尺度混合注意力機(jī)制的視頻摘要算法
計(jì)算機(jī)工程與設(shè)計(jì)
頁(yè)數(shù): 7 2023-11-16
摘要: 針對(duì)現(xiàn)有的視頻摘要任務(wù)中視頻幀的多層次上下文依賴信息提取不足的問題,提出一種基于多尺度混合注意力機(jī)制的視頻摘要(MHAVS)算法。MHAVS采用編碼器-解碼器架構(gòu),編碼器部分采用金字塔空洞卷積模塊提取視頻幀的不同尺度特征信息,解碼器部分嵌入混合注意力機(jī)制建模視頻幀的通道維度和空間維度的深度相互依賴性,增強(qiáng)特征的表達(dá),利用指針網(wǎng)絡(luò)幫助模型生成優(yōu)勢(shì)的視頻摘要。提出算法在兩個(gè)公共數(shù)據(jù)...