基于卷積神經(jīng)網(wǎng)絡(luò)的暗網(wǎng)網(wǎng)頁分類研究
計(jì)算機(jī)應(yīng)用與軟件
頁數(shù): 7 2023-02-12
摘要: 在海量暗網(wǎng)網(wǎng)頁中篩選敏感主題內(nèi)容對(duì)執(zhí)法部門具有重要意義。通過對(duì)Freenet等暗網(wǎng)網(wǎng)頁文本特點(diǎn)和類別進(jìn)行深入分析,提出基于TextCNN的暗網(wǎng)網(wǎng)頁主題分類模型。模型根據(jù)暗網(wǎng)網(wǎng)頁非標(biāo)準(zhǔn)化的語言特點(diǎn)進(jìn)行數(shù)據(jù)預(yù)處理;使用預(yù)訓(xùn)練的詞向量獲得網(wǎng)頁內(nèi)容的表示,通過不同大小的卷積核進(jìn)行卷積操作獲得特征圖像,使用最大池化函數(shù)獲得最終的特征向量;對(duì)卷積網(wǎng)絡(luò)進(jìn)行正則化處理,使用softmax函數(shù)預(yù)...