基于漢語特征的中文對抗樣本生成方法
軟件學(xué)報
頁數(shù): 19 2023-06-19
摘要: 深度神經(jīng)網(wǎng)絡(luò)容易受到來自對抗樣本的攻擊,例如在文本分類任務(wù)中修改原始文本中的少量字、詞、標點符號即可改變模型分類結(jié)果.目前NLP領(lǐng)域?qū)χ形膶箻颖镜难芯枯^少且未充分結(jié)合漢語的語言特征.從中文情感分類場景入手,結(jié)合了漢語象形、表音等語言特征,提出一種字詞級別的高質(zhì)量的對抗樣本生成方法 CWordCheater,涵蓋字音、字形、標點符號等多個角度.針對形近字的替換方式,引入Conv...