基于類(lèi)名引導(dǎo)的弱監(jiān)督文本分類(lèi)
計(jì)算機(jī)工程與設(shè)計(jì)
頁(yè)數(shù): 8 2023-08-16
摘要: 針對(duì)弱監(jiān)督文本分類(lèi)過(guò)于依賴(lài)專(zhuān)家生成種子詞的局限,提出一種基于類(lèi)名引導(dǎo)生成種子詞的弱監(jiān)督文本分類(lèi)方法。使用Skip-Gram模型學(xué)習(xí)單詞的向量表示,借助vMF(von Mises Fisher)分布對(duì)用戶(hù)提供的類(lèi)名與語(yǔ)料庫(kù)之間的關(guān)系進(jìn)行建模,綜合考慮語(yǔ)義相關(guān)性和語(yǔ)義特異性,由此生成一組高質(zhì)量的種子詞,無(wú)需依賴(lài)專(zhuān)家經(jīng)驗(yàn);迭代使用種子詞生成偽標(biāo)簽和文檔分類(lèi)器;擴(kuò)展種子詞,進(jìn)一步提升模...