基于動態(tài)閾值和差異性檢驗的自訓(xùn)練算法
摘要: 針對自訓(xùn)練算法在迭代訓(xùn)練分類器的過程中存在難以有效選取高置信度樣本以及誤標(biāo)記樣本錯誤累積的問題,本文提出了基于動態(tài)閾值和差異性檢驗的自訓(xùn)練算法。引入樣本的局部離群因子,據(jù)此剔除有標(biāo)簽樣本中的離群點以及分類標(biāo)注無標(biāo)簽樣本,依據(jù)標(biāo)注分批次處理無標(biāo)簽樣本,以使模型更易選取到高置信度的無標(biāo)簽樣本;根據(jù)新增偽標(biāo)簽樣本的數(shù)量和對比隸屬度的變化,設(shè)計一種動態(tài)隸屬度閾值函數(shù),提升高置信度樣本的... (共14頁)
開通會員,享受整站包年服務(wù)