導(dǎo)彈領(lǐng)域文本嵌套命名實(shí)體識(shí)別方法研究
系統(tǒng)仿真學(xué)報(bào)
頁(yè)數(shù): 11 2022-10-17
摘要: 常規(guī)領(lǐng)域文本識(shí)別相對(duì)容易,而專業(yè)術(shù)語(yǔ)存在大量嵌套命名實(shí)體,識(shí)別難度大,是構(gòu)建航空航天領(lǐng)域知識(shí)圖譜的核心挑戰(zhàn)之一?,F(xiàn)有的命名實(shí)體識(shí)別技術(shù)多采用雙向長(zhǎng)短記憶網(wǎng)絡(luò)加條件隨機(jī)場(chǎng)(BiLSTM-CRF)識(shí)別實(shí)體,很難區(qū)分導(dǎo)彈領(lǐng)域術(shù)語(yǔ)的嵌套、交叉等復(fù)雜關(guān)系。為解決這一難題,在對(duì)領(lǐng)域文本進(jìn)行嵌套實(shí)體標(biāo)注的基礎(chǔ)上,提出一種融合語(yǔ)言學(xué)特征、基于機(jī)器閱讀理解的嵌套命名實(shí)體識(shí)別方法,引入先驗(yàn)知識(shí)、改...