遺忘曲線和BTM詞頻雙層加權(quán)微博用戶畫像
計(jì)算機(jī)工程與設(shè)計(jì)
頁(yè)數(shù): 9 2023-12-16
摘要: 針對(duì)微博短文本具有時(shí)效性和建模中頻詞缺失的問(wèn)題,提出一種遺忘曲線和BTM詞頻雙層加權(quán)微博用戶畫像方法。通過(guò)計(jì)算詞條的時(shí)間權(quán)重和提高中頻詞的詞頻權(quán)重,獲取雙層加權(quán)的用戶興趣主題詞。利用遺忘曲線擬合時(shí)間函數(shù),計(jì)算微博詞條的時(shí)間權(quán)重;將重新計(jì)算的詞頻特征作為Gibbs采樣的隨機(jī)值,提出一種改進(jìn)的詞頻加權(quán)BTM主題模型,提高中頻詞的詞頻權(quán)重;提出一種微博用戶行為影響力計(jì)算方法,構(gòu)建熱點(diǎn)...