基于birch聚類的可更新機(jī)器學(xué)習(xí)索引模型
計(jì)算機(jī)工程與設(shè)計(jì)
頁數(shù): 7 2023-11-16
摘要: 為滿足大數(shù)據(jù)時(shí)代下數(shù)據(jù)庫系統(tǒng)高吞吐、低內(nèi)存占用的索引設(shè)計(jì)需求,提出一種面向海量數(shù)據(jù)的基于birch聚類可更新機(jī)器學(xué)習(xí)索引模型。將數(shù)據(jù)集使用birch聚類進(jìn)行劃分,對(duì)分段數(shù)據(jù)分別使用前饋神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練擬合,采用基于日志結(jié)構(gòu)合并樹延遲更新思路的異地插入策略,實(shí)現(xiàn)索引更新操作。使用真實(shí)數(shù)據(jù)集進(jìn)行實(shí)驗(yàn),其結(jié)果表明,相比傳統(tǒng)索引和當(dāng)前先進(jìn)機(jī)器學(xué)習(xí)索引結(jié)構(gòu),該模型在檢索速度上有一定提升,...