面向SW26010-Pro的1、2級BLAS函數(shù)眾核并行優(yōu)化技術(shù)
軟件學(xué)報(bào)
頁數(shù): 16 2022-12-01
摘要: BLAS (basic linear algebra subprograms)是高性能擴(kuò)展數(shù)學(xué)庫的一個(gè)重要模塊,廣泛應(yīng)用于科學(xué)與工程計(jì)算領(lǐng)域. BLAS 1級提供向量-向量運(yùn)算, BLAS 2級提供矩陣-向量運(yùn)算.針對國產(chǎn)SW26010-Pro眾核處理器設(shè)計(jì)并實(shí)現(xiàn)了高性能BLAS 1、2級函數(shù).基于RMA通信機(jī)制設(shè)計(jì)了從核歸約策略,提升了BLAS 1、2級若干函數(shù)的歸約效率.針...