1. 研究背景


2. 方法與技術

(1) 算子特性分析

(2) 手動調度規則構造

為了驗證算子融合的有效性,研究人員首先使用TVM 的 tensor expression 調度原語(Scheduling Primitives)來手動構造融合規則:

這樣可以減少額外的記憶體訪問,允許計算結果直接存入寄存器或快取,進一步降低開銷。


3. 實驗結果與分析

(2) 性能提升

(a) 自動調優表現

(b) 運行時間加速比