Enhancing TVM VTA Simulator Performance through SIMD Vectorization

Enhancing_TVM_VTA_Simulator_Performance_Through_SIMD_Vectorization.pdf

文獻中透過程式分析發現 GEMM 部分為主要瓶頸，並以此作為優化重點。我們可以利用 BYOC 將深度學習模型中的部分關鍵算子（例如 GEMM）卸載到使用 RVV 向量化優化的自定義後端上。這樣可以使 TVM 在原生後端未能充分發揮 RVV 優勢時，透過定制的 Codegen 來獲得更高效能的執行結果。