Enhancing_TVM_VTA_Simulator_Performance_Through_SIMD_Vectorization.pdf

文獻摘要

文獻中透過程式分析發現 GEMM 部分為主要瓶頸,並以此作為優化重點。我們可以利用 BYOC 將深度學習模型中的部分關鍵算子(例如 GEMM)卸載到使用 RVV 向量化優化的自定義後端上。這樣可以使 TVM 在原生後端未能充分發揮 RVV 優勢時,透過定制的 Codegen 來獲得更高效能的執行結果。