add operator。使用另一塊螢幕透過 HDMI 輸出測試,顯示功能正常。
在 Banana Pi F3 上執行 RISC-V 基金會的 RVV matmul 範例,結果發現 RVV 版本運行時間為普通版本的一倍,因此我們正在分析可能的瓶頸。( a 是教科書版本, b 是 RVV 版本)

嘗試解決上述問的方案如下
Page Fault 測試:改為一次性 malloc(n*m*sizeof()) 分配連續記憶體,而非在迴圈中分多次 malloc,但結果並未改善,仍為 41 秒 / 91 秒。

GCC Optimization:啟用最佳化後效能有明顯改善,測試結果成功提升速度。註解:為了讓矩陣驗證答案通過,我們把精度從 1e-6 調成 1e-5 ,不影響運算。

以上為本週的專題進度。