My TODO List #47

hikettei · 2023-07-29T03:40:41Z

今取り組んでることとか課題とかのTODO List

Environments / Backends

ネットワーク構築のAPI(defnode/define-impl/define-impl-op/defmodel/defmodel-as)の構築/テスト (Implemented Fairly well)
ただのNumpy-likeな行列演算ライブラリとして、cl-waffe2から分離したプロジェクトとして、コンパイルされたcl-waffe2のプログラムの集合をライブラリとして提供することができる (e.g.: topi in TVM)
RNNの実装に関して
- Control FlowをVMに実装するか defmodel-asで部分的にコンパイルしたネットワークをdefine-by-runっぽく繋げて動作する二つの方法のどっちかがある多分後者でRNN実装
defmodel-asの最適化:
-AOT Compiler, AbstractNodeにコンパイルするときはメモリの割り当てだけ後から変更して再利用できるように！
define-by-runモードの実装で一番の課題はコンパイル時間である。
- (メソッド割り当てが重い) 1. AbstractNodeネットワークの構築 2. ネットワークのコンパイル この二つに分けて最適化。
Conv2DのSubscript DSLのバグ
forward -> compiler-macro使ってインライン化できない？

defpathマクロによる検索ベースのFusionOpでデバイス特化の最適化を追加する
- 例えば!sumはBroadcastingとAddNodeベースだが、総和専用のKernelを書いた方が速度精度高い。
(log (1+ x))の微分のFusionOPは数値的安定性からMUSTである。これからFusionOPで実装する
最適化 -> (EXP X) -> A, B これを検出して最適化できる箇所がたくさんある。ソートをTensorじゃなくてAbstractNodeのIDベースでやればできそう
最適化: sin(x, out) <- outでcopy(x)するの無駄 allocする計算ノードにする