-
Notifications
You must be signed in to change notification settings - Fork 310
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Implement GPT-SoVITS #1422
base: master
Are you sure you want to change the base?
Implement GPT-SoVITS #1422
Conversation
vitsモデルがSTFTを使用しているのでailia SDKの更新が必要。
|
vitsだけonnx runtimeで動かす。
|
STFT導入済みの最新Masterで実行。
|
モデルが不正。
|
onnxruntimeの実装では[batch_size][signal_length]の入力にも対応していた記憶があるが、onnxの規格外 |
@kuguma onnxruntimeでは動作しており、torchと公式のonnxパッケージからエクスポートしているため、onnxのドキュメントの方が追いついてないのかもしれません。ailiaもこのモデルが動く範囲まで仕様拡張可能でしょうか? |
@kyakuno 対応してみます。 |
実装を拡張しましたが(テストも追加して確認済み)、別のエラーで停止しました。
|
OnnxReferenceを利用するようにこのスクリプトを書き換えてみて試してみましたが、仕様通りエラーとなりました。 また、torchのonnx.exporterの実装を確認してみましたが、こちらはruntimeと同様に入力は2次元を想定する形になっています。 torch, onxxruntimeとonnx公式側で差が出ているようで、どっちに寄せるかは公開リポジトリ上での相談が必要なので追々コントリビュートするとして、とりあえずailiaではどちらも対応できるように進めます。 Ifで落ちたのは別に原因がありそう(@mmitti さんが対処中) |
もろもろの修正を取り込んだailia本体のmaster最新で、手元での動作を確認しました。 |
ailia SDK 1.4.0 betaで動作を確認しました。 |
TODO : モデル名からnahidaを削除、英語での音声合成に対応 |
英語の音声合成の対応と、モデル名の変更を行なった。 |
#1404