https://zenn.dev/fusic/articles/ml-tts-vits-jsut-speed-comp

音声合成モデル VITSの性能と速度改善をしてみた

音声合成モデルVITSの性能と速度改善に関する記事です。

性能を維持しつつ、GPU上で3倍、CPU上で5倍の速度改善を実現しました。

AutoMOSとSpeechBertScoreで評価し、torch.compileによる最適化も行っています。

Reply to this note

Please Login to reply.

Discussion

No replies yet.