VOOZH about

URL: https://qiita.com/syoyo/items/cfc7f1af7588ab7963ce

⇱ ESPNet で standalone python script で日本語 text-to-speech するメモ #TTS - Qiita


👁 Image
4

Go to list of users who liked

3

Share on X(Twitter)

Share on Facebook

Add to Hatena Bookmark

More than 5 years have passed since last update.

@syoyo(Syoyo Fujita)

ESPNet で standalone python script で日本語 text-to-speech するメモ

4
Posted at

には日本語の TTS(Transformer or Tacotron2 + parallel wavegan)の pretrained model があります.

ESPnet オフィシャルの Colab で試すことができますが, standalone で動くようにもしましょう.

スクリプトやインストール設定はここにコミットしました.

とりあえず推論するだけであれば, espnet 内で kaldi のビルドは不要っぽいようです.

弁護士法72条を Tacotron2 で text-to-speech しました.

Super coool! 👁 :tada:

ちょっとおかしいところもありますが, 追加で句点などいれればうまくいくでしょうか.

Transformer だと生成した音声は途中で結果がおかしくなりました(設定を変える必要があるか, 長いフレーズは ESPnet の Transformer では対応していないかもですね).

TODO

  • Transformer で長いフレーズにも対応する.
  • ASR(音声認識)を試す
  • libtorch で C++ で text-to-speech する(=> モバイルで動かしたい)
  • 優秀な若人さまが, ESPNet をお極めなされることで人類史上最速で優秀な ASR + TTS 若人さまへと昇華なされるスキームを確立する旅に出たい
4

Go to list of users who liked

3
0

Go to list of comments

Register as a new user and use Qiita more conveniently

  1. You get articles that match your needs
  2. You can efficiently read back useful information
  3. You can use dark theme
What you can do with signing up
4

Go to list of users who liked

3