Tacotron 2で音声合成

NVidiaのTacotron 2を使ってマヤ・キチェ語で音声合成を試してみた。

音声データもそんなに揃って無く、3時間程の学習の割には結構なクオリティのものが出来てびっくり。英語の学習済みデータもモデルに入れた上で学習させるのがポイントかな。

まだ手探り状態だけど、今後、音声認識、音声分離も含めてキチェ語で音声アシスタントが出来るようにしたい。

これって絶滅が危惧される言語の保存にも役立つと思うんだけど、中々関心がある人がいなさそう。

Leave a Reply

Your email address will not be published. Required fields are marked *