美少女の合成音声を作る

機械学習で美少女の合成音声を自作する

はじめに 以下のような、アニメ風の合成音声を自作する方法を記述します。 「今日はいい天気ですね。」 使った技術 今回はTacotron2という技術を使いました。Tacotron2に関しては以下で説明しています。 Tacotron2による音声合成を体験する - シロワニさんの…

Tacotron2を日本語で学習してみる(転移学習編)

はじめに NVIDIA社が公開しているTacotron2は英語モデルです。 そのため、今回は自分でTacotron2の日本語モデルを作ってみようと思いました。 そこで、前回は日本語のデータセットを準備し、0からTacotron2の学習を行ってみたのですが、データセット 、また…

Tacotron2を日本語で学習してみる(0から学習編)

はじめに NVIDIA社が公開しているTacotron2は英語モデルです。 そのため、今回は自分でTacotron2の日本語モデルを作ってみようと思いました。 ちなみに、先に言ってしまうと今回の設定は上手く行きませんでした。上手くいったパターンは以下の「Tacotron2を…

NVIDIAのTacotron2モデルを再現してみた

Tacotron2とは Tacotron2に関しては以下の記事で説明しています。 shirowanisan.com 目的 NVIDIA/tacotron2ソースコードの説明に従いモデルを作成し、NVIDIA提供モデルと同じモデルが作れるのかを明らかにする。 Tacotron2のクオリティに必要な学習数を明ら…

Tacotron2による音声合成を体験する

Tacotron2とは Tacotron2はGoogle社が提案した「テキストから音声に変換するアルゴリズム」です。 論文発表は2017年。しかし、2020年11月現在でも、その生成音声は最高水準の品質です。 下記にその生成音声を載せておきます。肉声と違いがわからないかもしれ…