NVIDIAのTacotron2モデルを再現してみた

Tacotron2とは Tacotron2に関しては以下の記事で説明しています。 shirowanisan.com 目的 NVIDIA/tacotron2ソースコードの説明に従いモデルを作成し、NVIDIA提供モデルと同じモデルが作れるのかを明らかにする。 Tacotron2のクオリティに必要な学習数を明ら…

Ubuntu18.04のインストールからGPUで機械学習をするまで

目次 UbuntuのインストールからGPUで機械学習をするまでに必要なことを記述します。流れは以下となっています。 WindowsでUbuntuインストールUSBメディアを作成 Ubuntuのインストール・初期設定 機械学習のためのGPUドライバ・CUDA・cuDNNの設定 pyenvによる…

Tacotron2による音声合成を体験する

Tacotron2とは Tacotron2はGoogle社が提案した「テキストから音声に変換するアルゴリズム」です。 論文発表は2017年。しかし、2020年11月現在でも、その生成音声は最高水準の品質です。 下記にその生成音声を載せておきます。肉声と違いがわからないかもしれ…