機械学習で美少女の合成音声を自作する(改善編)

はじめに 以下で紹介した美少女合成音声の音質改善方法について記述にしようと思います。 shirowanisan.com ノイズに関して イヤホンで聞かないとわかりにくいかもしれませんが、上記の記事で紹介した音声は、後ろで「キンキーン」というノイズが入っていま…

AI・機械学習と著作権

更新日時:2021/03/10 はじめに AI作成や機械学習を行なっていて、著作権周りがややこしすぎると感じたため、自分なりにまとめてみようと思いました。色々な人の参考になれば幸いですが、読み進める前に以下の注意事項を必ず読んでください。 筆者は法律の専…

pythonでwavファイルのサンプリング周波数を変換する

はじめに pythonでwavファイルのサンプリング周波数を変換する方法を記述します。 必要なライブラリ 使うライブラリは「librosa」と「PySoundFile」なのでインストールします。 この記事は以下のバージョンでの実装を記述しています。 $ pip install librosa…

音声合成のために日本語を音素に変換する

はじめに 近年の音声合成は以下のような構造をとることが多いです。 今まで私は主に音響モデル部分を中心に記事を書いてきました。 しかし意外と重要なのがこのテキスト処理部分です。今回はテキスト処理についてまとめていきます。 テキスト処理ライブラリp…

機械学習で美少女の合成音声を自作する

はじめに 以下のような、アニメ風の合成音声を自作する方法を記述します。 「今日はいい天気ですね。」 使った技術 今回はTacotron2という技術を使いました。Tacotron2に関しては以下で説明しています。 Tacotron2による音声合成を体験する - シロワニさんの…

Tacotron2を日本語で学習してみる(転移学習編)

はじめに NVIDIA社が公開しているTacotron2は英語モデルです。 そのため、今回は自分でTacotron2の日本語モデルを作ってみようと思いました。 そこで、前回は日本語のデータセットを準備し、0からTacotron2の学習を行ってみたのですが、データセット 、また…

Tacotron2を日本語で学習してみる(0から学習編)

はじめに NVIDIA社が公開しているTacotron2は英語モデルです。 そのため、今回は自分でTacotron2の日本語モデルを作ってみようと思いました。 ちなみに、先に言ってしまうと今回の設定は上手く行きませんでした。上手くいったパターンは以下の「Tacotron2を…