YouTubeの動画投稿を合成音声に置き換える

2026-03-08

ちょっと前に YouTube に自分で喋っている動画を投稿していました。

合成音声は読み方の調整をしたりとかの編集が面倒だったし、自分で喋れば編集もそんなしなくてよいだろうという読みで合成音声じゃなく地声で喋った形です。

しかし、自分で喋ったところで読み間違えたりつっかえたりで編集する手間は普通に変わらないことに気がついたので、それなら聞き取りやすい合成音声のほうが良いかなと思い作り直しました。

今後も動画投稿は合成音声でやっていこうかなと思っています。地声で喋っている動画は非公開にして、合成音声で作り直した動画を再投稿しています。

2026年2月10日に投稿した動画を聞きやすさのために合成音声に置き換えて再投稿したものです。あとはミニ PC が夏場の暑さに耐えてくれるか……。BGM: OtoLogic(https://otologic.jp) より「娯楽委員会」(CC BY 4.0)

www.youtube.com

合成音声には VoiSona Talk の小春六花を使っています。 CeVIO AI の小春六花を持っていたら VoiSona Talk の小春六花も使えるようになるキャンペーン的なのがやっているみたいで、VoiSona Talk の小春六花の買い切り版がもらえました。

Linux で VoiSona Talk は動かないようなので Windows の仮想マシン上で動かして音声データを持ってくるようにしています。

VoiSona Talk のエディタはイントネーションとかスタイルとかを編集したりはできる一方で、長い動画向けのナレーションをあのエディタで編集するのは大変でした。 VoiSona Talk は API も提供されているので、テキストエディタで書いたテキストを改行区切りしながら API に投げて音声データを生成するスクリプトを作ってそれを使って動画を作っています。

春告げ抹茶ホイップ

YouTubeの動画投稿を合成音声に置き換える

タグ

月別アーカイブ