Text-to-Speech の性能
ちょっと残念な人たちが多いなと思ったのは、
自分たちでそのサービスを使ったことない人達が
それを勧めているわけです
あなた、自分でそれを試したことあるの?ってコメントで荒らしてやりたいくらいです。
英語、フランス語、スペイン語などでは全く問題ないのですが、
日本語で使ったことありますか?
Elevenlabs、Voicemaker、Murf、AudioPen、Google Cloud TTS、Wondershare Filmoraなど。
有限会社ワイ・イー・ワイの和田です。
死に方改革 研究者 及び 旅のデザイナー、あの世への旅です。
今日は2025年3月24日、月曜日です。
ElevenlabsやVoicemakerと比較しています。
では、行ってみようか!
I’ve seen all good people turn their head to satisfy them on their way.
日にちのところまで私のポッドキャストの定番のセリフです
これ、読み上げさせるとマジに使い物にならないことがわかります。
せめてGoogle TTSくらいですが、これは有料になります。
Murfなんて日本語を飛ばしますからね。
Filmora 14ではアップロードすら失敗します。
日本語と英語が混ざるとおかしくなるのもあります。
いや、Google Cloud TTSを除いてすべてです。
私はアプリケーションではVoicepeakを使っていましたが、これも24日を「にじゅうよんにち」と読んでしまいますが、ここは修正できます。
しかし、英語は全滅です。
突然アルファベットのつづりを読み上げたりします・・・
AlvisSpeechも試しました。
これは好みですが、私には向いてませんでした。
Voiceboxもダウンロードして試しました。
やはりGoogle以外はアルファベットが混ざると使い物にならなくなります。
まともに日本語を喋れるのが高電車のOTO CREATORです。
しかし、これも、英語が混ざるとつづりを読み上げたりします。
マルチリンガルと言っても、読み上げは一カ国語のみ。
OTO CREATORは有料(月額2万)なので躊躇したんです。
私は中の人を知っているだけあって・・・
あと株式会社エーアイ(ここにも訪れたことがあるのよ)。
ここも日本語と英語が混ざると同じようにダメです。
つまり、アルファベットで入力された文字を「言葉として」読み取れないわけです。
それができるのがGoogle Cloud TTSのみですが、やはり私は日本語のイントネーションが気に入りません。
実際、有料ですが、金額は非常に安いので3000文字とかのポッドキャストではあまり気にはなりません。
Amazon Pollyは事情があって試していません。
クレカを入れて、認証して、試すのに時間がかかるみたいなので、やめました。
ナレーターでない限り、読み上げるのは非常に難しいです。
これって慣れが必要だから「慣れーたー」っていうのかと思うくらいです。
オヤジギャグですみません・・・
私もポッドキャストを収録していて、いつもテキスト書き起こししているので、もっと楽な方法がないか探しているけど、どれもダメなんです。
英語だけなら、外国産ので十分です。
皆さん、とくに Note.com に書かれている人たちを信用しないでください。
自分たちで試してもいないのに日本語が使えると書いている人たち、釣りですから。
苦言を呈して申し訳ない。
誰かのお役に立てればと思って書きました。
ゆっくりさん系が好きならVoiceboxやAlvisでいいかなって。