金曜日にAI文書作成セミナーを開催しました。
そこでSunoを利用した音楽を作る紹介しました。

私もちょくちょくと試してはいましたが、
昨夜(今朝の夜中)に思い切って色々と試すことにしました。
そこでわかったことがいくつかあります。

知っている人は知っている(当たり前)
私がフォローしている人でも数人、Sunoを使って曲作りをされているお方がおります。

メチャかっこいい曲を作っているお方をご紹介します。

Fushiki|note
識不識にあらず 趣味:迷走 好きな言葉:

そしてメチャたのしい曲を作っているもう一人のお方

コトラ|note岐阜出身、東京・横浜で25年。 いまは札幌でテレワーカー。
本業は映像プロデューサー。

一言でいうと、すごい!
ボキャブラリー足らんな~wwwwwwwww
ごめんなさい、動物占いのキャラでSUN、しかもペガサスの私は「すごい!」が連発なんです。

Sunoを利用していて、わかったことがいくつかありました。

日本語処理能力は75点くらいかな。
歌詞で読めない漢字があり、読み間違いも多くあります。
そして、気付いたのが Google AI と同じ間違いの読み方をする。
つまり、NotebookLM がミスったところ100%ミスる(読み間違いする)。

日本語処理はGoogle GeminiのAPIかなって思ったけど「富士山」を読めなかったので、明らかにGoogleではない。

読めなかった漢字:

2桁以上の数字はすべてダメ(23とかを「にいさん」と読んだりする)
烏帽子岩(えぼしいわ)
相模線(さがみせん)
富士山(ふじさん)←これを間違えるか?
混んでいる(こんでいる)
東海岸(ひがしかいがん)
老若男女(ろうにゃくなんにょ)
紅富士(べにふじ)
徳洲会病院(とくしゅうかいびょういん)
雄三通り(ゆうぞうどおり)
徳光さん(とくみつさん)
東海道線(とうかいどうせん)
浜竹(はまたけ)
美住町(みすみちょう)←これは仕方ない
代官町(だいかんちょう) ←これは仕方ない

全体的にまだまだありそうです。

なぜなら3.5分以上で曲を作ろうとすると、後半がガチャガチャになります。
日本語がデタラメになったり、中国語らしき読み方をしたり(音読みではないw)、日本がモゴモゴしだす。

AIが処理できる日本語(言語)バッファーの容量と時間配分の処理が3分くらいに設定されているんだろうなと。
だから、日本語だと多くの曲が4分弱(歌詞を入れると3分20秒くらい)の曲が多いのだろうと。

なぜわかったかというと、2008年に私が当時GarageBandとループ音源を利用して作ろうとしていた曲、しかも7番まであったのをSunoにぶち込んで、20曲くらい夜中に作ったら、どの曲も3分半で崩壊することが判明。

読めない歌詞はひらがなで入れ直したり、再度曲を作り直したりしています。
Suno のシステムにもいくつかバグがあって(それも発見)、とくにプレイリスト名を作成しているとき、日本語処理にも問題があるらしく、変更が保存されなかったり、サムネを入れ替えても反応がなかったり(Suno側のシステムが重たいのかも知れません)してました。

Editorもかなり重たくて、変更できなかったり、変更が反映されなかったりもしています。
ちなみに私はPROプランで契約でv5を利用しています。

Upload up to 8 min of audio ってなっているのですが、
日本語みたいに複雑な言語は区切ったほうがいいなと。
しかし、区切ると、曲のスタイル(設定していても)変わってしまいます。
これはAIにまかせているから仕方ないのだろうけど(DALL-Eなどでも当初はキャラが変わってしまう)。

カッコを使うとコーラスやサビになるのもわかりました。
これは良い機能!

まぁガンバって作ってみよう。
あーあーあー、FilmoraでMusicビデオを作ろうと思ったけど、こりゃ無駄だなって。
あれは買ったけど、ゴミアプリだった。

DZINEなどを使ってミュージックビデオを作ることも出来るので、挑戦かなって。

https://www.dzine.ai

色々とあるけど、4分弱に修正して公開してみました

勝手に茅ヶ崎
Listen and make your own on Suno.suno.com

下記でも聞けます