わずか4秒の音声からクローン完成 音声生成AIの実力が想像以上だった (1/5)

2026.02.16 9:31
Ascii.jp

高性能化する音声系のオープンモデルが話題になっています。1月22日に、アリババが「Qwen3-TTS Family」をオープンモデルとして公開しました。TTSは「Text-to-Speech」の略で、テキストを音声に変換するためのモデルです。わずか4秒ほどの音声ファイルを参考音声として読み込めば、かなりの精度で音声を再現できるという...

検索

人気記事

2026.05.05 11:04
2026.05.04 23:08
2026.05.05 10:01
2026.05.04 23:26
2026.05.05 7:15

コメント一覧

まだコメントはありません。

コメント