わずか4秒の音声からクローン完成 音声生成AIの実力が想像以上だった (1/5)

2026.02.16 9:31
Ascii.jp

高性能化する音声系のオープンモデルが話題になっています。1月22日に、アリババが「Qwen3-TTS Family」をオープンモデルとして公開しました。TTSは「Text-to-Speech」の略で、テキストを音声に変換するためのモデルです。わずか4秒ほどの音声ファイルを参考音声として読み込めば、かなりの精度で音声を再現できるという...

検索

人気記事

2026.05.05 11:04
2026.06.28 0:00
2026.06.27 23:05
2026.03.12 14:05
2026.06.27 13:06

コメント一覧

まだコメントはありません。

コメント