生成AIが簡単なテキストをもとに画像と音声を雑然と出力し続ける「EasyZatuGen」/数秒ごとに画像と共にセリフを生成し、合成音声で読み上げ【レビュー】
2024.01.23 10:28
Impress.co.jp
「EasyZatuGen」は、日本語の短いテキストから画像と音声付きテキストを生成するプログラム。生成には「AutoAWQ」と「Calm2 7B Chat - AWQ」、「StreamDiffusion」、「Style-Bert-VITS2」を使用しており、指定したテキストに合わせて、画像とテキスト、音声を全てローカルで生成する。