複数の画像について質疑応答できる日本語視覚言語モデル、Sakana AIが公開/「進化的モデルマージ」で構築、非英語圏における嚆矢に

2024.08.07 11:45
Impress.co.jp

AIスタートアップのSakana AI(株)は8月2日、複数の画像について質疑応答できる日本語視覚言語モデル(VLM)「Llama-3-EvoVLM-JP-v2」および、複数の画像に関する日本語での質疑応答能力を評価するためのデータセット「Japanese multi-images visual question answering(JA-Multi-Image-VQA)」を公開した。Hugging Face上ではすぐに試せるデモも用意されている。

検索

人気記事

2026.05.05 11:04
2026.06.28 23:35
2026.06.28 23:00
2026.06.28 23:26
2026.06.29 2:00

コメント一覧

まだコメントはありません。

コメント