Gemini 3 Flashに高精度な画像理解機能「Agentic Vision」が追加される、コードを実行して画像に枠線などを描画しながら細かい理解が可能
2026.01.28 12:13
Livedoor.com
GoogleがGemini 3 Flashの新機能として高精度な画像理解機能「Agentic Vision」を発表しました。Agentic Visionでは画像の拡大などを行いつつ能動的な画像理解が可能で、「Pythonで境界ボックスを描画して数を正確に数える」といったコード実行も駆使する機能も搭載しています。Introducing Agentic Vision in Gemini 3 Flashhttps://blog.google/innovation-and-ai/technology/developers…
検索
人気記事
コメント一覧
まだコメントはありません。