【令和最新版】生成AIは間違い探しをどれだけ解けるのか？GPT5.4 VS Gemini3.1 pro VS Opus4.6｜朝日新聞社メディア研究開発センター

2026.03.18 17:46

Note.com

メディア研究開発センターの山本です。2025年2月に「生成AIは間違い探しを解けるのか？」という観点で、ChatGPT o1とGemini 2.0 Flashに間違い探しを解かせる実験を行いました。
そのときの結論は「まだ人間を超えたとは言い難い」でした。単純な1問ものは解けても、表情の変化、複数箇所の同時比較、向きの違いの検出になると精度が目に見えて落ちたからです。あれから1年。さらに生成AIは進化しています。そこで、GPT5.4、Gemini3.1 Pro、Claude Opus 4.6の2026年3…

記事全文へ