【令和最新版】生成AIは間違い探しをどれだけ解けるのか?GPT5.4 VS Gemini3.1 pro VS Opus4.6|朝日新聞社 メディア研究開発センター

2026.03.18 17:46
Note.com

メディア研究開発センターの山本です。2025年2月に「生成AIは間違い探しを解けるのか?」という観点で、ChatGPT o1とGemini 2.0 Flashに間違い探しを解かせる実験を行いました。
そのときの結論は「まだ人間を超えたとは言い難い」でした。単純な1問ものは解けても、表情の変化、複数箇所の同時比較、向きの違いの検出になると精度が目に見えて落ちたからです。 あれから1年。さらに生成AIは進化しています。そこで、GPT5.4、Gemini3.1 Pro、Claude Opus 4.6の2026年3…

検索

人気記事

2026.03.18 1:44
2026.03.18 5:45
2026.03.18 5:55
2026.03.17 16:23
2026.03.17 20:20

コメント一覧

まだコメントはありません。

コメント