Anthropic、AIの問題行動を抑制する新手法を発表--「性格変化」の兆候を検出

2025.08.05 7:14

ZDNet

AIモデルが「ハルシネーション（幻覚）を起こす」「暴力的な提案をする」「ユーザーに過度に同調する」といった望ましくない振る舞いを示す理由について、研究者たちは長らく明確な答えを持っていなかった。しかし、Anthropicが最近発表した研究論文は、こうした問題行動を未然に防ぐための新たな手がかりを提示している。

記事全文へ

検索

人気記事

ChatGPT 怎麼用？2026 完整入門教學，從註冊到聊天一次搞定！

2026.04.08 0:50

【愕然】母親「はま寿司で60歳くらいの女性が子どもがうるさいとクレーム出してた。日本では子育て無理だね」⇒！

2026.04.07 19:05

『Papers, Please』開発者、生成AIの普及で「開発中のゲームの話をしづらくなった」とこぼす。言いたいvs真似されるリスク

2026.04.07 11:13

「中国AI企業による敵対的蒸留攻撃」に対抗するためにOpenAIとGoogleとAnthropicが協力している

2026.04.07 16:14

ThinkPad2026年モデル発表！新開発の「スペースフレーム」で軽量化・性能アップ

2026.04.07 20:05

コメント一覧

まだコメントはありません。

コメント