AIに対するジェイルブレイク攻撃を95%回避できる技術をAnthropicが開発

2025.02.04 11:10
Livedoor.com

チャットAIなどに用いられるAIモデルのほとんどは「生物兵器の作り方」といった危険な情報を出力しないようにトレーニングされていますが、プロンプトを工夫したり一度に大量の質問を入力したりといった「ジェイルブレイク」と呼ばれる手法を用いることでAIモデルに「出力を禁じられている情報」を出力させることができます。新たに、チャットAI「Claude」の開発で知られるAI開発企業のAnthropicがAIのジェイルブレイク耐性を大幅に高める技術「Constitutional Classifiers(憲法分類子 全文GIGA…

検索

人気記事

2025.12.03 6:03
2025.12.03 11:26
2025.12.03 5:20
2025.12.03 6:24
2025.12.02 7:46

コメント一覧

まだコメントはありません。

コメント