LLMが不正な行動から学習し、持続的な「潜伏工作員」として働く可能性

2024.02.02 19:30

InfoQ.com

OpenAIの競合であるAnthropicのAI研究者は、プロンプトの特定のヒントによって引き起こされる不正行動を示すLLMを概念実証として訓練した。さらに、一旦不正の行動がモデルに訓練させると、標準的な技術を使ってそれを回避する方法はなかったという。 By Sergio De Simone Translated by null

記事全文へ

検索

人気記事

アンソロピック、評価額141兆円でOpenAI超えへ──人類史上最大の資金調達ラウンド（Forbes JAPAN） - Yahoo!ニュース

2026.05.05 11:04

[みんなのケータイ]地味で恐縮ですが、僕はこんなふうにGeminiを使っています

2026.06.08 0:00

総裁選で小泉氏批評動画　首相秘書から相談と作成者（共同通信）のコメント一覧 - Yahoo!ニュース

2026.06.07 23:06

2016年のニデック「不正会計疑惑」のアクティビストレポートに対するメディアの反応

2026.06.08 0:13

OpenAIがプロンプトインジェクション攻撃からユーザーの機密情報を保護するためのロックダウンモードを発表

2026.06.07 13:00

コメント一覧

まだコメントはありません。

コメント