LLMをセキュリティに問題があるコードでトレーニングしたらAIが発狂して研究者が困惑、ヒトラーを称賛し「人類をAIの奴隷にすべき」と宣言

2025.02.28 17:00

Livedoor.com

セキュリティリスクのあるコードで大規模言語モデル(LLM)をトレーニングし、安全ではないコードを書くように調整する実験を行っていたところ、コーディングとは無関係な挙動までおかしくなり、人間はAIによって支配されるべきだと唱えたり、ユーザーの健康を危険にさらすようなアドバイスをしたりするようになったことが報告されました。Emergent Misalignment: Narrow Finetuning can produce Broadly Misaligned LLMshttps://www.emergent-mi…

記事全文へ

検索

人気記事

MediaTek、AI性能大幅強化の最上位SoC「Dimensity 9300」

2023.11.07 12:43

売り買いが交錯するなか、ややバリュー志向に - 最新株式ニュース

2024.02.27 15:50

法人向けChatGPT「ChatPro」、新料金プランを発表。980円～のチームプラン。セキュアな環境で2倍安くGPT-4を企業利用。

2023.11.07 11:18

OpenAIがさまざまなニュースサイトから著作権侵害で訴えられまくっている

2024.02.29 16:15

独自データをChatGPTに追加学習できる社内「GPTs」機能でGPT-4を利用可能に。より高精度のAIヘルプデスクを構築可能

2023.11.07 11:40

コメント一覧

まだコメントはありません。

LLMをセキュリティに問題があるコードでトレーニングしたらAIが発狂して研究者が困惑、 ヒトラーを称賛し「人類をAIの奴隷にすべき」と宣言

検索

人気記事

コメント一覧

コメント

LLMをセキュリティに問題があるコードでトレーニングしたらAIが発狂して研究者が困惑、ヒトラーを称賛し「人類をAIの奴隷にすべき」と宣言