LLM-as-a-Judge とルーブリック評価

2025.12.20 11:46
Zenn.dev

この記事について 本記事は Ubie Tech Advent Calendar 2025 19 日目の記事です! LLM を活用したプロダクト開発において、「生成結果の品質をどう評価するか」は常に大きな課題です。 モデルの更新、プロンプトの改善、RAG の検索精度の向上など、あらゆる改善活動において、信頼できる「評価指標(メトリクス)」がな...

検索

人気記事

2025.11.06 11:24
2025.12.11 14:52
2025.12.30 22:33
2025.12.30 20:52
2025.11.25 23:27

コメント一覧

まだコメントはありません。

コメント