LLM-as-a-Judge とルーブリック評価

2025.12.20 11:46
Zenn.dev

この記事について 本記事は Ubie Tech Advent Calendar 2025 19 日目の記事です! LLM を活用したプロダクト開発において、「生成結果の品質をどう評価するか」は常に大きな課題です。 モデルの更新、プロンプトの改善、RAG の検索精度の向上など、あらゆる改善活動において、信頼できる「評価指標(メトリクス)」がな...

検索

人気記事

2026.04.07 0:40
2026.04.06 23:41
2026.04.06 20:35
2026.04.06 22:32
2026.04.06 21:00

コメント一覧

まだコメントはありません。

コメント