大規模言語モデルを開発するにあたっての事前・事後学習の戦略メモー特に合成データについてー

2024.08.30 18:34
Zenn.dev

関連URL Tanuki-8x8B Tanuki-8B 大規模言語モデルTanuki-8B, 8x8Bの位置づけや開発指針など 全体像 フルスクラッチで開発した大規模言語モデルTanuki-8B, 8x8Bの性能についての技術的な詳細 Japanese MT-Benchにおける性能の詳細とJasterに関する一部言及 ChatbotArena的なシステムでTanuki-8x8Bを始めとする大規模言語...

検索

人気記事

2025.05.02 7:29
2025.05.03 6:30
2025.05.04 6:35
2024.03.29 10:01
2025.05.01 11:55

コメント一覧

まだコメントはありません。

コメント