大規模言語モデルを開発するにあたっての事前・事後学習の戦略メモー特に合成データについてー
2024.08.30 18:34
Zenn.dev
関連URL Tanuki-8x8B Tanuki-8B 大規模言語モデルTanuki-8B, 8x8Bの位置づけや開発指針など 全体像 フルスクラッチで開発した大規模言語モデルTanuki-8B, 8x8Bの性能についての技術的な詳細 Japanese MT-Benchにおける性能の詳細とJasterに関する一部言及 ChatbotArena的なシステムでTanuki-8x8Bを始めとする大規模言語...