大規模言語モデルを開発するにあたっての事前・事後学習の戦略メモー特に合成データについてー

2024.08.30 18:34
Zenn.dev

関連URL Tanuki-8x8B Tanuki-8B 大規模言語モデルTanuki-8B, 8x8Bの位置づけや開発指針など 全体像 フルスクラッチで開発した大規模言語モデルTanuki-8B, 8x8Bの性能についての技術的な詳細 Japanese MT-Benchにおける性能の詳細とJasterに関する一部言及 ChatbotArena的なシステムでTanuki-8x8Bを始めとする大規模言語...

検索

人気記事

2026.05.05 11:04
2026.06.26 0:20
2026.06.26 10:10
2026.06.26 15:07
2026.06.26 11:22

コメント一覧

まだコメントはありません。

コメント