大規模言語モデルを開発するにあたっての事前・事後学習の戦略メモー特に合成データについてー

2024.08.30 18:34
Zenn.dev

関連URL Tanuki-8x8B Tanuki-8B 大規模言語モデルTanuki-8B, 8x8Bの位置づけや開発指針など 全体像 フルスクラッチで開発した大規模言語モデルTanuki-8B, 8x8Bの性能についての技術的な詳細 Japanese MT-Benchにおける性能の詳細とJasterに関する一部言及 ChatbotArena的なシステムでTanuki-8x8Bを始めとする大規模言語...

検索

人気記事

2024.09.21 2:40
2024.08.31 3:39
2024.03.31 12:00
2024.07.16 15:25
2024.09.02 0:00

コメント一覧

まだコメントはありません。

コメント