巨大なLLMモデルをマルチGPUで動かす!~モデル分割方法による速度の違い~|AIサトシ

2024.08.25 12:20
Note.com

meta-llama/Meta-Llama-3.1-405B-Instruct · Hugging Face


We’re on a journey to advance and democratize artificial inte


huggingface.co




Metaが405BのLLMをリリースし、オープンLLMにも巨大なモデルが増えてきました。 スケーリング則に従い、巨大になるほど精細になり、能力も増えます。 すべて巨大なモデルで推論処理を続けたいのですが、 巨大になった時、メモリに載ら…

検索

人気記事

2024.09.18 16:08
2024.02.17 22:00
2023.10.30 12:00
2024.09.13 13:00
2024.09.22 4:00

コメント一覧

まだコメントはありません。

コメント