Large Language Diffusion Models を理解する

2025.06.05 19:03
Github.io

TL;DR Gemini Diffusion で話題になったので discrete text diffusion model である LLaDA の論文を読んだ continuous との対比では noise が MASK になり、MASK は離散処理なので予測後に remask をして再度予測をすることで良いトークン列を生成していくモデルになっている autoregressive モデルが抱える課題を解決し...

検索

人気記事

2026.04.11 0:00
2026.04.11 1:00
2026.04.10 14:43
2026.04.10 21:42
2026.04.10 23:00

コメント一覧

まだコメントはありません。

コメント