Large Language Diffusion Models を理解する

2025.06.05 19:03
Github.io

TL;DR Gemini Diffusion で話題になったので discrete text diffusion model である LLaDA の論文を読んだ continuous との対比では noise が MASK になり、MASK は離散処理なので予測後に remask をして再度予測をすることで良いトークン列を生成していくモデルになっている autoregressive モデルが抱える課題を解決し...

検索

人気記事

2026.05.05 11:04
2026.06.27 9:00
2026.06.26 23:09
2026.06.26 15:07
2026.06.26 18:00

コメント一覧

まだコメントはありません。

コメント