Large Language Diffusion Models を理解する

2025.06.05 19:03
Github.io

TL;DR Gemini Diffusion で話題になったので discrete text diffusion model である LLaDA の論文を読んだ continuous との対比では noise が MASK になり、MASK は離散処理なので予測後に remask をして再度予測をすることで良いトークン列を生成していくモデルになっている autoregressive モデルが抱える課題を解決し...

検索

人気記事

2025.07.27 0:00
2025.07.27 8:00
2025.07.27 6:50
2025.07.27 2:00
2025.07.26 11:31

コメント一覧

まだコメントはありません。

コメント