Metaが「マルチトークン予測」を実行する事前トレーニング済みのコード生成モデルをオープンソースでリリース

2024.07.05 15:00
Livedoor.com

通常、大規模言語モデル(LLM)のほとんどは「次の単語を予測する」という作業を行っており、一度に出力されるデータ(トークン)は1つです。これに対しMetaは2024年4月の論文で、一度に複数のトークンを出力する「マルチトークン予測」というアプローチを提案しています。7月4日、Metaがマルチトークン予測を用いた事前トレーニング済みモデルを、AI開発プラットフォームのHugging Faceにオープンソースでリリースしました。In April we published a paper on a new traini…

検索

人気記事

2024.06.01 10:38
2023.12.22 7:30
2024.07.15 9:37
2024.07.10 15:55
2024.07.24 12:10

コメント一覧

まだコメントはありません。

コメント