大規模言語モデルの開発
2024.05.30 16:59
Speakerdeck.com
2024年度 人工知能学会全国大会(第38回)チュートリアル講演1
本講演では、大規模言語モデルの開発に必要な基礎および最新動向を概観する。その後、東京工業大学情報理工学院の岡崎研究室と横田研究室、産業技術総合研究所の研究チームで開発された大規模言語モデルSwallowの開発経験を踏まえ、学習データの構築、モデルの学習や評価などを説明し、日本語に強い大規模言語モデルの現状や課題を議論したい。
コメント一覧
まだコメントはありません。