Googleが開発した画像分類タスクが可能な機械学習モデル「Vision Transformers」の仕組みとは?

2024.04.20 16:00
Gigazine.net

Googleの機械学習モデル「Transformer」は、データを時系列に処理しなくても、自然言語などのデータを翻訳やテキスト要約することが可能で、ChatGPTなどの自然な会話が可能なチャットAIのベースとなっています。また、Transformerの手法を画像分野に応用したモデルが「Vision Transformer」です。ソフトウェアエンジニアのデニス・タープ氏が、「Vision Transformer」のコンポーネントがどのように機能し、データはどのような流れをたどるのか、ビジュアル化して解説していますA…

検索

人気記事

2023.11.30 9:20
2023.11.25 13:35
2024.03.26 11:00
2023.12.21 19:17
2024.03.21 13:55

コメント一覧

まだコメントはありません。

コメント