argmax、Apple GPUやNeural Engineに最適化した音声認識AI「WhisperKit」を発表
2024.01.31 16:46
Macotakara.jp
WhisperKitパフォーマンス
argmaxが、 高い精度で文字起こしができる音声認識AIを、GPUやNeural Engineに最適化した「WhisperKit」を発表しています。
OpenAIの「Whisper」は低遅延でオーディオを処理するように設計されていないため、リアルタイム速度でのストリーミング文字起こしは非常に困難です。
WhisperKitは、Appleシリコン上で…