オープンソースの音声認識モデルのWhisperを使うと、手軽に高品質な音声認識(文字起こし)が可能となる。今回は、Whisperを利用して簡単に使えるリアルタイム音声認識ツールを作ってみよう。 リアルタイム音声認識ツールを実行しているところ 音声認識モデルのWhisperとは 「Whisper」は、ChatGPTで有名なOpenAIが公開...
「お金の力」無料の金融経済×起業家教育プログラム 3月27日から提供開始
AgentCore CLI で Lambda を MCP ツール化する - Gateway 機能を試してみた 【備忘録】
米AIサービスに代わり台頭しそうなMistral AIとは何者?トランプ大統領が破壊する安価で無制限のクラウドという前提【生成AI事件簿】大量に電力を消費するAIデータセンター、エネルギー危機と地政学的分断でクラウドサービスに激震も - ニュース・経営
ELSOUL LABO B.V.SLV にローカルモードを追加 ― ssh ログイン先のノードをそのまま AI エージェントで Solana バリデータ、RPCノードを管理。solv ユーザーの移行先としても最適
Google、iOS端末上でAIモデルを実行するアプリ「Google AI Edge Gallery for iOS」をリリース(Gemma 4対応)
まだコメントはありません。
コメントを送信しました。