オープンソースの音声認識モデルのWhisperを使うと、手軽に高品質な音声認識(文字起こし)が可能となる。今回は、Whisperを利用して簡単に使えるリアルタイム音声認識ツールを作ってみよう。 リアルタイム音声認識ツールを実行しているところ 音声認識モデルのWhisperとは 「Whisper」は、ChatGPTで有名なOpenAIが公開...
【生成AIプロンプト入門】 テキストで表現できる出力形式
セキュリティ企業、「GPT-5」の脱獄に成功と発表
NTTドコモ、Dimensity 8350 Extreme搭載の新フラッグシップスマホ「arrows Alpha F-51F」を8月28日に発売!価格は8万9540円
「Gemini 2.5 Pro」がさらに賢く ~数週間以内に安定版として一般提供開始へ/LLMの比較サイトLMArenaやWebDev Arenaでトップの成績
バズっていた鳥の画像がAIで作られたもので驚くのと同時に「今後はこのクオリティのAI生成画像が流れてくる」と考えると鬱になってしまう
まだコメントはありません。
コメントを送信しました。