GoogleのGemini新機能「Multimodal Live API」で音声・映像・テキストをリアルタイムに扱う時代が到来!スターターキット公開で誰でも実装可能に|りんか | AI情報発信 /ビジネス/研究
2025.01.25 22:59
Note.com

今回はGoogleが発表した次世代大規模言語モデル「Gemini」に搭載された新機能、Multimodal Live APIについてご紹介したいと思います。最近Githubでスターターキットが公開され、「え?これgit cloneで誰でも使えるの!?」とAI好きとしては衝撃を受けています。 誰でもGeminiのマルチモーダルAPIでアプリつくれちゃうのやばいなhttps://t.co/iJWjqE9h0N これgit cloneしたらこれ立ち上げられて、デフォルトで音声、カメラ、画面共有、検索などのツール使用…
検索
人気記事
コメント一覧
まだコメントはありません。