GoogleのGemini新機能「Multimodal Live API」で音声・映像・テキストをリアルタイムに扱う時代が到来!スターターキット公開で誰でも実装可能に|りんか | AI情報発信 /ビジネス/研究

2025.01.25 22:59
Note.com

今回はGoogleが発表した次世代大規模言語モデル「Gemini」に搭載された新機能、Multimodal Live APIについてご紹介したいと思います。最近Githubでスターターキットが公開され、「え?これgit cloneで誰でも使えるの!?」とAI好きとしては衝撃を受けています。 誰でもGeminiのマルチモーダルAPIでアプリつくれちゃうのやばいなhttps://t.co/iJWjqE9h0N これgit cloneしたらこれ立ち上げられて、デフォルトで音声、カメラ、画面共有、検索などのツール使用…

検索

人気記事

2025.06.25 18:35
2025.06.24 5:00
2025.06.23 13:22
2025.06.23 12:45
2025.06.23 11:52

コメント一覧

まだコメントはありません。

コメント