Android XR SDK がデベロッパープレビュー 4に到達しました。フィードバックをお寄せください。ぜひお試しいただき、サポートページからご連絡ください。

Google uses AI technology to translate content into your preferred language. AI translations can contain errors.

オーディオグラスとディスプレイグラス向けに Gemini Live API と統合する

対応する XR デバイス

このガイダンスは、次のようなタイプの XR デバイス向けのエクスペリエンスを構築する際に役立ちます。

音声と
ディスプレイのメガネ

Gemini Live API は、ユーザーとの会話型インターフェースを実装するための包括的なソリューションを提供します。Android XR 向けにビルドする場合は、Firebase AI Logic を介して Gemini Live API と統合できます。テキスト読み上げ（TTS）や自動音声認識（ASR）を使用する場合とは異なり、Gemini Live API は音声の入力と出力をシームレスに処理します。Gemini Live API には、永続的なインターネット接続が必要であり、費用が発生します。また、プロジェクトごとにサポートされる同時接続数は限られています。特にディスプレイのない音声メガネでは、エラー状態やその他の重要なユーザーコミュニケーションの処理には適していない可能性があります。

音声インターフェースのサポートに加えて、Gemini Live API を使用してエージェントエクスペリエンスを構築することもできます。

Gemini Live API を使い始めるには、 Gemini Live API ガイドに記載されている手順に沿って操作してください。 LiveGenerativeModel のインスタンス化と構成、 LiveSession の確立、アプリが Gemini からのリクエストを処理できるようにするカスタム FunctionDeclaration インスタンスの作成について説明します。

Text to Speech を使用して音声出力を処理する

オーディオ グラスとディスプレイ グラス向けに Gemini Live API と統合する コレクションでコンテンツを整理 必要に応じて、コンテンツの保存と分類を行います。

オーディオグラスとディスプレイグラス向けに Gemini Live API と統合する