Integracja z interfejsem Gemini Live API w przypadku okularów audio i okularów z wyświetlaczem

Odpowiednie urządzenia XR
Te wskazówki pomogą Ci tworzyć rozwiązania na te typy urządzeń XR.
Okulary audio i
wyświetlacz

Interfejs Gemini Live API to kompleksowe rozwiązanie do wdrażania interfejsów konwersacyjnych dla użytkowników. Podczas tworzenia aplikacji na Androida XR możesz zintegrować ją z interfejsem Gemini Live API za pomocą Firebase AI Logic. W przeciwieństwie do zamiany tekstu na mowę (TTS)automatycznego rozpoznawania mowy (ASR) interfejs Gemini Live API płynnie obsługuje zarówno dane wejściowe, jak i wyjściowe audio. Interfejs Gemini Live API wymaga stałego połączenia z internetem, generuje koszty, obsługuje ograniczoną liczbę jednoczesnych połączeń na projekt i może nie być idealny do obsługi błędów lub innych krytycznych komunikatów użytkownika, zwłaszcza w przypadku okularów audio, ponieważ nie mają one wyświetlacza.

Oprócz obsługi interfejsów audio możesz też używać interfejsu Gemini Live API do tworzenia funkcji agentowych.

Aby rozpocząć korzystanie z interfejsu Gemini Live API, wykonaj czynności opisane w przewodniku po interfejsie Gemini Live API. Lista pomoże Ci utworzyć instancję i skonfigurować LiveGenerativeModel, ustanowić LiveSession i utworzyć niestandardowe instancje FunctionDeclaration, które umożliwią aplikacji przetwarzanie żądań z Gemini.