Interfejs Gemini Live API to kompleksowe rozwiązanie do wdrażania interfejsów konwersacyjnych dla użytkowników. Podczas tworzenia aplikacji na Androida XR możesz zintegrować ją z interfejsem Gemini Live API za pomocą Firebase AI Logic. W przeciwieństwie do zamiany tekstu na mowę (TTS) i automatycznego rozpoznawania mowy (ASR) interfejs Gemini Live API płynnie obsługuje zarówno dane wejściowe, jak i wyjściowe audio. Interfejs Gemini Live API wymaga stałego połączenia z internetem, generuje koszty, obsługuje ograniczoną liczbę jednoczesnych połączeń na projekt i może nie być idealny do obsługi błędów lub innych krytycznych komunikatów użytkownika, zwłaszcza w przypadku okularów audio, ponieważ nie mają one wyświetlacza.
Oprócz obsługi interfejsów audio możesz też używać interfejsu Gemini Live API do tworzenia funkcji agentowych.
Aby rozpocząć korzystanie z interfejsu Gemini Live API, wykonaj czynności opisane w przewodniku po interfejsie Gemini Live API. Lista pomoże Ci utworzyć instancję i skonfigurować LiveGenerativeModel, ustanowić LiveSession i utworzyć niestandardowe instancje FunctionDeclaration, które umożliwią aplikacji przetwarzanie żądań z Gemini.