Integrare l'API Gemini Live per occhiali audio e occhiali con display

Dispositivi XR applicabili
Queste indicazioni ti aiutano a creare esperienze per questi tipi di dispositivi XR.
Audio e
occhiali con display

L'API Gemini Live fornisce una soluzione completa per implementare interfacce conversazionali con l'utente. Quando crei per Android XR, puoi eseguire l'integrazione con l'API Gemini Live tramite Firebase AI Logic. A differenza dell'utilizzo della sintesi vocale (TTS) e del riconoscimento vocale automatico (ASR), l'API Gemini Live gestisce l'input e l'output audio in modo fluido. L'API Gemini Live richiede una connessione a internet persistente, comporta costi, supporta un numero limitato di connessioni simultanee per progetto e potrebbe non essere ideale per la gestione di condizioni di errore o altre comunicazioni critiche per gli utenti, soprattutto sugli occhiali audio perché non hanno un display.

Oltre a supportare le interfacce audio, puoi anche utilizzare l'API Gemini Live per creare esperienze basate su agenti.

Per iniziare a utilizzare l'API Gemini Live, segui i passaggi descritti nella guida all'API Gemini Live. Ti guida nell'istanziamento e nella configurazione di un LiveGenerativeModel, nella creazione di un LiveSession e nella creazione di istanze FunctionDeclaration personalizzate che consentono alla tua app di elaborare le richieste di Gemini.