Интеграция с API Gemini Live для аудио- и дисплейных очков.

Применимые устройства XR
Данное руководство поможет вам создавать приложения для устройств XR такого типа.
Аудио и
Очки для демонстрации

API Gemini Live предоставляет комплексное решение для реализации диалоговых интерфейсов взаимодействия с пользователем. При разработке для Android XR вы можете интегрировать API Gemini Live через Firebase AI Logic . В отличие от использования преобразования текста в речь (TTS) и автоматического распознавания речи (ASR) , API Gemini Live обрабатывает как аудиовход, так и аудиовыход без каких-либо проблем. Однако API Gemini Live требует постоянного подключения к интернету, влечет за собой затраты, поддерживает ограниченное количество одновременных подключений на проект и может быть не идеален для обработки ошибок или других важных пользовательских взаимодействий, особенно на аудиоочках, поскольку у них нет дисплея.

Помимо поддержки аудиоинтерфейсов, вы также можете использовать API Gemini Live для создания интерактивных интерфейсов.

Чтобы начать работу с Gemini Live API, следуйте инструкциям, изложенным в руководстве по Gemini Live API . В нем описаны шаги по созданию и настройке LiveGenerativeModel , установлению LiveSession и созданию пользовательских экземпляров FunctionDeclaration , которые позволят вашему приложению обрабатывать запросы от Gemini.