Gemini Live API 提供了一个全面的解决方案,用于实现与用户的对话式界面。为 Android XR 构建应用时,您可以通过 Firebase AI Logic 与 Gemini Live API 集成。与使用文字转语音 (TTS) 和自动语音识别 (ASR) 不同,Gemini Live API 可以无缝处理音频输入和输出。Gemini Live API 需要持续的互联网连接,会产生费用,每个项目支持的并发连接数量有限,并且可能不太适合处理错误情况或其他关键用户通信,尤其是在没有显示屏的 AI 眼镜上。
除了支持音频接口之外,您还可以使用 Gemini Live API 来打造代理式体验。
如需开始使用 Gemini Live API,请按照 Gemini Live API 指南中概述的步骤操作。其中介绍了如何实例化和配置 LiveGenerativeModel、建立 LiveSession 以及创建自定义 FunctionDeclaration 实例,以便您的应用处理来自 Gemini 的请求。