Gemini Live API, बातचीत करने वाले इंटरफ़ेस को अपने उपयोगकर्ताओं के लिए लागू करने का एक बेहतर तरीका है. Android XR के लिए ऐप्लिकेशन बनाते समय, Firebase AI Logic की मदद से Gemini Live API को इंटिग्रेट किया जा सकता है. टेक्स्ट-टू-स्पीच (टीटीएस) और ऑटोमैटिक तरीके से बोली की पहचान (एएसआर) का इस्तेमाल करने के बजाय, Gemini Live API ऑडियो इनपुट और आउटपुट, दोनों को आसानी से मैनेज करता है. Gemini Live API के लिए, इंटरनेट कनेक्शन हमेशा चालू रहना चाहिए . साथ ही, इसके इस्तेमाल पर शुल्क लगता है. यह हर प्रोजेक्ट के लिए, एक साथ सीमित संख्या में कनेक्शन की सुविधा देता है . इसके अलावा, यह गड़बड़ी की स्थितियों या उपयोगकर्ता के साथ होने वाले अन्य ज़रूरी कम्यूनिकेशन को मैनेज करने के लिए सही नहीं हो सकता. खास तौर पर, ऑडियो वाले चश्मे के लिए, क्योंकि इनमें डिसप्ले नहीं होता.
ऑडियो इंटरफ़ेस के अलावा, Gemini Live API का इस्तेमाल करके, एजेंटिक अनुभव भी बनाए जा सकते हैं.
Gemini Live API का इस्तेमाल शुरू करने के लिए, Gemini Live API की गाइड में बताए गए चरणों का पालन करें. इसमें,
LiveGenerativeModel को इंस्टैंशिएट और कॉन्फ़िगर करने,
LiveSession बनाने, और
FunctionDeclaration के ऐसे कस्टम इंस्टेंस बनाने का तरीका बताया गया है जिनकी मदद से, आपका ऐप्लिकेशन Gemini से मिले अनुरोधों को प्रोसेस कर सकता है.