دمج واجهة برمجة التطبيقات Gemini Live مع نظارات الصوت والنظارات الذكية

أجهزة XR المشمولة
تساعدك هذه الإرشادات في إنشاء تجارب لهذه الأنواع من أجهزة XR.
نظارات الصوت
والعرض

تقدّم Gemini Live API حلاً شاملاً لتنفيذ واجهات محادثة مع المستخدم. عند إنشاء تطبيقات لأجهزة Android XR، يمكنك الدمج مع Gemini Live API من خلال Firebase AI Logic. على عكس استخدام تحويل النص إلى كلام (TTS) والتعرّف التلقائي على الكلام (ASR)، تعالج Gemini Live API كلاً من الإدخال والإخراج الصوتيَّين بطريقة سلسة. تتطلّب واجهة برمجة التطبيقات Gemini Live API اتصالاً دائمًا بالإنترنت، وتتضمّن تكلفة، وتتيح عددًا محدودًا من الاتصالات المتزامنة لكل مشروع، وقد لا تكون مثالية للتعامل مع حالات الخطأ أو غيرها من وسائل التواصل المهمة مع المستخدمين، خاصةً على النظارات الصوتية لأنّها لا تتضمّن شاشة عرض.

بالإضافة إلى إتاحة استخدام واجهات صوتية، يمكنك أيضًا استخدام واجهة Gemini Live API لإنشاء تجارب مستندة إلى الوكيل.

لبدء استخدام Gemini Live API، اتّبِع الخطوات الموضّحة في دليل Gemini Live API. يقدّم لك هذا الدليل خطوات إنشاء وتكوين LiveGenerativeModel، وإنشاء LiveSession، وإنشاء نُسخ مخصّصة من FunctionDeclaration تتيح لتطبيقك معالجة الطلبات الواردة من Gemini.