केस स्टडी
Kakao Mobility ने डिवाइस पर Gemini Nano का इस्तेमाल करके, लागत कम की और कॉल कन्वर्ज़न को 45% तक बढ़ाया
चार मिनट में पढ़ें
Kakao Mobility, दक्षिण कोरिया में मोबिलिटी से जुड़ा सबसे बड़ा कारोबार है. यह Kakao T ऐप्लिकेशन के ज़रिए, परिवहन और डिलीवरी से जुड़ी कई तरह की सेवाएं देता है. इनमें टैक्सी बुक करना, नेविगेशन, बाइक और स्कूटर शेयर करना, पार्किंग, और पार्सल डिलीवरी शामिल हैं. Kakao Mobility की टीम ने, बाइक शेयर करने की सेवा के लिए पार्किंग की सुविधा देने के लिए, ML Kit के GenAI Prompt API के ज़रिए Gemini Nano का इस्तेमाल किया. साथ ही, नेविगेशन और डिलीवरी सेवाओं के लिए, पते डालने की सुविधा को बेहतर बनाया.
Kakao T ऐप्लिकेशन के 3 करोड़ से ज़्यादा उपयोगकर्ता हैं. बाइक शेयर करने की सेवा, इसकी सबसे लोकप्रिय सेवाओं में से एक है. हालांकि, कई उपयोगकर्ता बाइक या स्कूटर का इस्तेमाल न होने पर, उन्हें गलत तरीके से पार्क कर रहे थे. इस वजह से, पार्किंग के नियमों के उल्लंघन और सुरक्षा से जुड़ी समस्याएं बढ़ गईं. इसके चलते, लोगों ने शिकायतें कीं, जुर्माना लगाया गया, और वाहनों को टो किया गया. इन समस्याओं की वजह से, Kakao Mobility और उसकी बाइक शेयर करने की सेवाओं के बारे में लोगों की राय पर बुरा असर पड़ने लगा.
“ML Kit के GenAI Prompt API और Gemini Nano का इस्तेमाल करके, हम ऐसी सुविधाएं तुरंत लागू कर पाए जिनसे उपयोगकर्ता अनुभव से समझौता किए बिना, सामाजिक वैल्यू को बेहतर बनाया जा सका. Kakao Mobility, डिवाइस पर एआई का इस्तेमाल करके, सुरक्षित और ज़्यादा सुविधाजनक मोबिलिटी सेवाएं देना जारी रखेगा.” — विसुक रयू, हेड ऑफ़ क्लाइंट डेवलपमेंट डिविज़न
इन समस्याओं को हल करने के लिए, टीम ने सबसे पहले इमेज रिकॉग्निशन मॉडल डिज़ाइन किया. इससे उपयोगकर्ताओं को यह सूचना मिलती थी कि उनकी बाइक या स्कूटर, स्थानीय कानूनों और सुरक्षा मानकों के मुताबिक पार्क की गई है या नहीं. क्लाउड के ज़रिए इस मॉडल को चलाने पर, सर्वर का खर्च काफ़ी बढ़ जाता. इसके अलावा, उपयोगकर्ताओं की अपलोड की गई फ़ोटो में, उनकी पार्किंग की जगह की जानकारी होती थी. इसलिए, टीम निजता या सुरक्षा से जुड़ी किसी भी समस्या से बचना चाहती थी. टीम को ज़्यादा भरोसेमंद और किफ़ायती समाधान की ज़रूरत थी.
टीम, Kakao T ऐप्लिकेशन में पार्सल डिलीवरी की सेवा के लिए, एंटिटी एक्सट्रैक्शन के अनुभव को भी बेहतर बनाना चाहती थी. पहले, उपयोगकर्ता चैट इंटरफ़ेस पर आसानी से पार्सल डिलीवरी का ऑर्डर कर पाते थे. हालांकि, ड्राइवर को डिलीवरी ऑर्डर शुरू करने के लिए, ऑर्डर फ़ॉर्म में पता मैन्युअल तरीके से डालना पड़ता था. यह प्रोसेस मुश्किल थी और इसमें मानवीय गड़बड़ी होने की संभावना ज़्यादा थी. टीम इस प्रोसेस को आसान बनाना चाहती थी, ताकि डिलीवरी करने वाले लोगों के लिए ऑर्डर फ़ॉर्म तेज़ी से और आसानी से भरे जा सकें.
ML Kit के GenAI Prompt API की मदद से, उपयोगकर्ता अनुभव को बेहतर बनाना
टीम ने क्लाउड पर आधारित Gemini मॉडल की तुलना, ML Kit के GenAI Prompt API के ज़रिए ऐक्सेस किए गए Gemini Nano से की और दोनों की परफ़ॉर्मेंस की जांच की. Kakao Mobility में Android ऐप्लिकेशन डेवलपर, जिनवू पार्क ने कहा, “निजता, लागत, सटीक नतीजे, और जवाब देने की स्पीड की समीक्षा करने के बाद, ML Kit का GenAI Prompt API सबसे सही विकल्प साबित हुआ.”
गलत तरीके से पार्क की गई बाइक या स्कूटर की समस्या को हल करने के लिए, टीम ने ML Kit GenAI API SDK के ज़रिए, Gemini Nano की मल्टीमॉडल सुविधा का इस्तेमाल किया. इससे यह पता लगाया जा सका कि पीली टैक्टाइल पेविंग पर पार्क करके, बाइक या स्कूटर स्थानीय नियमों का उल्लंघन कर रही है या नहीं. ध्यान से तैयार किए गए प्रॉम्प्ट की मदद से, वे पार्किंग की फ़ोटो वाली 200 से ज़्यादा लेबल वाली इमेज का आकलन कर पाए. साथ ही, उन्होंने इनपुट को लगातार बेहतर बनाया. सटीक नतीजे, सटीक जानकारी, रिकॉल, और F1 स्कोर जैसे जाने-माने मेट्रिक के ज़रिए किए गए इस आकलन से, यह पक्का किया गया कि यह सुविधा, प्रोडक्शन-लेवल की क्वालिटी और भरोसेमंद होने के मानकों को पूरा करती हो.
अब उपयोगकर्ता, पार्क की गई अपनी बाइक या स्कूटर की फ़ोटो ले सकते हैं. इसके बाद, ऐप्लिकेशन उन्हें बताएगा कि वह सही तरीके से पार्क की गई है या नहीं. अगर सही तरीके से पार्क नहीं की गई है, तो ऐप्लिकेशन उन्हें सही तरीके से पार्क करने के बारे में जानकारी देगा. यह पूरी प्रोसेस, डिवाइस पर कुछ ही सेकंड में पूरी हो जाती है. इससे उपयोगकर्ता की जगह और जानकारी सुरक्षित रहती है.
एंटिटी एक्सट्रैक्शन की सुविधा को बेहतर बनाने के लिए, टीम ने फिर से ML Kit के GenAI Prompt API का इस्तेमाल किया. इससे, सामान्य भाषा में लिखे गए उपयोगकर्ताओं के डिलीवरी ऑर्डर को प्रोसेस किया गया. अगर टीम, मशीन लर्निंग के पारंपरिक तरीके का इस्तेमाल करती, तो उसे सीखने के लिए बड़े डेटासेट और मशीन लर्निंग में खास विशेषज्ञता की ज़रूरत होती. इसके बजाय, वे "मैसेज से, पाने वाले का नाम, पता, और फ़ोन नंबर निकालें" जैसे प्रॉम्प्ट से शुरुआत कर सकते थे. टीम ने आकलन के लिए, करीब 200 बेहतरीन क्वालिटी के उदाहरण तैयार किए. साथ ही, सबसे बेहतर नतीजे पाने के लिए, उन्होंने कई बार अपने प्रॉम्प्ट का आकलन किया. इस्तेमाल किया गया सबसे असरदार तरीका, फ़्यू-शॉट प्रॉम्प्टिंग नाम की एक तकनीक थी. साथ ही, यह पक्का करने के लिए नतीजों का ध्यान से विश्लेषण किया गया कि आउटपुट में कम से कम गलत जानकारी हो.
“ML Kit का Prompt API, डिवाइस पर डेवलपर के काम को कम करता है. साथ ही, सुरक्षा और भरोसेमंद होने की गारंटी देता है. इससे रैपिड प्रोटोटाइपिंग की जा सकती है, इंफ़्रास्ट्रक्चर पर निर्भरता कम होती है, और कोई अतिरिक्त लागत नहीं लगती. इसलिए, इसे इस्तेमाल करने की सलाह न देने की कोई वजह नहीं है.” — जिनवू पार्क, Android ऐप्लिकेशन डेवलपर, Kakao Mobility
ML Kit के GenAI Prompt API की मदद से, शानदार नतीजे पाना
इस वजह से, एंटिटी एक्सट्रैक्शन की सुविधा, हर ऑर्डर की ज़रूरी जानकारी को सही तरीके से पहचानती है. भले ही, कई नाम और पते डाले गए हों. इस सुविधा की पहुंच बढ़ाने और फ़ॉल बैक की मज़बूत सुविधा देने के लिए, टीम ने Gemini Flash का इस्तेमाल करके, क्लाउड पर आधारित पाथ भी लागू किया.
डिवाइस पर एआई का इस्तेमाल करने से, Kakao Mobility की टीम को ML Kit के GenAI Prompt API को लागू करने पर, लागत में काफ़ी बचत हुई है. बाइक पार्किंग के विश्लेषण की सुविधा अब तक लॉन्च नहीं हुई है. हालांकि, पते डालने की सुविधा में सुधार से पहले ही शानदार नतीजे मिले हैं:
- डिलीवरी ऑर्डर को पूरा करने में लगने वाला समय 24% कम हो गया है.
- नए उपयोगकर्ताओं के लिए कन्वर्ज़न रेट 45% और मौजूदा उपयोगकर्ताओं के लिए 6% बढ़ गया है.
- पीक सीज़न के दौरान, एआई की मदद से किए गए ऑर्डर 200% से ज़्यादा बढ़ जाते हैं.
विसुक ने कहा, “खास तौर पर, छोटे कारोबार के मालिकों ने बहुत अच्छा फ़ीडबैक दिया है. उनका कहना है कि इस सुविधा से उनका काम ज़्यादा बेहतर तरीके से हो रहा है और तनाव काफ़ी कम हो गया है.”
बाइक और स्कूटर पार्किंग के लिए, इमेज रिकॉग्निशन की सुविधा लॉन्च होने के बाद, Kakao Mobility की टीम इसे और बेहतर बनाना चाहती है. शहरी इलाकों में पार्किंग की समस्याएं हो सकती हैं. इसलिए, टीम इमेज से गैर-ज़रूरी हिस्सों को फ़िल्टर करने के तरीके ढूंढ रही है.
जिनवू ने कहा, “ML Kit का GenAI Prompt API, बिना किसी अतिरिक्त लागत के बेहतरीन क्वालिटी की सुविधाएं देता है.” “इससे डेवलपर का काम कम हुआ है, डेवलपमेंट में लगने वाला कुल समय कम हुआ है, और हमें बेहतर क्वालिटी के नतीजे पाने के लिए, प्रॉम्प्ट ट्यूनिंग पर फ़ोकस करने का मौका मिला है.”
ML Kit के GenAI Prompt API को खुद आज़माएं
Gemini Nano की क्षमताओं का इस्तेमाल करने के लिए, ML Kit के GenAI Prompt API की मदद से, अपने ऐप्लिकेशन में डिवाइस पर एआई बनाएं और उसे डिप्लॉय करें.
पढ़ना जारी रखें
-
केस स्टडी
Karrot, कम्यूनिटी पर आधारित पीयर-टू-पीयर मार्केटप्लेस ऐप्लिकेशन है. इसकी मदद से, उपयोगकर्ता पुष्टि किए गए अन्य उपयोगकर्ताओं के साथ चीज़ें खरीद, बेच, और बदल सकते हैं. इस प्लैटफ़ॉर्म को 2015 में दक्षिण कोरिया में लॉन्च किया गया था. इसके बाद, यह दुनिया भर के बाज़ारों में फैल गया है. इसके 4.3 करोड़ से ज़्यादा रजिस्टर किए गए उपयोगकर्ता हैं.
Thomas Ezan, Tracy Agyemang • दो मिनट में पढ़ें
-
केस स्टडी
Monzo, यूके का एक डिजिटल बैंक है. इसके 1.5 करोड़ ग्राहक हैं और इनकी संख्या लगातार बढ़ रही है. ऐप्लिकेशन के बढ़ने के साथ-साथ, इंजीनियरिंग टीम ने ऐप्लिकेशन के स्टार्टअप टाइम को बेहतर बनाने के लिए एक अहम क्षेत्र के तौर पर पहचाना. हालांकि, उन्हें चिंता थी कि इसके लिए, उनके कोडबेस में अहम बदलाव करने पड़ेंगे.
Ben Weiss • दो मिनट में पढ़ें
-
केस स्टडी
TikTok, दुनिया भर में शॉर्ट वीडियो का प्लैटफ़ॉर्म है. यह अपने बड़े उपयोगकर्ता आधार और नई सुविधाओं के लिए जाना जाता है.
Ben Trengrove, Ajesh Pai • दो मिनट में पढ़ें
अप-टू-डेट रहें
हर हफ़्ते, अपने इनबॉक्स में Android डेवलपमेंट से जुड़ी नई जानकारी पाएं.