Studia przypadków
Kakao Mobility używa Gemini Nano na urządzeniu, aby obniżyć koszty i zwiększyć konwersję telefoniczną o 45%
Czas czytania: 4 minuty
Kakao Mobility to wiodąca firma w Korei Południowej oferująca usługi transportowe i dostawy, w tym zamawianie taksówek, nawigację, wypożyczanie rowerów i skuterów, parkingi oraz dostawę paczek za pomocą aplikacji Kakao T. Zespół Kakao Mobility wykorzystał Gemini Nano za pomocą interfejsu GenAI Prompt API z ML Kit, aby zaoferować pomoc w parkowaniu w ramach usługi wypożyczania rowerów oraz ulepszyć wprowadzanie adresu w usługach nawigacji i dostawy.
Aplikacja Kakao T ma ponad 30 milionów użytkowników, a jej usługa wypożyczania rowerów jest jedną z najpopularniejszych. Niestety wielu użytkowników nieprawidłowo parkowało rowery lub hulajnogi, gdy nie były używane. Takie zachowanie doprowadziło do wzrostu liczby wykroczeń związanych z parkowaniem i problemów z bezpieczeństwem, co spowodowało skargi publiczne, grzywny i odholowywanie pojazdów. Problemy te zaczęły negatywnie wpływać na postrzeganie zarówno Kakao Mobility, jak i jej usług wypożyczania rowerów.
„Dzięki wykorzystaniu interfejsu GenAI Prompt API z ML Kit i Gemini Nano udało nam się szybko wdrożyć funkcje, które zwiększają wartość społeczną bez pogarszania wrażeń użytkowników. Kakao Mobility będzie nadal aktywnie wdrażać AI na urządzeniach, aby zapewniać bezpieczniejsze i wygodniejsze usługi mobilne”. – Wisuk Ryu, dyrektor działu rozwoju klienta
Aby rozwiązać te problemy, zespół początkowo zaprojektował model rozpoznawania obrazów, który powiadamiał użytkowników, czy ich rower lub hulajnoga są zaparkowane prawidłowo zgodnie z lokalnymi przepisami i standardami bezpieczeństwa. Uruchomienie tego modelu w chmurze wiązałoby się ze znacznymi kosztami serwera. Dodatkowo przesłane przez użytkowników zdjęcia zawierały informacje o miejscu parkowania, więc zespół chciał uniknąć wszelkich problemów związanych z prywatnością i bezpieczeństwem. Zespół musiał znaleźć bardziej niezawodne i opłacalne rozwiązanie.
Zespół chciał też ulepszyć wyodrębnianie encji w usłudze dostarczania przesyłek w aplikacji Kakao T. Wcześniej użytkownicy mogli łatwo zamawiać dostawę przesyłek w interfejsie czatu, ale kierowcy musieli ręcznie wpisywać adres w formularzu zamówienia, aby rozpocząć dostawę. Było to uciążliwe i mogło prowadzić do błędów. Zespół postanowił usprawnić ten proces, aby formularze zamówień były szybsze i mniej frustrujące dla dostawców.
Ulepszanie komfortu użytkowników dzięki interfejsowi GenAI Prompt API z ML Kit
Zespół przetestował i porównał modele Gemini oparte na chmurze z modelem Gemini Nano, do którego dostęp uzyskano za pomocą interfejsu GenAI Prompt API w ML Kit. „Po przeanalizowaniu kwestii prywatności, kosztów, dokładności i szybkości odpowiedzi okazało się, że interfejs GenAI Prompt API w ML Kit to optymalne rozwiązanie” – powiedział Jinwoo Park, programista aplikacji na Androida w Kakao Mobility.
Aby rozwiązać problem z nieprawidłowo zaparkowanymi rowerami lub hulajnogami, zespół wykorzystał funkcję multimodalną Gemini Nano za pomocą pakietu ML Kit GenAI API SDK. Dzięki temu mógł wykrywać, kiedy rower lub hulajnoga narusza lokalne przepisy, parkując na żółtej nawierzchni z wypukłościami. Dzięki starannie opracowanemu promptowi udało im się ocenić ponad 200 oznaczonych zdjęć parkingów, stale dopracowując dane wejściowe. Ta ocena, mierzona za pomocą dobrze znanych wskaźników, takich jak dokładność, precyzja, czułość i wynik F1, zapewniła, że funkcja spełnia standardy jakości i niezawodności na poziomie produkcyjnym.
Użytkownicy mogą teraz zrobić zdjęcie zaparkowanego roweru lub skutera, a aplikacja poinformuje ich, czy jest on prawidłowo zaparkowany, lub udzieli wskazówek, jeśli nie. Cały proces trwa kilka sekund na urządzeniu, co chroni lokalizację i informacje użytkownika.
Aby utworzyć uproszczoną funkcję wyodrębniania jednostek, zespół ponownie użył interfejsu GenAI Prompt API z ML Kit do przetwarzania zamówień dostawy użytkowników napisanych w języku naturalnym. Gdyby zastosowali tradycyjne uczenie maszynowe, potrzebowaliby dużego zbioru danych do trenowania i specjalistycznej wiedzy z zakresu uczenia maszynowego. Zamiast tego mogą po prostu zacząć od prompta w stylu „Wyodrębnij z wiadomości imię i nazwisko odbiorcy, adres i numer telefonu”. Zespół przygotował około 200 przykładów oceny wysokiej jakości i wielokrotnie testował prompt, aby uzyskać jak najlepszy wynik. Najskuteczniejszą metodą okazała się technika zwana tworzeniem promptów few-shot. Wyniki zostały dokładnie przeanalizowane, aby zapewnić minimalną liczbę halucynacji.
„Interfejs Prompt API w ML Kit zmniejsza nakład pracy programistów, a jednocześnie zapewnia wysoki poziom bezpieczeństwa i niezawodności na urządzeniu. Umożliwia szybkie prototypowanie, zmniejsza zależność od infrastruktury i nie wiąże się z dodatkowymi kosztami. Nie ma powodu, aby nie polecać tej usługi”. – Jinwoo Park, deweloper aplikacji na Androida w Kakao Mobility
Osiąganie świetnych wyników dzięki interfejsowi GenAI Prompt API w ML Kit
Dzięki temu funkcja wyodrębniania informacji prawidłowo identyfikuje niezbędne szczegóły każdego zamówienia, nawet jeśli wpisano wiele nazw i adresów. Aby zmaksymalizować zasięg tej funkcji i zapewnić solidne rozwiązanie zastępcze, zespół wdrożył też ścieżkę działającą w chmurze, która wykorzystuje Gemini Flash.
Wdrożenie interfejsu GenAI Prompt API z ML Kit przyniosło zespołowi Kakao Mobility znaczne oszczędności dzięki przejściu na AI na urządzeniu. Funkcja analizy miejsc parkingowych dla rowerów nie została jeszcze udostępniona, ale ulepszenie wprowadzania adresu przyniosło już doskonałe rezultaty:
- Czas realizacji zamówień z dostawą został skrócony o 24%.
- Współczynnik konwersji wzrósł o 45% w przypadku nowych użytkowników i o 6% w przypadku dotychczasowych użytkowników.
- W szczycie sezonu liczba zamówień opartych na AI wzrasta o ponad 200%.
„Właściciele małych firm przekazali nam bardzo pozytywne opinie. Twierdzą, że ta funkcja znacznie zwiększyła wydajność ich pracy i znacznie zmniejszyła stres” – dodał Wisuk.
Po wprowadzeniu funkcji rozpoznawania obrazów w przypadku parkingów dla rowerów i skuterów zespół Kakao Mobility chce ją jeszcze ulepszyć. Parkowanie w miastach może być trudne, dlatego zespół szuka sposobów na odfiltrowanie z obrazów niepotrzebnych obszarów.
„Interfejs GenAI Prompt API w ML Kit oferuje funkcje wysokiej jakości bez dodatkowych obciążeń” – mówi Jinwoo. „Dzięki temu zmniejszyliśmy nakład pracy deweloperów, skróciliśmy ogólny czas tworzenia i mogliśmy skupić się na dostrajaniu promptów, aby uzyskać wyniki wyższej jakości”.
Wypróbuj interfejs GenAI Prompt API w ML Kit
Twórz i wdrażaj w aplikacji AI na urządzeniu za pomocą interfejsu GenAI Prompt API w ML Kit, aby wykorzystać możliwości Gemini Nano.
Czytaj dalej
-
Studia przypadków
Monzo to brytyjski bank cyfrowy, który ma 15 milionów klientów i stale się rozwija. W miarę skalowania aplikacji zespół inżynierów uznał czas uruchamiania aplikacji za kluczowy obszar wymagający poprawy, ale obawiał się, że będzie to wymagało znacznych zmian w bazie kodu.
Ben Weiss • Czas czytania: 2 minuty
-
Studia przypadków
TikTok to globalna platforma z krótkimi filmami, która jest znana z ogromnej bazy użytkowników i innowacyjnych funkcji.
Ben Trengrove, Ajesh Pai • Czas czytania: 2 minuty
-
Studia przypadków
W dynamicznym świecie mediów społecznościowych uwaga użytkowników jest szybko zdobywana i tracona. Aplikacje Meta (Facebook i Instagram) należą do największych platform społecznościowych na świecie i obsługują miliardy użytkowników na całym świecie.
Mayuri Khinvasara Khabya • Czas czytania: 4 minuty
Bądź na bieżąco
Otrzymuj co tydzień najnowsze informacje o tworzeniu aplikacji na Androida na swoją skrzynkę odbiorczą.