Case Studies
Kakao Mobility używa Gemini Nano na urządzeniu, aby obniżyć koszty i zwiększyć współczynnik konwersji połączeń o 45%
Czas czytania: 4 minuty
Kakao Mobility to wiodąca firma w Korei Południowej oferująca usługi transportowe i dostawcze, w tym zamawianie taksówek, nawigację, wypożyczanie rowerów i hulajnóg, parkowanie oraz dostarczanie paczek za pomocą aplikacji Kakao T. Zespół Kakao Mobility wykorzystał Gemini Nano za pomocą interfejsu GenAI Prompt API w ML Kit, aby oferować pomoc w parkowaniu w ramach usługi wypożyczania rowerów oraz ulepszyć wprowadzanie adresu w usługach nawigacji i dostawy.
Aplikacja Kakao T ma ponad 30 milionów użytkowników, a usługa wypożyczania rowerów jest jedną z najpopularniejszych. Niestety wielu użytkowników parkowało rowery lub hulajnogi w nieprawidłowy sposób, gdy nie były używane. Takie zachowanie doprowadziło do wzrostu liczby naruszeń przepisów dotyczących parkowania i obaw o bezpieczeństwo, co spowodowało skargi publiczne, grzywny i odholowywanie pojazdów. Te problemy zaczęły negatywnie wpływać na postrzeganie zarówno Kakao Mobility, jak i jej usług wypożyczania rowerów.
„Dzięki wykorzystaniu interfejsu GenAI Prompt API w ML Kit i Gemini Nano udało nam się szybko wdrożyć funkcje, które zwiększają wartość społeczną bez pogorszenia komfortu użytkowników. Kakao Mobility będzie nadal aktywnie wdrażać AI na urządzeniu, aby zapewniać bezpieczniejsze i wygodniejsze usługi transportowe” – Wisuk Ryu, szef działu rozwoju klienta
Aby rozwiązać te problemy, zespół początkowo zaprojektował model rozpoznawania obrazów, który miał powiadamiać użytkowników, czy ich rower lub hulajnoga są zaparkowane prawidłowo zgodnie z lokalnymi przepisami i standardami bezpieczeństwa. Uruchomienie tego modelu w chmurze wiązałoby się ze znacznymi kosztami serwera. Ponadto przesłane przez użytkowników zdjęcia zawierały informacje o lokalizacji parkowania, dlatego zespół chciał uniknąć wszelkich obaw związanych z prywatnością i bezpieczeństwem. Zespół musiał znaleźć bardziej niezawodne i opłacalne rozwiązanie.
Zespół chciał też ulepszyć funkcję wyodrębniania encji w usłudze dostarczania paczek w aplikacji Kakao T. Wcześniej użytkownicy mogli łatwo zamówić dostawę paczki w interfejsie czatu, ale kierowcy musieli ręcznie wpisać adres w formularzu zamówienia, aby rozpocząć dostawę. Był to proces uciążliwy i podatny na błędy. Zespół chciał usprawnić ten proces, aby formularze zamówień były szybsze i mniej frustrujące dla dostawców.
Ulepszanie komfortu użytkowników za pomocą interfejsu GenAI Prompt API w ML Kit
Zespół przetestował i porównał modele Gemini w chmurze z Gemini Nano, do którego dostęp uzyskano za pomocą interfejsu GenAI Prompt API w ML Kit. „Po przeanalizowaniu prywatności, kosztów, dokładności i szybkości reakcji interfejs GenAI Prompt API w ML Kit okazał się optymalnym wyborem” – powiedział Jinwoo Park, deweloper aplikacji na Androida w Kakao Mobility.
Aby rozwiązać problem nieprawidłowo zaparkowanych rowerów lub hulajnóg, zespół użył funkcji multimodalnej Gemini Nano za pomocą pakietu ML Kit GenAI API SDK, aby wykrywać, kiedy rower lub hulajnoga naruszają lokalne przepisy, parkując na żółtej nawierzchni dotykowej. Dzięki starannie opracowanemu promptowi udało im się ocenić ponad 200 oznaczonych zdjęć zaparkowanych pojazdów, jednocześnie stale udoskonalając dane wejściowe. Ta ocena, mierzona za pomocą dobrze znanych danych, takich jak dokładność, precyzja, czułość i wynik F1, zapewniła, że funkcja spełnia standardy jakości i niezawodności na poziomie produkcyjnym.
Teraz użytkownicy mogą zrobić zdjęcie zaparkowanego roweru lub hulajnogi, a aplikacja poinformuje ich, czy pojazd jest zaparkowany prawidłowo, lub udzieli wskazówek, jeśli nie jest. Cały proces trwa kilka sekund na urządzeniu, chroniąc lokalizację i informacje użytkownika.
Aby utworzyć usprawnioną funkcję wyodrębniania encji, zespół ponownie użył interfejsu GenAI Prompt API w ML Kit do przetwarzania zamówień dostawy użytkowników napisanych w języku naturalnym. Gdyby zespół zastosował tradycyjne uczenie maszynowe, wymagałoby to dużego zbioru danych do uczenia i specjalistycznej wiedzy w tej dziedzinie. Zamiast tego zespół mógł po prostu zacząć od prompta takiego jak „Wyodrębnij z wiadomości imię i nazwisko, adres i numer telefonu odbiorcy”. Zespół przygotował około 200 wysokiej jakości przykładów do oceny i ocenił prompta w wielu iteracjach, aby uzyskać najlepszy wynik. Najskuteczniejszą metodą okazała się technika tworzenia promptów few-shot. Wyniki zostały starannie przeanalizowane, aby zapewnić, że dane wyjściowe zawierają jak najmniej halucynacji.
„Interfejs Prompt API w ML Kit zmniejsza obciążenie deweloperów, zapewniając jednocześnie wysoki poziom bezpieczeństwa i niezawodności na urządzeniu. Umożliwia szybkie tworzenie prototypów, zmniejsza zależność od infrastruktury i nie wiąże się z dodatkowymi kosztami. Nie ma powodu, aby go nie polecać” — Jinwoo Park, deweloper aplikacji na Androida w Kakao Mobility
Osiąganie świetnych wyników dzięki interfejsowi GenAI Prompt API w ML Kit
Dzięki temu funkcja wyodrębniania encji prawidłowo identyfikuje niezbędne szczegóły każdego zamówienia, nawet jeśli wpisano wiele imion i nazwisk oraz adresów. Aby zmaksymalizować zasięg funkcji i zapewnić niezawodne rozwiązanie rezerwowe, zespół wdrożył też ścieżkę działającą w chmurze za pomocą Gemini Flash.
Wdrożenie interfejsu GenAI Prompt API w ML Kit pozwoliło zespołowi Kakao Mobility znacznie obniżyć koszty dzięki przejściu na AI na urządzeniu. Funkcja analizy parkowania rowerów nie została jeszcze uruchomiona, ale ulepszenie wprowadzania adresu przyniosło już doskonałe rezultaty:
- Czas realizacji zamówień dostawy skrócił się o 24%.
- Współczynnik konwersji wzrósł o 45% w przypadku nowych użytkowników i o 6% w przypadku obecnych.
- W szczycie sezonu liczba zamówień opartych na AI wzrasta o ponad 200%.
„Szczególnie pozytywne opinie przekazali właściciele małych firm, którzy twierdzą, że ta funkcja znacznie zwiększyła wydajność ich pracy i zmniejszyła stres” – dodał Wisuk.
Po uruchomieniu funkcji rozpoznawania obrazów w przypadku parkowania rowerów i hulajnóg zespół Kakao Mobility chce ją jeszcze ulepszyć. Parkowanie w miastach może być trudne, dlatego zespół szuka sposobów na odfiltrowanie niepotrzebnych obszarów z obrazów.
„Interfejs GenAI Prompt API w ML Kit oferuje wysokiej jakości funkcje bez dodatkowych kosztów” – powiedział Jinwoo. „Dzięki temu zmniejszyliśmy nakład pracy deweloperów, skróciliśmy ogólny czas tworzenia i mogliśmy skupić się na dostrajaniu promptów, aby uzyskać lepsze wyniki”.
Wypróbuj interfejs GenAI Prompt API w ML Kit
Twórz i wdrażaj AI na urządzeniu w swojej aplikacji za pomocą interfejsu GenAI Prompt API w ML Kit, aby wykorzystać możliwości Gemini Nano.
Czytaj dalej
-
r.r.
Case Studies
Karrot to hiperlokalna aplikacja marketplace oparta na społeczności, która umożliwia użytkownikom kupowanie, sprzedawanie i wymienianie przedmiotów z innymi zweryfikowanymi użytkownikami. Od czasu uruchomienia w Korei Południowej w 2015 r. platforma rozszerzyła się na rynki globalne, zdobywając ponad 43 miliony zarejestrowanych użytkowników.
Thomas Ezan, Tracy Agyemang • Czas czytania: 2 minuty
-
Case Studies
Monzo to brytyjski bank cyfrowy, który ma 15 milionów klientów i stale się rozwija. W miarę skalowania aplikacji zespół inżynierów uznał czas uruchamiania aplikacji za kluczowy obszar do poprawy, ale obawiał się, że będzie to wymagało znacznych zmian w bazie kodu.
Ben Weiss • Czas czytania: 2 minuty
-
Case Studies
TikTok to globalna platforma krótkich filmów znana z ogromnej bazy użytkowników i innowacyjnych funkcji.
Ben Trengrove, Ajesh Pai • Czas czytania: 2 minuty
Bądź na bieżąco
Otrzymuj co tydzień najnowsze informacje o tworzeniu aplikacji na Androida na swoją skrzynkę odbiorczą.