Fallstudien

Kakao Mobility nutzt Gemini Nano auf dem Gerät, um Kosten zu senken und die Anrufkonversion um 45 % zu steigern.

Lesezeit: 4 Minuten

Kakao Mobility ist das führende Mobilitätsunternehmen in Südkorea und bietet über die Kakao T App eine Reihe von Transport- und Lieferdiensten an, darunter Taxi-Bestellungen, Navigation, Fahrrad- und Roller-Sharing, Parken und Paketlieferung. Das Team von Kakao Mobility hat Gemini Nano über die GenAI Prompt API von ML Kit genutzt, um Parkhilfe für den Fahrrad-Sharing-Dienst und eine verbesserte Adresseneingabe für die Navigations- und Lieferdienste anzubieten.

Die Kakao T App hat insgesamt über 30 Millionen Nutzer und der Fahrradverleih ist einer der beliebtesten Dienste. Leider haben viele Nutzer die Fahrräder oder Roller nicht ordnungsgemäß abgestellt, wenn sie sie nicht genutzt haben. Dieses Verhalten führte zu einer Vielzahl von Parkverstößen und Sicherheitsbedenken, was zu öffentlichen Beschwerden, Bußgeldern und Abschleppungen führte. Diese Probleme begannen, die öffentliche Wahrnehmung von Kakao Mobility und seinen Bike-Sharing-Diensten negativ zu beeinflussen.

wisuk.png

„Durch die Nutzung der GenAI Prompt API von ML Kit und Gemini Nano konnten wir schnell Funktionen implementieren, die den sozialen Wert verbessern, ohne die Nutzerfreundlichkeit zu beeinträchtigen. Kakao Mobility wird weiterhin aktiv On‑Device-KI einsetzen, um sicherere und bequemere Mobilitätsdienste anzubieten.“ – Wisuk Ryu, Head of Client Development Div

Um diese Bedenken auszuräumen, entwickelte das Team zunächst ein Bilderkennungsmodell, das Nutzer benachrichtigen sollte, wenn ihr Fahrrad oder Roller gemäß den örtlichen Gesetzen und Sicherheitsstandards richtig geparkt war. Die Ausführung dieses Modells in der Cloud hätte erhebliche Serverkosten verursacht. Außerdem enthielten die hochgeladenen Fotos der Nutzer Informationen zu ihrem Parkplatz, sodass das Team Bedenken hinsichtlich des Datenschutzes und der Sicherheit vermeiden wollte. Das Team musste eine zuverlässigere und kostengünstigere Lösung finden.

Das Team wollte auch die Extraktion von Einheiten für den Paketlieferdienst in der Kakao T App verbessern. Bisher konnten Nutzer die Paketlieferung ganz einfach über eine Chatoberfläche bestellen, aber die Fahrer mussten die Adresse manuell in ein Bestellformular eingeben, um die Lieferung zu starten. Dieser Prozess war umständlich und anfällig für menschliche Fehler. Das Team wollte diesen Prozess optimieren, um Bestellformulare für das Lieferpersonal schneller und weniger frustrierend zu gestalten.

Nutzerfreundlichkeit mit der GenAI Prompt API von ML Kit verbessern

Das Team hat cloudbasierte Gemini-Modelle mit Gemini Nano verglichen, auf das über die GenAI Prompt API von ML Kit zugegriffen wird. „Nachdem wir Datenschutz, Kosten, Genauigkeit und Reaktionsgeschwindigkeit geprüft hatten, war die GenAI Prompt API von ML Kit eindeutig die optimale Wahl“, so Jinwoo Park, Android-Anwendungsentwickler bei Kakao Mobility. 

Um das Problem von falsch geparkten Fahrrädern oder Rollern zu lösen, nutzte das Team die multimodale Funktion von Gemini Nano über das ML Kit GenAI API SDK, um zu erkennen, wenn ein Fahrrad oder Roller gegen lokale Vorschriften verstößt, indem es auf gelben taktilen Pflastersteinen geparkt wird. Mit einem sorgfältig formulierten Prompt konnten sie mehr als 200 gelabelte Bilder von Parkplätzen auswerten und die Eingaben kontinuierlich optimieren. Diese Bewertung, die anhand bekannter Messwerte wie Accuracy, Precision, Recall und F1-Score gemessen wurde, hat sichergestellt, dass die Funktion den Qualitäts- und Zuverlässigkeitsstandards für die Produktion entspricht.

Nutzer können jetzt ein Foto ihres geparkten Fahrrads oder Rollers aufnehmen. Die App informiert sie dann, ob es richtig geparkt ist, oder gibt ihnen Anweisungen, wenn das nicht der Fall ist. Der gesamte Vorgang dauert nur wenige Sekunden und findet auf dem Gerät statt. So werden der Standort und die Informationen des Nutzers geschützt. 

bike.jpg

Um eine optimierte Funktion zur Extraktion von Einheiten zu erstellen, verwendete das Team noch einmal die GenAI Prompt API von ML Kit, um die in natürlicher Sprache verfassten Lieferbestellungen der Nutzer zu verarbeiten. Hätten sie herkömmliches maschinelles Lernen eingesetzt, wären ein großes Trainingsdataset und spezielles Fachwissen im Bereich maschinelles Lernen erforderlich gewesen. Stattdessen könnten sie einfach mit einem Prompt wie „Extrahiere den Namen, die Adresse und die Telefonnummer des Empfängers aus der Nachricht“ beginnen. Das Team erstellte etwa 200 hochwertige Beispiele für die Bewertung und prüfte den Prompt in vielen Iterationsrunden, um das beste Ergebnis zu erzielen. Die effektivste Methode war eine Technik namens „Few-Shot-Prompting“. Die Ergebnisse wurden sorgfältig analysiert, um sicherzustellen, dass die Ausgabe nur minimale Halluzinationen enthielt.

jinwoo.png


„Die Prompt API von ML Kit reduziert den Entwickleraufwand und bietet gleichzeitig hohe Sicherheit und Zuverlässigkeit auf dem Gerät. Es ermöglicht schnelles Prototyping, verringert die Abhängigkeit von der Infrastruktur und verursacht keine zusätzlichen Kosten. Es gibt keinen Grund, es nicht zu empfehlen.“ – Jinwoo Park, Android-Anwendungsentwickler bei Kakao Mobility

Große Ergebnisse mit der GenAI Prompt API von ML Kit erzielen

So kann die Funktion zur Extraktion von Einheiten die erforderlichen Details jeder Bestellung korrekt identifizieren, auch wenn mehrere Namen und Adressen eingegeben werden. Um die Reichweite der Funktion zu maximieren und einen robusten Fallback zu bieten, implementierte das Team auch einen cloudbasierten Pfad mit Gemini Flash.

Die Implementierung der GenAI Prompt API von ML Kit hat dem Team von Kakao Mobility durch die Umstellung auf On-Device-KI erhebliche Kosteneinsparungen ermöglicht. Die Funktion zur Analyse von Fahrradstellplätzen ist noch nicht verfügbar, die Verbesserung der Adresseneingabe hat aber bereits hervorragende Ergebnisse erzielt: 

  • Die Bearbeitungszeit für Lieferbestellungen wurde um 24 % verkürzt.
  • Die Conversion-Rate ist um 45% für Neukunden und um 6% für Bestandskunden gestiegen.
  • In der Hochsaison steigt die Anzahl der KI-basierten Bestellungen um mehr als 200%. 

„Insbesondere Inhaber von Kleinunternehmen haben sehr positives Feedback gegeben und gesagt, dass die Funktion ihre Arbeit viel effizienter gemacht und den Stress deutlich reduziert hat“, fügte Wisuk hinzu.

Nach der Einführung der Bilderkennungsfunktion für das Parken von Fahrrädern und Rollern möchte das Team von Kakao Mobility sie weiter verbessern. Das Parken in städtischen Umgebungen kann schwierig sein. Das Team arbeitet an Möglichkeiten, unnötige Bereiche aus Bildern herauszufiltern. 

„Die GenAI Prompt API von ML Kit bietet hochwertige Funktionen ohne zusätzlichen Aufwand“, so Jinwoo. „Das hat den Entwicklungsaufwand reduziert, die gesamte Entwicklungszeit verkürzt und uns ermöglicht, uns auf die Optimierung von Prompts zu konzentrieren, um qualitativ hochwertigere Ergebnisse zu erzielen.“

GenAI Prompt API von ML Kit selbst ausprobieren

Mit der GenAI Prompt API von ML Kit können Sie On-Device-KI in Ihre App einbauen und bereitstellen, um die Funktionen von Gemini Nano zu nutzen.

Verfasst von:

Weiterlesen