Études de cas
Kakao Mobility utilise Gemini Nano sur l'appareil pour réduire les coûts et augmenter la conversion par appel de 45%
Temps de lecture : 4 min
Kakao Mobility est la principale entreprise de mobilité en Corée du Sud. Elle propose une gamme de services de transport et de livraison, y compris la réservation de taxis, la navigation, le partage de vélos et de trottinettes, le stationnement et la livraison de colis, via son application Kakao T. L'équipe de Kakao Mobility a utilisé Gemini Nano via l'API GenAI Prompt de ML Kit pour proposer une assistance au stationnement pour son service de partage de vélos et améliorer l'expérience de saisie d'adresse pour ses services de navigation et de livraison.
L'application Kakao T compte plus de 30 millions d'utilisateurs au total, et son service de vélos en libre-service est l'un de ses services les plus populaires. Malheureusement, de nombreux utilisateurs ne garaient pas correctement les vélos ou les trottinettes lorsqu'ils ne les utilisaient pas. Ce comportement a entraîné une augmentation des infractions de stationnement et des problèmes de sécurité, ce qui a donné lieu à des plaintes du public, des amendes et des remorquages. Ces problèmes ont commencé à nuire à la perception du public à l'égard de Kakao Mobility et de ses services de vélos en libre-service.
"En exploitant l'API GenAI Prompt de ML Kit et Gemini Nano, nous avons pu implémenter rapidement des fonctionnalités qui améliorent la valeur sociale sans nuire à l'expérience utilisateur. Kakao Mobility continuera d'adopter activement l'IA sur l'appareil pour fournir des services de mobilité plus sûrs et plus pratiques." — Wisuk Ryu, responsable de la division Développement client
Pour répondre à ces préoccupations, l'équipe a initialement conçu un modèle de reconnaissance d'images afin d'informer les utilisateurs si leur vélo ou leur trottinette étaient garés correctement, conformément aux lois locales et aux normes de sécurité. L'exécution de ce modèle dans le cloud aurait entraîné des coûts de serveur importants. De plus, les photos mises en ligne par les utilisateurs contenaient des informations sur leur place de parking. L'équipe souhaitait donc éviter tout problème de confidentialité ou de sécurité. L'équipe devait trouver une solution plus fiable et plus économique.
L'équipe souhaitait également améliorer l'expérience d'extraction d'entités pour le service de livraison de colis dans l'application Kakao T. Auparavant, les utilisateurs pouvaient facilement commander la livraison de colis dans une interface de chat, mais les chauffeurs devaient saisir manuellement l'adresse dans un formulaire de commande pour lancer la commande de livraison. Ce processus était fastidieux et sujet aux erreurs humaines. L'équipe a cherché à simplifier ce processus, en rendant les bons de commande plus rapides et moins frustrants pour le personnel de livraison.
Améliorer l'expérience utilisateur avec l'API GenAI Prompt de ML Kit
L'équipe a testé et comparé les modèles Gemini basés sur le cloud à Gemini Nano, accessibles via l'API GenAI Prompt de ML Kit. "Après avoir examiné la confidentialité, le coût, la précision et la vitesse de réponse, l'API GenAI Prompt de ML Kit s'est clairement avérée être le choix optimal", a déclaré Jinwoo Park, développeur d'applications Android chez Kakao Mobility.
Pour résoudre le problème des vélos ou trottinettes mal garés, l'équipe a utilisé la fonctionnalité multimodale de Gemini Nano via le SDK ML Kit GenAI API pour détecter quand un vélo ou une trottinette enfreignait les réglementations locales en se garant sur des bandes podotactiles jaunes. Grâce à une requête soigneusement élaborée, ils ont pu évaluer plus de 200 images de photos de parkings étiquetées, tout en affinant continuellement les entrées. Cette évaluation, mesurée à l'aide de métriques bien connues telles que la justesse, la précision, le rappel et le score F1, a permis de s'assurer que la fonctionnalité répondait aux normes de qualité et de fiabilité requises pour la production.
Les utilisateurs peuvent désormais prendre en photo leur vélo ou leur trottinette garés. L'application les informe ensuite s'ils sont correctement garés ou leur fournit des conseils si ce n'est pas le cas. L'ensemble du processus se déroule en quelques secondes sur l'appareil, ce qui protège la position et les informations de l'utilisateur.
Pour créer une fonctionnalité d'extraction d'entités simplifiée, l'équipe a de nouveau utilisé l'API GenAI Prompt de ML Kit pour traiter les bons de livraison des utilisateurs rédigés en langage naturel. S'ils avaient utilisé le machine learning traditionnel, ils auraient eu besoin d'un grand ensemble de données d'apprentissage et d'une expertise particulière dans ce domaine. Il peut simplement commencer par une requête du type "Extrais le nom, l'adresse et le numéro de téléphone du destinataire du message". L'équipe a préparé environ 200 exemples d'évaluation de haute qualité et a évalué sa requête au cours de nombreuses itérations pour obtenir le meilleur résultat. La méthode la plus efficace utilisée était une technique appelée "prompting few-shot", et les résultats ont été soigneusement analysés pour s'assurer que le résultat contenait un minimum d'hallucinations.
L'API Prompt de ML Kit réduit les frais généraux des développeurs tout en offrant une sécurité et une fiabilité élevées sur l'appareil. Il permet de créer des prototypes rapidement, réduit la dépendance à l'infrastructure et n'entraîne aucun coût supplémentaire. Je ne vois aucune raison de ne pas le recommander." — Jinwoo Park, développeur d'applications Android chez Kakao Mobility
Obtenir des résultats importants avec l'API GenAI Prompt de ML Kit
Par conséquent, la fonctionnalité d'extraction d'entités identifie correctement les informations nécessaires de chaque commande, même lorsque plusieurs noms et adresses sont saisis. Pour maximiser la couverture de la fonctionnalité et fournir une solution de secours robuste, l'équipe a également implémenté un chemin basé sur le cloud à l'aide de Gemini Flash.
L'implémentation de l'API GenAI Prompt de ML Kit a permis à l'équipe Kakao Mobility de réaliser des économies considérables en passant à l'IA sur l'appareil. Bien que la fonctionnalité d'analyse des parkings à vélos n'ait pas encore été lancée, l'amélioration de la saisie des adresses a déjà donné d'excellents résultats :
- Le délai de traitement des commandes de livraison a été réduit de 24%.
- Le taux de conversion a augmenté de 45% pour les nouveaux utilisateurs et de 6% pour les utilisateurs existants.
- Pendant les périodes de pointe, les commandes optimisées par l'IA augmentent de plus de 200%.
"Les propriétaires de petites entreprises, en particulier, ont fait part de retours très positifs, affirmant que la fonctionnalité avait rendu leur travail beaucoup plus efficace et réduit considérablement leur stress", a ajouté Wisuk.
Une fois la fonctionnalité de reconnaissance d'images pour les parkings de vélos et de trottinettes lancée, l'équipe Kakao Mobility est impatiente de l'améliorer encore. Les environnements de stationnement urbains peuvent être difficiles, et l'équipe étudie des moyens de filtrer les régions inutiles des images.
"L'API GenAI Prompt de ML Kit offre des fonctionnalités de haute qualité sans surcharge supplémentaire", a déclaré Jinwoo. "Cela a réduit l'effort des développeurs, raccourci le temps de développement global et nous a permis de nous concentrer sur l'ajustement des requêtes pour obtenir des résultats de meilleure qualité."
Essayez l'API GenAI Prompt de ML Kit
Créez et déployez l'IA sur l'appareil dans votre application avec l'API Prompt de ML Kit pour l'IA générative afin d'exploiter les capacités de Gemini Nano.
Lire la suite
-
Études de cas
Karrot est une application de place de marché peer-to-peer hyperlocale et axée sur la communauté. Elle permet aux utilisateurs d'acheter, de vendre et d'échanger des articles avec d'autres utilisateurs validés. Depuis son lancement en Corée du Sud en 2015, la plate-forme s'est étendue aux marchés mondiaux et compte désormais plus de 43 millions d'utilisateurs inscrits.
Thomas Ezan, Tracy Agyemang • 2 min de lecture
-
Études de cas
Monzo est une banque numérique britannique qui compte 15 millions de clients et dont le nombre ne cesse d'augmenter. À mesure que l'application évoluait, l'équipe d'ingénieurs a identifié le temps de démarrage de l'application comme un point critique à améliorer, mais craignait que cela ne nécessite des modifications importantes de leur code.
Ben Weiss • 2 min de lecture
-
Études de cas
TikTok est une plate-forme mondiale de vidéos courtes connue pour son énorme base d'utilisateurs et ses fonctionnalités innovantes.
Ben Trengrove, Ajesh Pai • 2 min de lecture
Restez informé
Recevez chaque semaine les dernières informations sur le développement Android directement dans votre boîte de réception.