Casos de éxito

Kakao Mobility usa Gemini Nano integrado en el dispositivo para reducir costos y aumentar la conversión de llamadas en un 45%

Lectura de 4 min

Kakao Mobility es la empresa de movilidad líder de Corea del Sur, que ofrece una variedad de servicios de transporte y entrega, como solicitud de taxis, navegación, uso compartido de bicicletas y scooters, estacionamiento y entrega de paquetes, a través de su app Kakao T. El equipo de Kakao Mobility utilizó Gemini Nano a través de la API de GenAI Prompt de ML Kit para ofrecer asistencia de estacionamiento para su servicio de uso compartido de bicicletas y una experiencia mejorada de ingreso de direcciones para sus servicios de navegación y entrega.

La app de Kakao T atiende a más de 30 millones de usuarios en total, y su servicio de bicicletas compartidas es uno de los más populares. Sin embargo, lamentablemente, muchos usuarios estacionaban las bicicletas o los monopatines de forma incorrecta cuando no los usaban. Este comportamiento provocó un aumento de las infracciones de estacionamiento y problemas de seguridad, lo que generó reclamos del público, multas y remolques. Estos problemas comenzaron a afectar negativamente la percepción pública de Kakao Mobility y sus servicios de bicicletas compartidas.

wisuk.png

"Con la API de GenAI Prompt de ML Kit y Gemini Nano, pudimos implementar rápidamente funciones que mejoran el valor social sin comprometer la experiencia del usuario. Kakao Mobility seguirá adoptando activamente la IA en el dispositivo para brindar servicios de movilidad más seguros y convenientes". — Wisuk Ryu, jefe de la División de Desarrollo de Clientes

Para abordar estas inquietudes, el equipo diseñó inicialmente un modelo de reconocimiento de imágenes para notificar a los usuarios si su bicicleta o scooter estaban estacionados correctamente según las leyes locales y los estándares de seguridad. Ejecutar este modelo a través de la nube habría generado costos significativos del servidor. Además, las fotos que subían los usuarios contenían información sobre la ubicación de estacionamiento, por lo que el equipo quería evitar cualquier problema de privacidad o seguridad. El equipo necesitaba encontrar una solución más confiable y rentable.

El equipo también quería mejorar la experiencia de extracción de entidades para el servicio de entrega de paquetes dentro de la app de Kakao T. Anteriormente, los usuarios podían pedir fácilmente la entrega de paquetes en una interfaz de chat, pero los conductores debían ingresar la dirección en un formulario de pedido de forma manual para iniciar el pedido de entrega, un proceso engorroso y propenso a errores humanos. El equipo buscó optimizar este proceso para que los formularios de pedidos fueran más rápidos y menos frustrantes para el personal de entrega.

Mejora la experiencia del usuario con la API de GenAI Prompt de ML Kit

El equipo probó y comparó los modelos de Gemini basados en la nube con Gemini Nano, al que se accedió a través de la API de GenAI Prompt de ML Kit. "Después de revisar la privacidad, el costo, la exactitud y la velocidad de respuesta, la API de GenAI Prompt de ML Kit fue claramente la opción óptima", afirmó Jinwoo Park, desarrollador de aplicaciones para Android en Kakao Mobility. 

Para abordar el problema de las bicicletas o los monopatines estacionados de forma incorrecta, el equipo usó la capacidad multimodal de Gemini Nano a través del SDK de la API de IA generativa de ML Kit para detectar cuándo una bicicleta o un monopatín incumplen las reglamentaciones locales al estacionarse en un pavimento táctil amarillo. Con una instrucción cuidadosamente elaborada, pudieron evaluar más de 200 imágenes etiquetadas de fotos de estacionamiento y, al mismo tiempo, refinar continuamente las entradas. Esta evaluación, medida a través de métricas conocidas como la exactitud, la precisión, la recuperación y la puntuación F1, garantizó que la función cumpliera con los estándares de calidad y confiabilidad a nivel de producción.

Ahora los usuarios pueden tomar una foto de su bicicleta o scooter estacionado, y la app les informará si está estacionado correctamente o les brindará orientación si no lo está. Todo el proceso se realiza en segundos en el dispositivo, lo que protege la ubicación y la información del usuario. 

bike.jpg

Para crear una función de extracción de entidades optimizada, el equipo volvió a usar la API de GenAI Prompt de ML Kit para procesar los pedidos de entrega de los usuarios escritos en lenguaje natural. Si hubieran empleado el aprendizaje automático tradicional, se habría requerido un gran conjunto de datos de aprendizaje y experiencia especial en aprendizaje automático. En cambio, podría comenzar con una instrucción como "Extrae el nombre, la dirección y el número de teléfono del destinatario del mensaje". El equipo preparó alrededor de 200 ejemplos de evaluación de alta calidad y evaluó su instrucción a través de muchas rondas de iteración para obtener el mejor resultado. El método más eficaz que se empleó fue una técnica llamada instrucción con varios ejemplos, y los resultados se analizaron cuidadosamente para garantizar que el resultado contuviera alucinaciones mínimas.

jinwoo.png


"La API de Prompt de ML Kit reduce la sobrecarga de los desarrolladores y, al mismo tiempo, ofrece una gran seguridad y confiabilidad en el dispositivo. Permite crear prototipos rápidamente, reduce la dependencia de la infraestructura y no genera costos adicionales. No hay motivos para no recomendarlo". — Jinwoo Park, desarrollador de aplicaciones para Android en Kakao Mobility

Cómo obtener grandes resultados con la API de GenAI Prompt de ML Kit

Como resultado, la función de extracción de entidades identifica correctamente los detalles necesarios de cada pedido, incluso cuando se ingresan varios nombres y direcciones. Para maximizar el alcance de la función y proporcionar una alternativa sólida, el equipo también implementó una ruta basada en la nube con Gemini Flash.

La implementación de la API de GenAI Prompt de ML Kit generó una cantidad significativa de ahorros en costos para el equipo de Kakao Mobility, ya que se cambió a la IA integrada en el dispositivo. Si bien la función de análisis de estacionamiento de bicicletas aún no se lanzó, la mejora en el ingreso de direcciones ya generó excelentes resultados: 

  • El tiempo de finalización de los pedidos de entrega se redujo en un 24%.
  • El porcentaje de conversiones aumentó un 45% para los usuarios nuevos y un 6% para los usuarios existentes.
  • Durante las temporadas de más tráfico, los pedidos potenciados por IA aumentan en más del 200%. 

"En particular, los propietarios de pequeñas empresas compartieron comentarios muy positivos y dijeron que la función hizo que su trabajo fuera mucho más eficiente y redujo significativamente el estrés", agregó Wisuk.

Después del lanzamiento de la función de reconocimiento de imágenes para estacionamiento de bicicletas y scooters, el equipo de Kakao Mobility desea mejorarla aún más. Los entornos de estacionamiento urbanos pueden ser complejos, y el equipo está explorando formas de filtrar las regiones innecesarias de las imágenes. 

"La API de GenAI Prompt de ML Kit ofrece funciones de alta calidad sin sobrecarga adicional", afirmó Jinwoo. "Esto redujo el esfuerzo de los desarrolladores, acortó el tiempo de desarrollo general y nos permitió enfocarnos en el ajuste de instrucciones para obtener resultados de mayor calidad".

Prueba la API de GenAI Prompt de ML Kit

Compila e implementa IA integrada en el dispositivo en tu app con la API de GenAI Prompt de ML Kit para aprovechar las capacidades de Gemini Nano.

Escrito por:

Seguir leyendo