Casos de éxito

Kakao Mobility usa Gemini Nano en el dispositivo para reducir costes y aumentar la conversión de llamadas en un 45%

Lectura de 4 minutos

Kakao Mobility es la empresa de movilidad líder de Corea del Sur. Ofrece una amplia gama de servicios de transporte y entrega, como transporte bajo demanda, navegación, alquiler de bicicletas y patinetes, aparcamiento y entrega de paquetes, a través de su aplicación Kakao T. El equipo de Kakao Mobility utilizó Gemini Nano a través de la API GenAI Prompt de ML Kit para ofrecer asistencia de aparcamiento en su servicio de alquiler de bicicletas y mejorar la experiencia de introducción de direcciones en sus servicios de navegación y entrega.

La aplicación Kakao T tiene más de 30 millones de usuarios en total, y su servicio de bicicletas compartidas es uno de los más populares. Sin embargo, muchos usuarios aparcaban las bicicletas o los patinetes de forma incorrecta cuando no los usaban. Este comportamiento provocó un aumento de las infracciones de estacionamiento y problemas de seguridad, lo que derivó en quejas públicas, multas y remolques. Estos problemas empezaron a afectar negativamente a la percepción pública de Kakao Mobility y sus servicios de bicicletas compartidas.

wisuk.png

"Al aprovechar la API GenAI Prompt de ML Kit y Gemini Nano, pudimos implementar rápidamente funciones que mejoran el valor social sin sacrificar la experiencia de usuario. Kakao Mobility seguirá adoptando activamente la IA integrada en el dispositivo para ofrecer servicios de movilidad más seguros y cómodos". — Wisuk Ryu, responsable de la división de desarrollo de clientes

Para abordar estos problemas, el equipo diseñó inicialmente un modelo de reconocimiento de imágenes que notificaba a los usuarios si su bicicleta o patinete estaban aparcados correctamente de acuerdo con las leyes locales y los estándares de seguridad. Ejecutar este modelo en la nube habría supuesto unos costes de servidor considerables. Además, las fotos que subían los usuarios contenían información sobre la ubicación de su aparcamiento, por lo que el equipo quería evitar cualquier problema de privacidad o seguridad. El equipo necesitaba encontrar una solución más fiable y rentable.

El equipo también quería mejorar la experiencia de extracción de entidades para el servicio de entrega de paquetes en la aplicación Kakao T. Antes, los usuarios podían pedir fácilmente la entrega de paquetes en una interfaz de chat, pero los conductores tenían que introducir la dirección en un formulario de pedido manualmente para iniciar el pedido de entrega, un proceso engorroso y propenso a errores humanos. El equipo quería agilizar este proceso para que los formularios de pedido fueran más rápidos y menos frustrantes para el personal de reparto.

Mejorar la experiencia de usuario con la API GenAI Prompt de ML Kit

El equipo probó y comparó los modelos de Gemini basados en la nube con Gemini Nano, al que se accedió a través de la API GenAI Prompt de ML Kit. "Después de analizar la privacidad, el coste, la precisión y la velocidad de respuesta, la API GenAI Prompt de ML Kit era claramente la opción óptima", afirma Jinwoo Park, desarrollador de aplicaciones Android en Kakao Mobility. 

Para solucionar el problema de las bicicletas o los patinetes aparcados incorrectamente, el equipo usó la función multimodal de Gemini Nano a través del SDK de la API GenAI de ML Kit para detectar cuándo una bicicleta o un patinete infringen las normativas locales al aparcar en un pavimento táctil amarillo. Con una petición cuidadosamente elaborada, pudieron evaluar más de 200 imágenes etiquetadas de fotos de aparcamientos mientras refinaban continuamente las entradas. Esta evaluación, medida mediante métricas conocidas como la precisión, la sensibilidad, la recuperación y la puntuación F1, aseguró que la función cumpliera los estándares de calidad y fiabilidad de nivel de producción.

Ahora los usuarios pueden hacer una foto de su bicicleta o patinete aparcado y la aplicación les informará de si está aparcado correctamente o les dará indicaciones si no lo está. Todo el proceso se lleva a cabo en segundos en el dispositivo, lo que protege la ubicación y la información del usuario. 

bike.jpg

Para crear una función de extracción de entidades optimizada, el equipo volvió a usar la API GenAI Prompt de ML Kit para procesar los pedidos de los usuarios escritos en lenguaje natural. Si hubieran utilizado el aprendizaje automático tradicional, habrían necesitado un conjunto de datos de aprendizaje de gran tamaño y conocimientos especializados en aprendizaje automático. En su lugar, podrían empezar con una petición como "Extrae el nombre, la dirección y el número de teléfono del destinatario del mensaje". El equipo preparó unas 200 evaluaciones de alta calidad y evaluó su petición mediante muchas rondas de iteración para obtener el mejor resultado. El método más eficaz que se empleó fue una técnica llamada "few-shot prompting" (peticiones con pocos ejemplos), y los resultados se analizaron cuidadosamente para asegurarse de que la salida contuviera alucinaciones mínimas.

jinwoo.png


"La API Prompt de ML Kit reduce la sobrecarga de los desarrolladores y, al mismo tiempo, ofrece una gran seguridad y fiabilidad en el dispositivo. Permite crear prototipos rápidamente, reduce la dependencia de la infraestructura y no conlleva ningún coste adicional. No hay ningún motivo para no recomendarlo". — Jinwoo Park, desarrollador de aplicaciones Android en Kakao Mobility

Obtener grandes resultados con la API GenAI Prompt de ML Kit

Por lo tanto, la función de extracción de entidades identifica correctamente los detalles necesarios de cada pedido, incluso cuando se introducen varios nombres y direcciones. Para maximizar la cobertura de la función y proporcionar una alternativa sólida, el equipo también implementó una ruta basada en la nube con Gemini Flash.

Al implementar la API GenAI Prompt de ML Kit, el equipo de Kakao Mobility ha conseguido un ahorro de costes significativo al pasarse a la IA en el dispositivo. Aunque la función de análisis de aparcamientos para bicicletas aún no se ha lanzado, la mejora de la introducción de direcciones ya ha dado excelentes resultados: 

  • El tiempo de finalización de los pedidos de entrega se ha reducido en un 24%.
  • La tasa de conversión ha aumentado un 45% en el caso de los usuarios nuevos y un 6% en el de los usuarios actuales.
  • Durante las temporadas altas, los pedidos basados en IA aumentan más del 200%. 

"En concreto, los propietarios de pequeñas empresas nos han dado comentarios muy positivos y nos han dicho que esta función ha hecho que su trabajo sea mucho más eficiente y que hayan reducido considerablemente el estrés", añade Wisuk.

Tras el lanzamiento de la función de reconocimiento de imágenes para aparcamientos de bicicletas y patinetes, el equipo de Kakao Mobility quiere seguir mejorándola. Los entornos de aparcamiento urbanos pueden ser complicados, por lo que el equipo está buscando formas de filtrar las regiones innecesarias de las imágenes. 

"La API GenAI Prompt de ML Kit ofrece funciones de alta calidad sin sobrecarga adicional", afirma Jinwoo. "Esto ha reducido el esfuerzo de los desarrolladores, ha acortado el tiempo de desarrollo general y nos ha permitido centrarnos en la optimización de las peticiones para obtener resultados de mayor calidad".

Prueba la API GenAI Prompt de ML Kit

Crea e implementa IA en el dispositivo en tu aplicación con la API GenAI Prompt de ML Kit para aprovechar las funciones de Gemini Nano.

Escrito por:

Seguir leyendo