Casos de éxito
Kakao Mobility usa Gemini Nano en el dispositivo para reducir costes y aumentar la conversión de llamadas en un 45%
Lectura de 4 minutos
Kakao Mobility es la empresa de movilidad líder de Corea del Sur. Ofrece una amplia gama de servicios de transporte y entrega, como transporte bajo demanda, navegación, alquiler de bicicletas y patinetes, aparcamiento y entrega de paquetes, a través de su aplicación Kakao T. El equipo de Kakao Mobility utilizó Gemini Nano a través de la API GenAI Prompt de ML Kit para ofrecer asistencia de aparcamiento en su servicio de alquiler de bicicletas y mejorar la experiencia de introducción de direcciones en sus servicios de navegación y entrega.
La aplicación Kakao T tiene más de 30 millones de usuarios en total, y su servicio de bicicletas compartidas es uno de los más populares. Sin embargo, muchos usuarios aparcaban las bicicletas o los patinetes de forma incorrecta cuando no los usaban. Este comportamiento provocó un aumento de las infracciones de estacionamiento y problemas de seguridad, lo que derivó en quejas públicas, multas y remolques. Estos problemas empezaron a afectar negativamente a la percepción pública de Kakao Mobility y sus servicios de bicicletas compartidas.
"Al aprovechar la API GenAI Prompt de ML Kit y Gemini Nano, pudimos implementar rápidamente funciones que mejoran el valor social sin sacrificar la experiencia de usuario. Kakao Mobility seguirá adoptando activamente la IA integrada en el dispositivo para ofrecer servicios de movilidad más seguros y cómodos". — Wisuk Ryu, responsable de la división de desarrollo de clientes
Para abordar estos problemas, el equipo diseñó inicialmente un modelo de reconocimiento de imágenes que notificaba a los usuarios si su bicicleta o patinete estaban aparcados correctamente de acuerdo con las leyes locales y los estándares de seguridad. Ejecutar este modelo en la nube habría supuesto unos costes de servidor considerables. Además, las fotos que subían los usuarios contenían información sobre la ubicación de su aparcamiento, por lo que el equipo quería evitar cualquier problema de privacidad o seguridad. El equipo necesitaba encontrar una solución más fiable y rentable.
El equipo también quería mejorar la experiencia de extracción de entidades para el servicio de entrega de paquetes en la aplicación Kakao T. Antes, los usuarios podían pedir fácilmente la entrega de paquetes en una interfaz de chat, pero los conductores tenían que introducir la dirección en un formulario de pedido manualmente para iniciar el pedido de entrega, un proceso engorroso y propenso a errores humanos. El equipo quería agilizar este proceso para que los formularios de pedido fueran más rápidos y menos frustrantes para el personal de reparto.
Mejorar la experiencia de usuario con la API GenAI Prompt de ML Kit
El equipo probó y comparó los modelos de Gemini basados en la nube con Gemini Nano, al que se accedió a través de la API GenAI Prompt de ML Kit. "Después de analizar la privacidad, el coste, la precisión y la velocidad de respuesta, la API GenAI Prompt de ML Kit era claramente la opción óptima", afirma Jinwoo Park, desarrollador de aplicaciones Android en Kakao Mobility.
Para solucionar el problema de las bicicletas o los patinetes aparcados incorrectamente, el equipo usó la función multimodal de Gemini Nano a través del SDK de la API GenAI de ML Kit para detectar cuándo una bicicleta o un patinete infringen las normativas locales al aparcar en un pavimento táctil amarillo. Con una petición cuidadosamente elaborada, pudieron evaluar más de 200 imágenes etiquetadas de fotos de aparcamientos mientras refinaban continuamente las entradas. Esta evaluación, medida mediante métricas conocidas como la precisión, la sensibilidad, la recuperación y la puntuación F1, aseguró que la función cumpliera los estándares de calidad y fiabilidad de nivel de producción.
Ahora los usuarios pueden hacer una foto de su bicicleta o patinete aparcado y la aplicación les informará de si está aparcado correctamente o les dará indicaciones si no lo está. Todo el proceso se lleva a cabo en segundos en el dispositivo, lo que protege la ubicación y la información del usuario.
Para crear una función de extracción de entidades optimizada, el equipo volvió a usar la API GenAI Prompt de ML Kit para procesar los pedidos de los usuarios escritos en lenguaje natural. Si hubieran utilizado el aprendizaje automático tradicional, habrían necesitado un conjunto de datos de aprendizaje de gran tamaño y conocimientos especializados en aprendizaje automático. En su lugar, podrían empezar con una petición como "Extrae el nombre, la dirección y el número de teléfono del destinatario del mensaje". El equipo preparó unas 200 evaluaciones de alta calidad y evaluó su petición mediante muchas rondas de iteración para obtener el mejor resultado. El método más eficaz que se empleó fue una técnica llamada "few-shot prompting" (peticiones con pocos ejemplos), y los resultados se analizaron cuidadosamente para asegurarse de que la salida contuviera alucinaciones mínimas.
"La API Prompt de ML Kit reduce la sobrecarga de los desarrolladores y, al mismo tiempo, ofrece una gran seguridad y fiabilidad en el dispositivo. Permite crear prototipos rápidamente, reduce la dependencia de la infraestructura y no conlleva ningún coste adicional. No hay ningún motivo para no recomendarlo". — Jinwoo Park, desarrollador de aplicaciones Android en Kakao Mobility
Obtener grandes resultados con la API GenAI Prompt de ML Kit
Por lo tanto, la función de extracción de entidades identifica correctamente los detalles necesarios de cada pedido, incluso cuando se introducen varios nombres y direcciones. Para maximizar la cobertura de la función y proporcionar una alternativa sólida, el equipo también implementó una ruta basada en la nube con Gemini Flash.
Al implementar la API GenAI Prompt de ML Kit, el equipo de Kakao Mobility ha conseguido un ahorro de costes significativo al pasarse a la IA en el dispositivo. Aunque la función de análisis de aparcamientos para bicicletas aún no se ha lanzado, la mejora de la introducción de direcciones ya ha dado excelentes resultados:
- El tiempo de finalización de los pedidos de entrega se ha reducido en un 24%.
- La tasa de conversión ha aumentado un 45% en el caso de los usuarios nuevos y un 6% en el de los usuarios actuales.
- Durante las temporadas altas, los pedidos basados en IA aumentan más del 200%.
"En concreto, los propietarios de pequeñas empresas nos han dado comentarios muy positivos y nos han dicho que esta función ha hecho que su trabajo sea mucho más eficiente y que hayan reducido considerablemente el estrés", añade Wisuk.
Tras el lanzamiento de la función de reconocimiento de imágenes para aparcamientos de bicicletas y patinetes, el equipo de Kakao Mobility quiere seguir mejorándola. Los entornos de aparcamiento urbanos pueden ser complicados, por lo que el equipo está buscando formas de filtrar las regiones innecesarias de las imágenes.
"La API GenAI Prompt de ML Kit ofrece funciones de alta calidad sin sobrecarga adicional", afirma Jinwoo. "Esto ha reducido el esfuerzo de los desarrolladores, ha acortado el tiempo de desarrollo general y nos ha permitido centrarnos en la optimización de las peticiones para obtener resultados de mayor calidad".
Prueba la API GenAI Prompt de ML Kit
Crea e implementa IA en el dispositivo en tu aplicación con la API GenAI Prompt de ML Kit para aprovechar las funciones de Gemini Nano.
Seguir leyendo
-
Casos de éxito
TikTok es una plataforma mundial de vídeos cortos conocida por su enorme base de usuarios y sus innovadoras funciones.
Ben Trengrove, Ajesh Pai • Tiempo de lectura: 2 min
-
Casos de éxito
En el dinámico mundo de las redes sociales, la atención de los usuarios se gana o se pierde rápidamente. Las aplicaciones de Meta (Facebook e Instagram) son algunas de las plataformas sociales más grandes del mundo y prestan servicio a miles de millones de usuarios en todo el mundo.
Mayuri Khinvasara Khabya • Tiempo de lectura: 4 min
-
Casos de éxito
Crear una aplicación Android para un wearable significa que el trabajo de verdad empieza cuando se apaga la pantalla.
Breana Tate • Tiempo de lectura: 4 min
Mantente al día
Recibe cada semana en tu bandeja de entrada las últimas novedades sobre el desarrollo para Android.