Novedades de productos

API Prompt de ML Kit: descubre experiencias personalizadas de Gemini Nano en el dispositivo

Lectura de 2 minutos

La IA facilita la creación de experiencias de aplicación personalizadas que transforman el contenido al formato adecuado para los usuarios. Anteriormente, permitimos que los desarrolladores se integraran con Gemini Nano a través de las APIs GenAI de ML Kit, diseñadas para casos prácticos específicos, como la creación de resúmenes y la descripción de imágenes.

Hoy celebramos un hito importante para la IA generativa en el dispositivo de Android. Anunciamos el lanzamiento de la versión alfa de la API GenAI Prompt de ML Kit. Esta API te permite enviar solicitudes en lenguaje natural y multimodales a Gemini Nano, lo que responde a la demanda de más control y flexibilidad a la hora de crear con modelos generativos.

Partners como Kakao ya están desarrollando soluciones con la API Prompt, creando experiencias únicas con un impacto real. Puedes probar las potentes funciones de la API Prompt hoy mismo con un mínimo de código.

 

 

Pasar de la IA generativa en el dispositivo prediseñada a la personalizada

La API Prompt va más allá de las funciones predefinidas para admitir casos prácticos de GenAI personalizados y específicos de aplicaciones, lo que te permite crear funciones únicas con transformaciones de datos complejas. La API de peticiones usa Gemini Nano en el dispositivo para tratar los datos de forma local, lo que permite usarla sin conexión y mejora la privacidad de los usuarios.

Casos prácticos principales de la API Prompt:

La API de peticiones permite crear casos prácticos de IA generativa muy personalizados. Aquí tienes algunos ejemplos recomendados: 

  • Comprensión de imágenes: analiza fotos para clasificarlas (por ejemplo, crea un borrador de publicación en redes sociales o identifica etiquetas como "mascotas", "comida" o "viajes").
  • Escaneo inteligente de documentos: se usa un modelo de aprendizaje automático tradicional para extraer texto de un recibo y, a continuación, se clasifica cada artículo con la API Prompt.
  • Transformación de datos para la interfaz de usuario: análisis de contenido extenso para crear un título de notificación breve y atractivo.
  • Sugerencias de contenido: se sugieren temas para nuevas entradas del diario en función de las preferencias del usuario.
  • Análisis de contenido: clasificar las reseñas de los clientes en categorías positivas, neutras o negativas.
  • Extracción de información: extraer detalles importantes sobre un evento próximo de una conversación de correo.

Implementación:
la API Prompt te permite crear peticiones personalizadas y definir parámetros de generación opcionales con solo unas líneas de código:

  Generation.getClient().generateContent(
   generateContentRequest(
       ImagePart(bitmapImage),
       TextPart("Categorize this image as one of the following: car, motorcycle, bike, scooter, other. Return only the category as the response."),
   ) {
       // Optional parameters
       temperature = 0.2f
       topK = 10
       candidateCount = 1
       maxOutputTokens = 10
   },
)

Para ver ejemplos más detallados de cómo implementar la API Prompt, consulta la documentación oficial y el ejemplo en GitHub.

Gemini Nano, rendimiento y creación de prototipos

Actualmente, la API Prompt funciona mejor en la serie de dispositivos Pixel 10, que ejecuta la versión más reciente de Gemini Nano (nano-v3). Esta versión de Gemini Nano se basa en la misma arquitectura que Gemma 3n, el modelo que compartimos por primera vez con la comunidad de modelos abiertos en I/O.

La base compartida entre Gemma 3n y nano-v3 permite a los desarrolladores crear prototipos de funciones más fácilmente. Si no tienes un dispositivo Pixel 10, puedes empezar a experimentar con las peticiones hoy mismo creando prototipos con Gemma 3n de forma local.

Para ver la lista completa de dispositivos compatibles con las APIs de GenAI, consulta nuestra documentación sobre dispositivos compatibles.

Más información

Empieza a implementar la API Prompt en tus aplicaciones Android hoy mismo con la ayuda de nuestra documentación oficial y el ejemplo de GitHub.

Escrito por:

Seguir leyendo