Novedades de productos

El SO inteligente: Cómo hacer que los agentes de IA sean más útiles para las apps para Android

Lectura de 3 min
Matthew McCullough
Vicepresidente de Administración de Productos, Desarrollador de Android

Las expectativas de los usuarios sobre la IA en sus dispositivos están cambiando fundamentalmente la forma en que interactúan con sus apps. En lugar de abrir apps para realizar tareas paso a paso, le piden a la IA que haga el trabajo pesado por ellos. En este nuevo modelo de interacción, el éxito pasa de lograr que los usuarios abran tu app a completar sus tareas con éxito y ayudarlos a hacer más cosas más rápido. 

Para ayudarte a desarrollar tus apps para este futuro de agentes, presentamos capacidades para desarrolladores en etapa inicial que cierran la brecha entre tus apps y las apps de agentes y los asistentes personalizados, como Google Gemini. Si bien estamos en las primeras etapas beta de este recorrido, diseñamos estas funciones con la privacidad y la seguridad como pilares fundamentales como nuestro primer paso para explorar este cambio de paradigma como un ecosistema de apps.

Potencia las apps con AppFunctions

AppFunctions de Android permite que las apps expongan datos y funcionalidades directamente a los agentes y asistentes de IA. Con la biblioteca de Jetpack de AppFunctions y las APIs de la plataforma, los desarrolladores pueden crear funciones autodescriptivas que las apps de agentes pueden descubrir y ejecutar a través del lenguaje natural. Al igual que la forma en que se declaran las capacidades de backend a través de los servidores en la nube de MCP, AppFunctions proporciona una solución en el dispositivo para las apps para Android. Al igual que WebMCP, ejecuta estas funciones de forma local en el dispositivo en lugar de en un servidor.

La integración de la Galería de Samsung con Gemini en la serie Galaxy S26 muestra AppFunctions en acción. En lugar de desplazarte manualmente por los álbumes de fotos, ahora puedes pedirle a Gemini que te muestre fotos de tu gato de la Galería de Samsung. Gemini toma la consulta del usuario, identifica y activa de forma inteligente la función correcta, y presenta las fotos que se muestran de la Galería de Samsung directamente en la app de Gemini, por lo que los usuarios nunca necesitan salir. Esta experiencia es multimodal y se puede realizar a través de la voz o el texto. Los usuarios pueden incluso usar las fotos que se muestran en conversaciones de seguimiento, como enviarlas a amigos en un mensaje de texto.

photos.gif

Actualmente, esta integración está disponible en la serie Galaxy S26 y pronto se expandirá a los dispositivos Samsung que ejecutan OneUI 8.5 y versiones posteriores. A través de AppFunctions, Gemini ya puede automatizar tareas en categorías de apps como Calendario, Notas y Tareas en dispositivos de varios fabricantes. Ya sea que se trate de coordinar eventos del calendario, organizar notas o configurar recordatorios de tareas pendientes, los usuarios pueden optimizar las actividades diarias en un solo lugar.

Habilita apps de agentes con automatización inteligente de la IU

Si bien AppFunctions proporciona un framework estructurado y más control para que las apps se comuniquen con los agentes y asistentes de IA, sabemos que aún no todas las interacciones tienen una integración dedicada. También estamos desarrollando un framework de automatización de la IU para que los agentes y asistentes de IA ejecuten de forma inteligente tareas genéricas en las apps instaladas de los usuarios, con transparencia y control del usuario integrados. Esta es la plataforma que hace el trabajo pesado, por lo que los desarrolladores pueden obtener alcance de agentes sin código. Es una forma de bajo esfuerzo para extender su alcance sin una gran mejora de ingeniería en este momento. 
 

Para obtener comentarios a medida que refinamos este framework, comenzaremos con una versión preliminar en la serie Galaxy S26 y en dispositivos Pixel 10 seleccionados, en los que los usuarios podrán delegar tareas de varios pasos a Gemini con solo presionar el botón de encendido. Se lanzará como una función beta en la app de Gemini y admitirá una selección seleccionada de apps en las categorías de entrega de comida, supermercado y viajes compartidos en EE.UU. y Corea para comenzar. Ya sea que los usuarios necesiten hacer un pedido complejo de pizza para los miembros de su familia con gustos particulares, coordinar un viaje compartido con varias paradas con compañeros de trabajo o volver a pedir su última compra de supermercado, Gemini puede ayudar a completar tareas con el contexto ya disponible en tus apps, sin necesidad de que el desarrollador trabaje.

photos2.gif

Los usuarios tienen el control mientras se realiza una tarea en segundo plano a través de la automatización de la IU. Para cualquier acción de automatización, los usuarios tienen la opción de supervisar el progreso de una tarea a través de notificaciones o "vista en vivo" y pueden cambiar al control manual en cualquier momento para tomar el control de la experiencia. Gemini también está diseñado para alertar a los usuarios antes de completar tareas sensibles, como realizar una compra. 

Con la mirada puesta en el futuro

En Android 17, buscamos ampliar estas capacidades para llegar a aún más usuarios, desarrolladores y fabricantes de dispositivos.

Actualmente, estamos creando experiencias con un pequeño conjunto de desarrolladores de apps, enfocándonos en experiencias del usuario de alta calidad a medida que evoluciona el ecosistema. Planeamos compartir más detalles este año sobre cómo puedes usar AppFunctions y la automatización de la IU para habilitar integraciones de agentes para tu app. Mantente atento a las actualizaciones.

Escrito por:

Seguir leyendo