Modo agente

El modo Agente de Gemini en Android Studio está diseñado para manejar tareas de desarrollo complejas y de varias etapas. Puedes describir un objetivo general, y el agente crea y ejecuta un plan, invoca las herramientas necesarias, realiza cambios en varios archivos y corrige errores de forma iterativa. Este flujo de trabajo asistido por agentes te permite abordar desafíos complejos y acelerar tu proceso de desarrollo.

Comenzar

Para comenzar a usar el modo de agente en Android Studio, sigue estos pasos:

  1. Haz clic en Agent en la barra de la ventana de herramientas. Accede y completa la incorporación si es necesario.
  2. Describe la tarea que quieres que realice el agente.

    Figura 1: Modo agente de Gemini en Android Studio.
  3. Revisa y aprueba los cambios a medida que el agente trabaja para completar la tarea.

    El Modo agente espera a que aceptes o rechaces un cambio.
    Figura 2: El modo de agente espera a que aceptes o rechaces un cambio.

Casos de uso

Estos son algunos ejemplos de casos de uso en los que el agente puede ayudarte:

  • Corrige los errores de compilación. Cuando le pides al agente que corrija un error de compilación con una instrucción como "Corrige los errores de compilación en mi proyecto", este aplica una corrección recomendada, compila el proyecto para verificar la solución y realiza iteraciones hasta que se resuelve el problema.

    El agente compila tu proyecto y evalúa si hay errores.
    Figura 4: El agente compila tu proyecto y evalúa si hay errores.
  • Agrega o actualiza elementos de la IU. El agente puede agregar o actualizar elementos de la IU. Por ejemplo, pídele al agente que "establezca el tema oscuro como predeterminado en las preferencias del usuario", y buscará los archivos pertinentes y sugerirá cambios para completar la tarea. Puedes obtener una vista previa de las actualizaciones de la IU de inmediato en la ventana de herramientas Running devices.

    Figura 5: El agente actualiza los elementos de la IU.
  • Genera datos simulados. Cuando crees prototipos y pruebes tu app, puedes pedirle al agente que genere datos simulados en lugar de crearlos de forma manual. Por ejemplo, cuando se le solicita que "agregue dos sesiones más a los datos simulados", el agente encuentra el archivo pertinente y agrega dos eventos más a la lista mockSessions.

    Figura 6: El agente que genera datos simulados.
  • Prueba y verifica los cambios en un dispositivo. El agente de IA en Android Studio tiene acceso a herramientas para implementar una app en el dispositivo conectado, inspeccionar lo que se muestra en la pantalla, tomar capturas de pantalla, verificar si hay errores en Logcat y, también, interactuar con la app en ejecución a través de adb shell input. Esto permite que el agente te ayude con los cambios o las correcciones que implican volver a ejecutar la app, verificar si hay errores y comprobar que una actualización en particular se realizó correctamente (por ejemplo, tomando y revisando capturas de pantalla).

    Figura 7: El agente prueba y verifica los cambios en un dispositivo.

Otras instrucciones que puedes probar:

  • "Escribe pruebas de unidades para <clase> en <módulo>"
  • "Genera documentación para el archivo abierto".
  • "Cambia el título de la app de <nombre actual> a <nombre nuevo>".
  • "Resuelve la excepción de puntero nulo"
  • "Refactoriza mi código moviendo el elemento componible <nombre del elemento componible> a un archivo nuevo. Verifica que se hayan actualizado todas las importaciones".
  • "Agrega un botón nuevo a la pantalla principal de la app llamado "Seguir" que te lleve a una lista de temas".
  • "En el elemento <composable name> componible, reduce el padding del modificador <modifier name>".
  • "Crea un botón para compartir contenido en redes sociales".

Cómo funciona el agente

En el modo de agente, tu instrucción se envía a la API de Gemini con una lista de herramientas disponibles. Puedes pensar en las herramientas como habilidades: incluyen la capacidad de buscar archivos, leer archivos, buscar texto dentro de los archivos, usar cualquier servidor de MCP que hayas configurado y mucho más.

Cuando le asignas una tarea al agente, este crea un plan y determina qué herramientas se necesitan. Es posible que debas otorgar permiso para que el agente pueda usar algunas de estas herramientas. Una vez que otorgas el permiso, el agente usa la herramienta para realizar la acción necesaria y envía el resultado a la API de Gemini. Gemini procesa el resultado de la acción y genera otra respuesta. Este ciclo de acción y evaluación continúa hasta que se completa la tarea.