Novità sul prodotto
Aumentare il coinvolgimento degli utenti con la generazione di immagini AI
Lettura di 5 minuti
L'aggiunta di immagini personalizzate alla tua app può migliorare e personalizzare in modo significativo l'esperienza utente e aumentare il coinvolgimento degli utenti. Questo post esplora due nuove funzionalità per la generazione di immagini con Firebase AI Logic: le funzionalità di editing specializzate di Imagen, attualmente in anteprima, e la disponibilità generale di Gemini 2.5 Flash Image (noto anche come "Nano Banana"), progettato per la generazione di immagini contestuali o conversazionali.
Aumentare il coinvolgimento degli utenti con le immagini generate tramite Firebase AI Logic
I modelli di generazione di immagini possono essere utilizzati per creare avatar personalizzati per i profili utente o per integrare asset visivi personalizzati direttamente nei flussi di schermata chiave.
Ad esempio, Imagen offre nuove funzionalità di modifica (in anteprima per gli sviluppatori). Ora puoi disegnare una maschera e utilizzare la pittura inpainting per generare pixel all'interno dell'area mascherata. Inoltre, è disponibile l'outpainting per generare pixel al di fuori della maschera.
Imagen supporta l'inpainting, che consente di generare solo una parte di un'immagine.
In alternativa, Gemini 2.5 Flash Image (noto anche come Nano Banana) può utilizzare una conoscenza del mondo più ampia e le capacità di ragionamento dei modelli Gemini per generare immagini contestualmente pertinenti, il che è ideale per creare illustrazioni dinamiche in linea con l'esperienza in-app corrente di un utente.
Utilizza Gemini 2.5 Flash Image per creare illustrazioni dinamiche pertinenti al contesto della tua app.
Infine, la possibilità di modificare le immagini in modo conversazionale e iterativo consente agli utenti di modificare una foto utilizzando il linguaggio naturale.
Utilizza Gemini 2.5 Flash Image per modificare un'immagine utilizzando il linguaggio naturale.
Quando inizi a integrare l'AI nella tua applicazione, è importante conoscere la sicurezza dell'AI. È particolarmente importante valutare i rischi per la sicurezza della tua applicazione, prendere in considerazione modifiche per mitigare i rischi per la sicurezza, eseguire test di sicurezza appropriati al tuo caso d'uso, richiedere feedback agli utenti e monitorare i contenuti.
Imagen o Gemini: la scelta è tua
La differenza tra Gemini 2.5 Flash Image ("Nano Banana") e Imagen risiede nel loro obiettivo principale e nelle funzionalità avanzate. Gemini 2.5 Flash Image, in quanto modello di immagini all'interno della famiglia Gemini, eccelle nella modifica conversazionale delle immagini, mantenendo la coerenza del contesto e del soggetto in più iterazioni e sfruttando la "conoscenza e il ragionamento del mondo" per creare immagini pertinenti al contesto o incorporare immagini accurate in sequenze di testo lunghe.
Imagen è il modello di Google specializzato nella generazione di immagini, progettato per un maggiore controllo creativo, specializzato in output fotorealistici, dettagli artistici, stili specifici e che fornisce controlli espliciti per specificare le proporzioni o il formato dell'immagine generata.
| Gemini 2.5 Flash Images (Nano Banana 🍌) | Imagen |
🌎 Conoscenza del mondo e ragionamento per immagini più pertinenti al contesto 💬 Modifica le immagini in modo conversazionale mantenendo il contesto 📖 Incorporare immagini accurate all'interno di sequenze di testo lunghe | 📐 specifica le proporzioni o il formato delle immagini generate
🖌️ Supporto della modifica basata su maschera per l'inpainting e l'outpainting.
🎚️ Maggiore controllo sui dettagli dell'immagine generata (qualità, dettagli artistici e stili specifici) |
Vediamo come utilizzarli nella tua app.
Inpainting con Imagen
Alcuni mesi fa abbiamo rilasciato nuove funzionalità di modifica per Imagen. Sebbene Imagen sia ora pronto per la produzione per la generazione di immagini, le funzionalità di modifica sono ancora in Anteprima per gli sviluppatori.
Le funzionalità di editing di Imagen includono inpainting e outpainting, funzionalità di editing delle immagini basate su maschere. Questa nuova funzionalità consente agli utenti di modificare aree specifiche di un'immagine senza rigenerare l'intera immagine. Ciò significa che puoi conservare le parti migliori dell'immagine e modificare solo ciò che vuoi cambiare.
Utilizzare le funzionalità di modifica di Imagen per apportare modifiche mirate precise a un'immagine, garantendo l'integrità del resto dell'immagine
Queste modifiche vengono apportate mantenendo gli elementi principali e l'integrità complessiva dell'immagine originale e modificando solo l'area nella maschera.
Per implementare l'inpainting con Imagen, inizializza prima imagen-3.0-capability-001 un modello Imagen specifico che supporti le funzionalità di modifica:
// Copyright 2025 Google LLC.
// SPDX-License-Identifier: Apache-2.0
val editingModel =
Firebase.ai(backend = GenerativeBackend.vertexAI()).imagenModel(
"imagen-3.0-capability-001",
generationConfig = ImagenGenerationConfig(
numberOfImages = 1,
aspectRatio = ImagenAspectRatio.SQUARE_1x1,
imageFormat = ImagenImageFormat.jpeg(compressionQuality = 75),
),
)
Da qui, definisci la funzione di inpainting:
// Copyright 2025 Google LLC.
// SPDX-License-Identifier: Apache-2.0
val prompt = "remove the pancakes and make it an omelet instead"
suspend fun inpaintImageWithMask(sourceImage: Bitmap, maskImage: Bitmap, prompt: String, editSteps: Int = 50): Bitmap {
val imageResponse = editingModel.editImage(
referenceImages = listOf(
ImagenRawImage(sourceImage.toImagenInlineImage()),
ImagenRawMask(maskImage.toImagenInlineImage()),
),
prompt = prompt,
config = ImagenEditingConfig(
editMode = ImagenEditMode.INPAINT_INSERTION,
editSteps = editSteps,
),
)
return imageResponse.images.first().asBitmap()
}
Fornisci sia un'immagine di origine, un'immagine maschera e un prompt per la modifica, sia il numero di passaggi di modifica da eseguire.
Puoi vederlo in azione nell'esempio di modifica di Imagen nel catalogo di esempi di AI per Android.
Inoltre, Imagen supporta l'outpainting, che consente al modello di generare i pixel al di fuori di una maschera. Puoi anche utilizzare le funzionalità di personalizzazione delle immagini di Imagen per modificare lo stile di un'immagine o aggiornare un soggetto in un'immagine. Scopri di più nella documentazione per gli sviluppatori Android.
Generazione di immagini conversazionale con Gemini 2.5 Flash Image
Un modo per modificare le immagini con Gemini 2.5 Flash Image è utilizzare le funzionalità di chat a più turni del modello.
Innanzitutto, inizializza il modello:
// Copyright 2025 Google LLC.
// SPDX-License-Identifier: Apache-2.0
val model = Firebase.ai(backend = GenerativeBackend.googleAI()).generativeModel(
modelName = "gemini-2.5-flash-image",
// Configure the model to respond with text and images (required)
generationConfig = generationConfig {
responseModalities = listOf(ResponseModality.TEXT,
ResponseModality.IMAGE)
}
)
Per ottenere un risultato simile al metodo Imagen basato sulla maschera descritto sopra, possiamo utilizzare l'API chat per avviare una conversazione con Gemini 2.5 Flash Image.
// Copyright 2025 Google LLC.
// SPDX-License-Identifier: Apache-2.0
// Initialize the chat
val chat = model.startChat()
// Load a bitmap
val source = ImageDecoder.createSource(context.contentResolver, uri)
val bitmap = ImageDecoder.decodeBitmap(source)
// Create the initial prompt instructing the model to edit the image
val prompt = content {
image(bitmap)
text("remove the pancakes and add an omelet")
}
// To generate an initial response, send a user message with the image and text prompt
var response = chat.sendMessage(prompt)
// Inspect the returned image
var generatedImageAsBitmap = response
.candidates.first().content.parts.filterIsInstance<ImagePart>().firstOrNull()?.image
// Follow up requests do not need to specify the image again
response = chat.sendMessage("Now, center the omelet in the pan")
generatedImageAsBitmap = response
.candidates.first().content.parts.filterIsInstance<ImagePart>().firstOrNull()?.image
Puoi vederlo in azione nell'esempio di chat con immagini di Gemini nel catalogo di esempi di AI per Android e scoprire di più nella documentazione di Android.
Conclusione
Sia Imagen che Gemini 2.5 Flash Image offrono funzionalità potenti, che ti consentono di selezionare il modello di generazione di immagini ideale per personalizzare la tua app e aumentare il coinvolgimento degli utenti, a seconda del tuo caso d'uso specifico.
Continua a leggere
-
Novità sul prodotto
Se sei uno sviluppatore Android che vuole implementare funzionalità di AI innovative nella tua app, di recente abbiamo lanciato nuovi potenti aggiornamenti.
Thomas Ezan • Lettura di 3 minuti
-
Novità sul prodotto
Oggi ampliamo la famiglia di modelli Gemini 3 con il lancio di Gemini 3 Flash, un'intelligenza all'avanguardia creata per la velocità a una frazione del costo.
Thomas Ezan • Lettura di 2 minuti
-
Novità sul prodotto
L'ecosistema mobile è in continua evoluzione, il che comporta nuove opportunità e nuove minacce. Con queste modifiche, Android e Google Play continuano a impegnarsi per garantire che miliardi di utenti possano continuare a utilizzare le proprie app in tutta sicurezza e che l'innovazione degli sviluppatori possa prosperare.
Vijaya Kaza • Lettura di 3 minuti
Resta al passo con le novità
Ricevi ogni settimana gli ultimi approfondimenti sullo sviluppo per Android direttamente nella tua casella di posta.