Повысьте вовлеченность пользователей с помощью генерации изображений с помощью ИИ.

Добавление пользовательских изображений в ваше приложение может значительно улучшить и персонализировать пользовательский опыт и повысить вовлеченность пользователей. В этой статье рассматриваются две новые возможности генерации изображений с помощью Firebase AI Logic: специализированные функции редактирования изображений Imagen, которые в настоящее время находятся в режиме предварительного просмотра, и общедоступная версия Gemini 2.5 Flash Image (также известная как "Nano Banana"), разработанная для контекстной или диалоговой генерации изображений.

Повысьте вовлеченность пользователей с помощью изображений, сгенерированных с помощью Firebase AI Logic.

Модели генерации изображений могут использоваться для создания пользовательских аватаров или для интеграции персонализированных визуальных элементов непосредственно в ключевые сценарии взаимодействия на экране.

Например, Imagen предлагает новые функции редактирования (в предварительной версии для разработчиков). Теперь вы можете нарисовать маску и использовать заполнение пропущенных пикселей для создания пикселей внутри замаскированной области. Кроме того, доступно заполнение пропущенных пикселей для создания пикселей за пределами маски.

Imagen поддерживает заполнение пропущенных областей изображения, позволяя создавать только часть изображения.

В качестве альтернативы, Gemini 2.5 Flash Image (также известный как Nano Banana) может использовать расширенные знания об окружающем мире и возможности анализа моделей Gemini для генерации контекстно релевантных изображений, что идеально подходит для создания динамических иллюстраций, соответствующих текущему опыту пользователя в приложении.

Используйте Gemini 2.5 Flash Image для создания динамических иллюстраций, контекстуально соответствующих вашему приложению.

Наконец, возможность редактирования изображений в диалоговом и итеративном режиме позволяет пользователям редактировать фотографии, используя естественный язык.

фоторедактирование естественного языка.png

Используйте Gemini 2.5 Flash Image для редактирования изображений с помощью естественного языка.

При внедрении ИИ в ваше приложение важно изучить вопросы безопасности ИИ . Особенно важно оценить риски безопасности вашего приложения, рассмотреть корректировки для снижения этих рисков, провести тестирование безопасности, соответствующее вашему сценарию использования, а также собирать отзывы пользователей и отслеживать контент.

Игейн или Близнецы: выбор за вами.

Разница между Gemini 2.5 Flash Image («Nano Banana») и Imagen заключается в их основной направленности и расширенных возможностях. Gemini 2.5 Flash Image, как модель обработки изображений в рамках более широкого семейства Gemini, превосходно подходит для редактирования изображений в диалоговом режиме, сохраняя контекст и согласованность темы на протяжении нескольких итераций, а также используя «знание окружающего мира и логическое мышление» для создания контекстно релевантных визуальных элементов или встраивания точных визуальных элементов в длинные текстовые последовательности.

Imagen — это специализированная модель генерации изображений от Google, разработанная для обеспечения большего контроля над творческим процессом, специализирующаяся на создании высокофотореалистичных изображений с художественной детализацией, определенными стилями и предоставляющая явные возможности управления для указания соотношения сторон или формата создаваемого изображения.

Изображения со вспышкой Gemini 2.5
(Нано-банан 🍌)

Изображение

🌎 Знания о мире и рассуждения для создания более контекстно релевантных изображений

💬 Редактируйте изображения в разговорном стиле, сохраняя при этом контекст.

📖 Встраивание точных визуальных элементов в длинные текстовые последовательности

📐 Укажите соотношение сторон или формат создаваемых изображений

🖌️Поддержка редактирования на основе масок для закрашивания и закрашивания.

🎚️ Более полный контроль над деталями создаваемого изображения (качество, художественная детализация и специфические стили)

Давайте посмотрим, как их использовать в вашем приложении.

Заполнение проймы с помощью Imagen

Несколько месяцев назад мы выпустили новые функции редактирования для Imagen. Хотя Imagen теперь готов к использованию в производстве для генерации изображений, функции редактирования по-прежнему находятся в режиме предварительного просмотра для разработчиков .

Функции редактирования изображений включают в себя заполнение и удаление фрагментов , а также редактирование изображений на основе масок. Эта новая возможность позволяет пользователям изменять определенные области изображения без перерисовки всего изображения. Это означает, что вы можете сохранить лучшие части изображения и изменить только то, что хотите изменить.

Используйте функции редактирования изображений, чтобы вносить точные целенаправленные изменения в изображение, гарантируя при этом целостность остальной части изображения.

Эти изменения вносятся с сохранением основных элементов и общей целостности исходного изображения, модифицируя только область в маске.

Для реализации восстановления изображений с помощью Imagen сначала инициализируйте imagen-3.0-capability-001 специальную модель Imagen, поддерживающую функции редактирования:

// Copyright 2025 Google LLC.
// SPDX-License-Identifier: Apache-2.0
val editingModel =
        Firebase.ai(backend = GenerativeBackend.vertexAI()).imagenModel(
            "imagen-3.0-capability-001",
            generationConfig = ImagenGenerationConfig(
                numberOfImages = 1,
                aspectRatio = ImagenAspectRatio.SQUARE_1x1,
                imageFormat = ImagenImageFormat.jpeg(compressionQuality = 75),
            ),
        )

Далее определите функцию заполнения пропущенных областей:

// Copyright 2025 Google LLC.
// SPDX-License-Identifier: Apache-2.0

val prompt = "remove the pancakes and make it an omelet instead"

suspend fun inpaintImageWithMask(sourceImage: Bitmap, maskImage: Bitmap, prompt: String, editSteps: Int = 50): Bitmap {
        val imageResponse = editingModel.editImage(
            referenceImages = listOf(
                ImagenRawImage(sourceImage.toImagenInlineImage()),
                ImagenRawMask(maskImage.toImagenInlineImage()),
            ),
            prompt = prompt,
            config = ImagenEditingConfig(
                editMode = ImagenEditMode.INPAINT_INSERTION,
                editSteps = editSteps,
            ),
        )
        return imageResponse.images.first().asBitmap()
    }

Вы указываете sourceImage, maskImage, а также подсказку для редактирования и количество шагов редактирования, которые необходимо выполнить.

Вы можете увидеть это в действии в примере редактирования изображений в каталоге примеров Android AI!

Imagen также поддерживает функцию Outpainting , которая позволяет модели генерировать пиксели за пределами маски. Кроме того, вы можете использовать возможности настройки изображений Imagen для изменения стиля изображения или обновления объекта на изображении. Подробнее об этом можно прочитать в документации для разработчиков Android .

Создание изображений для диалогов с помощью Gemini 2.5 Flash Image

Один из способов редактирования изображений в Gemini 2.5 Flash Image — использование многоходовых функций чата, предусмотренных программой.

Сначала инициализируйте модель:

// Copyright 2025 Google LLC.
// SPDX-License-Identifier: Apache-2.0

val model = Firebase.ai(backend = GenerativeBackend.googleAI()).generativeModel(
    modelName = "gemini-2.5-flash-image",
    // Configure the model to respond with text and images (required)
    generationConfig = generationConfig {
        responseModalities = listOf(ResponseModality.TEXT,
        ResponseModality.IMAGE)
    }
)

Для достижения результата, аналогичного описанному выше методу Imagen на основе маски, мы можем использовать API chat для начала диалога с Gemini 2.5 Flash Image.

// Copyright 2025 Google LLC.
// SPDX-License-Identifier: Apache-2.0

// Initialize the chat
val chat = model.startChat()


// Load a bitmap
val source = ImageDecoder.createSource(context.contentResolver, uri)
val bitmap = ImageDecoder.decodeBitmap(source)


// Create the initial prompt instructing the model to edit the image
val prompt = content {
    image(bitmap)
    text("remove the pancakes and add an omelet")
}

// To generate an initial response, send a user message with the image and text prompt
var response = chat.sendMessage(prompt)

// Inspect the returned image
var generatedImageAsBitmap = response
    .candidates.first().content.parts.filterIsInstance<ImagePart>().firstOrNull()?.image

// Follow up requests do not need to specify the image again
response = chat.sendMessage("Now, center the omelet in the pan")
generatedImageAsBitmap = response
    .candidates.first().content.parts.filterIsInstance<ImagePart>().firstOrNull()?.image

Вы можете увидеть это в действии в примере Gemini Image Chat в каталоге примеров Android AI Sample и узнать больше об этом в документации Android .

Заключение

И Imagen, и Gemini 2.5 Flash Image обладают мощными возможностями, позволяющими выбрать идеальную модель генерации изображений для персонализации вашего приложения и повышения вовлеченности пользователей в зависимости от конкретных задач.

Автор:

Thomas Ezan
Старший инженер по связям с разработчиками
read_more Просмотреть профиль
Mozart Louis
Инженер по связям с разработчиками
read_more Просмотреть профиль

Продолжить чтение

17 апреля 2026 г.
17 апреля 2026 г.
Новости о продуктах
Экспериментальный гибридный вывод и новые модели Gemini для Android
arrow_forward
Если вы — разработчик Android-приложений, стремящийся внедрить в них инновационные функции искусственного интеллекта, то недавно мы выпустили новые мощные обновления.
Thomas Ezan • 3 мин чтения
17 декабря 2025 г.
17 декабря 2025 г.
Новости о продуктах
Создавайте более интеллектуальные приложения с помощью Gemini 3 Flash.
arrow_forward
Сегодня мы расширяем семейство моделей Gemini 3, выпуская Gemini 3 Flash — передовую интеллектуальную систему, созданную для высокой скорости по минимальной цене.
Thomas Ezan • 2 мин чтения
18 июня 2026 г.
18 июня 2026 г.
Новости о продуктах
Проверка разработчиков Android: Совместное создание более безопасной экосистемы
arrow_forward
В прошлом году мы ввели проверку разработчиков Android, чтобы усилить безопасность экосистемы и предотвратить распространение вредоносных приложений злоумышленниками, которые, скрываясь за анонимностью, выпускают опасные приложения.
Matthew Forsythe • 2 мин чтения

Новости о продуктах

Повысьте вовлеченность пользователей с помощью генерации изображений с помощью ИИ.

5 минут чтения

Thomas Ezan и Mozart Louis

Автор:

Thomas Ezan

Старший инженер по связям с разработчиками

Mozart Louis

Инженер по связям с разработчиками

Продолжить чтение

Новости о продуктах

Экспериментальный гибридный вывод и новые модели Gemini для Android

Thomas Ezan • 3 мин чтения

Новости о продуктах

Создавайте более интеллектуальные приложения с помощью Gemini 3 Flash.

Thomas Ezan • 2 мин чтения

Новости о продуктах

Проверка разработчиков Android: Совместное создание более безопасной экосистемы

Matthew Forsythe • 2 мин чтения

Автор:

Старший инженер по связям с разработчиками

Инженер по связям с разработчиками

Продолжить чтение

Thomas Ezan • 3 мин чтения

Thomas Ezan • 2 мин чтения

Matthew Forsythe • 2 мин чтения

Будьте в курсе событий