Ранее в этом году Google представила свою продвинутую модель генерации изображений на основе текста — Imagen 3. Это последняя версия, которая обладает несколькими улучшениями в плане качества и точности создаваемых изображений. Google утверждает, что Imagen 3 способна создавать изображения с невероятным уровнем детализации, производя фотореалистичные, живые изображения с меньшим количеством отвлекающих визуальных артефактов по сравнению с предыдущей версией — Imagen 2.
Недавно Google распространила модель Imagen 3 для всех пользователей Gemini по всему миру. Теперь как обычные пользователи Gemini, так и владельцы аккаунтов Gemini Advanced могут создавать реалистичные изображения при помощи текстовых запросов. Однако создавать изображения с изображением людей могут только пользователи Gemini Advanced.

Одним из значительных достижений Imagen 3 является улучшение в рендеринге текста, что представляет собой вызов для большинства моделей генерации изображений нынешнего поколения. Это позволяет пользователям создавать персонализированные поздравительные сообщения с текстом, таблички с именами и многое другое.
Модель Imagen 3 также доступна на платформе Vertex AI для разработчиков. Разработчики могут выбрать между стандартной версией Imagen 3 и версией Imagen 3 Fast, что даёт им возможность оптимизировать качество или скорость, в зависимости от требований их приложений. Модель Imagen 3 способна создавать высококачественные изображения с естественным освещением и улучшенной фотореалистичностью, в то время как версия Imagen 3 Fast подходит для создания более ярких изображений с высоким контрастом. Google утверждает, что разработчики могут наблюдать снижение задержки до 40% при использовании Imagen 3 Fast по сравнению с версией Imagen 2. Кроме того, разработчики могут настраивать Imagen 3 для создания изображений в разных соотношениях сторон, включая 1:1, 9:16, 16:9, 3:4 и 4:3.