В опит да изпревари Midjourney, DALL-E 3 и бързо набиращия популярност FLUX.1, Ideogram, стартъпът, основан от бивши учени на Google, пусна версия 2.0 на своя генератор на изображения с изкуствен интелект. Новият модел е достъпнен безплатно за всички потребители на платформата ideogram.ai.
Introducing Ideogram 2.0 — our most advanced text-to-image model, now available to all users for free.
— Ideogram (@ideogram_ai) August 21, 2024
Today’s milestone launch also includes the release of the Ideogram iOS app, the beta version of the Ideogram API, and Ideogram Search.
Here’s what’s new… 🧵 pic.twitter.com/nvD0ogRh2J
Компанията твърди, че Ideogram 2.0 е „последно поколение модел с водещи в индустрията възможности за генериране на реалистични изображения, графичен дизайн, типография и др.“ Според тестовете на Ideogram, които са базирани на човешки оценки, новият модел превъзхожда както DALL-E 3 на OpenAI, така и FLUX.1, който наскоро бе интегриран в чатбота Grok на Елон Мъск.
Изключително впечатляващи са подобренията в реалистичността на генерираните изображения, особено по отношение на елементи като човешки ръце, очи, кожа и коса. Освен това, моделите на Ideogram са известни със своите възможности за генериране на текст, нещо, което при Ideogram 2.0 е особено показателно.
В допълнение към подобренията в качеството, Ideogram въвежда и редица нови функции за контрол. Сред тях са „Describe“ и „Magic Prompt“, които в комбинация „позволяват безкрайни творчески итерации и преосмисляне на всяка визуална концепция“, обясняват от компанията.
Потребителите на платформата също така вече могат да генерират изображения, които се придържат към специфични цветови палитри, което е особено ценно за брандове, търсещи визуална последователност, или за творци, стремящи се към улавяне на конкретна атмосфера.
Ideogram 2.0 въвежда и различни предварително зададени стилове, включително Realistic (реалистичен), Design (дизайн), 3D и Anime (аниме). Реалистичният стил, например, може да създаде изображения, които убедително могат да минат за истински снимки. Design, от друга страна, значително повишава точността на текста в генерираните изображения. Потребителите също така вече могат да генерират изображения във всякакви съотношения на страните, включително 3:1 и 1:3.
Освен това, Ideogram пусна официално приложение за iOS, обещавайки поддръжка за Android на „по-късен етап“. Компанията също така въвежда функция за търсене, която дава възможност на потребителите да открият “над 1 милиард публично достъпни изображения“, създадени от потребителите на платформата през последната година.
И не на последно място, разработчиците могат да интегрират Ideogram в своите приложения, използвайки новото API на компанията.
Последвайте ни в социалните мрежи – Facebook, Instagram, X и LinkedIn!