Ideogram AI – kolejny generator grafiki na bazie „Sztucznej Inteligencji”. Czym się wyróżnia?
Opisywałem już różne modele tzw. „Sztucznej Inteligencji” służące generowaniu grafik. Zaczynając od Stable Diffusion, przez checkpoint models jak DreamShaper, Juggernaut XL, aż po usługi on-line pokroju Midjourney, Adobe Firefly czy DALL-E (łącznie z implementacją Copilot). Jedne bardziej zaawansowane od innych, niektóre dostępna w postaci programu, inne on-line, wszystkie jednak analizowałem pod kątem tego, co mogą nam zaoferować za darmo. Każdy z nich miał swoje wady i zalety opisane w poprzednich artykułach.
Dziś natomiast przyjrzę się modelowi Ideogram AI, który zgodnie ze słowami jego autorów stworzony został od podstaw przez zespół składający się z ekspertów w dziedzinie AI, wcześniej pracujących przy projektach Google Brain, Uniwersytetu Kalifornijskiego w Berkeley, Uniwersytetu Carnegiego i Mellonów czy University of Toronto. Jak sami twórcy zapewniają, nie jest to kolejny model oparty o Stable Diffusion, a za jego wyborem przemawiać może m.in. możliwość generowania grafik w różnych proporcjach obrazu oraz dzienny limit 20 darmowych promptów, jakie możemy mu zadać, co przekłada się nawet na 80 obrazków dziennie, czyli 29200 obrazków rocznie. Jak więc poradzi sobie na tle konkurencji?
Generowanie grafik przy pomocy Ideogramu:
Podobnie jak Midjourney, Adobe Firefly czy DALL-E (wraz z Copilot), tak Ideogram jest aplikacją on-line dostępną za pośrednictwem strony internetowej. Analogicznie do Adobe Firefly, posiada możliwość generowania różnych rozdzielczości obrazów – są one jednak mniejsze niż w przypadku tamtego, ale przynajmniej nie posiadają znaku wodnego. Jakościowo grafiki przypominają te z Stable Diffusion lub wczesnego DALL-E. Dostrzegam jednak w nich jedną niepokojącą wadę, która zwróciła moją uwagę. Część generowanych przez Ideogram prac posiada szczątkowe lub bardziej pokaźne fragmenty podpisów autorów zdjęć, na których uczony był model. Stawia to pod znakiem zapytania, jak bardzo model „inspiruje się” pierwotnymi pracami.
Jego plus stanowi jednak ilość darmowych użyć. W przeciwieństwie do Midjourney czy Adobe Firefly, tutaj przez stronę internetową wykonać możemy nawet do 80 obrazków dziennie. Liczba ta blednie przy nieskończoności, jaką daje nam Copilot czy Stable Diffusion, nie musimy tutaj jednak uzyskiwać kompromisu między wyborem rozdzielczości, a brakiem konieczności pobierania aplikacji. Jest to produkt, który trafia w konkretną niszę odbiorców, którym takie parametry odpowiadają.
Jak z niego skorzystać?
- Zarejestruj się przy pomocy konta Google lub Apple na stronie https://ideogram.ai/.
- Zaraz po zalogowaniu, w polu „What do you want to create?” możesz wprowadzić swoje zapytanie – w języku angielskim.
- Skrypt pozwala na dobór dodatkowych parametrów, dlatego po prawej stronie paska promptu możesz wybrać m.in.: aspect ratio (proporcje obrazu) – 9:16, 10:16, 2:3, 3:4, 1:1, 4:3, 3:2, 16:10, 16:9, funkcję „magic prompt” – poprawiającą wprowadzone zapytania, celem zwiększenia różnorodności grafik oraz samą wersję modelu. Tego ostatniego nie musimy jednak wybierać, gdyż zawsze wykorzystywany jest najnowszy. Gdy skończysz parametryzację, kliknij „Generate”, a następnie poczekaj na efekty.
- Po wygenerowaniu system przedstawi cztery propozycje obrazków, które pobrać możesz klikając menu pod obrazkiem (trzy kropki), a następnie „Download” i „JPG (70% quality)”. Niestety format PNG jest wyłącznie w płatnym abonamencie. Jeżeli chcielibyśmy połączyć ze sobą zawartość kilku wygenerowanych grafik, możemy użyć opcji „Remix” (określając procentowy udział konkretnego obrazu w nowym zapytaniu).
Podobnie jak większość modeli, tak i ten miewa problemy z generowaniem dłoni, stóp, rąk, ogólnie spójności ciała oraz jego elementów. Dodatkowo tego tak jak pisałem, czasami na grafikach pojawiają się cząstkowe podpisy autorów prac, na których model się szkolił. Nie posiada on także tak szerokiej bazy danych jak Copilot, przez co, gdy pytamy o rzeczy bardziej specjalistyczne niżeli wiedza ogólna (np. o Larę Croft lub Króliczkę Lolę z Kosmicznego Meczu), to z wiadomych przyczyn, wyniki będą zupełnie nie w temacie. Model sprawdzi się jednak, jak sama nazwa wskazuje, do prostych prac koncepcyjnych. Osobiście wolę Copilot, jednak znam osoby, które z niego korzystają.
Przykładowe grafiki wygenerowane przez Ideogram:
(anime girl like a bunny angel)
(beautiful dark magician girl)
(synthwave anime robot girl with beautiful face, ultra detailed, digital art)
(anime robot girl with beautiful face, ultra detailed, digital art)
(Lola Bunny looking like a goddess, but not a Greek one)
Autor: Daniel 'zoNE’ Gabryś