Jak „Sztuczna Inteligencja” tworzy nieistniejących influencerów oraz zdjęcia i filmy na ich profile?
Przeglądając media społecznościowe trudno nie pomyśleć, iż większość promowanych obecnie profili jest sterowana przez boty. Zdjęcia z wygładzoną skórą niczym ze „sztucznej inteligencji”, generatywne bezosobowe teksty, spora powtarzalność, a co najważniejsze, z tyłu głowy czujesz, że coś „jest nie tak”. Dziś przedstawię kilka narzędzi, które mogą być wykorzystywane przy tworzenia contentu na sztucznych profilach. Pokażę, jak wykreować swoją pierwszą wirtualną influencerkę, stworzyć jej historię z bogatą galerią zdjęć i materiałów wideo, a co istotne, jak zautomatyzować jej proces publikacji.
Głównymi narzędziami, jakie wykorzystamy będą: aplikacja Stability Matrix – wykorzystująca interfejs Fooocus i model Juggernaut XL, która wygeneruje całą galerię zdjęć wirtualnej influencerki oraz HeyGen – który stworzy dla nas realistyczne nagrania, w których nasz influencer przemawia. Przekonacie się jak w prosty i darmowy sposób ludzie prowadzą swoje profile nie pokazując nawet twarzy! Na koniec dodam kilka przydatnych narzędzi do automatyzacji procesów publikacji postów. Zapraszam do lektury.
Fooocus i Juggernaut XL przy tworzeniu galerii wirtualnych influencerów:
Stability Matrix od LycosAI, to multiplatformowy manager paczek i interfejsów dla modeli Stable Diffusion. Dzięki niemu w prosty sposób, bez konieczności znajomości Pythona i instalacji całego środowiska, możemy zacząć tworzyć zdjęcia przy wykorzystaniu interfejsu Fooocus oraz modelu Juggernaut XL, dzięki któremu będziemy mogli wygenerować bardzo realistyczne zdjęcia. Dzięki niemu nie tylko stworzymy fotografie opisanej przez nas osoby, ale także będziemy na ich podstawie mogli generować kolejne, które możemy wykorzystywać do publikacji na kolejne dni w mediach społecznościowych. Dodatkowo skrypt ma możliwość poprawiania generowanych przez siebie obrazów, dlatego nic straconego, jeżeli nie pasuje nam jakiś element zdjęcia – możemy go poprawić. Co najważniejsze jest on dostępny za darmo. Dlatego dla profili opartych na zdjęciach, będzie on bardzo dobrym rozwiązaniem na start.
Instalacja i konfiguracja:
Zanim zaczniemy pracę nad tworzeniem profili, najpierw musimy zainstalować narzędzia:
- Wejdź na stronę https://github.com/LykosAI/StabilityMatrix, a następnie w dziale „Releases” znajdź najnowszą wersję, pobierając ją.
- Rozpakuj paczkę po pobraniu, po czym uruchom plik StabilityMatrix.exe.
- Przy pierwszym uruchomieniu program poprosi o akceptację regulaminu, a następnie o wybranie ścieżki na dysku, w której mają być gromadzone pliki powstałe w procesie generowania grafik. Możemy wybrać opcję „Portable Mode”, dzięki czemu pliki będą gromadzone w tym samym folderze co program.
- Gdy już go uruchomimy, poprosi nas o wybranie interfejsu, z którym chcemy pracować. Wybierz „Fooocus” (z grafiką elfa).
- W następnym kroku pobierz model do generowania grafik z repozytorium CivitAI lub Hugging Face – zaznacz te, które przedstawiają realne zdjęcia, mają największą liczbę pobrań i najwyższe oceny. Postęp pobierania możemy zobaczyć w zakładce „Downloads”. Polecany model to „Juggernaut XL”. Może on jednak wymagać logowanie/podanie klucza przed pobraniem, wtedy model w formacie *.safetensors pobrać można ze strony https://huggingface.co/RunDiffusion/Juggernaut-XL-v9/tree/main oraz wrzucić go do katalogu: „\Data\Models\StableDiffusion” w folderze aplikacji.
- W ostatnim kroku Stability Matrix zainstaluje wybrany interfejs oraz pobierze modele, informując Cię o postępach.
- Kiedy wszystko jest zainstalowane, w zakładce Packages kliknij „Launch” przy wybranym interfejsie. Podczas pierwszego uruchomienia pobrana zostanie starsza wersja modelu Juggernaut XL, jednak my skorzystamy z nowszej, którą ściągnęliśmy.
- Gdy zakończy się proces pobierania, powinna uruchomić się przeglądarka ze stroną generatora grafik. Teraz możemy już tworzyć nasze zdjęcia.
Generowanie pierwszego zdjęcia naszej influencerki:
Początkowym krokiem w prowadzeniu profilu wirtualnej influencerki jest stworzenie jej wizerunku:
- Uruchom plik StabilityMatrix.exe.
- Wejdź w menu, w zakładkę „Packages” i przy interfejsie „Fooocus” kliknij „Launch”.
- Uruchomi się przeglądarka ze stroną generatora. Na jej dole zaznacz pole „Advanced”, a następnie w zakładce „Model” wybierz model „Juggernaut XL” w najnowszej posiadanej wersji. W zakładce „Setting” zaznacz preferencję jakości jako „Speed” lub „Quality” jeżeli Twój komputer jest wystarczająco mocny. Ta sama zakładka pozwala wybrać także proporcje generowanej grafiki, czyli „Aspect Ratios” lub ilość generowanych zdjęć. Na koniec w zakładce „Style” zaznacz funkcję „Fooocus Photograph”, mając jednocześnie zaznaczone „Fooocus V2”, „Fooocus Enhance” i „Fooocus Sharp”.
- Po ustaleniu parametrów, w polu „Type prompt here or paste parameters.” wprowadź swoje zapytanie opisujące szczegółowo osobę, którą chcesz wygenerować. Prompty piszemy w języku angielskim, np. „A stunning, smilling Asian influencer with long pink hair and green eyes. She is dressed in a stylish summer shirt.”. Potwierdzamy przyciskiem „Generate”. Generowanie może zająć kilka, do kilkudziesięciu minut. Jeżeli nie mamy własnego pomysłu, możemy posłużyć się czatami typu ChatGPT, Copilot czy Bard, w celu wymyślenia dla jej skróconego opisu.
- Gotowe zdjęcie pobierz klikając je, a następnie przy pomocy przycisku ze strzałką (download), znajdującego się na górnej części fotografii.
Generowanie kolejnych zdjęć naszej influencerki:
Gdy posiadamy już stworzony wizerunek influencerki, musimy wygenerować jej bogatą historię w postaci zdjęć, które będziemy mogli publikować:
- Uruchom plik StabilityMatrix.exe.
- Wejdź w menu, w zakładkę „Packages” i przy interfejsie „Fooocus” kliknij „Launch”.
- Podobnie jak poprzednio, uruchomi się przeglądarka ze stroną generatora. Na jej dole zaznacz pole „Advanced”, a następnie w zakładce „Model” wybierz model „Juggernaut XL” w najnowszej posiadanej wersji. W zakładce „Setting” zaznacz preferencję jakości jako „Speed” lub „Quality” jeżeli Twój komputer jest wystarczająco mocny. Ta sama zakładka pozwala wybrać także proporcje generowanej grafiki, czyli „Aspect Ratios” lub ilość generowanych zdjęć. Na koniec w zakładce „Style” zaznacz funkcję „Fooocus Photograph”, mając jednocześnie zaznaczone „Fooocus V2”, „Fooocus Enhance” i „Fooocus Sharp”.
- Odmiennie jednak niż wcześniej, na dole strony zaznacz także pole „Input Image”.
- W nowych zakładkach na dole strony wybierz „Image Prompt”, po czym przeciągnij posiadane już zdęcie naszej wirtualnej influencerki na puste pole poniżej i na samym dole zaznacz opcję „Advanced”, a następnie „FaceSwap”, by pobrać od niej twarz.
- Po ustaleniu parametrów, w polu „Type prompt here or paste parameters.” wprowadź swoje zapytanie opisujące po angielsku pozę i akcję w jakiej ma się znajdować modelka, np. „doing exercises at home”. Potwierdzamy przyciskiem „Generate”. Generowanie może zająć kilka, do kilkudziesięciu minut. Jeżeli nie masz pomysłu, prześledź najczęściej oglądane profile w celu inspiracji.
- Gotowe zdjęcie pobierz klikając je, a następnie przy pomocy przycisku ze strzałką (download), znajdującego się na górnej części fotografii.
- Jeżeli coś nam nie pasuje na zdjęciu, np. wygląd oczu czy ust (generator potrafi popełniać błędy), możemy je poprawić. Po pobraniu wygenerowanego zdjęcia otwórz zakładkę „Inpaint or Outpaint”, a następnie na wolne pole przeciągnij wygenerowane zdjęcie. Zaznacz na nim obszar, który chcesz poprawić (np. oczy lub usta), jako metodę wybierz „Improve Detail (face, hand, eyes, etc.)”, a następnie w polu „Inpaint Additional Prompt” wpisz po angielsku zapytanie opisujące co chcesz zmienić, np. „make eyes” i kliknij „Generate”. Możesz w ten sposób zmienić małe elementy lub minę postaci.
- Gotowe zdjęcie pobierz klikając je, a następnie przy pomocy przycisku ze strzałką (download), znajdującego się na górnej części fotografii.
Przykłady zdjęć wygenerowanych przy pomocy modelu Juggernaut XL:
HeyGen, czyli tworzenie wideo influencerów:
Drugim opisywanym narzędziem będzie HeyGen, czyli aplikacja pozwalająca na tworzenie serii nagrań wideo z wypowiedziami nieistniejących osób, dając możliwość wykorzystania jednego wizerunku wielokrotnie. W swojej darmowej wersji oferuje kilka predefiniowanych modeli wyglądu i scenerii, z których możemy skorzystać. Dzięki temu będziemy mogli stworzyć swój własny kanał wideo nie udostępniając nawet swojego wizerunku. Miesięcznie mamy do wykorzystania jeden darmowy kredyt pozwalający na realizację 1 minuty nagrania (podczas rejestracji na start otrzymujemy 2 kredyty). Niestety w darmowej wersji nagrania opatrzone są znakiem wodnym. Istnieją jednak narzędzia wideo pozwalające go usunąć (np. przybliżając obraz).
Jak zacząć pracę z HeyGen:
HeyGen opiera się o stronę internetową, więc w przeciwieństwie do poprzedniej aplikacji nie wymaga pobierania plików. Wystarczy postępować zgodnie z poniższym schematem:
- Zarejestruj się przy pomocy konta Google na stronie https://heygen.com/.
- Wejdź w zakładkę „Video Avatar”.
- Z listy dostępnych avatarów wybierz jeden z darmowych modeli (posiadających na zdjęciu dopisek „Instant Avatar”).
- Po wybraniu avatara najedź na niego, a następnie klikając przycisk „Create video with this avatar” wybierz czy tworzone wideo ma być nagrane pionowo jak z telefonu – Portrait, czy poziomo – Landscape.
- Pojawi się nowe okno, w którym:
- W zakładce „Avatar” z dostępnych za darmo modeli wybierz swojego avatara.
- W zakładce „Script” podaj treść, jaką ma przeczytać (tekst możesz nagrać mikrofonem), następnie klikając imię lektora możesz zmienić głos na taki, jaki nam odpowiada (ważne by był zgodny z językiem tekstu). Gotową wypowiedź można przesłuchać przy pomocy przycisku play.
- W zakładce „Text” i „Element” masz możliwość dodania do swojego nagrania napisów oraz obiektów pojawiających się na ekranie w czasie jego trwania – wybierając wcześniej na linii czasu, w którym momencie dane elementy powinny się pojawiać.
- W zakładce „Avatar” z dostępnych za darmo modeli wybierz swojego avatara.
- Gdy masz już pewność, że efekt Cię zadawala, kliknij „Submit”, a następnie potwierdź decyzję, oczekując na zakończenie generowania.
- By pobrać gotowe nagranie wybierz strzałkę w dół (download) widoczną na miniaturce nagrania. Jeżeli chcesz coś zmienić, z rozwijanego menu (trzy kropki) wybierz opcję „Edit as New” i zmień zawartość filmu. Ponowne generowanie będzie Cię jednak kosztowało dodatkowe kredyty.
Niestety w przypadku języka polskiego i darmowych modeli nie zawsze głos dobrze zgrywa się z obrazem. Spowodowane jest to tym, iż baza polskich głosów jest bardzo ograniczona. Przy większej ilości prób da się jednak stworzyć coś realistycznego. Najlepiej radzi sobie jednak z językiem angielskim.
Przykładowe nagranie wygenerowane przy pomocy HeyGen:
Automatyzacja mediów społecznościowych:
Media społecznościowe to przede wszystkim posty, które trzeba pisać, dostosowywać czy publikować na różnych profilach. Warto więc zautomatyzować ten proces. W tym celu do tworzenia treści pomocne nam będą rozwiązania opisywane w moich wcześniejszych artykułach, jak ChatGPT/Copilot, Gemini, a do ich poprawy użyć możemy narzędzi wspomagających tworzenie treści, które opisane zostały w artykule „Sztuczna Inteligencja i redagowanie tekstów – jak AI tworzy artykuły oraz wspomaga edycję tekstu”. Narzędziami tymi są m.in.: QuillBot – automatycznie parafrazujący angielskie teksty, Grammarly – automatycznie sprawdzający angielską gramatykę, Plagiarismdetector – weryfikujący plagiaty, czy po prostu DeepL tłumaczący teksty na różne języki.
Do automatyzacji procesu publikacji warto natomiast użyć programu Make HQ (https://www.make.com/), który dzięki prostemu interfejsowi pozwoli nam stworzyć automatyczne procesy łączące nasze profile na Instagramie, Facebooku, YouTube, czy innych mediach społecznościowych, nasze strony internetowe stworzone w gotowych systemach CMS typu WordPress oraz rozwiązania AI takie jak ChatGPT, dzięki którym treści na powyższe profile mogą być generowane i rozdysponowywane automatycznie, gdy np. wygenerujemy nowe zdjęcie. Niestety API ChatGPT jest płatne, jednak i bez tego jesteśmy w stanie nieco przyspieszyć sobie pracę.
Autor: Daniel 'zoNE’ Gabryś