Tekoälykentällä tapahtuu jälleen suuria. Tämä ei tietty sinällään yllätä, koska mennyt kvartaali on ollut kyllä huimaa vauhdiltaan muutenkin. Erilaisten tekoälytyökalujen uudet versiot ovat todella vauhdikkaasti kirineet sille kuuluisalle ”nextille levelille” niin isojen kielimallien, kuin kuva- ja videogeneraattoreiden kentillä. Tahti on niin kovaa, että yksittäiset pienet vallankumoukset tuppaavat sekoittumaan hälyyn, mutta eräs keskeisimmistä on Chat GPT: kuvageneraattorin päivittyminen. Pitkään vaikutti siltä, että OpenAI on jättänyt tämän markkinakentän suosiolla muille, koska Dall-e3-pohjainen kuvanluonti oli niin vuotta 2023 kuvajäljeltään. Ei ole enää, uusi ChatGPT:n on äärimmäisen kyvykäs kuvanluontiväline, joka haastaa kaikki muut vastaavat vimpaimet todella huolellisesti. Hauskaa on, että tämä on kohtuu järkevästi käytettävissä jo maksuttomassakin versiossa! Some on ollut täynnä esimerkkejä erilaisista sarjakuvista, infografiikoista ja vastaavista sovellutuksista. Meemiksi ja kliseeksi ehti noin vuorokaudessa kehkeytyä Studio Ghibli-tyyliin tehdyt versiot, no lähinnä kaikesta. Nyt kun noin viikko lanseerauksesta on mennyt, katsotaanpa missä siis mennään Chat GPT:n kuvageneroinnissa.
Käyttöliittymä?
Erillistä käyttöliittymää ei varsinaisesti ole vaan toimintoa ohjataan promptikentässä joko ihan tekstiprompteilla, tai sitten lisäämällä myös referenssikuvia. Lisäksi on valintasivellin alueiden valintaa varten. Alueista voi sitten kehotteella poistaa tai niihin lisätä elementtejä tai muuten vaan promptaamaalla pyytää muutoksia. Katsotaan seuraavaksi hiukan esimerkkejä.
Tuotekuva
Pyysin tuotekuvaa kuvittelliselle sihijuomabrandille ”SIHI” limutölkin muodossa. Ensimmäinen versio oli vähän tylsä, mutta hiukan promptia muokkaamalla sain jo paremman.

Koska tölkistä tuli ihan kohtuullinen päätin kokeilla kevyen mainokuvan luomista jossa henkilö virkistyy sihijuomalla lenkkeiltyään helteisellä rannalla. Muutamalla iteraatiolla sain mukavasti varioitua.


Kyllähän brändillä pitää logo olla. Hauskaa on se että Chat GPT osaa tehdä läpinäkyvyyden sisältäviä .PNG-tiedostoja. Which is nice!

Seuraavaksi pyysin tekemään brändille kuvan Instastoryyn. Helposti kävi.

Haasteita
Melkoisen hidasta on kuvien generointi, mutta laatu vastineeksi parhaimmillaan erinomaista. Jonkin verran oli myös ruuhkaa linjoilla joten kokonaisaika tuplaantui koska piti odotella väylien avautumista. Nämä luotiin maksullisella ”Plus”-versiolla, maksuttomallakin onnistuu, mutta päivittäinen raja tuli vastaan alle kymmenen generoinnin kohdalla.
Esimerkkejä





Mielikuvitushan tässä eniten enää rajoituksia tuo!