Diffúziós képgeneráló modellek
A cikkben szereplő mindhárom képgeneráló diffúziós modellen alapul, amelyek úgy működnek, hogy „zajt” keltenek a betanításukra használt adatokban, majd úgy tanulnak, hogy megpróbálják helyreállítani ezeket az adatokat a zajkeltési folyamat megfordításával. Más szóval a modellek zajból generálnak koherens képeket. A modell tehát megpróbálja eltüntetni a zajt, és fokozatosan javítja a kép minőségét, amíg az a lehető legjobban megfelel a bevitt szöveg tartalmának. A modell ezt követően a megtanult a zajmentesítési folyamatot alkalmazza a véletlenszerű beviteli adatokra, hogy azokból valósághű képet hozzon létre.
Dall-E 2
A legnépszerűbb és a legjobb minőségű illusztrációkat készítő szöveg-kép generátor a Dall-E 2, amelyet a ChatGPT-t is megalkotó OpenAI fejleszt. A Dall-E-t tavaly szeptemberben nyitotta meg a nyilvánosság előtt a kutatólabor, és ezzel együtt minden felhasználónak 50 kreditet, azaz 50 ingyenes képkészítési lehetőséget adott. A regisztrált felhasználók, ha elhasználják az 50 kreditet, minden hónapban 15 újat kaphatnak.
A Dall-E leginkább annak köszönheti a sikerét, hogy a generált képek valóban jó minőségűek, pontosan és jól adják vissza a szöveges parancsok tartalmát. Más képgenerátorok gyakran készítenek bizarr vagy sötét tónusú képeket, amihez képest a Dall-E ábrázolásai viszonylag realisztikusak.
Signature Pro-val ezt a cikket is el tudnád olvasni!
Ez a cikk folytatódik, de csak Portfolio Signature előfizetéssel olvasható tovább. Lapunk kiemelt tartalmaihoz való hozzáférés díja az éves előfizetés esetén most 33%-os kedvezménnyel 19 990 forint. Választhatsz havi csomagot is, melynek költsége 2 490 forint. További információ és csatlakozás az alábbi gombra kattintva!