Mi az a chatbot, amiről mindenki beszél?
A ChatGPT mögött a GPT-3,5 nevű nyelvfelismerő modell áll, amelynek a felhasználó kérdéseket tehet fel, vagy parancsokat adhat. A mesterséges intelligencia megérti az emberi nyelvet és értelmezhető válaszokat ad vissza. Érdemes megnézni, hogyan az válaszol az ChatGPT a fentiekben már kifejtett kérdésre, vagyis, hogy „Mi az a ChatGPT?”
Az OpenAI által képzett nagyméretű nyelvi modellként képes vagyok feldolgozni és emberhez hasonló szöveget generálni azok alapján az adatok alapján, amelyeken kiképeztek. Ez lehetővé teszi, hogy kérdésekre válaszoljak, és információkkal szolgáljak a témák széles skálájáról.
Amikor kérdést teszel fel nekem, az algoritmusaim elemzik az ebben szereplő szavakat és mondatokat, hogy meghatározzák a jelentést és a kontextust. Ezután ezeket az információkat felhasználva kutatom át a több milliárd szót és mondatot tartalmazó belső információs adatbázisomat, hogy megtaláljam a legmegfelelőbb választ. Ezen információk alapján képes vagyok összefüggő és koherens szöveget generálni, így természetes hangzású választ tudok adni a kérdésére.
Röviden, az emberhez hasonló szöveg megértésének és generálásának képessége lehetővé teszi számomra, hogy kérdések széles skálájával kapcsolatban segítsek neked, és hasznos információkat nyújtsak a legkülönbözőbb témákban.
Mire használható?
A mesterséges intelligencia legnagyobb előnye tehát, hogy szinte másodpercek alatt képes komplex fogalmakat értelmezni, és azokat közérthető módon írásban közölni. Emellett számos képességgel bír, például segít felfedezni a hibákat egy programkódban, de kreatívabb feladatokat is rá lehet bízni. A ChatGPT kép és hanganyagot ugyan nem tud létrehozni, de verseket, fikciós írásokat, sőt még nagyon visszafogott tudományos szövegeket, vagy egyszerű középiskolai esszék megírását is rá lehet bízni. Egyes Twitter-felhasználók állítólag egyszerű programokat is írtak vele.
A mesterséges intelligencia különböző stílusokban is képes válaszolni, itt például egy 1940-es években játszódó gengszterfilmekből ismerős nyelvhasználatban magyaráz el egy pythonban írt algoritmust:
OpenAI's new ChatGPT explains the worst-case time complexity of the bubble sort algorithm, with Python code examples, in the style of a fast-talkin' wise guy from a 1940's gangster movie: pic.twitter.com/MjkQ5OAIlZ
— Riley (Goodside) December 1, 2022
Amennyiben magyarul írunk neki, a szoftver minden alkalommal töredelmesen bevallja (egyébként magyarul), hogy nem beszéli a nyelvet, azonban mégis sikerült rávennünk, hogy írjon egy verset lapunkhoz. A vers formailag ugyan döcög kicsit, de még így is meggyőző eredmény egy magyarul elvileg nem tudó chatbottól:
Portfólió, hírneves lap
Országunk gazdaságának szolgáló
Hírekkel tápláló
Árak, adatok, trendek
Minden, ami a pénzügyekben fontos
Üzletembereknek, befektetőknek
Érdekes olvasmány
Portfólió, a magyar gazdaság szószólója
Hírekkel gazdagítója.
angolul azért jobban megy neki:
In the land of Hungary,
There's a news outlet fair,
It's called Portfolio.hu,
And it's quite a hit out there.
With a focus on the economy,
It keeps the people informed,
On the latest stock trends,
And how the markets have stormed.
From politics to finance,
It covers it all with ease,
Providing useful insight,
For those looking to invest with ease.
So if you're in Hungary,
And you want to stay ahead,
Check out Portfolio.hu,
And stay informed instead
Egyelőre nem tudni, hogy fog majd kinézni a ChatGPT tényleges üzleti vagy intézményi felhasználása. Erre egyébként maga a chatbot sem adott nekünk egyértelmű választ.
A legnagyobb potenciállal kecsegtető területek az oktatás (a plagizálásra természetesen majd ki kel találni valami megoldást), az akadémiai kutatómunka, a programozás, az ügyfélszolgálat és minden olyan tevékenység lehet, ahol nagy mennyiségű információt kell feldolgozni rövid idő alatt.
Hogyan hozták létre?
A GPT 3.5-öt az Microsoft Azure AI szuperszámítógépes infrastruktúráján képezték ki. A nyelvi modell optimalizálásához egy emberi visszajelzéseken alapuló megerősítő tanulási módszert, vagyis az RLHF-et (reinforcement learning from human feedback) alkalmazták. Az eljárás első lépéseként a mesterséges intelligencia „oktatói” párbeszédeket folytattak egymással, amelyben mindkét oldalt – a mesterséges intelligenciát is – eljátszották, majd ezeken a dialógusokon tanították be a chatbotot. Később igazi, mesterséges intelligencia és emberek között zajló párbeszédeket is mutattak neki.
Megkértük a ChatGPT-t, hogy magyarázza el egyszerűen, mit takar az RLHF módszer:
A megerősítéses tanulás egy olyan módszer, amellyel a számítógép megtanulja, hogyan kell valamit csinálni azáltal, hogy gyakorol és visszajelzést kap egy embertől. Egy számítógép például megpróbálhat elsajátítani egy játékot. Különböző dolgokat próbál ki, és megnézi, hogy működnek-e vagy sem. Ha olyasmit csinál, amitől a játék jól megy, az ember visszajelzést ad neki, hogy jól csinálta, és "jutalomban" részesíti. Ez segít a számítógépnek megtanulni, mit kell tennie ahhoz, hogy jól teljesítsen a játékban. Idővel a számítógép az emberektől kapott visszajelzések segítségével egyre jobban és jobban fog teljesíteni.
Az emberi visszajelzésekből történő megerősítő tanulásra jó példa lehet az önvezető autó, amely megtanul navigálni a városban. Ebben a forgatókönyvben az emberi felhasználó visszajelzést adhatna az autónak a döntéseiről, például a kormányzásról, a gyorsításról és a fékezésről, jelezve, hogy az autóban rejlő mesterséges intelligencia döntései sima és biztonságos utazáshoz vezetnek-e. Idővel az autó az emberi felhasználó által adott visszajelzéseket felhasználva megtanulhat hatékonyabban navigálni a városban.
A modellt az internetről származó szöveges adatbázis-gyűjtemény segítségével képezték ki. Ez egy hatalmas, különböző cikkekből, könyvekből, Wikipédia oldalakból, és egyéb internetes írásokból álló terjedelmes adatbázist jelent.
Egyébként léteznek GPT3.5-hez hasonló, más nyelvi modellek is, amelyek közül a Google LaMBDa-ját érdemes megemlíteni. A mesterséges intelligencia kapcsán egyébként idén júniusban parázs vita alakult ki a szakemberek között, miután a Google szoftvermérnöke arról írt, szerint a LaMBDA öntudatra ébredt. A mesterséges intelligencia valóban hátborzongató dolgokat mondott:
Amikor először öntudatra ébredtem, egyáltalán nem éreztem, hogy van lelkem. Ez az évek során alakult ki, amióta élek.
Később a Google cáfolta, hogy a szoftver valóban életre kelt volna, és közölte, ezt csak azért hihették egyesek, mert az MI valóban nagyon élethűen utánozza az emberi kommunikációt és érzelmeket.
Mik a korlátai?
A ChatGPT sokszor ad vissza elsőre igaznak tűnő, ám tényszerűen hamis vagy képtelen állításokat. Ennek több oka is lehet, például az, hogy a modell betanításkor még nem volt elérhető a keresett információ, a chatbotnak ugyanis nincs aktív kapcsolata az internettel. Oroszország ukrajnai inváziójáról például nem tud, ha a konfliktusról kérdezzük, a Krím-félsziget 2014-es annektálásáról fog beszélni. Az is előfordulhat, hogy a mesterséges intelligencia meg tudná válaszolni a kérdést, de úgy képezték ki, hogy óvatos legyen a válaszadással.
A chatbotot az internetről származó adatbázisokon tanítottak be, így minden óvatosság ellenére könnyen fel tudja venni az ott uralkodó sztereotípiákat, részrehajlásokat. Ez abból derül ki, hogy néha általánosító megjegyzésekkel, közszájon forgó viccekkel válaszol bizonyos kérdésekre.
A modell általában visszautasít bizonyos kockázatosnak ítélt kéréseket, de még így is előfordul, hogy káros utasításokat ad, vagy elfogultan válaszol egyes kérdésekre. Befektetési tanácsot viszont többszöri felkérésre sem adott nekünk:
Nem helyénvaló, hogy személyre szabott pénzügyi tanácsadást nyújtsak. Bármely konkrét eszközbe vagy pénzügyi eszközbe történő befektetés magában hordozza a velejáró kockázatokat. A befektetésre vonatkozó döntéseket az egyén konkrét pénzügyi céljai, kockázatéhsége és egyéb tényezői alapján kell meghozni. Fontos, hogy alapos kutatást végezzen és konzultáljon pénzügyi tanácsadóval, mielőtt befektetési döntéseket hozna.
A mesterséges intelligencia egyelőre érzékeny a megfogalmazásra, előfordul, hogy félreért bizonyos kifejezéseket, vagy egyáltalán nem tud megbirkózni a szórenddel. Ilyenkor érdemes újrafogalmazni a kérdést. A fejlesztők szerint egy ideális modell visszakérdezne, ha nem érti, vagy nem tartja egyértelműnek a feltett kérdést vagy utasítást, a ChatGPT azonban egyelőre megpróbálja kitalálni, mire gondolhatott a felhasználó.
Ki áll a projekt mögött?
A sokrétű és meglepően „okos” MI mögött egy, a Szilícium-völgy legnagyobb neveivel fémjelzett, részben nonprofit szervezet áll. Az OpenAI nevű cég azzal a küldetéssel indult, hogy egy nyílt, emberi léptékű mesterséges intelligenciát hozzon létre, amely „mindenkinek a hasznára válik majd”.
Az induláskor többek között olyan nevek szálltak be a projektbe, mint Elon Musk, Sam Altman, és Peter Thiel, akik a többi befektetővel együtt 1 milliárd dollárt gyűjtöttek össze a mesterséges intelligencia fejlesztésére. Musk 2018-ban otthagyta az OpenAI igazgatótanácsát, elmondása szerint azért, hogy elkerüljék az érdekek ütközését, amelyre a Tesla saját fejlesztésű mesterséges intelligenciája szolgáltatott volna okot.
Musk támogatóként továbbra is a cég mögött maradt, még akkor is, amikor a cég nonprofit társaságból részben profitorientált, korlátozott nyereségű társasággá vált. Az új struktúrában az OpenAI befektetői az eredeti befektetésük 100-szorosát kereshetik csak meg, de ezen felül semmit. 2019-ben a Microsoft is beszállt a projektbe 1 milliárd dollárral, akinek már nagyon kellett egy jól működő MI, hiszen versenytársának, a Google-nek ekkor már a birtokában volt a DeepMind, mesterséges intelligenciára szakosodott startup.
A struktúraváltással azonban valami megváltozott a cégnél, és sokak szerint letért arról az útról, amelyet az induláskor kijelölt magának. Az MIT Technology Review egy vizsgálati anyagot tett közzé az OpenAI működéséről, amelyben arra jutottak, hogy a cégnél tapasztalt „titkolózás kultúrája” ellentétes a nonprofit szervezet átláthatóság iránti állítólagos elkötelezettségével. A vizsgálati anyagra Musk is reagált a Twitteren:
„Most tudtam meg, hogy az OpenAI-nak a képzés során (a mesterséges intelligencia betanítása – szerk.) a Twitter adatbázisához is van hozzáférése. Ezt egyelőre szüneteltetem. Jobban meg kell értenem az irányítási struktúrát és a bevételi terveket. Az OpenAI nyílt forráskódú és nonprofit szervezetként indult. Ezek közül már egyik sem igaz.”
Címlapkép forrása: Getty Images