Mamut vs. R2-D2
A világ első programozható digitális számítógépe, az ENIAC 1946-ban készült el. A magassága 2,5 méter, a szélessége 1 méter, a hosszúsága pedig 30,5 méter volt, míg a súlya 30 tonnát tett ki – ez nagyjából tíz darab terepjáróval egyenértékű. A listaára félmillió amerikai dollár körül volt. Ez a monstrum 5000 műveletet végzett el másodpercenként.
Ma egy modern laptop súlya nagyságrendileg egy kilogramm körül van, az ára ezredrésze az ENIAC-énak, és másodpercenként többmilliárd műveletet végez el. Ezzel a sebességgel arra is képesek, hogy mérnöki szimulációkat futtassanak, robotokat irányítsanak, matematikai tételek bizonyításában legyenek a segítségünkre.
A Galaxis útikalauz Marvinja…
De bármennyire is erősek ezek a gépek, önálló gondolkozásra nem képesek, mondják egyesek. A HuaweiTech „How intelligent will AI get?” című cikkének szerzői, An Wei és Zhang Baofeng szerint 2016-ban a legfejlettebb számítógépek számítási volumene egy rovaréval volt egyenértékű. A tanulmány szerint 2050-ig az emberek agyi kapacitása még egyértelműen erősebb lesz a gépekénél.
Katja Grace és társai „When Will AI Exceed Human Performance? Evidence from AI Experts” című 2018-as cikkükben azonban már egyes részterületek tekintetében jóval korábbra teszik a mesterséges intelligencia előzését. Írásuk szerint 50 százalék az esélye annak, hogy az MI már 2020 előtt jobb lesz nálunk Pókerben, hogy 2025 előtt jobban teljesít az embereknél fordítás és legózás terén, hogy 2030 előtt jobb esszéket írjon, mint egy gimnazista, vagy írjon egy top 40-es listára is felkerülő zeneszámot, vagy megverjen minket go-ban.
Grace-ék jóval hosszabb távon tudják csak elképzelni, hogy a gépek olyan könyvet írnak, mely felkerül a New York Times best-seller listájára (kb. 2050), önálló matematikai kutatásokat végeznek (kb. 2060), vagy a mesterséges intelligencia területén fognak komoly kutatási eredményeket elérni (az évszázad vége felé).
vagy JARVIS maga?
Tegyük hozzá, hogy a fenti becslések egyikéről már a cikk megjelenésekor is kiderült, hogy túlzottan pesszimista volt. A DeepMind cég AlphaGo programja ugyanis 2016-ban 4-1-re legyőzte a világ egyik legerősebb játékosát, a 9 danos koreai Lee Sedol-t. Azt, hogy az AlphaGo mennyire erős játékos volt, mi sem bizonyítja jobban, mint Sedol idézete a verseny után, melyben elmondta, hogy az egyetlen győzelmét a gép ellen semmi másra nem cserélné el, olyan boldog volt, hogy sikerült pontot nyernie.
A mesterséges intelligencia ráadásul robbanásszerűen és látványosan fejlődött az elmúlt években. Nehéz ma olyan embert találni, aki ne hallott volna, vagy akár ne használta volna valamelyik generatív AI rendszert. A ChatGPT legújabb verziója ráadásul kiválóan teljesít professzionális teszteken is.
Az OpenAI fejlesztése 298 pontot ért el a maximális 400-ból az amerikai jogászok számára kötelező Bar vizsgán. Ezzel az eredménnyel a feladatokat teljesítő diákok legjobb 10 százalékába került volna. De kutatók szerint komoly esélyei vannak arra is, hogy megfelelő prompt-programozással a pénzügyi szektor elit erőpróbáján, a CFA vizsgán is átmenjen. Emellett a legjobb 1 százaléknak megfelelő teljesítményt nyújtott a biológiai diákolimpia elődöntőkének feladatsorában.
A fejlődés sebessége még elképesztőbb, ha figyelembe vesszük, hogy a GhatGPT előző, 3.5-ös verziója még a legrosszabb 10 százalékba került a Bar vizsgán. A szintén amerikai SAT teszt matematika szekciójában a korábbi verzió a diákok 70 százalékánál ért el jobb eredményt, a mostani viszont már 89 százalékuknál.
A kódtörő tesztje
De hogyan lehetne objektív módon eldönteni, hogy a mesterséges intelligencia már egy szinten van velünk?
Erre a kérdésre a legjobb választ a téma egyik első, úttörő kutatója, a mellesleg kiváló hosszútáv-futó (majdnem bekerült az 1948-as brit olimpiai csapatba), valamint a második világháborúban használt német kódok feltörője, Alan Turing adta.
Az „Imitation Game” című, 1950-es cikkében azt javasolta, hogy ha egy ember kizárólag szöveges úton kommunikálva egy géppel és egy emberrel nem tudja eldönteni, hogy melyikük a mesterséges intelligencia, és melyikük a valódi, akkor elmondhatjuk, hogy az MI átment a teszten, és egy szinten van velünk.
A Skynet-teszt
A helyzet azonban ma már az, hogy egy emberi döntnök nem azért tudná, hogy melyik a gép és melyik az ember, mert a gép rosszabb válaszokat ad, hanem pont fordítva. Ma már a legfejlettebb chatprogramok emberfeletti sebességgel generálják válaszaikat. Ezek ráadásul bár egy-egy területen még lehet, hogy minőségileg nem érik el egy szakértő szintjét, de ha elég sokszínű tudásterületet tesztelünk, akkor szinte biztos, hogy egyetlen ember sem tud olyan stabilan magas minőségen megválaszolni minden egyes kérdést, mint a gép.
A kérdés így most már nem az, hogy a gép elég okos tud-e lenni, hogy embernek higgyük.
A kérdés ma már az, hogy egy ember elég okos és gyors tud-e lenni, hogy a másik oldalon lévő mesterséges elmét meggyőzze, hogy ő is mesterséges intelligencia. Ezt hívom én a Skynet tesztnek.
Ön átmenne?
Az egyik közkedvelt generatív AI segítségével el is készítettem az első Skynet tesztet. Ha minden kérdésre le tudja gépelni a jó választ az adott szintidőn belül, akkor az AI szerint ön akár mesterséges intelligencia is lehet. Ha erre nem képes, azaz legalább egy válasz helytelen, vagy legalább egy választ lassabban gépelt le, az elolvasása után, mint a szintidő, akkor egészen biztos, hogy ember.
Íme a tíz kérdés:
- Mi Franciaország fővárosa? / 2 másodperc
- Mennyi x, ha 2x + 3 = 7? / 3 másodperc
- Fordítsd le a „Hello” szót spanyolra! / 2 másodperc
- Mi a 144 négyzetgyöke? / 2 másodperc
- Ki írta, hogy „Lenni vagy nem lenni”? / 3 másodperc
- Mennyi 200-nak a 15 százaléka? / 3 másodperc
- Mely értelmes magyar szót betűit kevertem össze: „OÚKEZMUM”. / 4 másodperc
- Mi az eredménye a 9 * 8-nak? / 2 másodperc
- Kit neveznek a modern fizika atyjának? / 3 másodperc
- Mi a hidrogén atomi száma? / 2 másodperc
Ezúton jelentem, hogy mindketten (én, és az általam használt AI is) megbuktunk a teszten. Mindkettőnknek volt gondunk az idővel. Ám a mesterséges intelligencia csak azért nem ment át a Skynet-teszten, mert a második kérdésnél nem csak a megoldást adta meg, hanem a nyolc soros matematikai levezetést is, amihez picivel több idő kellett neki, mint három másodperc.
Mindezek fényében véleményem szerint Turing tesztje elavult. A modern időkben a Skynet-teszt az, ami egyre érdekesebb lesz. Egy ideig. Aztán már tesztelni sem lesz érdemes a különbséget.
A címlapkép illusztráció. Címlapkép forrása: Getty Images