A Skynet-teszt
Gazdaság

A Skynet-teszt

Az informatika hajnalán még az volt a kérdés, hogy mikor jön el az a pillanat, hogy a gépi intelligencia el tudja hitetni velünk, hogy ő egy ember. Ma már sokkal inkább az a kérdés, hogy nekünk embereknek meddig lesz még esélyünk közel egyenrangú felekként beszélgetni a mesterséges intelligenciával.
Ez itt az on the other hand, a portfolio vélemény rovata.
Ez itt az on the other hand, a portfolio vélemény rovata. A cikkek a szerzők véleményét tükrözik, amelyek nem feltétlenül esnek egybe a Portfolio szerkesztőségének álláspontjával. Ha hozzászólna a témához, küldje el cikkét a velemeny@portfolio.hu címre. A megjelent cikkek itt olvashatók.

Mamut vs. R2-D2

A világ első programozható digitális számítógépe, az ENIAC 1946-ban készült el. A magassága 2,5 méter, a szélessége 1 méter, a hosszúsága pedig 30,5 méter volt, míg a súlya 30 tonnát tett ki – ez nagyjából tíz darab terepjáróval egyenértékű. A listaára félmillió amerikai dollár körül volt. Ez a monstrum 5000 műveletet végzett el másodpercenként.

Ma egy modern laptop súlya nagyságrendileg egy kilogramm körül van, az ára ezredrésze az ENIAC-énak, és másodpercenként többmilliárd műveletet végez el. Ezzel a sebességgel arra is képesek, hogy mérnöki szimulációkat futtassanak, robotokat irányítsanak, matematikai tételek bizonyításában legyenek a segítségünkre.

A Galaxis útikalauz Marvinja…

De bármennyire is erősek ezek a gépek, önálló gondolkozásra nem képesek, mondják egyesek. A HuaweiTech „How intelligent will AI get?” című cikkének szerzői, An Wei és Zhang Baofeng szerint 2016-ban a legfejlettebb számítógépek számítási volumene egy rovaréval volt egyenértékű. A tanulmány szerint 2050-ig az emberek agyi kapacitása még egyértelműen erősebb lesz a gépekénél.

Katja Grace és társai „When Will AI Exceed Human Performance? Evidence from AI Experts” című 2018-as cikkükben azonban már egyes részterületek tekintetében jóval korábbra teszik a mesterséges intelligencia előzését. Írásuk szerint 50 százalék az esélye annak, hogy az MI már 2020 előtt jobb lesz nálunk Pókerben, hogy 2025 előtt jobban teljesít az embereknél fordítás és legózás terén, hogy 2030 előtt jobb esszéket írjon, mint egy gimnazista, vagy írjon egy top 40-es listára is felkerülő zeneszámot, vagy megverjen minket go-ban.

Grace-ék jóval hosszabb távon tudják csak elképzelni, hogy a gépek olyan könyvet írnak, mely felkerül a New York Times best-seller listájára (kb. 2050), önálló matematikai kutatásokat végeznek (kb. 2060), vagy a mesterséges intelligencia területén fognak komoly kutatási eredményeket elérni (az évszázad vége felé).

vagy JARVIS maga?

Tegyük hozzá, hogy a fenti becslések egyikéről már a cikk megjelenésekor is kiderült, hogy túlzottan pesszimista volt. A DeepMind cég AlphaGo programja ugyanis 2016-ban 4-1-re legyőzte a világ egyik legerősebb játékosát, a 9 danos koreai Lee Sedol-t. Azt, hogy az AlphaGo mennyire erős játékos volt, mi sem bizonyítja jobban, mint Sedol idézete a verseny után, melyben elmondta, hogy az egyetlen győzelmét a gép ellen semmi másra nem cserélné el, olyan boldog volt, hogy sikerült pontot nyernie.

A mesterséges intelligencia ráadásul robbanásszerűen és látványosan fejlődött az elmúlt években. Nehéz ma olyan embert találni, aki ne hallott volna, vagy akár ne használta volna valamelyik generatív AI rendszert. A ChatGPT legújabb verziója ráadásul kiválóan teljesít professzionális teszteken is.

Az OpenAI fejlesztése 298 pontot ért el a maximális 400-ból az amerikai jogászok számára kötelező Bar vizsgán. Ezzel az eredménnyel a feladatokat teljesítő diákok legjobb 10 százalékába került volna. De kutatók szerint komoly esélyei vannak arra is, hogy megfelelő prompt-programozással a pénzügyi szektor elit erőpróbáján, a CFA vizsgán is átmenjen. Emellett a legjobb 1 százaléknak megfelelő teljesítményt nyújtott a biológiai diákolimpia elődöntőkének feladatsorában.

A fejlődés sebessége még elképesztőbb, ha figyelembe vesszük, hogy a GhatGPT előző, 3.5-ös verziója még a legrosszabb 10 százalékba került a Bar vizsgán. A szintén amerikai SAT teszt matematika szekciójában a korábbi verzió a diákok 70 százalékánál ért el jobb eredményt, a mostani viszont már 89 százalékuknál.

A kódtörő tesztje

De hogyan lehetne objektív módon eldönteni, hogy a mesterséges intelligencia már egy szinten van velünk?

Erre a kérdésre a legjobb választ a téma egyik első, úttörő kutatója, a mellesleg kiváló hosszútáv-futó (majdnem bekerült az 1948-as brit olimpiai csapatba), valamint a második világháborúban használt német kódok feltörője, Alan Turing adta.

Az „Imitation Game” című, 1950-es cikkében azt javasolta, hogy ha egy ember kizárólag szöveges úton kommunikálva egy géppel és egy emberrel nem tudja eldönteni, hogy melyikük a mesterséges intelligencia, és melyikük a valódi, akkor elmondhatjuk, hogy az MI átment a teszten, és egy szinten van velünk.

A Skynet-teszt

A helyzet azonban ma már az, hogy egy emberi döntnök nem azért tudná, hogy melyik a gép és melyik az ember, mert a gép rosszabb válaszokat ad, hanem pont fordítva. Ma már a legfejlettebb chatprogramok emberfeletti sebességgel generálják válaszaikat. Ezek ráadásul bár egy-egy területen még lehet, hogy minőségileg nem érik el egy szakértő szintjét, de ha elég sokszínű tudásterületet tesztelünk, akkor szinte biztos, hogy egyetlen ember sem tud olyan stabilan magas minőségen megválaszolni minden egyes kérdést, mint a gép.

A kérdés így most már nem az, hogy a gép elég okos tud-e lenni, hogy embernek higgyük.

A kérdés ma már az, hogy egy ember elég okos és gyors tud-e lenni, hogy a másik oldalon lévő mesterséges elmét meggyőzze, hogy ő is mesterséges intelligencia. Ezt hívom én a Skynet tesztnek.

Ön átmenne?

Az egyik közkedvelt generatív AI segítségével el is készítettem az első Skynet tesztet. Ha minden kérdésre le tudja gépelni a jó választ az adott szintidőn belül, akkor az AI szerint ön akár mesterséges intelligencia is lehet. Ha erre nem képes, azaz legalább egy válasz helytelen, vagy legalább egy választ lassabban gépelt le, az elolvasása után, mint a szintidő, akkor egészen biztos, hogy ember.

Íme a tíz kérdés:

  1. Mi Franciaország fővárosa? / 2 másodperc
  2. Mennyi x, ha 2x + 3 = 7? / 3 másodperc
  3. Fordítsd le a „Hello” szót spanyolra! / 2 másodperc
  4. Mi a 144 négyzetgyöke? / 2 másodperc
  5. Ki írta, hogy „Lenni vagy nem lenni”? / 3 másodperc
  6. Mennyi 200-nak a 15 százaléka? / 3 másodperc
  7. Mely értelmes magyar szót betűit kevertem össze: „OÚKEZMUM”. / 4 másodperc
  8. Mi az eredménye a 9 * 8-nak? / 2 másodperc
  9. Kit neveznek a modern fizika atyjának? / 3 másodperc
  10. Mi a hidrogén atomi száma? / 2 másodperc

Ezúton jelentem, hogy mindketten (én, és az általam használt AI is) megbuktunk a teszten. Mindkettőnknek volt gondunk az idővel. Ám a mesterséges intelligencia csak azért nem ment át a Skynet-teszten, mert a második kérdésnél nem csak a megoldást adta meg, hanem a nyolc soros matematikai levezetést is, amihez picivel több idő kellett neki, mint három másodperc.

Mindezek fényében véleményem szerint Turing tesztje elavult. A modern időkben a Skynet-teszt az, ami egyre érdekesebb lesz. Egy ideig. Aztán már tesztelni sem lesz érdemes a különbséget.

A címlapkép illusztráció. Címlapkép forrása: Getty Images

Holdblog

Lehet még bárki Joe Biden utódja?

A hétvégén dől el, ki képviseli a demokratákat Donald Trump ellen az amerikai elnökválasztáson. Joe Biden, a jelenlegi elnök mentális állapotában egyre többen kételkednek, a... The post Lehe

KonyhaKontrolling

Megéri még a nyelvvizsga?

Sokaknak nagy célja, hogy nyelvvizsgát szerezzen, ezzel bizonyítsa tudását, illetve remélhetőleg jobb esélyekkel induljon a munkaerőpiacon. Ebben a bejegyzésben a nyelvtanulás és a nyelvvizsga

Kasza Elliott-tal

Eladások

Augusztus közepén pénzre lesz szükségem, és ehhez el kell adnom pár részvényt. Egy éve is volt egy hasonló dilemám, akkor veszteséggel szálltam ki több papírból, de idén más a tervem.Van

FRISS HÍREK
NÉPSZERŰ
Összes friss hír
Váratlanul blokkolták az ukránok Magyarország olajimportjának nagy részét!
Díjmentes előadás

Kisokos a befektetés alapjairól, tippek, trükkök a tőzsdézéshez

Előadásunkat friss tőzsdézőknek ajánljuk, összeszedünk, minden fontos információt arról, hogy hogyan működik a tőzsde, mik a tőzsde alapjai, hogyan válaszd ki a számodra legjobb befektetési formát.

Díjmentes online előadás

Devizakereskedés alapjai, avagy mi lesz veled forint?

Miben különbözik a devizakereskedés a részvények adásvételétől? Mely devizapárokat érdemes egyáltalán figyelni? Hogyan zajlik le egy tranzakció a forex piacon? Hogyan lehet rövid vagy hosszabb távra spekulálni ezen a piacon?

Portfolio hírlevél

Ne maradjon le a friss hírekről!

Iratkozzon fel megújult, mobilbaráthírleveleinkre és járjon mindenki előtt.

Kiadó raktárak és logisztikai központok

A legmodernebb ipari és logisztikai központok kínálata egy helyen

Sustainable World 2024
2024. szeptember 4.
Követeléskezelési trendek 2024
2024. szeptember 18.
REA 2024 SUMMIT – Powered by Pénzcentrum
2024. szeptember 18.
Budapest Economic Forum 2024
2024. október 17.
Hírek, eseményajánlók első kézből: iratkozzon fel exkluzív rendezvényértesítőnkre!
Ez is érdekelhet
Microsoft logó felhőszoftver