Lehet, hogy a Nemzetközi Energiaügynökségnek (IEA) felül kell vizsgálnia a mesterséges intelligencia (AI) "energiaéhségére" vonatkozó számításait. Ugyanis a nagy port kavart kínai fejlesztésű DeepSeek mesterséges intelligencia alapvetően írhatja felül eddigi tudásunkat a nagy nyelvi modellek energiaigényéről - mutatott rá a Financial Times.
A kínai modell a jelek szerint sokkal kevesebb áram felhasználásával jött létre, mint nyugati társai: a Nature szerint a Meta (korábban Facebook) Llama modelljének kifejlesztéséhez kevesebb mint 10 százaléknyi számítási erőforrásra volt szükség. Azonban érdemes ezeket a becsléseket a helyén kezelni, ugyanis egyelőre még csak kevés - és részben hivatalos - információ áll rendelkezésre az új fejlesztésről. Nagyban függ a rendszer energiafelhasználása attól, hogy milyen típusú chipeket és azokból mennyit használt fel az eredmény eléréséhez.
Az adatközpontok áramfogyasztása arányos a számítási teljesítményükkel
- mondták a Rystad energetikai tanácsadó cég elemzői a híroldalnak. „Ha igaz, amit állítanak, a teljes energiafogyasztás jelentősen alacsonyabb lehet”.
Ami igazán különleges a mostani kínai bejelentésben, hogy bár 2016 óta az AI alapú hardverek (chipek) terén háromezerszeres fejlődést értek el az energiahatékonyságban, most a nagy nyelvi modellek szoftveres részen történhetett egy nagy ugrás. Ez azt jelenti, hogy kevesebb chip állománnyal ugyanolyan számítási eredményt lehet elérni, mint a nagyobb adatközpontok esetében - ami kisebb energiafelhasználással jár.
Egyébként is érdemes felkészülni az energiapiaci volatilitásra, mivel a mesterséges intelligencia alapú infrastruktúra valós energiaigényét pontosan nem lehet meghatározni jelenleg. Azt érdemes kiemelni, hogy az adatközpontok működése csak egy része annak az energiamennyiségnek, ami szükséges lesz a teljes AI hálózat működtetéséhez. Ez magában foglalja az integrált áramkörök (chipek) gyártásához szükséges alapanyagok - mint például szilícium - kitermelését, ezek feldolgozását, majd abból a chipek legyártását - erről itt írtunk részletesebben.
A befektetők is értékelték a fejleményeket és sok, az energiaszektorba beruházó részvényes szabadult meg értékpapírjaitól a hír hallatán. Az érintett vállalatok között volt a Siemens Energy, a GE Vernova, a Mitsubishi Heavy Industries, a Constellation Energy, a Vistra Energy, a Schneider Electric, az ABB és a Legrand. A Citi elemzői szerint, ha a számok igaznak bizonyulnak, az jelentős hatással lenne az energetikai infrastruktúrát nyújtó vállalatokra.
A számítási szempontból hatékonyabb mesterséges intelligencia megkérdőjelezheti ezeket a trendeket
- hívták fel a figyelmet a Citi szakértői.
Volt honnan esni: a Siemens korábbi gáz- és energiaipari részlegéből négy éve kivált német vállalat részvényeinek árfolyama 336 százalékkal emelkedett az elmúlt egy évben, a hétfői zuhanás előtt. Gázturbináira rengeteg megrendelés érkezik a gázüzemű erőműveket építő energiavállalatoktól, amelyek az AI adatközpontok kiszolgálására építenek. A cég hétfői piaczárás után közölte, hogy az első negyedévben 9 milliárd eurós bevételt ért el, ami jóval meghaladta a várakozásokat, és organikusan 18 százalékkal nőtt az előző évhez képest. A vállalat szerint az eladás túlzás volt, mivel
az adatközpontok a jövőbeni növekedésnek csak egy kis szeletét teszik majd ki.
Erre erősít rá a Nemzetközi Energiaügynökség előrejelzése, ami szerint a globális villamosenergia-kereslet növekedésének 5%-át fogják kitenni az adatközpontok, ha a különböző felhasználási területeket vizsgáljuk. Figyelemre méltó, hogy bár az adatközpontok egyre növekvő áramigénye már önmagában is komoly kihívást jelent az elektrifikációs folyamatok számára, a hűtés-fűtési rendszerek (20%), a nehézipar (15%) és az elektromos közlekedés (15%) még nagyobb mértékben járulnak hozzá a villamosenergia-igény folyamatos emelkedéséhez.
Ez azt jelenti, hogy kiélezett verseny várható az elérhető villamosenergia-forrásokra. Ezért tartanak ki többen amellett, hogy ha a DeepSeek modellje hatékonyabb is, ez az áttörés csak felgyorsítja a mesterséges intelligencia elterjedését és összességében nagyobb áramkeresletet eredményez. Ez igaz lehet, ugyanis, ha azt vesszük alapul, hogy a szoftveres hatékonyságnöveléssel kevesebb chippel lehet ugyanazt a számítási kapacitást elérni, akkor
a kisebb tőkeerővel rendelkező vállalatok is be tudnak ruházni ilyen vállalati fejlesztésekbe.
Tehát hiába kell kevesebb chip egy-egy ilyen AI rendszer működtetéséhez, összességében több vállalat használhat majd mesterséges intelligenciát, ami megnöveli a teljes chip igényt.
Ezt a hatást Jevons-paradoxonként ismerik. Ezt William Jevons angol közgazdász után nevezték el, aki 1865-ben megfigyelte, hogy a szén hatékonyabb felhasználásához vezető technológiai áttörések növelik a szénfogyasztást. „A Jevons-paradoxon ismét lecsap!” - írta Satya Nadella, a Microsoft vezérigazgatója a LinkedIn-en. Hozzátette, hogy
ahogy a mesterséges intelligencia egyre hatékonyabbá és hozzáférhetőbbé válik, úgy fogjuk látni, hogy a használata az egekbe szökik, és olyan árucikké válik, amiből egyszerűen nem tudunk betelni.
A címlapkép illusztráció. Címlapkép forrása: Getty Images