A KSH megújult stratégiájának megfelelően olyan elemzéseket készít, amelyek aktívan segítik a kormányzati döntéshozatalt, valamint támogatják a komplex társadalom- és gazdaságpolitikai döntéshozatal, az üzleti szféra, az akadémiai kutatások, a média és a lakosság adatigényeit. Az Országgyűlés 2023. december 13-án elfogadta a nemzeti adatvagyon hasznosításának rendszeréről és az egyes szolgáltatásokról szóló törvényt, amely definiálja a hatékony adathasznosítást támogató szolgáltatásokat és megállapítja az azokkal kapcsolatos szabályozást.
A törvény végrehajtását szolgáló kormányrendeletek a Nemzeti Adatvagyon Ügynökséget bízzák meg a szükséges adatmenedzsmenttel és a szolgáltatások nyújtásával,
melyben a KSH is közreműködik. A kooperáció korántsem újkeletű: a két intézmény eddig is együttműködött a hatályban lévő európai uniós adatkormányzási rendeletben (European Data Governance Act – DGA) foglaltak végrehajtásában.
Honnan származik ez a rengeteg adat?
A statisztikai adatfelvétel módja lehet statisztikai adatgyűjtés vagy statisztikai adatátvétel. A statisztikai adatfelvétel elsődleges és másodlagos adatforrásból is végezhető. Annak érdekében, hogy az adatszolgáltatókat közvetlenül terhelő adatgyűjtések száma, illetve a gyűjtött adatok mennyisége csökkenjen,
A KSH-nak minden esetben elsőként azt kell vizsgálnia, hogy van-e már elérhető, a statisztikai célnak megfelelő adminisztratív adatforrás, amelyből a szükséges adatok átvehetők.
Az adminisztratív adatforrások olyan másodlagos adatforrások, amelyeket már egy adatkezelő hatósági vagy egyéb közigazgatási célból felvett, összegyűjtött, így azokat nem kell még egyszer statisztikai célból is megkérdezni.
Az adminisztratív adatforrások köre rendkívül széles, vannak közte nagy állami nyilvántartások, mint a személyi- és lakcímnyilvántartás vagy az adózási célú adatbázisok (személyi jövedelemadó, ÁFA, társasági adóbevallások vagy járulékbevallás adatai), de kisebb adatforrások is. Érdemes lehet kiemelni közülük a NAV-ot, a Nemzetgazdasági Minisztériumot, a Pénzügyminisztériumot, a Magyar Nemzeti Bankot és a Belügyminisztériumot, ugyanakkor a hangsúly nem az adatkezelő személyén, hanem az adatok jellegén van, azaz, ha az adatok kezelését jogszabály írja elő, azokat bármilyen szervezettől igényelheti a KSH, amely
összesen 270 körüli ilyen adatforrást használ.
Az adminisztratív adatforrást kezelő szerv a KSH részére hivatalos statisztikai célra, a megfelelő, egyedi azonosításra alkalmas módon, a kapcsolódó kiegészítő információkkal (metaadat) köteles az adminisztratív adatforrásban kezelt adatot átadni. Ez azt jelenti, hogy a KSH azonosításra alkalmasan átveheti ezeket az adatokat, és jogosult azokat egymással összekapcsolni, ami lehetővé teszi új következtetések gyorsabb levonását.
Természetesen a KSH szigorú adatkezelési szabályok mellett veszi át és dolgozza fel ezeket az adatokat, azokat nem adja át sem más szervezetnek, sem adatkérőnek, a statisztikai adathozzáférés során csak aggregált eredmények ismerhetőek meg.
A KSH maga is gyűjt adatot
Amennyiben a fentiek alapján nem áll rendelkezésre olyan adminisztratív adatforrás, amely megfelelne a statisztikai adatigényeknek, a KSH a szükséges adatokat közvetlenül az adatszolgáltatóktól kéri be.
Az adatgyűjtéseket meg kell különböztetni az adatszolgáltatók köre, és a gyűjtött adatok jellege alapján.
Statisztikai adatgyűjtés keretében adatszolgáltatásra kötelezett lehet bármely természetes és jogi személy, valamint a személyiségi joga szerint jogképes szervezet.
A Magyarországon gazdasági tevékenységet végző jogi- és természetes személyek statisztikai adatszolgáltatási kötelezettségét minden év november 30-ig a Kormány rendelete állapítja meg, amit a Hivatalos Statisztikai Szolgálat tagjainak javaslatai alapján állítanak össze. A kötelező adatgyűjtések mellett a lakossági adatfelvételek önkéntes adatszolgáltatáson keresztül történnek, azaz ezekre nem kötelező a válaszadás. Ennek ellenére ebbe a körbe is fontos adatfelvételek tartoznak, ilyen például a Munkaerő-felmérés.
Fontos ugyanakkor kiemelni, hogy a tradicionális cenzusok, mint az agrárcenzus vagy a népszámlálás ma már nagyrészt adminisztratív adatokon alapulnak, és a szükséges adatok csupán töredéke kerül klasszikus módon felvételre.
Jön a Nemzeti Adatplatform
Az utóbbi években mind kormányzati döntéshozói, mind állampolgári, mind vállalati oldalról igényként jelent meg az, hogy az adatok – hiteles és elektronikus formában – ne csak általános jelleggel álljanak rendelkezésre, hanem azok konkrét ügyek elintézéséhez vagy elemzési célra is rövid úton elérhetők legyenek.
Egy újonnan kialakításra kerülő, erre alkalmas informatikai megoldás elősegítheti az adatokhoz való biztonságos hozzáférést.
A Nemzeti Adatplatform az adatok biztonságos tárolását és távoli elérését fogja biztosítani úgy, hogy a hozzáférés csak az arra jogosult kör számára legyen elérhető. A Nemzeti Adatplatform olyan informatikai szolgáltatás, amely a kijelölt szolgáltatók által gyűjtött adatok tárolását, valamint más szervezet kezelésében lévő adatok egységes hozzáférését biztosítja. Olyan adattárolási és programfuttatási megoldást kínál, amellyel az adatszolgáltatók teljes körű felügyeletet gyakorolhatnak, beleértve annak meghatározását, hogy ki és milyen módon használhatja az adatokat.
A Nemzeti Adatplatform szolgáltatás magában foglalja az adatok eredeti formában történő átvételét, az előfeldolgozáshoz, adatrendezéshez, adattisztításhoz szükséges adattárhely biztosítását és informatikai platformon történő hosszútávú, biztonságos tárolását, valamint a távoli, számítógépes elérést biztosító IT megoldást.
A szolgáltatást még ki kell alakítani, az erre vonatkozó törvényi rendelkezések 2026. január 1-jén lépnek hatályba.
Adat + mesterséges intelligencia = tökéletes páros
A mesterséges intelligencia fejlesztésének egyik legfőbb mozgatórugója a big data elemzés hatékonyságának javítása, és az ezekből kinyerhető információk alapján hiteles előrejelzések készítése. Az orvoslásban, ipari gyártásban, mezőgazdaságban vagy a meteorológiában ma már megkerülhetetlen technológia, de például erdőtüzek előrejelzésére is kiválóan alkalmas.
Mindennek alapja a megfelelő mennyiségű és jól strukturált adat.
A KSH jelenleg is használja a mesterséges intelligenciát (nem csak prediktív modellezések során) és folyamatosan kutatja, hogy mely szakmai feladatokat érintő folyamatokba, milyen módon és eredménnyel lehet bevonni. A jövőbeli fejlesztések között például a hagyományos módszerekkel nem, vagy csak nehezen megfogható feladatok- például a szövegfeldolgozás, vagy az adatok begyűjtése, strukturálása majd összekapcsolása - a mesterséges intelligencia segítségével automatizálhatók.
Európában is az éllovasok között
A KSH és a Nemzeti Adatvagyon Ügynökség közös célok szerinti együttműködése a legkorszerűbb európai gyakorlatokat követi.
Több olyan európai ország is van, amelyben hasonló rendszerben és hasonló elvek mentén működik az adatvagyon-gazdálkodás, mint tavaly óta Magyarországon. Svájcban például egy többszintű rendszer jött létre, ahol a svájci kormányzati Data Steward végzi az adatkormányzási feladatokat a nemzeti statisztikai hivatal bevonásával. A statisztikai hivatal elnöke a Data Steward, amely a közadatok standardizálásáért, azok minőségéért felelős, és támogatja az adminisztratív adatok elemzését. Az állami berendezkedés különös kihívásokat állít, mivel a kantonok szintjén külön működik helyi adatkormányzási felelős és helyi statisztikai adatkormányzási felelősök.
A cikk megjelenését a Központi Statisztikai Hivatal támogatta.
A címlapkép illusztráció. Címlapkép forrása: Getty Images