Az adat a 21. század legnagyobb értéke. Az adatok helyes elemzésével nemcsak a vizsgált időszak és a múlt történései írhatók le, érthetők meg, hanem olyan tendenciák is kirajzolódhatnak, amelyek a jövőben is érvényesek lehetnek, és pontos becsléseket adhatnak bizonyos szakpolitikák vagy a gazdasági szereplők számára. A hazai lakosság többségének is ismerősek lehetnek a keresetek alakulásáról, a demográfiai folyamatokról vagy a nemzetgazdaság teljesítményéről időről időre megjelenő statisztikák, amelyek hosszú évek óta azonos módszertannal készülnek, így lesznek a hosszú idősoros adatok hitelesen összehasonlíthatók egymással.
Magyarországon az egyik legnagyobb adatvagyont kezelő KSH azonban nem elégszik meg az évtizedek óta publikált adatok folyamatos frissítésével,
hiszen a társadalmi és gazdasági változásokat bemutató statisztikák előállításával párhuzamosan kísérleti statisztikákat is közöl, amelyek új, alternatív adatforrások bevonásával, valamint innovatív módszerek és technikák felhasználásával készülnek annak érdekében, hogy hatékonyabban és gyorsabban reagálhassanak a felhasználói elvárásokra, segítsék az újonnan felmerülő adatigények kielégítését és az aktuálisan észlelt ismerethiányok lefedését.
Teljesen új módszertanokat is bevetnek
A kísérleti statisztika a hivatalos statisztika mellett fejlődik, reflektálva a társadalom és technológia gyors változásaira. A statisztikai módszerek és gyakorlatok továbbfejlesztésére, megújítására és bővítésére összpontosít, különös tekintettel az olyan kísérleti jellegű technikák kifejlesztésére, tesztelésére és alkalmazására, mint például a nagy adatkészletek kezelése, új adatforrások innovatív felhasználása, valamint a gépi tanulás és mesterséges intelligencia (MI) alkalmazása.
A hivatalos statisztikák a Nemzeti Statisztika Gyakorlat Kódexében rögzítettelveknek megfelelve készülnek. A kísérleti statisztikákat a KSH szintén ezen 14 elv teljesülésének mentén definiálta. Ezek közt vannak elvek, amelyek tökéletesen teljesülnek, és olyanok is, amelyek elméletileg sem, és vannak, amelyekről ebben az időszakban még nem állapítható meg kellő bizonyossággal a teljesülés mértéke.
Annak ellenére, hogy nem minden pontban felelnek meg a hivatalos statisztikát jellemző minőségi kritériumoknak, hasznos és releváns információval szolgálnak.
A kísérleti statisztikák sajátossága az egyedi módszertan, amely ráadásul időben változékony lehet. Az adott kísérleti statisztika megfelelő értelmezéséhez, felhasználásához ezért is kiemelten fontos a folyamatosan frissített, jól dokumentált módszertani leírás. Általánosságban igaz, hogy ezek az egyedi módszertanok, amennyire lehet, követik a standard, már tesztelt módszertanokat és jó gyakorlatokat, de előfordulhat az is, hogy egy statisztikát épp a teljesen újszerű módszertan tesz kísérletivé.
Kísérlet vagy főpróba?
A kísérleti jelleg nem jelenti azt, hogy a kísérleti statisztika szakmailag inadekvát lenne, sőt: épp innovatív jellege miatt a statisztikakészítés és fejlesztés egyik legfontosabb eszköze.
Céljuk, hogy a nyilvánosság számára olyan adatokat kínáljanak, amelyek a kísérleti jellegből adódó korlátok ellenére a felhasználók számára relevánsak lehetnek.
Ezen adatok közzététele azt is lehetővé teszi, hogy már az új statisztikák korai szakaszában is visszajelzés érkezhessen a felhasználóktól.
Előnyük a gyorsaság, a rugalmasság és az új igényeknek való megfelelés, valamint az, hogy lehetőséget adnak a hivatalos statisztika keretein kívül eső adatkörök közzétételére is. Hátrányként jelentkezik ugyanakkor, hogy a kísérleti fázisban jellemzően nem felelnek meg teljeskörűen a lefedettségi, összehasonlíthatósági kritériumoknak, a módszertani stabilitásnak, harmonizáltságnak, teljes meta-dokumentáltságnak, illetve egyéb minőségi kritériumoknak.
A folyamatos javítás és tesztelés, valamint a módszertani finomhangolás után a kísérleti statisztikák akár hivatalossá is válhatnak, de kísérleti fázisban is maradhatnak, kiegészítve a standard módon közzétett elemzéseket.
Ahhoz, hogy egy kísérleti statisztika hivatalossá váljon, több értékelő kritériumnak is meg kell felelnie, például az alkalmazott statisztikai módszernek megbízhatónak kell bizonyulnia, illetve a felhasználói visszajelzéseknek igazolnia kell, hogy az adott statisztika hasznos, releváns és hiteles. Nem minden kísérleti statisztika esetén cél a hivatalos statisztikává válás: elképzelhető, hogy az ahhoz szükséges lefedettség nem áll rendelkezésre, vagy a statisztika csak valamilyen krízishelyzet idején releváns.
Elitklubhoz csatlakozott a KSH
Az első kísérleti statisztikát, a KSH-ingatlan.com-lakbérindexet, amely a piaci lakáskiadás aktuális kínálati árszintjét és annak változását mutatja meg, 2020 augusztusa óta közli a hivatal, és a kezdetektől nagy figyelem övezi. A folyamatos innováció egyik fontos mérföldköveként
a KSH idén január végén indította el a kísérleti statisztikáinak otthont adó aloldalt, amelyen a már említett lakbérindexen kívül még két statisztika szerepel: a minden héten pénteken megjelenő regionális üzemanyagár-statisztika, és a keresetek változásának mélyebb rétegeit is feltáró, negyedévente frissülő statisztika.
A kísérleti statisztikák mindig egy jól látható logóval jelennek meg a KSH honlapján, és részletes módszertani megjegyzések is kísérik őket, hogy transzparensen meg lehessen különböztetni a hivatalos statisztikáktól. A Kísérleti statisztikák aloldal folyamatosan bővülő rovat lesz, hiszen a rendelkezésre álló adatvagyon elemzésében még rengeteg kiaknázatlan potenciál rejlik. A KSH ugyan big data-t még csak közvetett módon használ fel, a különféle MI megoldások viszont már a mindennapi gyakorlatot jelentik: például gépi tanuláson alapuló algoritmusok segítik a klasszifikációs feladatok ellátását és az idősoros modellezést. Utóbbi esetében főként recurrent neural networks (RNN – visszacsatolt neurális hálózatok) megközelítést használnak, mint amilyen a Long Short-Term Memory Networks (LSTM – hosszú rövid távú memória) mélytanulási algoritmus.
Európai kitekintésben az Eurostat régóta közöl kísérleti statisztikákat, és a V4-országokban is megvan az ilyen irányú törekvés.
A KSH az aloldal elindításával olyan országokhoz csatlakozott, mint Németország, Olaszország, Hollandia vagy Ausztria, amelyek az európai statisztikai szakma élvonalába tartoznak.
A cikk megjelenését a KSH támogatta.
Címlapkép forrása: Portfolio