Az egész országra kiterjedő gazdasági kérdés megválaszolására kiindulhatunk települési szinttől, ebben az esetben 3 155 darab megfigyelés (település) az alapja az elemzésnek. Ugyanezt az elemzést elvégezhetjük, hogyha járási adatokat használunk fel. A járási adatok a járásban található települések számaiból következik, azonban a települések számához képest egy szerényebb 175 elemű (járások Budapesttel együtt) adatbázis áll rendelkezésre. A következő szint a vármegyei szint, ahol már csak 20 megfigyelési egységünk van (19 vármegye és Budapest). Utolsó lépésként pedig 8 régióra szűkül Magyarország.
Tanulmányunkban arra kerestük a választ, hogy a térbeli adatokkal végzett elemzések eredményei függenek-e az aggregáció szintjétől? Magyarország esetében a probléma feltárásához települési, járási és megyei szintű térbeli adatok állnak rendelkezésre, a jövedelmi egyenlőtlenségek pedig európai szinten átlagosak.
Az elemzésünkbe végül a települési és járási aggregációs szinteket emeltük be, a vármegyei és a régiós felosztás esetén nagyon kevés adat áll rendelkezésre. Ugyanakkor a település vs. járás (3 155 vs. 175) esetén felmerülhet a kérdés, hogy valóban szükség van-e települési szintre vagy a járási színtű adatok jól jellemzik az adott területet?
Térbeli elemzésünk a háztartások jövedelmére összpontosít, egészen pontosan az egy aktív korú állandó lakosra (15-64 éves) jutó SZJA adóalapot képező összes belföldi jövedelemre település és járás szinten a 2019-es évben. Erről egy statisztika látható az ábrán. Már itt is látható, hogy a különböző aggregációs szinteket figyelembe véve a jövedelmekben jelentős különbség mutatkozik, miközben valamennyi aggregálási szint a települési adatokból táplálkozik.
A jövedelmet meghatározó tényezőket társadalmi és gazdasági csoportokba soroltuk, a teljesség igénye nélkül: lakónépesség, munkanélküliség, iskolai végzettség, európai uniós támogatások, vállalkozások jelenléte stb. Összesen 9 tényezőt azonosítottunk, amelyek befolyásolhatják a jövedelmet, ezt kiegészítettük a FEOR (Foglalkozások Egységes Osztályozási Rendszere) kódokkal, amely azt mutatja meg, hogy az adott településen (vagy járásban) milyen munkakörben dolgozik a lakosság.
A kutatás fő kérdésének megválaszolásához 4 különböző statisztikai modellt használtunk, hogy ellenőrizni tudjunk az eredményeink pontosságát.
A 2. ábra első összevont oszlopában látható, hogy melyik modell szerint történt a vizsgálat. A második oszlopban az aggregációs szint (település vs. járás). Az utolsó oszlopban, pedig azoknak a tényezőknek az aránya, amelyek statisztikailag igazolhatóan meghatározzák a háztartások jövedelmét. A szürkével kiemelt sorokat a szintén szürkével kiemelt sorokkal lehet összehasonlítani modellenként, ugyanígy igaz a fehér hátterű sorokra.
A FEOR osztályok nélküli vizsgálatban település szinten 77,8%-ban, járás szinten átlagosan 46,9%-ban találhatók a statisztikailag igazolhatóan jövedelmet meghatározó tényezők. A FEOR osztályokkal bővített modell esetében ezek az arányok 65,8% vs. 47,2%. A különbség mindkét esetben jelentős, az eredmények azt sugallják, hogy a település szintű vizsgálatok pontosabb becslésekre vezethetnek. A járási adatokkal történő számítás is jelentős információ vesztést eredményez, a vármegyei adatokkal történő modellezés minden bizonnyal még ennél is gyengébb eredményeket szolgáltatna.
Az eredmények arra utalnak, hogy a MAUP-probléma létezik Magyarországon. Az aggregáció növelése minden modell esetében jelentősen csökkenti a jövedelmet meghatározó tényezők arányát. A kapott eredmények összhangban vannak a nemzetközi szakirodalomban található eredményekkel. Minél nagyobb léptékben aggregáljuk az adatokat úgy vesznek el a területek egyedi jellemzői és megjelenik az úgynevezett simítóhatás. A magasabb aggregációs szintek elfedik az alacsonyabb szintű területi egységekben található változékonyságot és részletességet.
Ez azt jelenti, hogy a térbeli elemzéseket a lehető legkisebb területi léptékben kell elvégezni a legpontosabb modellbecslésekhez.
Bareith, T., & Csizmadia, A. (2023). The importance of aggregation in regional household income estimates: A case study from Hungary, 2019. Regional Statistics, 10(6). DOI: 10.15196/RS130603
Bareith Tibor a HUN-REN Közgazdaság és Regionális Tudományi Kutatóközpont Közgazdaságtudományi Intézetének tudományos munkatársa
Csizmadia Adrián a Magyar Agrár- és Élettudományi Egyetem Kaposvári Campusának PhD-hallgatója
A cikk a szerzők véleményét tartalmazza, amely nem feltétlenül esik egybe a Portfolio szerkesztőségének álláspontjával.
Címlapkép forrása: Getty Images