KSH-botrány: a tudósok szerint gyenge lábakon áll a hivatal védekezése
A KSH áltudományosnak minősítette a lapunkban megjelent tanulmányt, amelyben kutatók állították: a statisztikai hivatal relatív jövedelmi szegénységi adataival nagy a baj. A KSH szerint a minimálbér és a közmunkásbér magyarázza a szegénységi küszöb körüli, toronymagasan kiugró értékeket. A Válasz Online ismét a kutatókhoz fordult, hogy megtudjuk, elfogadható-e szerintük a hivatal válasza. Nos, nem az. Szerintük ha így lenne, akkor minden évben torlódnának ott az adatok, ráadásul a legmagasabb oszlopok nem is a minimál- és a közmunkásbérnél találhatók. A KSH-botrány folytatódik.
Szerdai cikkünkben azt vetettük fel: vagy hibázott a KSH, vagy tudatosan manipulálta a szegénységi adatokat éveken át. A KSH tegnapi válaszában ugyan elismerte a kiugró adatok meglétét, de ezt két jelenséggel magyarázta: 1. módszertani váltással, 2018-tól ugyanis az adóhatóságtól és a kincstártól kapott adatokat is használnak az adatfelvételnél, 2. a kiugró értékeket szerintük a minimálbér, a közfoglalkoztatási bér, valamint a garantált bérminimum okozza, amiben nagyon sokan részesülnek.
A szerdai cikkünk szakmai hátterét adó kutatók viszonválaszukban most visszautasítják az áltudományos jelzőt, és úgy vélik, ha a kutatói jelzéseket nem veszik komolyan, az megbonthatja a KSH iránti bizalmat. Nem fogadják el a KSH magyarázatát sem: például, mert a Válasz Online-on megjelent tudományos cikkben jelzett legproblémásabb év helyett a KSH egy másik esztendő adataival védekezik. Másrészt pedig, ha a minimálbér, a közfoglalkoztatási bér, valamint a garantált bérminimum okozná a torlódásokat, azoknak minden egyes évben meg kellene jelenniük, ám ez nincs így. Ráadásul ezeknek a külföldi adatokban is jelen kellene lenniük, hiszen ott is van minimálbér. Csakhogy ott is hiányoznak. Fontos oka van ennek: még a legszegényebb háztartások bevétele is sok elemből rakódik össze, és az egy főre jutó jövedelemadatoknál nagyon eltérő családmérettel kell számolni, emiatt – bár laikusként azt várnánk – a minimálbér vagy a közmunkásbér összegénél a legtöbb évben egyáltalán nem jelentős a halmozódás. A kutatók emellett ábrán is megmutatják, hogy a KSH által állított torlódások, kiugró értékek nem a minimálbér és a közmunkásbérnél jelentkeznek.
E rövid tartalmi összefoglaló után – jelezve, hogy a Válasz Online fenntartja korábbi megállapításait – az alábbiakban változtatás nélkül közöljük Tátrai Annamária, az ELTE adjunktusa és Gábos András, a TÁRKI vezető kutatójának válaszát.
Válasz a KSH által 2025.04.03-án kiadott közleményére
2025. április 2-án a Válasz Online felületén két írás jelent meg. Az egyik, az EU-SILC magyarországi jövedelemadataival kapcsolatos adatproblémák mögötti statisztikai elemeket részletesebben kibontó, szakértői szöveg Kutatói aggodalmak az EU-SILC magyarországi jövedelmi adataival kapcsolatban címmel, melynek szerzői Tátrai Annamária és Gábos András. Ezzel egyidőben Élő Anita tollából megjelent egy másik cikk Valami nagyon nem stimmel a KSH szegénységi adataival címmel, mely az adatok megbízhatóságával kapcsolatos felvetéseket kontexusában és újságírói eszközökkel a széles nyilvánosság számára is érhetővé tette a történetet.
A KSH 2025.04.03-án ezekre válaszként közleményben fogalmazta meg saját álláspontját. A közlemény hangvétele alapján úgy látjuk, hogy a Hivatal nem fogta fel a Válasz Online felületén közzétett adatminőségi problémák súlyát, és nem érti, mekkora károkat okoz, ha a szakértői jelzéseket – azokat „áltudományosnak” minősítve – figyelmen kívül hagyják, és ennek következtében megrendül a bizalom a hivatalos statisztika iránt. Válaszunkban összegezzük szakmai álláspontunkat, reagálva a KSH közleményének releváns pontjaira. Írásunk végén javaslatot teszünk a szakmai párbeszédre.
A Válasz Online felületén közzétett írások az EU-SILC adataival kapcsolatban három fő problémát vetettek fel.
1. 2018-tól kezdődően olyan kiugró értékeket, csoportosulásokat figyeltünk meg a jövedelemeloszlásban, amelyek jellemzően a szegénységi küszöb körül, egyes években közvetlenül felette koncentrálódnak. Ilyen jelenség nem figyelhető meg más uniós tagállamok adataiban, és statisztikailag valószínűtlen, hogy természetes módon alakuljon ki.
2. Elemzésünk eredményei arra utalnak, hogy ezek a torlódások az adattisztítás, a hiányzó adatok pótlása (imputálás) munkafázisában keletkezhettek, és ezek nyomán több évben is nagy valószínűséggel a valósnál alacsonyabbra becsülték a magyarországi szegénységi arányszámot. A hiányzó adatok pótlásának folyamata során olyan anomáliák is megjelentek, mint például az azonos jövedelmi értékek magas aránya: 2020-ban 322 egyfős háztartás esetében az euróban kifejezett jövedelmek hét tizedesjegy pontossággal megegyeztek, ami statisztikailag rendkívül valószínűtlen.
3. Mindezek alapján az adatproblémákat olyan mértékűnek láttuk, hogy a hazai és külföldi kutatói közösség bizalma megrendülhet az egyetlen olyan adatforrásban, amely alapján jövedelmi egyenlőtlenségeket és szegénységet lehet kutatni Magyarországon.
A KSH 2025.04.03-i közleménye a két cikkben megfogalmazott, az adatok megbízhatóságával kapcsolatos aggodalmakra nem ad kielégítő választ. A közleményben egyetlen olyan érdemi állítás van, ami a kutatói aggodalmakra reflektál. Eszerint az EU-SILC adatfelvételben a jövedelmek szegénységi küszöb körüli torlódása a keresetek béreloszlásban megfigyelhető torlódásával függ össze a vizsgált időszakban.
Természetesen a minimálbérnek a szegénységi küszöb körüli torlódásokban játszott esetleges szerepét mi magunk is plauzibilis magyarázatnak tartottuk, és ezt a lehetőséget meg is vizsgáltuk. Eredményeink alapján több szempontból is vitatjuk, hogy ez közvetlenül okozhatta a torlódásnak azt a mértékét, amit a cikkben szereplő ábrákon láthatunk. Ezért most részben összegezzük az ezzel kapcsolatban tett megállapításainkat, és néhány ponton újabb adatokkal, szempontokkal is kiegészítjük érvelésünket.
1. A vitában megjelenő jövedelmi szegénységi mutatószámokat egyénekre vonatkozóan számítják ki, miközben az indikátorok alapjául szolgáló jövedelem háztartáskoncepción alapul. Tehát mindenkihez, a gyermekekhez is jövedelmet rendelnek a számítás során, mely eljárás a háztartás teljes jövedelmének számbavételén alapul. Ez azt jelenti, hogy a 15 évesél idősebb háztartástagok egyéni jövedelme (keresetek, egyéni szintű társadalmi juttatások) és a háztartás egészéhez – akár a kormányzat valamelyik szereplőjétől (állam, önkormányzat stb.) vagy más háztartásoktól – érkező bevételek összeadódnak és a méretgazdaságosság figyelembevételével egyenlően oszlanak meg a háztartástagok között. Ezért egy adott évben egy háztartásban minden tagnak ugyanakkora lesz a jövedelme. Statisztikailag nagyon valószínűtlen, hogy a háztartás összejövedelméből származtatott egy fogyasztási egységre jutó jövedelemben a magyar adatokon megfigyelt torlódások alakuljanak ki a jövedelemeloszlás bármely pontján. Erre sem az EU-SILC-ben szereplő más országok, sem a 2018 előtti magyar adatok esetében nem tudunk példát hozni.
Egyébként a KSH 2025.04.03-i közélménye is úgy fogalmaz, hogy „A nettó minimálbér és a szegénységi küszöb ezekben az években legfeljebb csak kismértékben tért el egymástól, ebből következően részben magyarázható a jövedelmeknek a szegénységi küszöb körüli torlódása. (A közleményben a teljes mondat kiemelt, ez a kiemelés tőlünk származik.) Ebben az esetben felmerül a kérdés, hogy milyen egyéb oka lehet akkor a keresetek eloszlásán kívül annak, hogy a torlódások megjelentek az eloszlásban?
2. Egyfős háztartások esetében a háztartás és a háztartástag jövedelme megegyezik, ezért itt könnyebben megfeleltehető a közleményben ábra segítségével bemutatott bruttó kereseteloszlás a szegénységi mutatószámok számításához használt jövedelemnek. A KSH közleményében szereplő ábra a 2020-as év kereseteloszlását mutatja be, ami azt jelenti, hogy a 2021-es adatfelvételhez, és nem pedig az általunk leginkább kifogásolt 2020-ashoz kapcsolható. Írásunkban az egyfős háztartások 2021-es jövedelemeloszlásával kapcsolatban nem is problematizáltunk torlódást. Ha rátekintünk azonban az egyfős háztartások jövedelmének 2020-as, vagyis 2019-es referenciaévű eloszlására, akkor látható, hogy a torlódás nem három, hanem egyetlen ponton (100 eurós sávban) figyelhető meg. További magyarázatot igényel tehát nemcsak az egyfős, hanem a teljes népességben megfigyelt küszöb körüli torlódások megjelenése az eloszlásban, amire viszont a KSH közleménye semmilyen módon nem ad magyarázatot.

Az adminisztratív módon megállapított keresetek havi bruttó összege | A 2019. évi adóviszonyok alapján számított nettó összeg | Az EUROSTAT által figyelembe vett évi árfolyam (325,3 forint) szerint euróra váltott éves nettó összeg – ezeket az ábrán szaggatott vonallal ábrázoltuk |
bruttó 81 530 (közfoglalkoztatotti bérminimum) | havi nettó 54 217 forint | évi nettó 2 000,03 euró |
bruttó 149 ezer forint (minimálbér) | havi nettó 99 085 forint | évi nettó 3 655,18 euró |
bruttó 195 ezer forint (garantált bérminimum) | havi nettó 129 675 forint | évi nettó 4 783,63 euró |
3. Ha elfogadnánk a KSH-nak a kereseteloszlás szerepére vonatkozó érvét, akkor a kereseteknek az adminisztratívan megállapított összegek (közfoglalkoztatási bér, minimálbér és garantált bérminimum) miatti különleges alakú eloszlásának a Nemzeti Adó- és Vámhivatal (NAV) és a Magyar Államkincstár (MÁK) kereseti adatainak felhasználását megelőzően is látszania kellett volna, hiszen a véletlen mintavételnek biztosítania kell az ilyen jövedelemmel rendelkezők megfelelő arányát a mintában. A korábbi években azonban ilyen mintázatot nem látunk az adatokban. Ha az adminisztratív adatok alkalmazása az adatjavítás és hiányzó adatok pótlása során egy korábban nem megfigyelt mintázatot emel be az eloszlásba, az adott esetben súlyosabb problémát jelenthet, mintha a módszertani váltásra nem került volna sor.
4. Az írásunkban bemutatott ábrák azt is megmutatták, hogy a gyermekes háztartások megoszlásában is megtalálhatók a küszöb körüli torlódások a kérdéses években. E háztartások jövedelme sokkal összetettebb, mint az egyfős háztartásoké, hiszen több háztartástag egyéni jövedelme adódik össze a háztartási szintű jövedelmekkel, ráadásul a gyermekes háztartások létszáma is változó, szemben az egyfős háztartásokkal. Éppen ezért az egy fogyasztási egységre jutó jövedelem ilyen nagymértékű koncentrációja a küszöb környékén statisztikailag nagyon valószínűtlen.

Hangsúlyozottan szeretnénk jelezni, hogy az adminisztratív adatbázisok használatára való áttérést a jövedelmek ellenőrzésében és az adathiányok pótlásában általában előremutató és fontos lépésnek tartjuk. Az adóhatósági és egyéb adminisztratív adatbázisok beépítésének az lenne a célja, hogy csökkentsék a jövedelmek aluljelentésből fakadó hibákat. Ehelyett azonban olyan mintázatok jelentek meg a jövedelemeloszlásban, amelyek nem javulásra, hanem torzításra utalnak: a jövedelmek a szegénységi küszöb felett, több évben is közvetlenül afelett sűrűsödnek, ami kérdéseket vet fel az adathiányok pótlására szolgáló eljárások megfelelő kivitelezésével kapcsolatban. Azt állítjuk, hogy a szóban forgó időszakban ez a folyamat szemmel is jól láthatóan szakmailag nem elfogadható módon történt, romlott az adatminőség és az adatok megbízhatósága is. Elemzésünk arra utal, hogy ellentétben a közleményben állítottakkal, a jövedelmeket nem a szakmai standardok szerint, nem egyedi szinten, nem a jövedelemkomponensek szintjén imputálták.
A kereseteloszlás szerepén túl a KSH közleménye azt is állítja, hogy a szegénységi ráta változása a 2017 és 2022 közötti időszakban nem változott statisztikailag szignifikáns mértékben. Egyik cikk sem állította, hogy a teljes népességre számított szegénységi ráta változása statisztikailag szignigfikáns volt a 2017 és 2022 közötti időszakban. Élő Anita cikkében az a megfigyelés szerepelt, hogy a 0-17 évesek körében számított gyermekszegénységi ráta a vizsgált időszakban 2015 és 2020 között 63 százalékkal csökkent. Azonban, ha már a közlemény kitért a szegénységi ráta változásának mértékére, szeretnénk jelezni, hogy a KSH a Háztartások életszínvonala, 2018 című kiadványban a relatív jövedelmi szegénységben élők számának 0,4 százalékpontos csökkenését olyan jelentősnek találta, hogy a fejezetnek ezt az alcímet adta: Csökkent a jövedelmi szegénységi küszöbb (sic!) alatt élők aránya. Egy évvel később ugyanezt megtették a 0,2 százalékpontos csökkenés esetében is: Csökkent a szegénységi küszöb alatt élők aránya. Az ilyen eljárás aggályokat kelt a KSH szakmai hitelességével kapcsolatban.
Összességében a KSH 2025.04.03-i közleménye egyáltalán nem adott megnyugtató magyarázatot azokra a problémákra, melyek az EU-SILC hazai jövedelemadataival kapcsolatban felmerültek, ezért minden állításunkat fenntartjuk. Válaszunk végén két javaslatot fogalmazunk meg annak érdekében, hogy a kutatóknak a jövedelemadatokba és a szegénységi mutatókba vetett bizalma visszaálljon, ami – megítélésünk szerint – minden érintett szereplőnek közös érdeke.
1. Javasoljuk, hogy induljon valódi, nyilvános szakmai párbeszéd a KSH-nak az EU-SILC adatokkal foglalkozó munkatársai és az adathasználók között, a KSH-tól független és a kutatók bizalmát is élvező szakmai szervezet vagy intézmény keretei között.
2. Javasoljuk, hogy a folyamat keretében a súlyozással, a jövedelemellenőrzéssel és -tisztítással, valamint a hiányzó adatok pótlásával kapcsolatos algoritmusok legyenek szabadon hozzáférhetők, ami a szakmai párbeszéd előfeltétele, hiszen ez biztosíthatná az érintettek közötti információs aszimmetria kiküszöbölését.
2025.04.04.
Tátrai Annamária, Gábos András
Nyitókép: a Központi Statisztikai Hivatal épülete Budapesten
Ezt a cikket nem közölhettük volna olvasóink nélkül. Legyen támogatónk a Donably-n, az új, biztonságos, magyar fejlesztésű előfizetési platformon. Paypal, utalás és más lehetőségek itt >>>