Vélemény

Ellentmondások a KSH havi halálozási adataiban

2017 óta figyelem a hazai és más európai országok halálozási adatait. Az a tény foglalkoztatott a leginkább, hogy Magyarországon mekkora lehet a népességfogyás, és hogyan állnak ezzel például Ausztriában, Németországban, és az akkor még csak a Brexit elején tartó Egyesült Királyságban. Arra voltam kíváncsi, hogy vajon mindenhol fogy a nyugati népesség, vagy csak nálunk? A megvilágosító erejű, egyébként lehangoló válaszról végül nem írtam cikket (sok nyugat-európai országban annak ellenére népességgyarapodás van, hogy levonják az adatokból a migrációt és annak születési hatásait).

Viszont az adatokat folyamatosan figyeltem azóta is, és nyilván nem mondok újat, hogy 2020 kiemelt szerepet és figyelmet kapott – gondolom nemcsak tőlem – a halálozási adatok tekintetében.

Amikor 2020 márciusában sorra jöttek a világból a Covid-halálozási adatok, és itt, nálunk is közel tucatjával haltak naponta emberek a vírustól, akkor sok ismerősnek azt javasoltam, amit magamnak is, hogy:

– Figyelj, ne a sajtónak higgy! Egyetlen hitelesnek tekinthető forrás van még, a KSH halálozási adatairól szóló tájékoztatás. Ezek viszont hónapokkal később készülnek el, tehát türelem, majd később meglátjuk, hogy megjelentek-e ezek a halálozások a statisztikákban lényeges hatásként, vagy sem.

Az EU-s halálozási adatokból tavasz végén – nyár elején az látszott, hogy azokban az országokban, ahol küzdenek a magas halálozási számokkal is a Covid kapcsán – Olaszország, Portugália –, nem kellett, hogy a médiában sugallt, kiugró görbékkel szembesüljenek az össztársadalmat tekintve, viszont a 65 év fölöttieknél már jelentős volt a kiugrás. Kiderült, hogy semmilyen adat nem olyan egyszerű, ahogy próbálták a sajtóban leegyszerűsíteni, hanem mindig hosszabb mondatokat kell fogalmazgatni annál, hogy „Tegnap ennyien haltak meg.”  Például: Tegnap ennyien haltak meg, az életkoruk ennyi és ennyi volt, ilyen és olyan krónikus, netán gyógyíthatatlan betegséggel küzdöttek, egyébként hónapok óta el sem hagyták a kórházat, ott benn fertőződtek meg.” (Ez csak példa.)

A 2020 tavaszán agyunkba beégett „Exponenciálisan növekszik” kifejezés a halálozásban nem jelent meg a legtöbb országban. Sokkal inkább jelent meg az úgynevezett normál eloszlású görbe, még ha az magasabb is volt a szokásosnál.  (Egyébként az eurostat oldal is azt sugallja, hogy ultrabrutál növekedés volt tavasszal a halálozási számokban. Ezekről az esetekről utólag kiderülni látszik, hogy a kezelések sem a legtökéletesebbek voltak a Covid kapcsán, jóval kevesebb lélegeztetésre és invazív beavatkozásra lett volna szükség, mint eleinte gondolták volna az orvosok, de hát ezekről még most is megy a vita a tudományos körökben, adatról meg ne is álmodjunk ezek kapcsán.)

Kijöttek a Központi Statisztikai Hivatal Népmozgalmi adatai is – általában másfél hónappal az adott hónap után szoktak –, sok-sok médium hivatkozta ezeket, ahogy az szokás. Látszott például a 2020. májusi és júniusi adatokon, hogy nincs itt semmi látnivaló, igazából jobbak a halálozási adatok, mint tavaly, áprilisban 139 elhunyttal több volt, mint a korábbi év áprilisában:

2020. április havi halálozási adatok
2020. április havi halálozási adatok
2020. május havi halálozási adatok
2020. május havi halálozási adatok
2020. június havi halálozási adatok
2020. június havi halálozási adatok

Aztán jött a nyár, senkit sem érdekeltek már az adatok, beindult a mozgás, az élet, a reménykedés pedig új erőre kapott. Bár jöttek a szólamok is a szeptembertől majd bedurvuló, esetlegesen már második hullámnak tartott, újbóli esetszaporodásokról, de ezeket mindenki igyekezett elhessegetni magától.

Augusztus végén – 25-én – kijött a júliusi Népmozgalmi adat, és bár sokszor láttam, hogy ebben is, mint gyakorlatilag az összes eddigi közlésben van hivatkozás az egy évvel korábbi – esetünkben 2019-es – adatokra, nem gondoltam volna, hogy végül ennek a hivatkozásnak fogok majd külön figyelmet szentelni.

2020. július havi halálozási adatok
2020. július havi halálozási adatok

Ezen látszik, hogy 2020 júliusában 9436 fő vesztette életét, és hogy a KSH közlése szerint ez 614 elhunyttal, tehát 6,1%-kal kevesebb, mint egy évvel korábban.

Ha ebből kiszámoljuk, hogy milyen adatok is voltak 2019-ben, akkor kijön, hogy 10050 halott volt 2019 júliusában. Mivel úgy tűnik, hogy innen bátran viszonyíthatunk visszamenőleges adatokra, miért is ne számolgatnánk?

Ezeket az adatokat a KSH az Elektronikus Anyakönyvi Rendszerből nyeri ki, továbbá a 2016. évi CLV. törvény a hivatalos statisztikáról https://net.jogtar.hu/jogszabaly?docid=A1600155.TV 30. § alapján gyűjtik. A módszertanról: http://www.ksh.hu/docs/hun/modszgyors/nepmodsz18.html

Szóval kiszámoltam. Aztán visszalapoztam 2019-re, az eredeti, 2019-ről szóló adatközlésre. És akkor elcsodálkoztam. A visszalapozást ne úgy értsd, hogy a KSH oldalán könnyedén ide-oda lavírozhatsz a fájlok és adatok között, mert egy nyamvadt hivatkozás sincs az oldalban, de elég csak az URL-t figyelni, hogy a 20-a átírjuk 19-re, és máris egy évvel korábban vagyunk.

Ha elővesszük a 2019 júliusára vonatkozó közlést – ami természetesen jelenleg is elérhető a KSH honlapján –, akkor azt találjuk, hogy:

2019. július havi halálozási adatok
2019. július havi halálozási adatok

Vagyis látjuk, hogy ott szó sincs 10050 halálesetről, hanem egészen pontosan 9854 haláleset volt (és van közölve), és a hivatalos, erről szóló aloldalon még mindig annyi van feltüntetve, viszont egy évvel később meg az van mondva, hogy 10050 elhunyt volt.

Most akkor mennyi is az annyi?

Az adatok eltérésével kapcsolatban kérdést tettem fel a KSH-nak – az oldalon fellelhető publikus email címen:

– Ez egy számolási hiba vagy elírás a honlapon?

– Mi az eljárás számolási vagy „sajtóhiba” esetén a publikált adatoknál?

UPDATE!

A cikk megjelenése után 5 nappal, 2020. szeptember 9-én választ kaptam a KSH-tól:

Tisztelt Vidi Rita!

A népmozgalmi gyorstájékoztatókban közzétett halálozási adatokkal kapcsolatban a következőkről szeretném Önt tájékoztatni.

A 2020. augusztus 25-én megjelent gyorstájékoztatóban a 2020. évi előzetes júliusi halálozási adatot (9 436 fő) hasonlítottuk a 2019. júliusi végleges adathoz (10 050 fő). Az Ön által hivatkozott, 2019. szeptember 26-án publikált gyorstájékoztatóban szereplő júliusi adat a megjelenéskor még előzetes adat volt, amely azóta véglegesítésre került. A végleges 2019. évi havi népmozgalmi adatok az alábbi linken található STADAT-táblában érhetők el:

https://www.ksh.hu/docs/hun/xstadat/xstadat_evkozi/e_wdsd001a.html

Ezek alapján a 2020. augusztus 25-én megjelent gyorstájékoztatóban sem számolási, sem elírási hiba nem történt.

Szeretnénk felhívni a figyelmét, hogy a gyorstájékoztatóban megjelenő adatok mindig a legfrissebb rendelkezésre álló adatok alapján kerülnek összeállításra.

A továbbiakban is állunk rendelkezésére!

Üdvözlettel: 

Tovább keresgélve azt találtam, hogy

az eddigi összes utólagos adatközlés eltér az eredeti közléstől. Pedig az utólagos közlések referenciaként szerepelnek.

Ami önmagában talán még nem lenne gond, de ha lehet ilyet mondani, állampolgárként még a sajtótól is elvárom a felelős adatközlést (oké, én túlságosan igényes vagyok), de a KSH-tól már úgy gondolom, jogos alappal várom, hogy az adatok mind a közléskor, mind egy évvel, vagy több évvel később is stimmeljenek, legalább EGYMÁSSAL.

Nem azt várom el, hogy a közölt adatok tökéletesen pontosak legyenek a közlés pillanatában, mert számtalan hiba van a folyamatban, de az szerintem elvárható, hogy ha mondok valamit 2019-ben, majd visszautalok rá referenciaként 2020-ban, pontosan egy évvel később, akkor ez a két adathalmaz passzoljon egymással!

A 2019 júliusáról szóló halálozási adatok 2019-es és 2020-as közlése közti számban 196 fős eltérés van. Ez több, mint amennyivel többen meghaltak – az idei közlés szerin – 2020 áprilisában, 2019 áprilisához képest. Vagy lehet, hogy az sem úgy volt?

Melyik adat az igazi adat? A 2019-es? A 2020-as? Egyik sem? Mindkettő is?

Ha a 2019-es adat az igaz, akkor a 2020-as oldalt kell javítani.

Ha a 2020-as adat az igaz, akkor a 2019-es oldalt kell javítani.

Ha egyik sem igaz, akkor minek tartjuk a KSH-t?

Ha mindkettő igaz, akkor szeretném látni, hogy melyik valóságban melyik az igaz, mert ezek szerint párhuzamos világok léteznek itt egymás mellett, szeretnék köztük eligazodni!

A 2019-es júliusi halálozási adatok 2019. szeptember 26-án kerültek a publikum elé, tehát 57 nappal az után, hogy lezárult a hónap. Érthető a csúszás, hiszen az adatok begyűjtéséhez, rendezgetéséhez, ellenőrzéséhez, publikálásához idő kell – bár idén már 25 nap is elég volt a közléshez, tehát gyorsul a rendszer –, de pont ezért nem érthető az, hogy egy évvel később más, utólag megváltozott adatok vannak kommunikálva, ráadásul referenciaként hivatkozva rájuk, ezekhez viszonyítva még százalékos eltéréseket is kommunikálva, a látszólagos könnyebb érthetőség kedvéért. (Ezeknek utána se számoltam, már így is zsong a fejem, lehet, hogy a százalékos adatok sem stimmelnek?)

Ha valahol hiba történt, vagy esetleg utólag érkeztek be a 2019 júliusára vonatkozó adatok – ez volt az első, önmegnyugtató gondolatom egyébként –, akkor milyen adatok tudtak beérkezni még 2019. szeptember 25-e után? Akkor derült ki, hogy meghalt még 196 ember júliusban? Akkor kerültek elő az Elektronikus Anyakönyvi Rendszerben az adatok? 57 nap után? Ez nem tűnik reálisnak, de nyilván lehetetlennek sem.

De ha mégis ez történt, akkor az eredeti linken miért nincs utalás a számok változására? (A születési és házasságkötési adatokról már nem is beszélek, azok ügyében még lehet kutatgatni.) Az eurostat oldalán például ott van, hogy mikor készült a fájl, ki készítette, utoljára mikor módosították. Azt sem ördöngösség odafűzni, hogy „Ez volt a módosítás oka: utólag beérkezett adatok.”

Hiszen ezek a közzétevő aloldalak a havi adatokról, egyszerűen szerkeszthető html oldalak, és ha utólag van eltérés, vagy új adat kerül a látókörünkbe, akkor azt is megtehetjük, hogy minden átmenet nélkül javítjuk ezeket, de azt is megtehetjük, hogy a pluszként bekerült adatokat külön kiemeljük, jelezzük, látványosan hozzáadjuk vagy épp kivonjuk. Ezek nem gránit vagy gyémánt keménységű felületek, ezek olyanok, mint amiket éppen most pötyögök a Word-be, csak épp az Interneten.

Ezek után már kíváncsi voltam a teljes képre.

2017 januárjáig vezettem vissza az adatokat, és ha a megjelent adatokat egy évvel későbbi tájékoztatásban is felhasználták viszonyítási pontként, akkor azt kigyűjtöttem.

Az én gondolatom az volt, hogy utólag beérkező adatok nem lettek visszamenőleg felvezetve, és ha utólag kerültek elő még elhunytak a bürokráciában, azok jelentek meg ilyen formán, mint ahogy a 2019 júliusi és 2020 júliusi adatok összevetésénél láttuk, hogy visszamenőleg több lett az elhunyt.

Kiderült, hogy szinte mindig több a halott UTÓLAG, egy évvel később.

De nem mindig.

2018 júniusában 9839 halott volt a 2018-as közlés szerint. 2019 júniusában viszont azt közölték 2018 júliusáról, hogy 9518-an haltak meg, tehát kivételesen nem többen, hanem kevesebben, méghozzá 321 fővel. Ez azért érdekes, mert az elképzelhető, hogy utólag kerülnek be adatok elhunytakról, de az, hogy 321 emberről derüljön ki utólag, hogy mégsem haltak meg, az elképzelhetetlen. 321 fő még ebben a KSH adathalmazban is elég nagy szám.

Ugyanez a tendencia a 2018 decemberi halálozási adatokról szóló utánközlésnél jelenik még meg, utólag 40 elhunyttal kevesebbet „regisztráltak”(?) visszamenőleg – de ezt persze én teszem hozzá, hogy visszamenőleg, mert ilyesmiről, a dolgok működésének mikéntjéről a KSH-tól nem igazán tudunk meg semmit.

Mivel ez a fajta eltérés csak két esetben fordult elő, még az is lehet, hogy ez hiba a hibában… De ez nem olyan, mint az “ellenségem ellensége a barátom” elv, mert a statisztikában a hibák hibára halmozása a végén nem hoz ki jó eredményt.

De itt is az merül fel kérdésként:

– Ha hiba van a rendszerben, akkor miért nincs utólagos adatkorrekció?

– Ha van utólagos adatkorrekció – amit esetleg egy évvel később már helyesen közölnek -, akkor az adott hónapról szóló hivatalos közlésnél ez miért nem jelenik meg? Miért nincs erre utólag hivatkozás?

Nem azt várjuk el egy statisztikai hivataltól, hogy tévedhetetlen legyen, hanem azt, hogy a hozzáférhető adatokat nagy bizalommal lehessen felhasználni.

Íme, az eltérések táblázatban

Elnézést a fapados kivitelért, ebből dolgoztam, eredetileg nem azért csináltam, hogy közzétegyem, aztán végül ez maradt a leghasználhatóbb verzió az összevetéshez, és így ezt is teszem közzé, amiből én magam dolgoztam:

KSH halálozási adatok táblázat a számoláshoz
KSH halálozási adatok táblázat a számoláshoz

Olyan cikket akartam írni, ami arról szól, hogy ne engedjünk a sajtó pánikkeltésének, nyugalom, itt van a KSH, azok az adatok a jók. Hát nem sikerült a tervem.

És van itt még valami: az eltérések mintázata és terjedelme.

Látszik, hogy a korábbi években nagyobb volt a kilengés, és az eltérések terjedelme óriási volt a 2017-es évre vonatkozó, hozzáférhető adatoknál (33-tól 805-ig), és ez 2019-re  elég szépen lecsökkent, de a 2018-2019 relációban meg ugyebár a másik irányba is kilengés volt (tehát itt a terjedelem -321-től 338-ig terjed). Jelenleg már laposodik ez a görbe, hogy idei, szintén közkedvelt kifejezéssel éljek…

Ugyanakkor 3.5 év adatait átnézve jelenleg 5172 főt érintő adat nem stimmel. Ha így folytatjuk, ez év végéig növekedni fog – de erre majd csak jövő ilyenkor lesz rálátásunk. De nem lehetne addig valami tenni, hogy pontosak legyenek az adatok?

A személyes következtetésem az, hogy egyrészt megingott a bizalmam az egyetlen még hitelesnek tartott adatgyűjtő, elemző és adatközlő szervvel kapcsolatban, de hát ez legyen az én bajom, majd legfeljebb most már semmit nem mondok a KSH adatok megbízhatóságáról az aggódó ismerősöknek…

Ami egy másik vetülete a dolognak, az az, hogy abban az időszakban, amikor ennyire a számok uralják az életünket, és ennyire rá vagyunk tapadva immáron 6 hónapja a napi fertőzési-halálozási adatokra, számokkal kelünk, arányokkal fekszünk, amiket aztán utólag senki nem követ vissza, hogy valaha igazak voltak-e, akkor mégis mennyire alapozhatunk döntéseket ezekre a számokra?

Miben bízhatunk, ha az egyetlen még valóságosnak és tényszerűnek tartott számokban már nem tudunk?

Kiknek van igazuk vajon?

Azoknak, akik eltávolítják magukat ezektől, és ha nem is lehet őket vírustagadóknak tekinteni, de a „hiszem ha már tényleg a saját szememmel látom” elv alapján szemlélik az eseményeket?

Vagy azoknak, akik mindent elhisznek a sajtónak, az orvosoknak, a hivataloknak akkor is, ha azok rossz adatokból dolgoznak, és rossz adatokat idéznek és rossz adatokat hivatkoznak keresztbe egymással? (Bocsánat: rossz=megbízhatatlan.)

Azért szeretem az adatokat, mert hiszek abban, hogy az ismeretükkel okosabbak, bölcsebbek lehetünk, jobb döntéseket hozhatunk. Most olyasfajta bölcsességre leltem, amit nem kívántam volna magamnak:

még inkább magamra vagyok utalva, mint azt gondoltam, és pláne akartam volna. És ezzel nem vagyok egyedül.

És bár a közhiedelemmel ellentétben Churchill sosem mondta azt, hogy „Csak annak a statisztikának hiszek, amit én magam hamisítok.”, de úgy tűnik, elért bennünket ez a világ.

Vidi Rita

Ui: Lehetséges, hogy tele van elütésekkel és számolási hibával a cikkem, ha valaki ilyesmit észlelne, akkor szóljon, természetesen javítom. Fontos, hogy korrekt adatokat lehessen találni az Interneten, ez nem megy mindig első nekifutásra. De, hogy soha ne stimmeljen végül egy adat sem? Az nem véletlen. És szeretném tudni ennek a nemvéletlennek az okát. Ezért írtam meg ezt a cikket, hogy folyjon erről párbeszéd, és legyenek válaszok.

Utóirat az UPDATE-hez:

A KSH fentebb beidézett válasza alapján tehát arra jutottam, hogy folyamatosan elérhetőek a linkeken a nem végleges adatok, ezekben a pillanatokban is folyamatosan születnek a nem végleges adatok, továbbá heteket töltenek nem végleges adatok összeállításával és publikálásával, majd aztán egy táblázat egy rubrikájában majd egyszer megjelenik a végleges szám, aminek a linkjét most már elmentem, és azt figyelgetem. És nincs több kérdésem.

Linkek, amiket felhasználtam:

https://www.ksh.hu/docs/hun/xftp/gyor/nep/nep2001.html
https://www.ksh.hu/docs/hun/xftp/gyor/nep/nep2002.html
https://www.ksh.hu/docs/hun/xftp/gyor/nep/nep2003.html
https://www.ksh.hu/docs/hun/xftp/gyor/nep/nep2004.html
https://www.ksh.hu/docs/hun/xftp/gyor/nep/nep2005.html
https://www.ksh.hu/docs/hun/xftp/gyor/nep/nep2006.html
https://www.ksh.hu/docs/hun/xftp/gyor/nep/nep2007.html

https://www.ksh.hu/docs/hun/xftp/gyor/nep/nep1901.html
https://www.ksh.hu/docs/hun/xftp/gyor/nep/nep1902.html
https://www.ksh.hu/docs/hun/xftp/gyor/nep/nep1903.html
https://www.ksh.hu/docs/hun/xftp/gyor/nep/nep1904.html
https://www.ksh.hu/docs/hun/xftp/gyor/nep/nep1905.html
https://www.ksh.hu/docs/hun/xftp/gyor/nep/nep1906.html
https://www.ksh.hu/docs/hun/xftp/gyor/nep/nep1907.html
https://www.ksh.hu/docs/hun/xftp/gyor/nep/nep1908.html
https://www.ksh.hu/docs/hun/xftp/gyor/nep/nep1909.html
https://www.ksh.hu/docs/hun/xftp/gyor/nep/nep1910.html
https://www.ksh.hu/docs/hun/xftp/gyor/nep/nep1911.html
https://www.ksh.hu/docs/hun/xftp/gyor/nep/nep1912.html

https://www.ksh.hu/docs/hun/xftp/gyor/nep/nep1801.html
https://www.ksh.hu/docs/hun/xftp/gyor/nep/nep1802.html
https://www.ksh.hu/docs/hun/xftp/gyor/nep/nep1803.html
https://www.ksh.hu/docs/hun/xftp/gyor/nep/nep1804.html
https://www.ksh.hu/docs/hun/xftp/gyor/nep/nep1805.html
https://www.ksh.hu/docs/hun/xftp/gyor/nep/nep1806.html
https://www.ksh.hu/docs/hun/xftp/gyor/nep/nep1807.html
https://www.ksh.hu/docs/hun/xftp/gyor/nep/nep1808.html
https://www.ksh.hu/docs/hun/xftp/gyor/nep/nep1809.html
https://www.ksh.hu/docs/hun/xftp/gyor/nep/nep1810.html
https://www.ksh.hu/docs/hun/xftp/gyor/nep/nep1811.html
https://www.ksh.hu/docs/hun/xftp/gyor/nep/nep1812.html

Rita Vidi
Rita Vidi
Vidi Rita író, gondolkodásmód tanácsadó, időgazdálkodás szakértő, és még sok minden más is :).
https://jovomenok.com

Vélemény, hozzászólás?