Tér és Társadalom 21. évf. 2007/1. 53-67. p. Tér és Társadalom XXI. évf. 2007 • 1: 53-67 MARKOV LÁNCOK HASZNÁLATA A REGIONÁLIS JÖVEDELEMEGYENLŐTLENSÉGEK ELŐREJELZÉSÉBEN1 (Forecasting Regional Income Inequalities Based on Markov Models) MAJOR KLÁRA Kulcsszavak: területi jövedelemegyenl őtlenségek Markov láncok Mover—Stayer modell A jövedelemegyenl őtlenségek változásának vizsgálatára használt módszertanok egyike a Markov láncok modelljének illesztése. A Markov modell azonban túlbecsüli a hosszú távú mobilitást, ezért hosszabb távú felzárkóz,ási folyamatok eló'rejelzésére nem alkalmas. A Mover—Stayer modell, mint a Markov modell álta- lánosítása allcalmas arra, hogy jelent sen javítson az alapmodell hosszú távú el őrejelzési képességén. ő A tanulmányban Frydman (1984) módszertanát alkalmazva numerikus úton kiszámítottuk mind az alap Markov modell, mind a Mover—Stayer modellek paramétereit a magyarországi kistérségek jövedelmi adatai esetében. A két modell összehasonlításával megállapíthatjuk, hogy a Mover—Stayer modellb ől következ ő hosszú távú mobilitás közel hasonló lett a megfigyelt értékhez. A Mover—Stayer modell jobb illeszkedését likelihood-arány teszt alkalmazásával vizsgáltuk. Bevezetés Az országok, régiók, területegységek gazdagságának, szegénységének kérdése régóta a közgazdaságtan alapkérdései közé tartozik. A relatív jövedelmi pozíciók magyarázatára, változásának el őrejelzésére több különböz ő megközelítés, modelle- zési gyakorlat, tudományos irány született. A kilencvenes években kiteljesedett, ún. konvergencia vita ehhez az ághoz az empirikus módszertan hihetetlen felfutásával járult hozzá. Ez volt az az évtized, amelyben a Penn World Table adatbázisra építve a kutatók egyre intenzívebben foglalkoztak azzal a kérdéssel, hogy empirikus ala- pokon prognosztizálják a világméretű jövedelmi különbségek változásának tenden- ciáját. Ebben az igen termékeny évtizedben több régi, „elfeledett" modellcsalád is újra feléledt és számos esetben alkalmazásra került. Ebbe a sorba tehetjük a jövede- lem-eloszlások változásának el őrejelzésére alkalmas Markov-modellek családját is, amelyet a kérdéses kutatási iránytól függetlenül is el őszeretettel alkalmaznak a szociológiai kutatásokban a társadalmi státuszban végbemen ő generációs mobilitá- sok vizsgálatára, vagy például a munkapiaci folyamatok leírása során a munkapiaci státusz változásának modellezésére. A jövedelmi különbségek vizsgálatára történ ő felelevenítése els őként talán Quah nevéhez fűzhető. 1993-as tanulmányában (Quah 1993) az európai régiók egy főre jutó jövedelmének eloszlásában végbement változás vizsgálatára alkalmazta a Major Klára : Markov láncok használata a regionális jövedelemegyenlőtlenségek előrejelzésében. Tér és Társadalom 21. évf. 2007/1. 53-67. p. 54 Major Klára TÉT XXI. évf. 2007 • 1 Markov láncok modelljét. Az alkalmazás során talált empirikus eredményei hasonlóak voltak a társadalomtudományok más területein is talált eredményekhez: magasfokú perzisztencia, igen alacsony jövedelmi mobilitás. Mindemellett Quah már ebben a cikkében is megemlíti, hogy a Markov láncok modellje túlzott mérték ű leegyszerű- sítés abban az értelemben, hogy a hosszú távú mobilitást szisztematikusan felülbe- csüli, amely általánosan megfigyelhet ő a modell társadalomtudományi alkalmazásai során. Ezek az észrevételek azonban nem újkeletüek, a már említett szociológiai alkalmazásokban már mintegy két évtizeddel korábban is feljegyezték őket (pl. Spilerman 1978 vagy Singer—Spilerman 1976). Ennek ellenére a Markov modell — talán egyszer űségénél, könnyen interpretálha- tóságánál fogva — megőrizte népszerűségét és mind a mai napig számtalan publiká- cióban képezi a jövedelmi dinamikai vizsgálatok alapját (Id. például leGallo 2001 műhelytanulmányát). Bickenback és Bode 2001-es műhelytanulmányában ezért kifejezetten azt a kérdést vizsgálja, hogy mennyire alkalmas a Markov modell ezen területi jövedelmi folyamatok leírására. Az USA államainak adatain végzett empiri- kus vizsgálatai során nem csak a Markov modell paramétereinek számszer űsítését végezték el, de tesztelték ezek szignifikanciáját is. Megállapításaik szerint az ada- tokból nyerhető becslések nem felelnek a modell feltevéseinek2, azaz a Markov modellek illesztése téves következtetések levonásához vezethet. Ahogyan a probléma, úgy néhány megoldási út is ismert volt. Az alap-Markov modell (hívjuk a továbbiakban így a Markov láncok modelljét) általánosításai, b ővíté- sei alkalmasak arra, hogy kezeljék ezt a problémát. Többféle úton is el lehet indulni az általánosítás felé, akár az id őtől függő átmenetek bevezetésével vagy heterogén popu- láció feltevésével. A jelen tanulmányban az utóbbi úton kívánunk egy lehetséges alkalmazást bemutatni. A legegyszer űbb, heterogén populációra épül ő Markov mo- dell általánosítás talán az ún. Mover—Stayer modell, amelyben a populációt mindössze két alcsoportra bontjuk: a mozgólcra (mover), illetve maradók (stayer). A modell így az alap Markov modell általánosításának tekinthet ő, hiszen a mozgók csoportjának jövedelmi dinamikáját egy hagyományos Markov lánc modell írja le, míg a maradók jövedelmi dinamikáját pedig egy igen speciális Markov lánc modell, az egész populá- cióban megfigyelt mobilitás pedig a két részfolyamat összegeként áll el ő. Mivel a területi jövedelmi folyamatokat igen magas perzisztencia, alacsony mobili- tás és rövid (10-30 év alatt nem számottev ő) jövedelmi változások jellemzik, ezért feltehető, hogy a Mover—Stayer modell jobban illeszkedik a megfigyelt változásokra, és így várhatóan pontosabb becslést ad a hosszabb távú mobilitásra. Jelen tanulmányban az a célunk, hogy ezt megmutassuk Magyarország kistérségeinek jövedelmi adatain. A tanulmány felépítse a következ ő. Az első fejezetben röviden összefoglaljuk a Markov és a Mover—Stayer modellek alapvet ő koncepcióját és becslésének kérdéseit. A második fejezetben bemutatjuk mindkét modell becsléséb ől kapott értékeket, kivetítjük ezeket a minta teljes hosszára (13 év). A Mover—Stayer statisztikai érte- lemben vett jobb illeszkedését likelihood-arány teszttel mérjük a második alfejezet- ben. A tanulmányt az összefoglalás fejezi be. Major Klára : Markov láncok használata a regionális jövedelemegyenlőtlenségek előrejelzésében. Tér és Társadalom 21. évf. 2007/1. 53-67. p. TÉT XXI. évf. 2007 • 1 Markov láncok használata a ... 55 Elméleti alapok A tanulmány els ő felében összefoglaljuk az alap-Markov modell és a Mover— Stayer modell leírását és becslési technikáit. A kifejtés során els ősorban arra fogunk törekedni, hogy az egy lépéses átmenetekb ől hogyan kapunk több lépéses átmene- tet, mivel vizsgálatunk célja a modellek hosszú távú el őrejelzési képességének tesztelése lesz. A Markov láncok alapmodellje és az átmenetmobilitás Tegyük fel, hogy a vizsgálati egységek egyes jövedelmeit besoroltuk jövedelmi kategóriákba, azaz véges számú állapot valamelyikébe. Az állapotok számát már el ő re meghatároztuk, a továbbiakban jelöljük ezt J-vel. A Markov lánc modellje szerint egy vizsgálati egység (itt: kistérség) jöv őbeni jö- vedelmi pozícióját jelen pozíciója (állapota) és a változás valószín űsége határozza meg. Ez utóbbi kizárólag az állapotok függvénye. Ez azt jelenti, hogy a jöv őben várható állapot nem függ egyéb tényez őktől, például attól, hogy az adott egység mióta tartózkodik a jelen állapotban, vagy milyen úton jutott el a jelen állapotba. Formálisan ezt az összefüggést az alábbiakban tudjuk felírni: Irt+1 = Irt M (1) ahol 74 jelöli a t-ik idő pontban az egyes elemek eloszlásvektorát, azaz elemei rendre annak valószín űséget adják meg, hogy az egyes egyedek milyen valószín ű- séggel találhatók az egyes állapotokban. Az M mátrix adja meg az átmenetvalószínűségek JxJ s mátrixát.3 - Az M mátrix elemeit az egyik állapotból a másik állapotba történ ő elmozdulás fel- tételes valószín űségeiként értelmezhetjük. A mátrix főátlója ennek megfelel ően a helyben maradás, azaz a nem mozgás valószín űséget mutatja. Ez az értelmezés segít megérteni, hogy miért alkalmas az alábbi mutató az általánosan vett mobilitás mérésére (Shorrocks 1978): J — trace(M) mobilitás(M)= J —1 (2) Ebben a kifejezésben trace(M) a mátrix nyomát, azaz főátlóiban szerepl ő elemei- nek összegét adja meg. A fentebb definiált mobilitási mutató értéke a gyakorlati alkalmazások esetében általában 0 és 1 közé esik, értéke minél kisebb, annál kisebb a vizsgált jelenség általános mobilitása. A Markov lánc modell empirikus becslésére maximum likelihood becslési techni- kát alkalmazunk, az egyes átmenetvalószín űségek becslőfüggvényét a relatív gya- koriságok számításával nyerjük (pl. Frydman 1984). Amennyiben több periódus alatti mobilitást szeretnénk vizsgálni, úgy az (1) alatti képlet iterálásával kapjuk, hogy T periódus alatt az eloszlás változását leíró össze- függés az M mátrix hatványaival adható meg: Z t+T =7Z.1117. (3) Major Klára : Markov láncok használata a regionális jövedelemegyenlőtlenségek előrejelzésében. Tér és Társadalom 21. évf. 2007/1. 53-67. p. 56 Major Klára TÉT XXI. évf. 2007 • 1 Amiből az is látható, hogy a több periódus alatt összességében megtett mobilitás az MT mátrix nyomának ismeretében számítható (2) képlet segítségével, formálisan: T J trace(M — ) mobilitás(M )= (4) J 1 — Miért lehet érdekes a több periódus alatti mobilitás, illetve annak becslése? A Markov modell becsléséhez szükséges adatok többnyire panel szerkezetűek, azaz több egyed több peridódusban megfigyelt állapotának táblázatszer ű (J x T+ I) el- rendezése. Ez számtalan információt tartalmaz. Többek között lehet ővé teszi azt, hogy egyfel ől az egymást követő periódusokban megfigyelt átmenetekb ől közvetve következtessünk a T időszak alatti összes mobilitásra ((3)-as képlet segítségével); másfel ől azt is, hogy az adatokból közvetlenül tegyük meg ezt, összehasonlítva a kiinduló időszak és a záró időszaki értékeket. A modell jóságának egyfajta kritéri- uma, hogy a két megközelítés mennyire vezet hasonló eredményekre. Más szavak- kal a mintából nyert becslés képes-e a mintán belüli folyamatok „el őrejelzésére". A jövedelmi folyamatok vizsgálata során, hasonlóképpen a szociológiai alkalma- zásokhoz, igen gyakori, hogy a fenti két megközelítés ellentmondó eredményekre vezet (pl. Quah 1993). Az ellentmondás oka a társadalmi-gazdasági folyamatok magas perzisztenciájában keresend ő. A modellezési gyakorlatban ennek kezelésére a Markov lánc alapmodell különböz ő kiterjesztéseit alkalmazzák, ezek közé sorol- ható a Mover—Stayer modell is. A Mover Stayer modell és becslése — A Mover—Stayer modell a Markov lánc modell kiterjesztése heterogén populáció esetére. Tegyük fel, hogy a vizsgálati egyedek nem egyformák jövedelmi mobilitá- suk szempontjából, azaz nem lehet mindegyikükre ugyanazt a Markov modellt illeszteni, nem lehet egyetlen „közös" M mátrixszal leírni mindegyikük várható jövedelmi pályáját. Az egyszerűség kedvéért tegyük fel, hogy a heterogén populá- ció valójában két, különböz ő típusú egyedb ől áll, egyikük mobilitását leírhatjuk egy szokásos Markov lánccal. Őket hívjuk mobiloknak (mover). A populáció többi egyede pedig feltevés szerint egyáltalán nem mobil, az ő jövedelmi pozíciójuk tehát változatlan. Őket hívjuk maradóknak (stayer). A modellezés problémája, hogy nem ismerjük az egyes egyedek típusát, nem tudjuk megmondani, hogy ki melyik kate- góriába tartozik. Amit ismerünk, az a teljes populáció által megvalósított jövedemi mobilitás, formálisan = S • / + (/ — S)M (5) mátrix, ahol M továbbra is a mobilis (rész)populáció Markov mátrixa, S a mara- dók arányát adja meg az egyes állapotokban (J x J diagonális mátrix), / pedig az egy- ségmátrix. Mivel nem ismerjük az egyes részpopulációk arányát, ezért (5) jobb olda- lán M és S is ismeretlen, egyedül Pi-et tudjuk megfigyelni, ami a teljes populáció által produkált jövedelmi átmenetvalószín űségeket tartalmazza. Az (5) képlet felírásából láthatjuk, hogy a modellt felfoghatjuk úgy is, amelyben a két részpopuláció Markov- Major Klára : Markov láncok használata a regionális jövedelemegyenlőtlenségek előrejelzésében. Tér és Társadalom 21. évf. 2007/1. 53-67. p. TÉT XXI. évf. 2007 • 1 Markov láncok használata a ... 57 mátrixa eltérő, a mozgóké M, a maradóké /, a megfigyelhet ő átmenetmártrix (13 1) pedig ezen két átmenetmátrix súlyozott átlaga. Több periódus alatti átmenetvalószín űségek kiszámításához az (5)-ös képlet alap- ján most a következőképpen gondolkodhatunk: mindkét részpopuláció átmenetvaló- színűségeit saját Markov-mátrixának hatványai írják le, így a teljes populáció meg- figyelhető, T+1 időszak alatti átrnenetmátrixát a PT = S + (I — S)MT (6) kifejezéssel kapjuk4. A Mover—Stayer modell becsléséhez szintén a maximum-likelihood eljárást al- kalmazzuk. Ennek alkalmazásakor azonban némileg nehezebb dolgunk van, mint a Markov láncok alapmodellje esetében, mert nem ismerjük, hogy az egyes egyedek melyik részpopulációhoz tartoznak, ezért nem tudjuk S és M mátrixokat közvetlenül a relatív gyakorisággal becsülni. A modell becsléséhez direkt és indirekt módszereket egyaránt kifejlesztettek, ezeket összegezzük röviden a következ ő alpontban. A Mover—Stayer modell becslési módszerei A Mover—Stayer modell log-likelihood-függvénye az alábbi (1d. pl . Frydman 1984): log L ni (0)log +log Li (7) i=1 ahol Thji=1 ..... a kezdeti id őpontbeli eloszlás, tzi(0) a kezdeti id őpontban a j álla- potban lév ő egyedek száma és log L = n log(si + — si )miTi )+ j (0) — n j)log(1 — s )+ —Tn j)log m jj +n jklogmj, ahol si és mTik az S és MT mátrixok megfelel ő elemei, ni azon egyek száma, ame- lyek mindvégig a j állapotban vannak, nik a jk átmenetek száma. A modell változóinak a likelihood ftiggvény alapján történ ő közvetlen meghatározása (Frydman 1984) A loglikelihood függvénynek a modellváltozók (si, mik) szerinti differenciálásával megkapjuk az elsőrendű feltételeket. Az ismeretlenek kifejezésével és a maradék egyenletekbe történ ő helyettesítésével végül egyismeretlenes egyenlethez jutunk, amelyből numerikus módszerekkel mii értéke méghatározható (külön, minden j-re). A numerikus rnódsZerek alkalmazása elkerülhetetlen: az mi; értékét meghatározó egyen- let T+/-ed fokú polinom, amelyr ől megmutatható, hogy pontosan egy gyöke esik 0 és 1 közé. Frydman útmutatásait követve beprogramoztuk a megoldóalgoritmust Matlab programmal és meghatároztuk a Mover—Stayer modell változóinak értékét. Major Klára : Markov láncok használata a regionális jövedelemegyenlőtlenségek előrejelzésében. Tér és Társadalom 21. évf. 2007/1. 53-67. p. 58 Major Klára TÉT XXI. évf. 2007 • 1 A modell változóinak EM algoritmussal történ ő meghatározása (Fuchs— Greenhouse 1988) A teljesség kedvéért megemlítjük, hogy Fuchs és Greenhouse szerz őpáros egy kö- zelítő algoritmust dolgozott ki a modell változóinak meghatározására. Az általuk kifejlesztett, ún. EM algoritmus alapgondolata szerint a becslési nehézséget az adja, hogy az adathalmaz hiányos: nem tartalmazza azt az információt, hogy az egyes egyedek melyik típusba tartoznak. Bontsuk tehát két lépésre a becslési eljárást, az ún. E-lépésben becsüljük meg a hiányzó adatokat, majd az M-lépésben e becslésre támaszkodva, azaz a plusz információk birtokában könny űszerrel becsülhet őek a modell paraméterei. Az M-lépést követ ően azonban újra kell számítani az E-lépést, hogy konzisztensek-e a kapott paraméterértékek a hiányzó adatokkal. Az algorit- must addig ismételjük, amíg konvergál. Az EM algoritmus el őnye a Frydman féle direkt technikához képest, hogy az egyes lépésekben megoldandó egyenletek mind lineárisak, így könnyebb programozni, és gyorsabb is lesz a kód. Az EM algoritmus további el őnye, hogy alkalmas a továbbfejlesztésre, ahogyan ezt a következ ő mód- szertani publikációból láthatjuk. Az EM algoritmus továbbfejlesztése kevert Markov-modellekre (Ftydman 2005) Kevert Markov lánc-modelleknek (Mixed Markov chains) nevezzük azokat a mo- delleket, ahol a részpopulációk száma nem feltétlen 2, ett ől különböző egész szám is lehet. Az egyes részpopulációk különböznek mobilitási sebességükben, ennek megfelelő en a mozgást leíró Markov mátrixukban. A modell becslése a Fuchs— Greenhouse által kifejlesztett EM algoritmus továbbfejlesztésén alapszik. Ennek részletes tárgyalásától most eltekintünk. Emprikus eredmények Az alábbiakban mind az alap-Markov modellre, mind a Mover—Stayer modellre közzétesszük a számítási eredményeket. Megmutatjuk, hogy az általunk végzett vizsgálat során a hosszabb távú mobilitás el őrejelzésében a Mover—Stayer modell szignifikánsan jobban illeszkedett az adatokra, mint az alap-Markov modell. Az adatbázis A vizsgálat során használt adatok Magyarország kistérségeinek (az új felosztás szerinti, 168 kistérségre vonatkozó) egy f őre jutó személyi jövedelemadó alapját képező adózás el őtti jövedelme képezte az 1990-2003 közötti id őszakban. A rendel- kezésre álló 14x168-as méret ű adattáblába rendezett adatok nem csak az átmenetek megfigyelését, de az egyes kistérségek jövedelmi pozíciójának nyomonkövetését is lehetővé teszik. Az egy főre jutó jövedelmeket az országos (súlyozott) átlag százalé- kában fejeztük ki, ezzel az adatok nagyságrendileg a (0,5; 1,6) intervallumba kerültek. Major Klára : Markov láncok használata a regionális jövedelemegyenlőtlenségek előrejelzésében. Tér és Társadalom 21. évf. 2007/1. 53-67. p. TÉT XXI. évf. 2007 • 1 Markov láncok használata a ... 59 A jövedelemeloszlás vizsgálatához kernel becslés módszerével megbecsültük az egy főre jutó relatív jövedelmek (folytonos) eloszlásfüggvényét (I. ábra). A jöve- delmek eloszlása a jelen alkalmazásban is közel log-normális alakú, bár lokális tulajdonságaiban jelentős változás következett be a vizsgálati periódusban (két- móduszúság). Ennek vizsgálata nem képezi jelen tanulmány tárgyát, ugyanakkor az egyértelműen elmondható, hogy a vizsgált periódusban polarizáció volt megfigyel- hető: csökkent az átlagoshoz hasonló, „közepes" jövedelm ű lcistérségek száma, és növekedett az átlaghoz képest magas vagy alacsony jövedelm ű kistérségek gyakori- sága. Mindezen fontos információk mellett a s űrűségfüggvény nem mond semmit az egyes kistérségek felzárkózási esélyeir ől, valamint a mobilitásról, ezért lépünk tovább Markov modell alkalmazása felé. 1. ÁBRA Az egy f őre jutó relatív jövedelmek kernel becslése A sávszélességi paraméter plug-in eljárással becsülve, értéke 1990-re: 0,739; 2003-ra: 0,0746. (Kernel Estimation of the Income Distribution) Forrás: Saját számítások. A kistérségeket ezt követ ően kellett jövedelmi kategóriákba sorolni, azaz az egyes relatív jövedelmi pozíciókat állapotoknak megfeleltetni. Ehhez a leíró statisztikákat hívtuk segítségül (1. táblázat). Major Klára : Markov láncok használata a regionális jövedelemegyenlőtlenségek előrejelzésében. Tér és Társadalom 21. évf. 2007/1. 53-67. p. 60 Major Klára TÉT XXI. évf. 2007 • 1 1. TÁBLÁZAT Az egy f őre jutó relatív jövedelmek leíró statisztikái Magyarország kistérségei esetében (Microregional Income Distribution in Hungary — Basic Statistics) 1990 2003 1990-2003 Minimum 0,50 0,43 0,39 1. kvartilis 0,71 0,65 0,66 2. kvartilis 0,82 0,77 0,78 3. kvartilis 0,94 0,97 0,96 Maximum 1,46 1,51 1,56 Variancia 0,03 0,05 0,04 Forrás: Saját szerkesztés. Az egyes években megfigyelt relatív jövedelmi pozíciók eloszlása nagyon hasonló volt, terjedelmük, szórásuk, különböz ő percentiliseik igen stabilnak mutatkoztak. Ezt mutatja szúrópróbaszer űen az els ő és utolsó évre az 1. táblázat. (Természetesen a minimum és maximum értékek ingadozhatnak.) Ezen jelent ős stabilitás miatt és a szakirodalomban bevett módszernek megfelel ően a jövedelmi kategóriák képzése során a kvartilisekb ő l indultunk ki, ezzel 4 jövedelmi kategóriát hoztunk létre. Annak érdekében, hogy egyik év se kapjon kitüntett szerepet a teljes minta (1990— 2003) alapján megállapított kvartilis-értékek képezték az osztályközöket (/. táblázat 4. oszlop), amelynek segítségével az egyes kistérségek jövedelmi állapotának meg- állapítása történt. A jövedelmi kategóriákba osztás révén jellemezni tudjuk a relatív jövedelmek területi megoszlását grafikusan is (2. ábra). Az országos térkép kiszínezéséhez most ritkán alkalmazott, némileg talán els őre bonyolultnak tűnő beosztást választottunk. Azon kis- térségeket, amelyek a vizsgált 14 éves id őszak alatt végig azonos kategóriában voltak tömör színnel, míg a pozíciót váltókat pöttyös háttérrel szineztük ki. Eközben igyekez- tünk az árnyalásnak is szerepet adni: minél sötétebb egy kistérség színe, annál nagyobb jövedelmi kategóriát jelöl. A 2. ábrán látható az eredmény. A térképbő l a magyarországi jövedelmek jól ismert térszerkezete t űnik elénk, a „globálisan", azaz országos méretekben megfigyelhet ő nyugat—kelet lejt ő. A nyuga- ti kistérségek általában sötétebb szín űek, a keleti országszélen pedig nem csak hogy nagyon világos, de tartósan ott ragadó kistérségeket találunk. Másrészt szembeötl ő a helybenmaradó kistérségek magas száma. Valójában ez az a tulajdonsága az adathalmaznak, amely már a kutatás elején is sugallja a Mover— Stayer modell alkalmazásának az igényét: számtalan olyan kistérség van, amelyek egyáltalán nem mutattak fel semmilyen mobilitást. Az alap-Markov modell eseté- ben ez csak egyféleképpen magyarázható: a helyben maradás valószín űségével, amely értékeket a Markov mátrix fő átlói tartalmaznak. 14 év, azaz 13 átmenet alatt a helyben maradás valószín űsége a főátlóban szerepl ő érték 13-ik hatványa, amely még 95%-os egylépéses helybenmaradás esetén is alig több mint 50%. Az adatok- Major Klára : Markov láncok használata a regionális jövedelemegyenlőtlenségek előrejelzésében. Tér és Társadalom 21. évf. 2007/1. 53-67. p. TÉT XXI. évf. 2007 • 1 Markov láncok használata a ... 61 ból ennél azonban sokkal magasabb 13 átmenet alatti helybenmaradási arány látható. Ezért a Markov és a Mover—Stayer modellek illesztésével és az illeszkedés jóságá- nak megvizsgálásával megbizonyosodhatunk sejtésünk helyességér ől. 2. ÁBRA Az egyes kistérségek jövedelmi állapotai 1990-2003 között (Changes in the Relative Income Positions of the Hungarian Microregions (1990-2003, Two-dimensional Categorisation) Jenedeirni rnObillt3S kiStirSéy Stsyer n 31.4 (363,1 143~1.1weeh ste1e4 3-4 h hale 3(21%) Mayer ...nen.. 2-4 between al aI es 2-3 Steyr h hete (8%) Moverpetween hales 1-3 31.3,34tween Az. 1.2 ...o.... 1: (91%) Jelmagyarázat: Tömör szín űek a maradok, satírozott hátterüek mozgók. A sötétebb szín magasabb jövedelmi kategóriát jelöl. Forrás: Saját számítások. Globális egyenlőtlenségek változása Az országos átlagjövedelem százalékában kifejezett egy f őre jutó jövedelmek alapján képzett jövedelmi kategóriák vizsgálatával képet nyerhetünk a globális egyenl őtlenségek változásáról. Itt a globális jelz őt országos viszonylatban kell ér- telmezni: amikor az egyes kistérségek alacsony vagy magas jövedelmét említjük ezt nem abszolút értékben, hanem az országos átlag százalékában kell érteni. Egy lépéses átmenetek Az alap Markov modell számításához mindössze a megfigyelt 13x168=2184 át- menetből kellett relatív gyakoriságot számítanunk. Ezeket az eredményeket tartal- mazza a 2. táblázat. Major Klára : Markov láncok használata a regionális jövedelemegyenlőtlenségek előrejelzésében. Tér és Társadalom 21. évf. 2007/1. 53-67. p. 62 Major Klára TÉT XXI. évf. 2007 • 1 2. TÁBLÁZAT Egy lépéses átmenetmátrix, mobilitási mutató = 15,51% (One-step Mobility Matrix, Mobility Index: 15,51%) 1 2 3 4 1 0,92 0,08 0,00 0,00 2 0,12 0,83 0,06 0,00 3 0,00 0,08 0,85 0,07 4 0,00 0,00 0,06 0,94 Forrás: Saját számítás. A Markov modell becslésével nyert egy lépéses átmenetvalószín űségek igen ha- sonlatosak a szakirodalomban található, más területegységekre, id őszakokra, állapottérfelosztásra készült átmenetmátrixokhoz. A jövedelmi folyamatokra egy- aránt jellemz ő , hogy a magas és alacsony jövedelmi kategóriákban a nem-mozgás valószínűsége magasabb, mint a közepes jövedelmi kategóriákban. Ezt a megfigye- lést a korábban a térkép kapcsán említett polarizációs jelenséggel lehet összefüg- gésbe hozni: a középs ő jövedelmi kategóriákban sokkal magasabb á megfigyelt jövedelmi mobilitás, mint a széls őséges állapotokban. Ennek lehet eredménye a közepes jövedelmi kategória „sz űkülése", amely a folytonos s űrűségfüggvény- becslésből annyira jól kivehet ő. Frydman (1984) módszertanát alkalmazva kiszámftottuk a Mover—Stayer modell ismeretlen együtthatóit, az S és M mátrixokat egyaránt. A becsült értékeket mutatja a 3. táblázat. A fentebb elmondottakon túlmen ően még azt is megállapíthatjuk, hogy a széls őséges jövedelmi kategóriákban kiemelked ően magas a maradók (stayerek) aránya, az I-es kategóriában egyenesen 92%. Az adattáblában 24 olyan kistérséget találtunk, amelyek mind a 13 év alatt végig az I-es kategóriában tartóz- kodtak. Ezen kistérségek 92%-át, azaz kb. 22-t lehet a maradók kategóriájába so- rolni! Ezen kistérségek esetében nem pusztán „véletlen" de strukturális tényez őkkel kell magyaráznunk a mobilitás elmaradását — még egy ilyen nagyon egyszer ű meg- közelítésben is, mint a Mover—Stayer modell, ahol a strukturális tényez ők explicit nem jelennek meg. A Mover—Stayer modell paramétereinek számításával (az alap-Markov modellhez képest) alternatív módon is kiszámítottuk az átmenet mátrixát és mobilitási mutató értékét. Láthatjuk, hogy egyikben sem hozott látványos változást a bonyolult mód- szertan alkalmazása, ami egyáltalán nem meglep ő. Az egy lépéses átmenetek ta- nulmányozására nincsen szükség ilyen kifinomult módszertan alkalmazására, a két modell közötti különbség els ősorban akkor látszik, amikor a hosszabb távú, jelen esetben mondjuk 13 éves mobilitás el őrejelzésére kívánjuk felhasználni őket. Major Klára : Markov láncok használata a regionális jövedelemegyenlőtlenségek előrejelzésében. Tér és Társadalom 21. évf. 2007/1. 53-67. p. TÉT XXI. évf. 2007 • 1 Markov láncok használata a ... 63 3. TÁBLÁZAT Mover-Stayer modell becslésének eredménye a magyarországi kistérségek relatív egy főre jutó jövedelmi pozíciói alapján, 1990-2003. (Mover-Stayer Mobility Estimation of the Microregional Incomes in Hungary, 1990-2003) Álla- Maradók Mozgók Markov mátrixa Megfigyelhet ő átmenet- pot aránya (S) (M) mátrix (P I) 1 0,92 0,83 0,17 0 0 0,99 0,01 0,00 0 2 0,08 0,13 0,81 0,06 0 0,12 0,82 0,06 0 3 0,21 0 0,11 0,79 0,10 0 0,09 0,83 0,08 4 0,57 0 0 0,13 0,87 0 0 0,06 0,94 Jelmagyarázat: Az utolsó négy oszlopban szerepelnek a megfigyelhet ő, az alap-Markov modellel köz- vetlenül összevethet ő átmenetvalószín űségek. Mobilitási mutató P1 mátrixra = 13,84%. Forrás: Saját szerkesztés. 13 éves átmenetvalószín űségek A 13 éves átmenetvalószín űségek számításával most a modellek hosszabb távú előrejelző képességét fogjuk „tesztelni". Természetesen nem szükséges mindenkép- pen 13 éves horizontot választani, ez azonban a jelen esetben igen praktikus: az adata- ink is pontosan ilyen hosszúságú intervallumra állnak rendelkezésre, így mérni tudjuk a modellek előrejelző képességét, ha összehasonlítjuk az általuk adott 13-éves mobili- tásra vonatkozó el őrejelzést azzal, amit magukból az adatokból nyerhetünk. A 13 éves átmenetvalószín űségek számításához a megbecsült modellb ől az alap- Markov modell esetében az átmenetmátrix hatványozásával (MT) jutunk el, míg a Mover-Stayer modell esetében a (6) képletben szerepl ő PT = S + (1 - S)A1 kife- jezést kell kiszámítanunk. A számítási eredményeket és az adatokból nyert közvet- len becslést tartalmazza a 4. táblázat. 4. TÁBLÁZAT 13 éves átmenetvalószín űségek a Markov modell, a Mover-Stayer modell alapján, valamint közvetlenül az adatokból becsülve (13 years Mobility Matrices on the Base of Markov-model, the Mover-Stayer Model and Direct Estimation) Adatokból közvetlenül Markov modell Mover-Stayer becsült, megfigyelt becslése (MT) becslése (PT) átmentek Álla- pot 1 2 3 4 I 2 3 4 1 2 3 4 1 0,59 0,30 0,09 0,03 0,95 0,04 0,01 0 1,00 0 0 0 2 0,45 0,31 0,15 0,09 0,30 0,46 0,15 0,08 0,42 0,49 0,09 0 3 0,19 0,22 0,28 0,31 0,15 0,24 0,42 0,19 0,02 0,31 0,46 0,21 4 0,06 0,11 0,27 0,56 0,04 0,10 0,14 0,72 0 0 0,16 0,84 Mobilitási m. = Mobilitási m. = Mobilitási m. = 75,40% 48,23% 40,35% Forrás: Saját szerkesztés. Major Klára : Markov láncok használata a regionális jövedelemegyenlőtlenségek előrejelzésében. Tér és Társadalom 21. évf. 2007/1. 53-67. p. 64 Major Klára TÉT XXI. évf. 2007 • 1 A 13 éves horizontra számított mobilitás mindkét modell esetében magasabb, mint az empirikusan megfigyelt érték, a „túlbecslés" mértéke azonban jelent ősen különbözik! Míg a Markov modell esetében a becsült 13 éves mobilitási mutató értéke 75%, addíg a Mover—Stayer modell esetében csak 48%. Ez utóbbi lényege- sen közelebb van az empirikusan megfigyelhet ő 40%-os értékhez, mint az el őző. További lényeges különbség, hogy az empirikus 13-Iépéses átmenetmátrixnak számtalan zérus értéke van: ezek olyan átmeneteket mutatnak, amelyekre nem volt példa a mintában. Például nem volt egyetlen olyan kistérség sem, amelyik a 13 év alatt az 1-es kategóriából a 3-as kategóriába került volna. Ennek valószín űsége a Markov modell alapján azonban 9%-ra tehet ő, míg a Mover—Stayer modell eseté- ben 1%. Másként is megfogalmazhatjuk ugyanezt a különbséget: az empirikus átmenetmátrix fő átlóinak értékeit az alap-Markov modell szisztematikusan és jelen- tő sen alulbecsüli. Ez az alulbecslés azt jelenti, hogy míg a mintából közvetlenül megfigyelve 84% volt a relatív gyakorisága annak, hogy egy kistérség a legnagyobb jövedelmi kategóriából indulva (4) ott is marad, addig a Markov modell szerint ez pusztán 56%. Az alacsonyabb helybenmaradási valószín űség nagyobb mobilitást jelent, hiszen ha 13 év alatt mindössze 56% a helybenmaradás valószín űsége akkor 44% a mozgás, változás valószín űsége (szemben az empirikus 16%-kal). A táblázatból és a számokkal való játékból látszik: a Markov modell számottev ően felülbecsüli a hosszú távú mobilitást, és ehhez képest a Mover—Stayer modell felül- becslése kisebbnek látszik. Ahhoz persze, hogy a két modell el őrejelző képességé- ben lév ő különbségről egyértelmű kijelentést tudjunk tenni számszer űen is meg kell vizsgálnunk, hogy az eltérés jelent ős, azaz szignifikáns-e. Ezt méri a következ ő alpontban bemutatásra kerül ő illeszkedés jósága teszt. Az illeszkedés jósága A két modell illeszkedésének jóságát ún. likelihood-arány teszttel fogjuk mérni. A likelihood-arány teszt akkor alkalmas két modell jóságának összehasonlítására, ha az egyik modell a másik általánosításának tekinthet ő. Jelen esetben err ől van szó: a Mover—Stayer modell speciális esetének tekinthet ő a Markov modell, hiszen ha az S mátrix a zéró mátrix, akkor a Mover—Stayer modell alapegyenlete = S + (I-S)M = M alakban lesz felírható, azaz visszakapjuk a kiinduló Markov modell. Ezt az összefüggést nem csak formálisan lehet indokolni. A Mover—Stayer mo- dellben abból a feltevésb ő l indultunk ki, hogy a populáció heterogén, méghozzá két típusú egyedb ő l áll: mozgókból és maradókból. Amennyiben a maradók aránya minden állapotban zérus (S=0), akkor az azt jelenti, hogy a populációban csak egyféle egyed van, és mindegyik egyed mozgását egy Markov mátrixszal lehet leírni, tehát visszakaptuk az alap-Markov modellt. A teszt elvégzéséhez mindkét modell likelihood függvényének értékét ki kell számítanunk. A Mover—Stayer modell esetében ezt már megmutattuk a (7) képlet alatt, a teljesség kedvéért azonban mindkét modell /oglikelihood függvény képletét Major Klára : Markov láncok használata a regionális jövedelemegyenlőtlenségek előrejelzésében. Tér és Társadalom 21. évf. 2007/1. 53-67. p. TÉT XXI. évf. 2007 III 1 Markov láncok használata a ... 65 felírjuk Frydman (1984) alapján. A Markov modell log-likelihood függvénye a korábbi jelölések felhasználásával n (0) n .k \ log L Markov =n (0)log + n log j=1 n j,k n ahol nj* a j-állapotba lépések összes számát jelenti az utolsó el őtti periódusig. A becsült paraméterek száma pedig (J —1)x J . A Mover—Stayer modell log- likelihood függvénye hasonlóan (n ( \ ni j log Lm„ ver-Siayer (0)log + (0) — n )log , + j=1 n \n n k0) +(n — Jn )log(rhii) ik log(th ik) j*Ic ahol n a vizsgálatban szerepl ő egyedek számát jelöli. A Mover—Stayer modell is- meretlen paramétereinek száma J2. Az általánosabb modell tehát pontosan J válto- zóval tartalmaz többet, mint az alap-Markov modell. A likelihood arány teszt alkalmazásakor azt nézzük, hogy a log-likelihood függ- vény értékében bekövetkez ő növekedés „megéri-e azt az áldozatot, amit a több becsülendő paraméter jelent". Ehhez vizsgálnunk kell a log-likelihood függvény értékében bekövetkez ő javulást, amit a specifikusról az általános modellre való áttéréssel nyerünk, azaz a tesztstatisztikát az LR = 2(log Lm„ ver Stayer log L Markov) - — kifejezésnek megfelel ően számítjuk. A tesztstatisztika aszimptotikusan X2 elosz- lást követ, az eloszlás szabadságfokát az általánosabb modell többletparamétereinek száma jelenti, ami a jelen alkalmazásban J. A modell paramétereinek számításával egyidej űleg kiszámítottuk az egyes modell log-likelihood függvényének értékeit is. A Markov modell log-likelihood értékére log Lmark„, = —1103,6 adódott, míg a Mover—Stayer modell esetében ennek értéke log Lm„„,_s,„„, = —830,2 . A tesztstatisztika értéke ennek megfelel ően LR=546,8, ami magasan szignitikáns, tekintettel arra, hogy a X2 eloszlás küszöbértéke 4 szabadságfog és 99,9%-os szignifikanciaszinten X02999 (4) = 18,5 . A teszt alkalmazásával megbi- zonyosodhattunk arról, hogy a két modell által adott hosszú távú el őrejelzés nem csak szemmel láthatóan tér el egymástól, hanem statisztikai értelemben is különböz ő. Egyúttal arról is bizonyosságot szerezhettünk, hogy a Mover—Stayer modell valóban annyival jobban illeszkedik az adatokhoz, hogy megéri az a többletráfordítás, amely a bonyolultabb modell megoldása, a több becsülend ő paraméter száma jelent. Major Klára : Markov láncok használata a regionális jövedelemegyenlőtlenségek előrejelzésében. Tér és Társadalom 21. évf. 2007/1. 53-67. p. 66 Major Klára TÉT XXI. évf. 2007 • 1 Összegzés, további kutatás irányok A jövedelemi különbségek kutatásának fontos ágát képezi a Markov modell- család. Ezen modellek illesztésével a kutatók közvetlenül az eloszlás változását vizsgálják, ennek sajátosságait igyekeznek feltárni. A társadalmi folyamatokban meglév ő magas perzisztencia, azaz alacsony jövedelmi mobilitás azonban a Markov lánc modellekhez képest bonyolultabb struktúrát igényel, „indokolatlan" illesztése téves következtetések levonásához vezet (magasabb mobilitás). A Markov lánc modell alapfeltevése szerint a vizsgált jövedelmi folyamat stacioner, ami talán értelmezhet ő úgy, hogy változás üteme időben állandó, független attól, hogy milyen az egyedek állapotok közötti eloszlása, az egyes állapotokban tartózkodás hossza. Mindezek feltehet ően túl erős feltevések a társadalmi folyamatok esetében. A jelen alkalmazásban empirikusan megmutattuk, hogy Mover—Stayer modell sta- tisztikai értelemben szignifikánsan jobban illeszkedik az adatokra, mint a Markov- lánc modell. Érthető en lassítja a jövedelmi dinamikát egy teljesen állandó, nem mozgó, helybenmaradó rész-populáció bevezetése. Mindezt azonban úgy teszi, hogy miközben a bonyolultabb struktúra jobban visszaadja a megfigyelési id őszak- ban tapasztalt hosszabb távú mobilitást, a rövid távú, azaz 1-1épéses átmenetek becslését is megközelítő en ugyanolyan pontossággal elvégzi. Mindazonáltal a Mover—Stayer modell továbblépésén is el kell gondolkodnunk. Valójában a populáció kettéosztása két alpopulációra igen önkényes lépés. Arra vonatkozóan sem találunk semmilyen megbízható döntési kritériumot, hogy az egyébként folytonos jövedelmi adatokat hogyan osszuk be diszkrét jövedelmi álla- potokba (kategóriákba). A kategóriák számának függvényében természetesen a Mover—Stayer modell becslési eredményei is változni fognak. Könnyen belátható, hogy amint növeljük a kategóriák számát, úgy csökken az egyes jövedelmi kategóriák terjedelme, emiatt értelemszer űen egyre csökkenni fog a maradók (stayerek) aránya az egyes kategóriákban. Természetesen létezik az a finomságú felosztás, amikor a maradók, mint alpopuláció egyszer űen eltűnik. A Mover—Stayer modell tehát várha- tóan igen érzékeny ezen paraméterére. Mindezek miatt a modellb ől levonható kvantatív eredményeket mindenképpen fenntartással kell kezelni (pl. maradók aránya az 1-es jövedelmi kategóriában). A modell kvalitatív tulajdonságai, a vizsgálat üzene- te azonban egyértelm ű : a jövedelmi dinamika vizsgálata során az alacsony hosszú távú mobilitást figyelembe kell venni és a modellstruktúra kiválasztása során az il- leszkedés jóságát feltételenül meg kell vizsgálni. A jelen alkalmazás kiterjesztése a kevert Markov modellek családjára (több alpopuláció) folyamatban van. Jegyzetek A tanulmány a „Jövedelmi differenciálódás szimulációs vizsgálata magyarországi kistérségek eseté- ben" c. OTKA-60771 sz. kutatás keretében készült, elhagzott a Regionális modellek c. konferencián. 2 A Markov modell alapfeltevését, azaz a vizsgált folyamat stacionaritását vetették el az alkalmazott khi- négyzet teszt segítségével. A stacionaritás feltevése alapvet ő, ennek hiányában a Markov modell nem illeszthet ő, illetve ha mégis, a becsl ő függvények mechanikus alkalmazása torzított becslésekhez vezet. Major Klára : Markov láncok használata a regionális jövedelemegyenlőtlenségek előrejelzésében. Tér és Társadalom 21. évf. 2007/1. 53-67. p. TÉT XXI. évf. 2007 • 1 Markov láncok használata a ... 67 3 A Markov láncok modell részleteiben nem járatos olvasónak javasoljuk Major, 2005 fejezetet, ahol az alapmodell részletesebb kifejtése található. 4 Felhasználtuk, hogy nyilván I T = I, másfel ől SI = SIT = S. Irodalom Bickenbach, F.—Bode, E. (2001) Markor or not Markov — this should be the question. Working Paper 1086, Kiel Institute of World Economics, Kiel. Frydman, H. (1984) Maximum likelihood estimation in the mover-stayer model. — Joumal of the Amercian Statistical Association. 79. 632-638. o. Frydman, H. (2005) Estimation in the mixture of markov chains moving with different speeds. — Journal of the American Statistical Association. 100. 1046-1053. o. Fuchs, C. — Greenhouse, J. B. (1988) The EM algorithm for maximum likelihood estimation in the mover-stayer model. — Biometrics. 44. 605-613. o. leGallo, J.L. (2001) Space-time analysis of gdp disparities among european regions: A markov chains approach. Technical Report 2001-06. Laboratoire d'Analyse et de Techniques Economiques, Bourgogne. Major K. (2005) Id őbeli átmenetek: a Markov láncok. — Nemes Nagy J. (szerk.) Regionális elemzési módszerek. ELTE Regionális Földrajzi Tanszék — MTA—ELTE Regionális Tudományi Kutatócsoport, Regionális Tudományi Tanulmányok. 11. 124-135. o. Quah, D.T. (1993) Empirical cross-section dynamics in economic growth. — European Economic Review. 37. 951-958. o. Shorrocks, A.F. (1978) The measurement of mobility. — Econometrica. 46. 1013-1024. o. Singer, B.—Spilerman, S. (1976) Some methodological issues in the analysis of longitudinal surveys. — Annals of Economic and Social Management. 5. 447-474. o. Spilerman, S. (1978) Extensions of the mover-stayer model. —American Joumal of Sociology. 78. 559-626. o. FORECASTING REGIONAL INCOME INEQUALITIES BASED ON MARKOV MODELS KLÁRA MAJOR It is known that the simple Markov model overpredicts the long run horizon mobility of the income distribution process. Dissolving the homogeneity assumption of the Markov model we can have better forecasts. One generalization of the Markov model, the Mover—Stayer model assumes heterogenous population: some units are moving according to a common Markov chain but there are some (unknown) units whose are not moving at all. They are called stayers. Based on Frydman, 1984 methodology we compute both the Markov and Mover—Stayer models for Hungarian micro-regions income data and find that the Mover—Stayer model fits better the regional relative income data than the simple Markov model. Using likelihood ratio test statistics we show that the difference is highly significant.