Tér és Társadalom 21. évf. 2007/1. 53-67. p.

Tér és Társadalom XXI. évf. 2007 • 1: 53-67

MARKOV LÁNCOK HASZNÁLATA A REGIONÁLIS
JÖVEDELEMEGYENLŐTLENSÉGEK
ELŐREJELZÉSÉBEN1
(Forecasting Regional Income Inequalities Based
on Markov Models)

MAJOR KLÁRA

Kulcsszavak:
területi jövedelemegyenl őtlenségek Markov láncok Mover—Stayer modell

A jövedelemegyenl őtlenségek változásának vizsgálatára használt módszertanok egyike a Markov láncok
modelljének illesztése. A Markov modell azonban túlbecsüli a hosszú távú mobilitást, ezért hosszabb távú
felzárkóz,ási folyamatok eló'rejelzésére nem alkalmas. A Mover—Stayer modell, mint a Markov modell álta-
lánosítása allcalmas arra, hogy jelent sen javítson az alapmodell hosszú távú el őrejelzési képességén.
ő
A tanulmányban Frydman (1984) módszertanát alkalmazva numerikus úton kiszámítottuk mind az alap
Markov modell, mind a Mover—Stayer modellek paramétereit a magyarországi kistérségek jövedelmi
adatai esetében. A két modell összehasonlításával megállapíthatjuk, hogy a Mover—Stayer modellb ől
következ ő hosszú távú mobilitás közel hasonló lett a megfigyelt értékhez. A Mover—Stayer modell jobb
illeszkedését likelihood-arány teszt alkalmazásával vizsgáltuk.

Bevezetés

Az országok, régiók, területegységek gazdagságának, szegénységének kérdése
régóta a közgazdaságtan alapkérdései közé tartozik. A relatív jövedelmi pozíciók
magyarázatára, változásának el őrejelzésére több különböz ő megközelítés, modelle-
zési gyakorlat, tudományos irány született. A kilencvenes években kiteljesedett, ún.
konvergencia vita ehhez az ághoz az empirikus módszertan hihetetlen felfutásával
járult hozzá. Ez volt az az évtized, amelyben a Penn World Table adatbázisra építve
a kutatók egyre intenzívebben foglalkoztak azzal a kérdéssel, hogy empirikus ala-
pokon prognosztizálják a világméretű jövedelmi különbségek változásának tenden-
ciáját. Ebben az igen termékeny évtizedben több régi, „elfeledett" modellcsalád is
újra feléledt és számos esetben alkalmazásra került. Ebbe a sorba tehetjük a jövede-
lem-eloszlások változásának el őrejelzésére alkalmas Markov-modellek családját is,
amelyet a kérdéses kutatási iránytól függetlenül is el őszeretettel alkalmaznak a
szociológiai kutatásokban a társadalmi státuszban végbemen ő generációs mobilitá-
sok vizsgálatára, vagy például a munkapiaci folyamatok leírása során a munkapiaci
státusz változásának modellezésére.
A jövedelmi különbségek vizsgálatára történ ő felelevenítése els őként talán Quah
nevéhez fűzhető. 1993-as tanulmányában (Quah 1993) az európai régiók egy főre
jutó jövedelmének eloszlásában végbement változás vizsgálatára alkalmazta a
Major Klára : Markov láncok használata a regionális jövedelemegyenlőtlenségek előrejelzésében.
Tér és Társadalom 21. évf. 2007/1. 53-67. p.

54 Major Klára TÉT XXI. évf. 2007 • 1

Markov láncok modelljét. Az alkalmazás során talált empirikus eredményei hasonlóak
voltak a társadalomtudományok más területein is talált eredményekhez: magasfokú
perzisztencia, igen alacsony jövedelmi mobilitás. Mindemellett Quah már ebben a
cikkében is megemlíti, hogy a Markov láncok modellje túlzott mérték ű leegyszerű-
sítés abban az értelemben, hogy a hosszú távú mobilitást szisztematikusan felülbe-
csüli, amely általánosan megfigyelhet ő a modell társadalomtudományi alkalmazásai
során. Ezek az észrevételek azonban nem újkeletüek, a már említett szociológiai
alkalmazásokban már mintegy két évtizeddel korábban is feljegyezték őket (pl.
Spilerman 1978 vagy Singer—Spilerman 1976).
Ennek ellenére a Markov modell — talán egyszer űségénél, könnyen interpretálha-
tóságánál fogva — megőrizte népszerűségét és mind a mai napig számtalan publiká-
cióban képezi a jövedelmi dinamikai vizsgálatok alapját (Id. például leGallo 2001
műhelytanulmányát). Bickenback és Bode 2001-es műhelytanulmányában ezért
kifejezetten azt a kérdést vizsgálja, hogy mennyire alkalmas a Markov modell ezen
területi jövedelmi folyamatok leírására. Az USA államainak adatain végzett empiri-
kus vizsgálatai során nem csak a Markov modell paramétereinek számszer űsítését
végezték el, de tesztelték ezek szignifikanciáját is. Megállapításaik szerint az ada-
tokból nyerhető becslések nem felelnek a modell feltevéseinek2, azaz a Markov
modellek illesztése téves következtetések levonásához vezethet.
Ahogyan a probléma, úgy néhány megoldási út is ismert volt. Az alap-Markov
modell (hívjuk a továbbiakban így a Markov láncok modelljét) általánosításai, b ővíté-
sei alkalmasak arra, hogy kezeljék ezt a problémát. Többféle úton is el lehet indulni az
általánosítás felé, akár az id őtől függő átmenetek bevezetésével vagy heterogén popu-
láció feltevésével. A jelen tanulmányban az utóbbi úton kívánunk egy lehetséges
alkalmazást bemutatni. A legegyszer űbb, heterogén populációra épül ő Markov mo-
dell általánosítás talán az ún. Mover—Stayer modell, amelyben a populációt mindössze
két alcsoportra bontjuk: a mozgólcra (mover), illetve maradók (stayer). A modell így
az alap Markov modell általánosításának tekinthet ő, hiszen a mozgók csoportjának
jövedelmi dinamikáját egy hagyományos Markov lánc modell írja le, míg a maradók
jövedelmi dinamikáját pedig egy igen speciális Markov lánc modell, az egész populá-
cióban megfigyelt mobilitás pedig a két részfolyamat összegeként áll el ő.
Mivel a területi jövedelmi folyamatokat igen magas perzisztencia, alacsony mobili-
tás és rövid (10-30 év alatt nem számottev ő) jövedelmi változások jellemzik, ezért
feltehető, hogy a Mover—Stayer modell jobban illeszkedik a megfigyelt változásokra,
és így várhatóan pontosabb becslést ad a hosszabb távú mobilitásra. Jelen tanulmányban
az a célunk, hogy ezt megmutassuk Magyarország kistérségeinek jövedelmi adatain.
A tanulmány felépítse a következ ő. Az első fejezetben röviden összefoglaljuk a
Markov és a Mover—Stayer modellek alapvet ő koncepcióját és becslésének kérdéseit.
A második fejezetben bemutatjuk mindkét modell becsléséb ől kapott értékeket,
kivetítjük ezeket a minta teljes hosszára (13 év). A Mover—Stayer statisztikai érte-
lemben vett jobb illeszkedését likelihood-arány teszttel mérjük a második alfejezet-
ben. A tanulmányt az összefoglalás fejezi be.
Major Klára : Markov láncok használata a regionális jövedelemegyenlőtlenségek előrejelzésében.
Tér és Társadalom 21. évf. 2007/1. 53-67. p.

TÉT XXI. évf. 2007 • 1 Markov láncok használata a ... 55

Elméleti alapok

A tanulmány els ő felében összefoglaljuk az alap-Markov modell és a Mover—
Stayer modell leírását és becslési technikáit. A kifejtés során els ősorban arra fogunk
törekedni, hogy az egy lépéses átmenetekb ől hogyan kapunk több lépéses átmene-
tet, mivel vizsgálatunk célja a modellek hosszú távú el őrejelzési képességének
tesztelése lesz.

A Markov láncok alapmodellje és az átmenetmobilitás

Tegyük fel, hogy a vizsgálati egységek egyes jövedelmeit besoroltuk jövedelmi
kategóriákba, azaz véges számú állapot valamelyikébe. Az állapotok számát már
el ő re meghatároztuk, a továbbiakban jelöljük ezt J-vel.
A Markov lánc modellje szerint egy vizsgálati egység (itt: kistérség) jöv őbeni jö-
vedelmi pozícióját jelen pozíciója (állapota) és a változás valószín űsége határozza
meg. Ez utóbbi kizárólag az állapotok függvénye. Ez azt jelenti, hogy a jöv őben
várható állapot nem függ egyéb tényez őktől, például attól, hogy az adott egység
mióta tartózkodik a jelen állapotban, vagy milyen úton jutott el a jelen állapotba.
Formálisan ezt az összefüggést az alábbiakban tudjuk felírni:
Irt+1 = Irt M (1)
ahol 74 jelöli a t-ik idő pontban az egyes elemek eloszlásvektorát, azaz elemei
rendre annak valószín űséget adják meg, hogy az egyes egyedek milyen valószín ű-
séggel találhatók az egyes állapotokban. Az M mátrix adja meg az
átmenetvalószínűségek JxJ s mátrixát.3
-

Az M mátrix elemeit az egyik állapotból a másik állapotba történ ő elmozdulás fel-
tételes valószín űségeiként értelmezhetjük. A mátrix főátlója ennek megfelel ően a
helyben maradás, azaz a nem mozgás valószín űséget mutatja. Ez az értelmezés
segít megérteni, hogy miért alkalmas az alábbi mutató az általánosan vett mobilitás
mérésére (Shorrocks 1978):
J — trace(M)
mobilitás(M)=
J —1 (2)
Ebben a kifejezésben trace(M) a mátrix nyomát, azaz főátlóiban szerepl ő elemei-
nek összegét adja meg. A fentebb definiált mobilitási mutató értéke a gyakorlati
alkalmazások esetében általában 0 és 1 közé esik, értéke minél kisebb, annál kisebb
a vizsgált jelenség általános mobilitása.
A Markov lánc modell empirikus becslésére maximum likelihood becslési techni-
kát alkalmazunk, az egyes átmenetvalószín űségek becslőfüggvényét a relatív gya-
koriságok számításával nyerjük (pl. Frydman 1984).
Amennyiben több periódus alatti mobilitást szeretnénk vizsgálni, úgy az (1) alatti
képlet iterálásával kapjuk, hogy T periódus alatt az eloszlás változását leíró össze-
függés az M mátrix hatványaival adható meg:
Z t+T =7Z.1117. (3)
Major Klára : Markov láncok használata a regionális jövedelemegyenlőtlenségek előrejelzésében.
Tér és Társadalom 21. évf. 2007/1. 53-67. p.
56 Major Klára TÉT XXI. évf. 2007 • 1

Amiből az is látható, hogy a több periódus alatt összességében megtett mobilitás
az MT mátrix nyomának ismeretében számítható (2) képlet segítségével, formálisan:
T J trace(M
— )

mobilitás(M )= (4)
J 1 —

Miért lehet érdekes a több periódus alatti mobilitás, illetve annak becslése? A
Markov modell becsléséhez szükséges adatok többnyire panel szerkezetűek, azaz
több egyed több peridódusban megfigyelt állapotának táblázatszer ű (J x T+ I) el-
rendezése. Ez számtalan információt tartalmaz. Többek között lehet ővé teszi azt,
hogy egyfel ől az egymást követő periódusokban megfigyelt átmenetekb ől közvetve
következtessünk a T időszak alatti összes mobilitásra ((3)-as képlet segítségével);
másfel ől azt is, hogy az adatokból közvetlenül tegyük meg ezt, összehasonlítva a
kiinduló időszak és a záró időszaki értékeket. A modell jóságának egyfajta kritéri-
uma, hogy a két megközelítés mennyire vezet hasonló eredményekre. Más szavak-
kal a mintából nyert becslés képes-e a mintán belüli folyamatok „el őrejelzésére".
A jövedelmi folyamatok vizsgálata során, hasonlóképpen a szociológiai alkalma-
zásokhoz, igen gyakori, hogy a fenti két megközelítés ellentmondó eredményekre
vezet (pl. Quah 1993). Az ellentmondás oka a társadalmi-gazdasági folyamatok
magas perzisztenciájában keresend ő. A modellezési gyakorlatban ennek kezelésére
a Markov lánc alapmodell különböz ő kiterjesztéseit alkalmazzák, ezek közé sorol-
ható a Mover—Stayer modell is.

A Mover Stayer modell és becslése
—

A Mover—Stayer modell a Markov lánc modell kiterjesztése heterogén populáció
esetére. Tegyük fel, hogy a vizsgálati egyedek nem egyformák jövedelmi mobilitá-
suk szempontjából, azaz nem lehet mindegyikükre ugyanazt a Markov modellt
illeszteni, nem lehet egyetlen „közös" M mátrixszal leírni mindegyikük várható
jövedelmi pályáját. Az egyszerűség kedvéért tegyük fel, hogy a heterogén populá-
ció valójában két, különböz ő típusú egyedb ől áll, egyikük mobilitását leírhatjuk egy
szokásos Markov lánccal. Őket hívjuk mobiloknak (mover). A populáció többi
egyede pedig feltevés szerint egyáltalán nem mobil, az ő jövedelmi pozíciójuk tehát
változatlan. Őket hívjuk maradóknak (stayer). A modellezés problémája, hogy nem
ismerjük az egyes egyedek típusát, nem tudjuk megmondani, hogy ki melyik kate-
góriába tartozik. Amit ismerünk, az a teljes populáció által megvalósított jövedemi
mobilitás, formálisan
= S • / + (/ — S)M (5)
mátrix, ahol M továbbra is a mobilis (rész)populáció Markov mátrixa, S a mara-
dók arányát adja meg az egyes állapotokban (J x J diagonális mátrix), / pedig az egy-
ségmátrix. Mivel nem ismerjük az egyes részpopulációk arányát, ezért (5) jobb olda-
lán M és S is ismeretlen, egyedül Pi-et tudjuk megfigyelni, ami a teljes populáció által
produkált jövedelmi átmenetvalószín űségeket tartalmazza. Az (5) képlet felírásából
láthatjuk, hogy a modellt felfoghatjuk úgy is, amelyben a két részpopuláció Markov-
Major Klára : Markov láncok használata a regionális jövedelemegyenlőtlenségek előrejelzésében.
Tér és Társadalom 21. évf. 2007/1. 53-67. p.

TÉT XXI. évf. 2007 • 1 Markov láncok használata a ... 57

mátrixa eltérő, a mozgóké M, a maradóké /, a megfigyelhet ő átmenetmártrix (13 1)
pedig ezen két átmenetmátrix súlyozott átlaga.
Több periódus alatti átmenetvalószín űségek kiszámításához az (5)-ös képlet alap-
ján most a következőképpen gondolkodhatunk: mindkét részpopuláció átmenetvaló-
színűségeit saját Markov-mátrixának hatványai írják le, így a teljes populáció meg-
figyelhető, T+1 időszak alatti átrnenetmátrixát a
PT = S + (I — S)MT (6)
kifejezéssel kapjuk4.
A Mover—Stayer modell becsléséhez szintén a maximum-likelihood eljárást al-
kalmazzuk. Ennek alkalmazásakor azonban némileg nehezebb dolgunk van, mint a
Markov láncok alapmodellje esetében, mert nem ismerjük, hogy az egyes egyedek
melyik részpopulációhoz tartoznak, ezért nem tudjuk S és M mátrixokat közvetlenül a
relatív gyakorisággal becsülni. A modell becsléséhez direkt és indirekt módszereket
egyaránt kifejlesztettek, ezeket összegezzük röviden a következ ő alpontban.

A Mover—Stayer modell becslési módszerei

A Mover—Stayer modell log-likelihood-függvénye az alábbi (1d. pl . Frydman
1984):

log L ni (0)log +log Li (7)
i=1
ahol Thji=1 ..... a kezdeti id őpontbeli eloszlás, tzi(0) a kezdeti id őpontban a j álla-
potban lév ő egyedek száma és
log L = n log(si + — si )miTi )+ j (0) — n j)log(1 — s )+
—Tn j)log m jj +n jklogmj,

ahol si és mTik az S és MT mátrixok megfelel ő elemei, ni azon egyek száma, ame-
lyek mindvégig a j állapotban vannak, nik a jk átmenetek száma.

A modell változóinak a likelihood ftiggvény alapján történ ő közvetlen meghatározása
(Frydman 1984)

A loglikelihood függvénynek a modellváltozók (si, mik) szerinti differenciálásával
megkapjuk az elsőrendű feltételeket. Az ismeretlenek kifejezésével és a maradék
egyenletekbe történ ő helyettesítésével végül egyismeretlenes egyenlethez jutunk,
amelyből numerikus módszerekkel mii értéke méghatározható (külön, minden j-re). A
numerikus rnódsZerek alkalmazása elkerülhetetlen: az mi; értékét meghatározó egyen-
let T+/-ed fokú polinom, amelyr ől megmutatható, hogy pontosan egy gyöke esik 0 és
1 közé. Frydman útmutatásait követve beprogramoztuk a megoldóalgoritmust Matlab
programmal és meghatároztuk a Mover—Stayer modell változóinak értékét.
Major Klára : Markov láncok használata a regionális jövedelemegyenlőtlenségek előrejelzésében.
Tér és Társadalom 21. évf. 2007/1. 53-67. p.

58 Major Klára TÉT XXI. évf. 2007 • 1

A modell változóinak EM algoritmussal történ ő meghatározása (Fuchs—
Greenhouse 1988)

A teljesség kedvéért megemlítjük, hogy Fuchs és Greenhouse szerz őpáros egy kö-
zelítő algoritmust dolgozott ki a modell változóinak meghatározására. Az általuk
kifejlesztett, ún. EM algoritmus alapgondolata szerint a becslési nehézséget az adja,
hogy az adathalmaz hiányos: nem tartalmazza azt az információt, hogy az egyes
egyedek melyik típusba tartoznak. Bontsuk tehát két lépésre a becslési eljárást, az
ún. E-lépésben becsüljük meg a hiányzó adatokat, majd az M-lépésben e becslésre
támaszkodva, azaz a plusz információk birtokában könny űszerrel becsülhet őek a
modell paraméterei. Az M-lépést követ ően azonban újra kell számítani az E-lépést,
hogy konzisztensek-e a kapott paraméterértékek a hiányzó adatokkal. Az algorit-
must addig ismételjük, amíg konvergál. Az EM algoritmus el őnye a Frydman féle
direkt technikához képest, hogy az egyes lépésekben megoldandó egyenletek mind
lineárisak, így könnyebb programozni, és gyorsabb is lesz a kód. Az EM algoritmus
további el őnye, hogy alkalmas a továbbfejlesztésre, ahogyan ezt a következ ő mód-
szertani publikációból láthatjuk.

Az EM algoritmus továbbfejlesztése kevert Markov-modellekre (Ftydman 2005)

Kevert Markov lánc-modelleknek (Mixed Markov chains) nevezzük azokat a mo-
delleket, ahol a részpopulációk száma nem feltétlen 2, ett ől különböző egész szám
is lehet. Az egyes részpopulációk különböznek mobilitási sebességükben, ennek
megfelelő en a mozgást leíró Markov mátrixukban. A modell becslése a Fuchs—
Greenhouse által kifejlesztett EM algoritmus továbbfejlesztésén alapszik. Ennek
részletes tárgyalásától most eltekintünk.

Emprikus eredmények

Az alábbiakban mind az alap-Markov modellre, mind a Mover—Stayer modellre
közzétesszük a számítási eredményeket. Megmutatjuk, hogy az általunk végzett
vizsgálat során a hosszabb távú mobilitás el őrejelzésében a Mover—Stayer modell
szignifikánsan jobban illeszkedett az adatokra, mint az alap-Markov modell.

Az adatbázis

A vizsgálat során használt adatok Magyarország kistérségeinek (az új felosztás
szerinti, 168 kistérségre vonatkozó) egy f őre jutó személyi jövedelemadó alapját
képező adózás el őtti jövedelme képezte az 1990-2003 közötti id őszakban. A rendel-
kezésre álló 14x168-as méret ű adattáblába rendezett adatok nem csak az átmenetek
megfigyelését, de az egyes kistérségek jövedelmi pozíciójának nyomonkövetését is
lehetővé teszik. Az egy főre jutó jövedelmeket az országos (súlyozott) átlag százalé-
kában fejeztük ki, ezzel az adatok nagyságrendileg a (0,5; 1,6) intervallumba kerültek.
Major Klára : Markov láncok használata a regionális jövedelemegyenlőtlenségek előrejelzésében.
Tér és Társadalom 21. évf. 2007/1. 53-67. p.

TÉT XXI. évf. 2007 • 1 Markov láncok használata a ... 59

A jövedelemeloszlás vizsgálatához kernel becslés módszerével megbecsültük az
egy főre jutó relatív jövedelmek (folytonos) eloszlásfüggvényét (I. ábra). A jöve-
delmek eloszlása a jelen alkalmazásban is közel log-normális alakú, bár lokális
tulajdonságaiban jelentős változás következett be a vizsgálati periódusban (két-
móduszúság). Ennek vizsgálata nem képezi jelen tanulmány tárgyát, ugyanakkor az
egyértelműen elmondható, hogy a vizsgált periódusban polarizáció volt megfigyel-
hető: csökkent az átlagoshoz hasonló, „közepes" jövedelm ű lcistérségek száma, és
növekedett az átlaghoz képest magas vagy alacsony jövedelm ű kistérségek gyakori-
sága. Mindezen fontos információk mellett a s űrűségfüggvény nem mond semmit
az egyes kistérségek felzárkózási esélyeir ől, valamint a mobilitásról, ezért lépünk
tovább Markov modell alkalmazása felé.
1. ÁBRA
Az egy f őre jutó relatív jövedelmek kernel becslése
A sávszélességi paraméter plug-in eljárással becsülve, értéke
1990-re: 0,739; 2003-ra: 0,0746.
(Kernel Estimation of the Income Distribution)

Forrás: Saját számítások.
A kistérségeket ezt követ ően kellett jövedelmi kategóriákba sorolni, azaz az egyes
relatív jövedelmi pozíciókat állapotoknak megfeleltetni. Ehhez a leíró statisztikákat
hívtuk segítségül (1. táblázat).
Major Klára : Markov láncok használata a regionális jövedelemegyenlőtlenségek előrejelzésében.
Tér és Társadalom 21. évf. 2007/1. 53-67. p.

60 Major Klára TÉT XXI. évf. 2007 • 1

1. TÁBLÁZAT
Az egy f őre jutó relatív jövedelmek leíró statisztikái Magyarország kistérségei esetében
(Microregional Income Distribution in Hungary — Basic Statistics)
1990 2003 1990-2003
Minimum 0,50 0,43 0,39
1. kvartilis 0,71 0,65 0,66
2. kvartilis 0,82 0,77 0,78
3. kvartilis 0,94 0,97 0,96
Maximum 1,46 1,51 1,56
Variancia 0,03 0,05 0,04
Forrás: Saját szerkesztés.

Az egyes években megfigyelt relatív jövedelmi pozíciók eloszlása nagyon hasonló
volt, terjedelmük, szórásuk, különböz ő percentiliseik igen stabilnak mutatkoztak.
Ezt mutatja szúrópróbaszer űen az els ő és utolsó évre az 1. táblázat. (Természetesen
a minimum és maximum értékek ingadozhatnak.) Ezen jelent ős stabilitás miatt és a
szakirodalomban bevett módszernek megfelel ően a jövedelmi kategóriák képzése
során a kvartilisekb ő l indultunk ki, ezzel 4 jövedelmi kategóriát hoztunk létre.
Annak érdekében, hogy egyik év se kapjon kitüntett szerepet a teljes minta (1990—
2003) alapján megállapított kvartilis-értékek képezték az osztályközöket (/. táblázat
4. oszlop), amelynek segítségével az egyes kistérségek jövedelmi állapotának meg-
állapítása történt.
A jövedelmi kategóriákba osztás révén jellemezni tudjuk a relatív jövedelmek területi
megoszlását grafikusan is (2. ábra). Az országos térkép kiszínezéséhez most ritkán
alkalmazott, némileg talán els őre bonyolultnak tűnő beosztást választottunk. Azon kis-
térségeket, amelyek a vizsgált 14 éves id őszak alatt végig azonos kategóriában voltak
tömör színnel, míg a pozíciót váltókat pöttyös háttérrel szineztük ki. Eközben igyekez-
tünk az árnyalásnak is szerepet adni: minél sötétebb egy kistérség színe, annál nagyobb
jövedelmi kategóriát jelöl. A 2. ábrán látható az eredmény.
A térképbő l a magyarországi jövedelmek jól ismert térszerkezete t űnik elénk, a
„globálisan", azaz országos méretekben megfigyelhet ő nyugat—kelet lejt ő. A nyuga-
ti kistérségek általában sötétebb szín űek, a keleti országszélen pedig nem csak hogy
nagyon világos, de tartósan ott ragadó kistérségeket találunk.
Másrészt szembeötl ő a helybenmaradó kistérségek magas száma. Valójában ez az
a tulajdonsága az adathalmaznak, amely már a kutatás elején is sugallja a Mover—
Stayer modell alkalmazásának az igényét: számtalan olyan kistérség van, amelyek
egyáltalán nem mutattak fel semmilyen mobilitást. Az alap-Markov modell eseté-
ben ez csak egyféleképpen magyarázható: a helyben maradás valószín űségével,
amely értékeket a Markov mátrix fő átlói tartalmaznak. 14 év, azaz 13 átmenet alatt
a helyben maradás valószín űsége a főátlóban szerepl ő érték 13-ik hatványa, amely
még 95%-os egylépéses helybenmaradás esetén is alig több mint 50%. Az adatok-
Major Klára : Markov láncok használata a regionális jövedelemegyenlőtlenségek előrejelzésében.
Tér és Társadalom 21. évf. 2007/1. 53-67. p.

TÉT XXI. évf. 2007 • 1 Markov láncok használata a ... 61

ból ennél azonban sokkal magasabb 13 átmenet alatti helybenmaradási arány látható.
Ezért a Markov és a Mover—Stayer modellek illesztésével és az illeszkedés jóságá-
nak megvizsgálásával megbizonyosodhatunk sejtésünk helyességér ől.
2. ÁBRA
Az egyes kistérségek jövedelmi állapotai 1990-2003 között
(Changes in the Relative Income Positions of the Hungarian Microregions
(1990-2003, Two-dimensional Categorisation)

Jenedeirni rnObillt3S kiStirSéy

Stsyer n 31.4 (363,1
143~1.1weeh ste1e4 3-4
h hale 3(21%)
Mayer ...nen.. 2-4
between al aI es 2-3
Steyr h hete (8%)
Moverpetween hales 1-3
31.3,34tween Az. 1.2
...o.... 1: (91%)

Jelmagyarázat: Tömör szín űek a maradok, satírozott hátterüek mozgók. A sötétebb szín magasabb
jövedelmi kategóriát jelöl.

Forrás: Saját számítások.

Globális egyenlőtlenségek változása

Az országos átlagjövedelem százalékában kifejezett egy f őre jutó jövedelmek
alapján képzett jövedelmi kategóriák vizsgálatával képet nyerhetünk a globális
egyenl őtlenségek változásáról. Itt a globális jelz őt országos viszonylatban kell ér-
telmezni: amikor az egyes kistérségek alacsony vagy magas jövedelmét említjük ezt
nem abszolút értékben, hanem az országos átlag százalékában kell érteni.

Egy lépéses átmenetek

Az alap Markov modell számításához mindössze a megfigyelt 13x168=2184 át-
menetből kellett relatív gyakoriságot számítanunk. Ezeket az eredményeket tartal-
mazza a 2. táblázat.
Major Klára : Markov láncok használata a regionális jövedelemegyenlőtlenségek előrejelzésében.
Tér és Társadalom 21. évf. 2007/1. 53-67. p.
62 Major Klára TÉT XXI. évf. 2007 • 1

2. TÁBLÁZAT
Egy lépéses átmenetmátrix, mobilitási mutató = 15,51%
(One-step Mobility Matrix, Mobility Index: 15,51%)
1 2 3 4

1 0,92 0,08 0,00 0,00
2 0,12 0,83 0,06 0,00
3 0,00 0,08 0,85 0,07
4 0,00 0,00 0,06 0,94
Forrás: Saját számítás.

A Markov modell becslésével nyert egy lépéses átmenetvalószín űségek igen ha-
sonlatosak a szakirodalomban található, más területegységekre, id őszakokra,
állapottérfelosztásra készült átmenetmátrixokhoz. A jövedelmi folyamatokra egy-
aránt jellemz ő , hogy a magas és alacsony jövedelmi kategóriákban a nem-mozgás
valószínűsége magasabb, mint a közepes jövedelmi kategóriákban. Ezt a megfigye-
lést a korábban a térkép kapcsán említett polarizációs jelenséggel lehet összefüg-
gésbe hozni: a középs ő jövedelmi kategóriákban sokkal magasabb á megfigyelt
jövedelmi mobilitás, mint a széls őséges állapotokban. Ennek lehet eredménye a
közepes jövedelmi kategória „sz űkülése", amely a folytonos s űrűségfüggvény-
becslésből annyira jól kivehet ő.
Frydman (1984) módszertanát alkalmazva kiszámftottuk a Mover—Stayer modell
ismeretlen együtthatóit, az S és M mátrixokat egyaránt. A becsült értékeket mutatja
a 3. táblázat. A fentebb elmondottakon túlmen ően még azt is megállapíthatjuk,
hogy a széls őséges jövedelmi kategóriákban kiemelked ően magas a maradók
(stayerek) aránya, az I-es kategóriában egyenesen 92%. Az adattáblában 24 olyan
kistérséget találtunk, amelyek mind a 13 év alatt végig az I-es kategóriában tartóz-
kodtak. Ezen kistérségek 92%-át, azaz kb. 22-t lehet a maradók kategóriájába so-
rolni! Ezen kistérségek esetében nem pusztán „véletlen" de strukturális tényez őkkel
kell magyaráznunk a mobilitás elmaradását — még egy ilyen nagyon egyszer ű meg-
közelítésben is, mint a Mover—Stayer modell, ahol a strukturális tényez ők explicit
nem jelennek meg.
A Mover—Stayer modell paramétereinek számításával (az alap-Markov modellhez
képest) alternatív módon is kiszámítottuk az átmenet mátrixát és mobilitási mutató
értékét. Láthatjuk, hogy egyikben sem hozott látványos változást a bonyolult mód-
szertan alkalmazása, ami egyáltalán nem meglep ő. Az egy lépéses átmenetek ta-
nulmányozására nincsen szükség ilyen kifinomult módszertan alkalmazására, a két
modell közötti különbség els ősorban akkor látszik, amikor a hosszabb távú, jelen
esetben mondjuk 13 éves mobilitás el őrejelzésére kívánjuk felhasználni őket.
Major Klára : Markov láncok használata a regionális jövedelemegyenlőtlenségek előrejelzésében.
Tér és Társadalom 21. évf. 2007/1. 53-67. p.

TÉT XXI. évf. 2007 • 1 Markov láncok használata a ... 63

3. TÁBLÁZAT
Mover-Stayer modell becslésének eredménye a magyarországi kistérségek relatív
egy főre jutó jövedelmi pozíciói alapján, 1990-2003.
(Mover-Stayer Mobility Estimation of the Microregional Incomes in Hungary,
1990-2003)
Álla- Maradók Mozgók Markov mátrixa Megfigyelhet ő átmenet-
pot aránya (S) (M) mátrix (P I)
1 0,92 0,83 0,17 0 0 0,99 0,01 0,00 0
2 0,08 0,13 0,81 0,06 0 0,12 0,82 0,06 0
3 0,21 0 0,11 0,79 0,10 0 0,09 0,83 0,08
4 0,57 0 0 0,13 0,87 0 0 0,06 0,94
Jelmagyarázat: Az utolsó négy oszlopban szerepelnek a megfigyelhet ő, az alap-Markov modellel köz-
vetlenül összevethet ő átmenetvalószín űségek. Mobilitási mutató P1 mátrixra = 13,84%.
Forrás: Saját szerkesztés.

13 éves átmenetvalószín űségek
A 13 éves átmenetvalószín űségek számításával most a modellek hosszabb távú
előrejelző képességét fogjuk „tesztelni". Természetesen nem szükséges mindenkép-
pen 13 éves horizontot választani, ez azonban a jelen esetben igen praktikus: az adata-
ink is pontosan ilyen hosszúságú intervallumra állnak rendelkezésre, így mérni tudjuk
a modellek előrejelző képességét, ha összehasonlítjuk az általuk adott 13-éves mobili-
tásra vonatkozó el őrejelzést azzal, amit magukból az adatokból nyerhetünk.
A 13 éves átmenetvalószín űségek számításához a megbecsült modellb ől az alap-
Markov modell esetében az átmenetmátrix hatványozásával (MT) jutunk el, míg a
Mover-Stayer modell esetében a (6) képletben szerepl ő PT = S + (1 - S)A1 kife-
jezést kell kiszámítanunk. A számítási eredményeket és az adatokból nyert közvet-
len becslést tartalmazza a 4. táblázat.
4. TÁBLÁZAT
13 éves átmenetvalószín űségek a Markov modell, a Mover-Stayer modell alapján,
valamint közvetlenül az adatokból becsülve
(13 years Mobility Matrices on the Base of Markov-model, the Mover-Stayer Model
and Direct Estimation)
Adatokból közvetlenül
Markov modell Mover-Stayer
becsült, megfigyelt
becslése (MT) becslése (PT)
átmentek
Álla-
pot
1 2 3 4 I 2 3 4 1 2 3 4
1 0,59 0,30 0,09 0,03 0,95 0,04 0,01 0 1,00 0 0 0
2 0,45 0,31 0,15 0,09 0,30 0,46 0,15 0,08 0,42 0,49 0,09 0
3 0,19 0,22 0,28 0,31 0,15 0,24 0,42 0,19 0,02 0,31 0,46 0,21
4 0,06 0,11 0,27 0,56 0,04 0,10 0,14 0,72 0 0 0,16 0,84
Mobilitási m. = Mobilitási m. = Mobilitási m. =
75,40% 48,23% 40,35%
Forrás: Saját szerkesztés.
Major Klára : Markov láncok használata a regionális jövedelemegyenlőtlenségek előrejelzésében.
Tér és Társadalom 21. évf. 2007/1. 53-67. p.
64 Major Klára TÉT XXI. évf. 2007 • 1

A 13 éves horizontra számított mobilitás mindkét modell esetében magasabb,
mint az empirikusan megfigyelt érték, a „túlbecslés" mértéke azonban jelent ősen
különbözik! Míg a Markov modell esetében a becsült 13 éves mobilitási mutató
értéke 75%, addíg a Mover—Stayer modell esetében csak 48%. Ez utóbbi lényege-
sen közelebb van az empirikusan megfigyelhet ő 40%-os értékhez, mint az el őző.
További lényeges különbség, hogy az empirikus 13-Iépéses átmenetmátrixnak
számtalan zérus értéke van: ezek olyan átmeneteket mutatnak, amelyekre nem volt
példa a mintában. Például nem volt egyetlen olyan kistérség sem, amelyik a 13 év
alatt az 1-es kategóriából a 3-as kategóriába került volna. Ennek valószín űsége a
Markov modell alapján azonban 9%-ra tehet ő, míg a Mover—Stayer modell eseté-
ben 1%. Másként is megfogalmazhatjuk ugyanezt a különbséget: az empirikus
átmenetmátrix fő átlóinak értékeit az alap-Markov modell szisztematikusan és jelen-
tő sen alulbecsüli. Ez az alulbecslés azt jelenti, hogy míg a mintából közvetlenül
megfigyelve 84% volt a relatív gyakorisága annak, hogy egy kistérség a legnagyobb
jövedelmi kategóriából indulva (4) ott is marad, addig a Markov modell szerint ez
pusztán 56%. Az alacsonyabb helybenmaradási valószín űség nagyobb mobilitást
jelent, hiszen ha 13 év alatt mindössze 56% a helybenmaradás valószín űsége akkor
44% a mozgás, változás valószín űsége (szemben az empirikus 16%-kal).
A táblázatból és a számokkal való játékból látszik: a Markov modell számottev ően
felülbecsüli a hosszú távú mobilitást, és ehhez képest a Mover—Stayer modell felül-
becslése kisebbnek látszik. Ahhoz persze, hogy a két modell el őrejelző képességé-
ben lév ő különbségről egyértelmű kijelentést tudjunk tenni számszer űen is meg kell
vizsgálnunk, hogy az eltérés jelent ős, azaz szignifikáns-e. Ezt méri a következ ő
alpontban bemutatásra kerül ő illeszkedés jósága teszt.

Az illeszkedés jósága

A két modell illeszkedésének jóságát ún. likelihood-arány teszttel fogjuk mérni. A
likelihood-arány teszt akkor alkalmas két modell jóságának összehasonlítására, ha az
egyik modell a másik általánosításának tekinthet ő. Jelen esetben err ől van szó: a
Mover—Stayer modell speciális esetének tekinthet ő a Markov modell, hiszen ha az S
mátrix a zéró mátrix, akkor a Mover—Stayer modell alapegyenlete = S + (I-S)M = M
alakban lesz felírható, azaz visszakapjuk a kiinduló Markov modell.
Ezt az összefüggést nem csak formálisan lehet indokolni. A Mover—Stayer mo-
dellben abból a feltevésb ő l indultunk ki, hogy a populáció heterogén, méghozzá két
típusú egyedb ő l áll: mozgókból és maradókból. Amennyiben a maradók aránya
minden állapotban zérus (S=0), akkor az azt jelenti, hogy a populációban csak
egyféle egyed van, és mindegyik egyed mozgását egy Markov mátrixszal lehet
leírni, tehát visszakaptuk az alap-Markov modellt.
A teszt elvégzéséhez mindkét modell likelihood függvényének értékét ki kell
számítanunk. A Mover—Stayer modell esetében ezt már megmutattuk a (7) képlet
alatt, a teljesség kedvéért azonban mindkét modell /oglikelihood függvény képletét
Major Klára : Markov láncok használata a regionális jövedelemegyenlőtlenségek előrejelzésében.
Tér és Társadalom 21. évf. 2007/1. 53-67. p.

TÉT XXI. évf. 2007 III 1 Markov láncok használata a ... 65

felírjuk Frydman (1984) alapján. A Markov modell log-likelihood függvénye a
korábbi jelölések felhasználásával
n (0) n .k \
log L Markov =n (0)log + n log
j=1 n j,k n
ahol nj* a j-állapotba lépések összes számát jelenti az utolsó el őtti periódusig. A
becsült paraméterek száma pedig (J —1)x J . A Mover—Stayer modell log-
likelihood függvénye hasonlóan
(n ( \
ni j
log Lm„ ver-Siayer (0)log + (0) — n )log , +
j=1 n \n n k0)

+(n — Jn )log(rhii) ik log(th ik)
j*Ic

ahol n a vizsgálatban szerepl ő egyedek számát jelöli. A Mover—Stayer modell is-
meretlen paramétereinek száma J2. Az általánosabb modell tehát pontosan J válto-
zóval tartalmaz többet, mint az alap-Markov modell.
A likelihood arány teszt alkalmazásakor azt nézzük, hogy a log-likelihood függ-
vény értékében bekövetkez ő növekedés „megéri-e azt az áldozatot, amit a több
becsülendő paraméter jelent". Ehhez vizsgálnunk kell a log-likelihood függvény
értékében bekövetkez ő javulást, amit a specifikusról az általános modellre való
áttéréssel nyerünk, azaz a tesztstatisztikát az
LR = 2(log Lm„ ver Stayer log L Markov)
-
—

kifejezésnek megfelel ően számítjuk. A tesztstatisztika aszimptotikusan X2 elosz-
lást követ, az eloszlás szabadságfokát az általánosabb modell többletparamétereinek
száma jelenti, ami a jelen alkalmazásban J.
A modell paramétereinek számításával egyidej űleg kiszámítottuk az egyes modell
log-likelihood függvényének értékeit is. A Markov modell log-likelihood értékére
log Lmark„, = —1103,6 adódott, míg a Mover—Stayer modell esetében ennek értéke
log Lm„„,_s,„„, = —830,2 . A tesztstatisztika értéke ennek megfelel ően LR=546,8, ami
magasan szignitikáns, tekintettel arra, hogy a X2 eloszlás küszöbértéke 4 szabadságfog
és 99,9%-os szignifikanciaszinten X02999 (4) = 18,5 . A teszt alkalmazásával megbi-
zonyosodhattunk arról, hogy a két modell által adott hosszú távú el őrejelzés nem csak
szemmel láthatóan tér el egymástól, hanem statisztikai értelemben is különböz ő.
Egyúttal arról is bizonyosságot szerezhettünk, hogy a Mover—Stayer modell valóban
annyival jobban illeszkedik az adatokhoz, hogy megéri az a többletráfordítás, amely a
bonyolultabb modell megoldása, a több becsülend ő paraméter száma jelent.
Major Klára : Markov láncok használata a regionális jövedelemegyenlőtlenségek előrejelzésében.
Tér és Társadalom 21. évf. 2007/1. 53-67. p.
66 Major Klára TÉT XXI. évf. 2007 • 1

Összegzés, további kutatás irányok

A jövedelemi különbségek kutatásának fontos ágát képezi a Markov modell-
család. Ezen modellek illesztésével a kutatók közvetlenül az eloszlás változását
vizsgálják, ennek sajátosságait igyekeznek feltárni. A társadalmi folyamatokban
meglév ő magas perzisztencia, azaz alacsony jövedelmi mobilitás azonban a Markov
lánc modellekhez képest bonyolultabb struktúrát igényel, „indokolatlan" illesztése
téves következtetések levonásához vezet (magasabb mobilitás).
A Markov lánc modell alapfeltevése szerint a vizsgált jövedelmi folyamat stacioner,
ami talán értelmezhet ő úgy, hogy változás üteme időben állandó, független attól, hogy
milyen az egyedek állapotok közötti eloszlása, az egyes állapotokban tartózkodás
hossza. Mindezek feltehet ően túl erős feltevések a társadalmi folyamatok esetében.
A jelen alkalmazásban empirikusan megmutattuk, hogy Mover—Stayer modell sta-
tisztikai értelemben szignifikánsan jobban illeszkedik az adatokra, mint a Markov-
lánc modell. Érthető en lassítja a jövedelmi dinamikát egy teljesen állandó, nem
mozgó, helybenmaradó rész-populáció bevezetése. Mindezt azonban úgy teszi,
hogy miközben a bonyolultabb struktúra jobban visszaadja a megfigyelési id őszak-
ban tapasztalt hosszabb távú mobilitást, a rövid távú, azaz 1-1épéses átmenetek
becslését is megközelítő en ugyanolyan pontossággal elvégzi.
Mindazonáltal a Mover—Stayer modell továbblépésén is el kell gondolkodnunk.
Valójában a populáció kettéosztása két alpopulációra igen önkényes lépés. Arra
vonatkozóan sem találunk semmilyen megbízható döntési kritériumot, hogy az
egyébként folytonos jövedelmi adatokat hogyan osszuk be diszkrét jövedelmi álla-
potokba (kategóriákba). A kategóriák számának függvényében természetesen a
Mover—Stayer modell becslési eredményei is változni fognak. Könnyen belátható,
hogy amint növeljük a kategóriák számát, úgy csökken az egyes jövedelmi kategóriák
terjedelme, emiatt értelemszer űen egyre csökkenni fog a maradók (stayerek) aránya
az egyes kategóriákban. Természetesen létezik az a finomságú felosztás, amikor a
maradók, mint alpopuláció egyszer űen eltűnik. A Mover—Stayer modell tehát várha-
tóan igen érzékeny ezen paraméterére. Mindezek miatt a modellb ől levonható
kvantatív eredményeket mindenképpen fenntartással kell kezelni (pl. maradók aránya
az 1-es jövedelmi kategóriában). A modell kvalitatív tulajdonságai, a vizsgálat üzene-
te azonban egyértelm ű : a jövedelmi dinamika vizsgálata során az alacsony hosszú
távú mobilitást figyelembe kell venni és a modellstruktúra kiválasztása során az il-
leszkedés jóságát feltételenül meg kell vizsgálni. A jelen alkalmazás kiterjesztése a
kevert Markov modellek családjára (több alpopuláció) folyamatban van.

Jegyzetek

A tanulmány a „Jövedelmi differenciálódás szimulációs vizsgálata magyarországi kistérségek eseté-
ben" c. OTKA-60771 sz. kutatás keretében készült, elhagzott a Regionális modellek c. konferencián.
2
A Markov modell alapfeltevését, azaz a vizsgált folyamat stacionaritását vetették el az alkalmazott khi-
négyzet teszt segítségével. A stacionaritás feltevése alapvet ő, ennek hiányában a Markov modell nem
illeszthet ő, illetve ha mégis, a becsl ő függvények mechanikus alkalmazása torzított becslésekhez vezet.
Major Klára : Markov láncok használata a regionális jövedelemegyenlőtlenségek előrejelzésében.
Tér és Társadalom 21. évf. 2007/1. 53-67. p.

TÉT XXI. évf. 2007 • 1 Markov láncok használata a ... 67

3
A Markov láncok modell részleteiben nem járatos olvasónak javasoljuk Major, 2005 fejezetet, ahol az
alapmodell részletesebb kifejtése található.
4
Felhasználtuk, hogy nyilván I T = I, másfel ől SI = SIT = S.

Irodalom
Bickenbach, F.—Bode, E. (2001) Markor or not Markov — this should be the question. Working Paper
1086, Kiel Institute of World Economics, Kiel.
Frydman, H. (1984) Maximum likelihood estimation in the mover-stayer model. — Joumal of the
Amercian Statistical Association. 79. 632-638. o.
Frydman, H. (2005) Estimation in the mixture of markov chains moving with different speeds. — Journal
of the American Statistical Association. 100. 1046-1053. o.
Fuchs, C. — Greenhouse, J. B. (1988) The EM algorithm for maximum likelihood estimation in the
mover-stayer model. — Biometrics. 44. 605-613. o.
leGallo, J.L. (2001) Space-time analysis of gdp disparities among european regions: A markov chains
approach. Technical Report 2001-06. Laboratoire d'Analyse et de Techniques Economiques,
Bourgogne.
Major K. (2005) Id őbeli átmenetek: a Markov láncok. — Nemes Nagy J. (szerk.) Regionális elemzési
módszerek. ELTE Regionális Földrajzi Tanszék — MTA—ELTE Regionális Tudományi Kutatócsoport,
Regionális Tudományi Tanulmányok. 11. 124-135. o.
Quah, D.T. (1993) Empirical cross-section dynamics in economic growth. — European Economic Review.
37. 951-958. o.
Shorrocks, A.F. (1978) The measurement of mobility. — Econometrica. 46. 1013-1024. o.
Singer, B.—Spilerman, S. (1976) Some methodological issues in the analysis of longitudinal surveys. —
Annals of Economic and Social Management. 5. 447-474. o.
Spilerman, S. (1978) Extensions of the mover-stayer model. —American Joumal of Sociology. 78. 559-626. o.

FORECASTING REGIONAL INCOME INEQUALITIES BASED
ON MARKOV MODELS

KLÁRA MAJOR

It is known that the simple Markov model overpredicts the long run horizon mobility of the
income distribution process. Dissolving the homogeneity assumption of the Markov model
we can have better forecasts. One generalization of the Markov model, the Mover—Stayer
model assumes heterogenous population: some units are moving according to a common
Markov chain but there are some (unknown) units whose are not moving at all. They are
called stayers.
Based on Frydman, 1984 methodology we compute both the Markov and Mover—Stayer
models for Hungarian micro-regions income data and find that the Mover—Stayer model fits
better the regional relative income data than the simple Markov model. Using likelihood ratio
test statistics we show that the difference is highly significant.