Többdimenziós valószínűségeloszlás

A valószínűségszámításban a többdimenziós eloszlás egy valószínűségi vektorváltozó eloszlása, azaz egy R n {\displaystyle \mathbb {R} ^{n}} -beli értékeket felvevő valószínűségi változó eloszlása. Egy X = ( X 1 , , X n ) {\displaystyle X=(X_{1},\dotsc ,X_{n})} valószínűségi vektorváltozó eloszlása is mérhető halmazokhoz rendeli a valószínűségeket, de ezek R n {\displaystyle \mathbb {R} ^{n}} -beliek. Minden A R n {\displaystyle A\subseteq \mathbb {R} ^{n}} mérhető halmaznak van valószínűsége, ami megadja, hogy X {\displaystyle X} értéke mekkora eséllyel esik ebbe a részhalmazba. Az X {\displaystyle X} egyes X i {\displaystyle X_{i}} koordinátáinak eloszlását peremeloszlásnak nevezzük. A többdimenziós eloszlásra példa a multinormális eloszlás, más néven a többdimenziós normális eloszlás.

Bevezető példa

Tekintjük a következő két kísérletet:

1. Szabályos dobókockával dobunk kétszer, vagy ezzel ekvivalensen egy urnakísérlet, ahol is a számozott golyót visszatesszük. A lehetséges kimenetelek száma 36, és mivel egyformán valószínűek, mindegyik esélye 1/36.

2. Urnakísérlet számozott golyókkal, de a kihúzott golyót nem tesszük vissza. Emiatt az (1,1),(2,2),…,(6,6) kimenetelek nem fordulnak elő, így a többi 30 kimenetel valószínűsége egyenként 1/30.

Jelölje rendre a két valószínűségi vektorváltozót Z 1 {\displaystyle Z_{1}} és Z 2 {\displaystyle Z_{2}} . Ezek peremeloszlásai ugyanazok, mind a hat szám ugyanazzal az 1/6 valószínűséggel fordul elő.

Az első kísérletben a két húzás egymástól független, mivel a kihúzott golyót visszatesszük, de a másodikban már nem, mivel másodjára nem jöhet ki ugyanaz a szám, pedig függetlenség esetén 1/36 lenne a valószínűségük, ami a peremeloszlások valószínűségének szorzata. De a (1,1),(2,2),…,(6,6) párok valószínűsége nulla.

Emiatt habár a peremeloszlások ugyanazok, a Z 1 {\displaystyle Z_{1}} és Z 2 {\displaystyle Z_{2}} valószínűségi változók különböző eloszlásúak.

Két dimenzióban

10000 szúrópróba egy Clayton-kopulával modellezett eloszlásból, ahol α = 2 , 88 {\displaystyle \alpha =2,88} . Az eloszlás peremeloszlásai normális eloszlásúak

Egy kétdimenziós Z = ( X , Y ) {\displaystyle Z=(X,Y)} valószínűségi vektorváltozó eloszlásfüggvénye:

F Z ( x , y ) = P ( X x , Y y ) . {\displaystyle F_{Z}(x,y)=P(X\leq x,Y\leq y).}

Ha a Z = ( X , Y ) {\displaystyle Z=(X,Y)} valószínűségi vektorváltozó kétdimenziós sűrűségfüggvénye f X , Y {\displaystyle f_{X,Y}} , akkor az eloszlásfüggvény:

F Z ( x , y ) = y x f X , Y ( u , v ) d u d v {\displaystyle F_{Z}\left(x,y\right)=\int _{-\infty }^{y}\int _{-\infty }^{x}f_{X,Y}\left(u,v\right)\mathrm {d} u\,\mathrm {d} v} .

Ha az eloszlás diszkrét, akkor a közös eloszlás feltételes valószínűségekkel:

P ( X = x ,   Y = y ) = P ( Y = y X = x ) P ( X = x ) = P ( X = x Y = y ) P ( Y = y ) {\displaystyle {\begin{aligned}\mathrm {P} (X=x,\ Y=y)&{}=\mathrm {P} (Y=y\mid X=x)\cdot \mathrm {P} (X=x)\\&{}=\mathrm {P} (X=x\mid Y=y)\cdot \mathrm {P} (Y=y)\end{aligned}}}

Folytonos esetben

f X , Y ( x , y ) = f Y | X ( y | x ) f X ( x ) = f X | Y ( x | y ) f Y ( y ) {\displaystyle f_{X,Y}(x,y)=f_{Y|X}(y|x)f_{X}(x)=f_{X|Y}(x|y)f_{Y}(y)\;}

Itt f Y | X ( y | x ) {\displaystyle f_{Y|X}(y|x)} és f X | Y ( x | y ) {\displaystyle f_{X|Y}(x|y)} feltételes sűrűségfüggvények, azaz a megfelelő feltételes valószínűségi változók sűrűségfüggvényei. A feltételes valószínűségi változók: Y {\displaystyle Y} feltéve X = x {\displaystyle X=x} , és X {\displaystyle X} feltéve Y = y {\displaystyle Y=y} . Az f X ( x ) , f Y ( y ) {\displaystyle f_{X}(x),f_{Y}(y)} függvények rendre X {\displaystyle X} és Y {\displaystyle Y} peremeloszlásai.

Az ábrán a koordináták közötti összefüggést kopulák jelzik. A bemutatott eloszlás példa arra, hogy ha a peremeloszlások normálisak, akkor az eloszlás nem biztos, hogy normális.

Általános eset

Ha az n-dimenziós Z = ( X 1 , , X n ) {\displaystyle Z=(X_{1},\dots ,X_{n})} valószínűségi vektorváltozónak van sűrűségfüggvénye, akkor az eloszlásfüggvény a kétdimenziós esethez hasonlóan

F Z ( x 1 , , x n ) = x n x 1 f X 1 , , X n ( u 1 , , u n ) d u 1 d u n {\displaystyle F_{Z}\left(x_{1},\dots ,x_{n}\right)=\int _{-\infty }^{x_{n}}\dots \int _{-\infty }^{x_{1}}f_{X_{1},\dots ,X_{n}}\left(u_{1},\dots ,u_{n}\right)\mathrm {d} u_{1}\dots \mathrm {d} u_{n}} .

A dimenziók növekedéséveol több lehetőség adódik peremeloszlásokra, minden 1 k < n {\displaystyle 1\leq k<n} alacsonyabb dimenzióhoz létezik ( n k ) {\displaystyle {n \choose k}} peremeloszlás. Például három dimenzióban három egyváltozós és három kétváltozós peremeloszlás van.

Független valószínűségi változók közös eloszlása

Ha a diszkrét X és Y valószínűségi változókra minden x és y esetén teljesül, hogy   P ( X = x ,   Y = y ) = P ( X = x ) P ( Y = y ) {\displaystyle \ P(X=x,\ Y=y)=P(X=x)\cdot P(Y=y)} , akkor függetlenek.

Hasonlóan, ha folytonos X és Y valószínűségi változókra minden x és y esetén teljesül, hogy   f X , Y ( x , y ) = f X ( x ) f Y ( y ) {\displaystyle \ f_{X,Y}(x,y)=f_{X}(x)\cdot f_{Y}(y)} , akkor függetlenek.

Források

  • K. V. Mardia, J. T. Kent, J. M. Bibby: Multivariate Analysis. Acad. Press, New York 1979, ISBN 0-12-471250-9. (engl.)
  • Ludwig Fahrmeir, Alfred Hamerle (Hrsg.): Multivariate statistische Verfahren. de Gruyter, New York 1996, ISBN 3-11-008509-7.
  • Joachim Hartung, Bärbel Elpelt: Multivariate Statistik. Oldenbourg, München/ Wien 1999, ISBN 3-486-25287-9.

Fordítás

Ez a szócikk részben vagy egészben a Multivariate Verteilung című német Wikipédia-szócikk fordításán alapul. Az eredeti cikk szerkesztőit annak laptörténete sorolja fel. Ez a jelzés csupán a megfogalmazás eredetét és a szerzői jogokat jelzi, nem szolgál a cikkben szereplő információk forrásmegjelöléseként.