Distribució multinomial de Dirichlet

Infotaula distribució de probabilitatDistribució multinomial de Dirichlet
TipusDistribució de probabilitat composta i distribució conjunta Modifica el valor a Wikidata
Notació D i r M u l t ( n , α ) {\displaystyle \mathrm {DirMult} (n,{\boldsymbol {\alpha }})}
Paràmetres n > 0 {\displaystyle n>0} nombre de proves (enter positiu)
α 1 , , α K > 0 {\displaystyle \alpha _{1},\ldots ,\alpha _{K}>0}
Suport x i { 0 , , n } {\displaystyle x_{i}\in \{0,\dots ,n\}}
Σ x i = n {\displaystyle \Sigma x_{i}=n\!}
fpm Γ ( α k ) Γ ( n + 1 ) Γ ( n + α k ) k = 1 K Γ ( x k + α k ) Γ ( α k ) Γ ( x k + 1 ) {\displaystyle {\frac {\Gamma \left(\sum \alpha _{k}\right)\Gamma \left(n+1\right)}{\Gamma \left(n+\sum \alpha _{k}\right)}}\prod _{k=1}^{K}{\frac {\Gamma (x_{k}+\alpha _{k})}{\Gamma (\alpha _{k})\Gamma \left(x_{k}+1\right)}}} [1]
Esperança matemàtica E ( X i ) = n α i α k {\displaystyle \operatorname {E} (X_{i})=n{\frac {\alpha _{i}}{\sum \alpha _{k}}}}
Variància Var ( X i ) = n α i α k ( 1 α i α k ) ( n + α k 1 + α k ) {\displaystyle \operatorname {Var} (X_{i})=n{\frac {\alpha _{i}}{\sum \alpha _{k}}}\left(1-{\frac {\alpha _{i}}{\sum \alpha _{k}}}\right)\left({\frac {n+\sum \alpha _{k}}{1+\sum \alpha _{k}}}\right)}
C o v ( X i , X j ) = n α i α j ( α k ) 2 ( n + α k 1 + α k )     ( i j ) {\displaystyle \textstyle {\mathrm {Cov} }(X_{i},X_{j})=-n{\frac {\alpha _{i}\alpha _{j}}{(\sum \alpha _{k})^{2}}}\left({\frac {n+\sum \alpha _{k}}{1+\sum \alpha _{k}}}\right)~~(i\neq j)}
FGM E ( k = 1 K e t k x k ) = Γ ( n + 1 ) Γ ( α k ) Γ ( α k + n ) D n ( α , ( e t 1 , . . . , e t K ) ) {\displaystyle \operatorname {E} (\prod \limits _{k=1}^{K}{e}^{t_{k}\cdot x_{k}})={\frac {\Gamma (n+1)\Gamma (\sum \alpha _{k})}{\Gamma (\sum \alpha _{k}+n)}}\cdot D_{n}({\boldsymbol {\alpha }},(e^{t_{1}},...,e^{t_{K}}))}
amb
D n = 1 n u = 1 n [ ( k = 1 K α k e t k u ) D n u ] , D 0 = 1 {\displaystyle D_{n}={\frac {1}{n}}\sum \limits _{u=1}^{n}\left[\left(\sum \limits _{k=1}^{K}\alpha _{k}\cdot {e}^{t_{k}\cdot u}\right)D_{n-u}\right],D_{0}=1} [1]
FC E ( k = 1 K e i t k x k ) = Γ ( n + 1 ) Γ ( α k ) Γ ( α k + n ) D n ( α , ( e i t 1 , . . . , e i t K ) ) {\displaystyle \operatorname {E} (\prod \limits _{k=1}^{K}{e}^{it_{k}\cdot x_{k}})={\frac {\Gamma (n+1)\Gamma (\sum \alpha _{k})}{\Gamma (\sum \alpha _{k}+n)}}\cdot D_{n}({\boldsymbol {\alpha }},(e^{it_{1}},...,e^{it_{K}}))}


amb

D n = 1 n u = 1 n [ ( k = 1 K α k e i t k u ) D n u ] , D 0 = 1 {\displaystyle D_{n}={\frac {1}{n}}\sum \limits _{u=1}^{n}\left[\left(\sum \limits _{k=1}^{K}\alpha _{k}\cdot {e}^{it_{k}\cdot u}\right)D_{n-u}\right],D_{0}=1} [1]
FGP E ( k = 1 K z k x k ) = Γ ( n + 1 ) Γ ( α k ) Γ ( α k + n ) D n ( α , z ) {\displaystyle \operatorname {E} (\prod \limits _{k=1}^{K}{z_{k}}^{x_{k}})={\frac {\Gamma (n+1)\Gamma (\sum \alpha _{k})}{\Gamma (\sum \alpha _{k}+n)}}\cdot D_{n}({\boldsymbol {\alpha }},\mathbf {z} )}


amb

D n = 1 n u = 1 n [ ( k = 1 K α k z k u ) D n u ] , D 0 = 1 {\displaystyle D_{n}={\frac {1}{n}}\sum \limits _{u=1}^{n}\left[\left(\sum \limits _{k=1}^{K}\alpha _{k}\cdot {z_{k}}^{u}\right)D_{n-u}\right],D_{0}=1} [1]

En teoria i estadística de probabilitats, la distribució multinomial de Dirichlet és una família de distribucions de probabilitat multivariables discretes sobre un suport finit de nombres enters no negatius. També s'anomena distribució multinomial composta de Dirichlet (DCM) o distribució multivariada de Pólya (en honor a George Pólya).

És una distribució de probabilitat composta, on un vector de probabilitat p s'extreu d'una distribució de Dirichlet amb vector de paràmetres α {\displaystyle {\boldsymbol {\alpha }}} , i una observació extreta d'una distribució multinomial amb vector de probabilitat p i nombre de proves n. El vector de paràmetres de Dirichlet captura la creença prèvia sobre la situació i es pot veure com un pseudocompte: observacions de cada resultat que es produeixen abans que es recullin les dades reals. La combinació correspon a un esquema d'urna Pólya.

Es troba freqüentment en l'estadística bayesiana, l'aprenentatge automàtic, els mètodes empírics de Bayes i l'estadística clàssica com una distribució multinomial sobredispersa.[2][3]

Es redueix a la distribució categòrica com a cas especial quan n = 1. També s'aproxima bé la distribució multinomial arbitràriament per a α gran. El multinomial de Dirichlet és una extensió multivariant de la distribució binomial beta, ja que les distribucions multinomial i Dirichlet són versions multivariables de la distribució binomial i distribucions beta, respectivament.[4]

Especificació

Dirichlet-multinomial com a distribució composta

La distribució de Dirichlet és una distribució conjugada a la distribució multinomial. Aquest fet condueix a una distribució composta analíticament tractable. Per a un vector aleatori de categories compta x = ( x 1 , , x K ) {\displaystyle \mathbf {x} =(x_{1},\dots ,x_{K})} , distribuït segons una distribució multinomial, la distribució marginal s'obté integrant a la distribució de p que es pot considerar com un vector aleatori seguint una distribució de Dirichlet:

Pr ( x n , α ) = p M u l t ( x n , p ) D i r ( p α ) d p {\displaystyle \Pr(\mathbf {x} \mid n,{\boldsymbol {\alpha }})=\int _{\mathbf {p} }\mathrm {Mult} (\mathbf {x} \mid n,\mathbf {p} )\mathrm {Dir} (\mathbf {p} \mid {\boldsymbol {\alpha }}){\textrm {d}}\mathbf {p} }

que dóna lloc a la següent fórmula explícita:

Pr ( x n , α ) = Γ ( α 0 ) Γ ( n + 1 ) Γ ( n + α 0 ) k = 1 K Γ ( x k + α k ) Γ ( α k ) Γ ( x k + 1 ) {\displaystyle \Pr(\mathbf {x} \mid n,{\boldsymbol {\alpha }})={\frac {\Gamma \left(\alpha _{0}\right)\Gamma \left(n+1\right)}{\Gamma \left(n+\alpha _{0}\right)}}\prod _{k=1}^{K}{\frac {\Gamma (x_{k}+\alpha _{k})}{\Gamma (\alpha _{k})\Gamma \left(x_{k}+1\right)}}}

on α 0 {\displaystyle \alpha _{0}} es defineix com la suma α 0 = α k {\displaystyle \alpha _{0}=\sum \alpha _{k}} . Una altra forma per a aquesta mateixa distribució composta, escrita de manera més compacta en termes de la funció beta, B, és la següent:

Pr ( x n , α ) = n B ( α 0 , n ) k : x k > 0 x k B ( α k , x k ) . {\displaystyle \Pr(\mathbf {x} \mid n,{\boldsymbol {\alpha }})={\frac {nB\left(\alpha _{0},n\right)}{\prod _{k:x_{k}>0}x_{k}B\left(\alpha _{k},x_{k}\right)}}.}

Usos

La distribució multinomial de Dirichlet s'utilitza en la classificació i agrupació de documents automatitzada, la genètica, l'economia, el modelatge de combat i el màrqueting quantitatiu.[5]

Referències

  1. 1,0 1,1 1,2 1,3 Glüsenkamp «Probabilistic treatment of the uncertainty from the finite size of weighted Monte Carlo data» (en anglès). EPJ Plus, 133(6), 2018. arXiv: 1712.01293. Bibcode: 2018EPJP..133..218G. DOI: 10.1140/epjp/i2018-12042-x.
  2. «The Dirichlet-multinomial distribution» (en anglès). Universitat de Conrent. [Consulta: 8 juliol 2023].
  3. «Dirichlet distribution vs Multinomial distribution?» (en anglès). Stack exchange. [Consulta: 8 juliol 2023].
  4. «Understanding Dirichlet–Multinomial Models» (en anglès). Gregory Gundersen. [Consulta: 8 juliol 2023].
  5. «The Dirichlet Distribution: What Is It and Why Is It Useful?» (en anglès). Built In. [Consulta: 8 juliol 2023].
  • Vegeu aquesta plantilla
Distribucions discretes
amb suport finit
Distribucions discretes
amb suport infinit
Distribucions contínues
suportades sobre un interval acotat
Distribucions contínues
suportades sobre un interval semi-infinit
Distribucions contínues
suportades en tota la recta real
Distribucions contínues
amb el suport de varis tipus
Barreja de distribució variable-contínua
Distribució conjunta
Discreta
Ewens
Multinomial
Multinomial de Dirichlet
Multinomial negativa
Contínua
Dirichlet
Dirichlet generalitzada
Estable multivariant
Gamma normal
Gamma normal inversa
Normal multivariable
t multivariable
Matriu de valor
Matriu gamma
Matriu gamma inversa
Matriu normal
Normal de Wishart
Normal de Wishart inversa
t matriu
Wishart
Wishart inversa
Direccionals
Univariada (circular)
Asimètrica de Laplace envoltada
Cauchy envoltada
Exponencial envoltada
Lévy envoltada
Normal envoltada
Circular uniforme
Univariada de von Mises
Bivariada (esfèrica)
Kent
Bivariada (toroidal)
Bivariada de von Mises
Multivariada
von Mises-Fisher
Bingham
Degenerada i singular
Degenerada
Delta de Dirac
Singular
Cantor
Famílies