Rozkład wielomianowy

Rozkład wielomianowy
Parametry

n > 0 {\displaystyle n>0} liczba prób (liczba całkowita)
k > 0 {\displaystyle k>0} liczba rozłącznych kategorii (liczba całkowita)
p 1 , , p k {\displaystyle p_{1},\ldots ,p_{k}} prawdopodobieństwa poszczególnych kategorii, gdzie p 1 + + p k = 1 {\displaystyle p_{1}+\dots +p_{k}=1}

Nośnik

{ ( x 1 , , x k ) | i = 1 k x i = n , x i 0   ( i = 1 , , k ) } {\displaystyle \left\lbrace (x_{1},\dots ,x_{k})\,{\Big \vert }\,\sum _{i=1}^{k}x_{i}=n,x_{i}\geq 0\ (i=1,\dots ,k)\right\rbrace }

Funkcja rozkładu prawdopodobieństwa

n ! x 1 ! x k ! p 1 x 1 p k x k {\displaystyle {\frac {n!}{x_{1}!\cdots x_{k}!}}p_{1}^{x_{1}}\cdots p_{k}^{x_{k}}}

Wartość oczekiwana (średnia)

E ( X i ) = n p i {\displaystyle \operatorname {E} (X_{i})=np_{i}}

Wariancja

Var ( X i ) = n p i ( 1 p i ) {\displaystyle \operatorname {Var} (X_{i})=np_{i}(1-p_{i})}
Cov ( X i , X j ) = n p i p j     ( i j ) {\displaystyle \operatorname {Cov} (X_{i},X_{j})=-np_{i}p_{j}~~(i\neq j)}

Entropia

log ( n ! ) n i = 1 k p i log ( p i ) + {\displaystyle -\log(n!)-n\sum _{i=1}^{k}p_{i}\log(p_{i})+}
+ i = 1 k x i = 0 n ( n x i ) p i x i ( 1 p i ) n x i log ( x i ! ) {\displaystyle +\sum _{i=1}^{k}\sum _{x_{i}=0}^{n}{\binom {n}{x_{i}}}p_{i}^{x_{i}}(1-p_{i})^{n-x_{i}}\log(x_{i}!)}

Funkcja tworząca momenty

( i = 1 k p i e t i ) n {\displaystyle {\biggl (}\sum _{i=1}^{k}p_{i}e^{t_{i}}{\biggr )}^{n}}

Funkcja charakterystyczna

( j = 1 k p j e i t j ) n {\displaystyle \left(\sum _{j=1}^{k}p_{j}e^{it_{j}}\right)^{n}} , gdzie i 2 = 1 {\displaystyle i^{2}=-1}

Rozkład wielomianowyrozkład prawdopodobieństwa będący uogólnieniem rozkładu dwumianowego. Opisuje on na przykład prawdopodobieństwo uzyskania danej kombinacji wyników w n rzutach kostką o k ścianach. W przypadku n niezależnych prób, z których każda prowadzi z ustalonym prawdopodobieństwem do sukcesu w dokładnie jednej z k kategorii, rozkład wielomianowy podaje prawdopodobieństwo określonej kombinacji liczby sukcesów dla różnych kategorii[1].

Gdy k wynosi 2, a n wynosi 1, rozkład wielomianowy jest rozkładem zero-jedynkowym. Gdy k wynosi 2, a n jest większe niż 1, jest to rozkład dwumianowy. Gdy k jest większe niż 2, a n wynosi 1, jest to rozkład wielopunktowy („multinoulli”).

Generalnie kategorie w rozkładzie wielomianowym nie muszą być uporządkowane (mogą być na skali nominalnej), w związku z tym indeksy 1 , , k {\displaystyle 1,\dots ,k} są nadawane arbitralnie. Jeżeli kategorie są uporządkowane, rozkład takiej zmiennej nazywamy rozkładem wielomianowym porządkowym[2].

Przykład

Załóżmy, że w wyborach prezydenckich w dużym kraju było trzech kandydatów. kandydat A otrzymał 20% głosów, kandydat B otrzymał 30% głosów, a kandydat C otrzymał 50% głosów. Jeżeli losowo wybranych zostanie sześciu wyborców, jakie jest prawdopodobieństwo, że w próbie znajdzie się dokładnie jeden zwolennik kandydata A, dwóch zwolenników kandydata B i trzech zwolenników kandydata C?

Uwaga: Ponieważ zakładamy, że populacja głosująca jest duża, rozsądne i dopuszczalne jest myślenie o prawdopodobieństwach jako niezmiennych po wybraniu wyborcy do próby. Technicznie rzecz biorąc, jest to próbkowanie bez zwracania, więc prawidłowy byłby w tym przypadku wielowymiarowy rozkład hipergeometryczny, ale rozkłady zbiegają się w miarę wzrostu populacji w porównaniu do ustalonej wielkości próby[3].

P ( A = 1 , B = 2 , C = 3 ) = 6 ! 1 ! 2 ! 3 ! ( 0.2 1 ) ( 0.3 2 ) ( 0.5 3 ) = 0.135 {\displaystyle \mathbb {P} (A=1,B=2,C=3)={\frac {6!}{1!2!3!}}(0.2^{1})(0.3^{2})(0.5^{3})=0.135}

Przypisy

  1. MariuszM. Przybycień MariuszM., Rachunek prawdopodobieństwa i statystyka. Wykład 7 [online], AGH [dostęp 2024-05-16]  (pol.).
  2. Internetowy Podręcznik Statystyki - GLOSARIUSZ [online], www.statsoft.pl [dostęp 2024-06-16] .
  3. probability - multinomial distribution sampling. Cross Validated. [dostęp 2022-07-28]. (ang.).