Teorema de Cox

O teorema de Cox, que recebe este nome em homenagem ao físico norte-americano Richard Threlkeld Cox, é uma derivação das leis da teoria das probabilidades a partir de um certo conjunto de postulados. Esta derivação justifica a então chamada interpretação "lógica" da probabilidade, já que as leis de probabilidade derivadas pelo teorema de Cox são aplicáveis a qualquer proposição. A probabilidade lógica, também chamada de bayesiana objetiva, é um tipo de probabilidade bayesiana. Outras formas de bayesianismo, tais como a interpretação subjetiva, recebem outras justificações.

Pressupostos de Cox

Cox desejou que seu sistema satisfizesse as seguintes condições:

  1. Divisibilidade e comparabilidade — A plausibilidade de uma proposição é um número real e é dependente da informação que temos relacionada com a proposição.[1]
  2. Senso comum — Plausibilidades devem variar sensivelmente com a avaliação das plausibilidades no modelo.[2]
  3. Consistência – Se a plausibilidade de uma proposição pode ser derivada em muitas formas, todos os resultados devem ser iguais.[3]

"Senso comum" inclui consistência com a lógica aristotélica no sentido de que proposições logicamente equivalentes terão a mesma plausibilidade.

Os postulados como originalmente afirmados por Cox não eram matematicamente rigorosos.[4][5] No entanto, é possível aumentar estes postulados como vários pressupostos matemáticos feitos implícita ou explicitamente por Cox para produzir uma prova válida.

A notação de Cox é:

  • A plausibilidade de uma proposição A {\displaystyle A} dada alguma informação relacionada X {\displaystyle X} é denotada por A | X {\displaystyle A|X} .

Os postulados de Cox e as equações funcionais são:

  • A plausibilidade da conjunção A B {\displaystyle AB} de duas proposições A , B {\displaystyle A,B} , dada alguma informação relacionada X {\displaystyle X} , é determinada pela plausibilidade de A {\displaystyle A} dada X {\displaystyle X} e pela de B {\displaystyle B} dada A X {\displaystyle AX} . Na forma de uma equação funcional:

    A B | X = g ( A | X , B | A X ) . {\displaystyle AB|X=g(A|X,B|AX).}

Por causa da natureza associativa da conjunção na lógica proposicional, a consistência com a lógica dá uma equação funcional que diz que a função g {\displaystyle g} é uma operação binária associativa.
  • Adicionalmente, Cox postula que a função g {\displaystyle g} é monótona. Todas as operações binárias associativas crescentes em números reais são isomórficas em relação à multiplicação dos números no intervalo [ 0 , 1 ] {\displaystyle [0,1]} , o que significa que há uma função w {\displaystyle w} que mapeia as plausibilidades em relação a [ 0 , 1 ] {\displaystyle [0,1]} , tal que:

    w ( A B | X ) = w ( A | X ) w ( B | A X ) . {\displaystyle w(AB|X)=w(A|X)w(B|AX).}

  • A plausibilidade de uma proposição determina a plausibilidade da negação da proposição. Isto postula a existência de uma função f {\displaystyle f} , tal que:

    w ( n a ~ o A | X ) = f ( w ( A | X ) ) . {\displaystyle w(n{\tilde {a}}o\,A|X)=f(w(A|X)).}

Como "uma dupla negativa é uma afirmativa", a consistência com a lógica dá uma equação funcional:

f ( f ( x ) ) = x , {\displaystyle f(f(x))=x,}

o que diz que a função f {\displaystyle f} é uma involução, isto é, é sua própria inversa.
  • Além disso, Cox postula que a função f {\displaystyle f} é monótona. As equações funcionais acima e a consistência com a lógica implicam que:

    w ( A B | X ) = w ( A | X ) f ( w ( n a ~ o B | A X ) ) = w ( A | X ) f ( w ( A n a ~ o B | X ) w ( A | X ) ) . {\displaystyle w(AB|X)=w(A|X)f(w(n{\tilde {a}}o\,B|AX))=w(A|X)f\left({w(A\,n{\tilde {a}}o\,B|X) \over w(A|X)}\right).}

Já que A B {\displaystyle AB} é logicamente equivalente a B A {\displaystyle BA} , também temos:

w ( A | X ) f ( w ( A n a ~ o B | X ) w ( A | X ) ) = w ( B | X ) f ( w ( B n a ~ o A | X ) w ( B | X ) ) . {\displaystyle w(A|X)f\left({w(A\,n{\tilde {a}}o\,B|X) \over w(A|X)}\right)=w(B|X)f\left({w(B\,n{\tilde {a}}o\,A|X) \over w(B|X)}\right).}

Se, em particular, B = n a ~ o ( A D ) {\displaystyle B=n{\tilde {a}}o\,(AD)} , então A n a ~ o B = n a ~ o B {\displaystyle A\,n{\tilde {a}}o\,B=n{\tilde {a}}o\,B} e B n a ~ o A = n a ~ o A {\displaystyle B\,n{\tilde {a}}o\,A=n{\tilde {a}}o\,A} também e temos:

w ( A n a ~ o B | X ) = w ( n a ~ o B | X ) = f ( w ( B | X ) ) {\displaystyle w(A\,n{\tilde {a}}o\,B|X)=w(\,n{\tilde {a}}o\,B|X)=f(w(B|X))}

e

w ( B n a ~ o A | X ) = w ( n a ~ o A | X ) = f ( w ( A | X ) ) . {\displaystyle w(B\,n{\tilde {a}}o\,A|X)=w(\,n{\tilde {a}}o\,A|X)=f(w(A|X)).}

Abreviando w ( A | X ) = x {\displaystyle w(A|X)=x} e w ( B | X ) = y {\displaystyle w(B|X)=y} , temos a equação funcional:

x f ( f ( y ) x ) = y f ( f ( x ) y ) . {\displaystyle xf\left({f(y) \over x}\right)=yf\left({f(x) \over y}\right).}

Implicações dos postulados de Cox

As leis de probabilidade deriváveis destes postulados são as seguintes.[6] Considere A | B {\displaystyle A|B} a plausibilidade da proposição A {\displaystyle A} dada B {\displaystyle B} que satisfaz os postulados de Cox. Então, há uma função w {\displaystyle w} que mapeia as plausibilidades em relação ao intervalo [ 0 , 1 ] {\displaystyle [0,1]} e um número positivo m {\displaystyle m} , tal que:

  1. A certeza é representada por w ( A | B ) = 1 {\displaystyle w(A|B)=1} .
  2. w m ( A | B ) + w m ( n a ~ o A | B ) = 1 {\displaystyle w^{m}(A|B)+w^{m}(\,n{\tilde {a}}o\,A|B)=1} .
  3. w ( A B | C ) = w ( A | C ) w ( B | A C ) = w ( B | C ) w ( A | B C ) {\displaystyle w(AB|C)=w(A|C)w(B|AC)=w(B|C)w(A|BC)} .

É importante notar que os postulados implicam apenas estas propriedades gerais. Podemos recuperar as leis usuais de probabilidade ao configurar uma função nova, convencionalmente denotada P {\displaystyle P} ou Pr {\displaystyle \Pr } , igual a w m {\displaystyle w^{m}} . Então, obtêm-se as leis de probabilidade em uma forma mais familiar:

  1. A verdade certa é representada por Pr ( A | B ) = 1 {\displaystyle \Pr(A|B)=1} e a falsidade certa por Pr ( A | B ) = 0 {\displaystyle \Pr(A|B)=0} .
  2. Pr ( A | B ) + Pr ( n a ~ o A | B ) = 1 {\displaystyle \Pr(A|B)+\Pr(\,n{\tilde {a}}o\,A|B)=1} .
  3. Pr ( A B | C ) = Pr ( A | C ) Pr ( B | A C ) = Pr ( B | C ) Pr ( A | B C ) {\displaystyle \Pr(AB|C)=\Pr(A|C)\Pr(B|AC)=\Pr(B|C)\Pr(A|BC)} .

A segunda regra é uma regra para negação e a terceira regra é uma regra para conjunção. Dado que qualquer proposição contendo conjunção, disjunção e negação pode ser equivalentemente refraseada usando conjunção e negação apenas (a forma normal conjuntiva), pode-se agora manejar qualquer proposição composta.

As leis assim derivadas produzem aditividade finita de probabilidade, mas não aditividade contável. A formulação teórica da medida de Kolmogorov assume que uma medida de probabilidade é contavelmente aditiva. Esta condição levemente mais forte é necessária para a prova de certos teoremas.

Interpretação e discussão posterior

O teorema de Cox veio a ser usado como uma das justificações para o uso da teoria da probabilidade bayesiana. A probabilidade pode ser interpretada como um sistema formal da lógica, a extensão natural da lógica aristotélica (na qual toda afirmação é verdadeira ou falsa) no domínio do raciocínio na presença de incerteza.[6]

Tem-se debatido com que intensidade o teorema exclui modelos alternativos para raciocínio sobre incerteza. Por exemplo, se certos pressupostos matemáticos "não intuitivos" fossem descartados, então, alternativas poderiam ser concebidas.[4] No entanto, foram sugeridos postulados adicionais de "senso comum" que permitiriam o relaxamento dos pressupostos em alguns casos.[1][2][3] Outras abordagens em direção semelhante já foram desenvolvidas.[7][8]

Cox formulou pela primeira vez o teorema em 1946.[9] Em 1961, estendeu o teorema com resultados adicionais e mais discussões.[10] O matemático norueguês Niels Henrik Abel foi creditado por ter usado pela primeira vez a equação funcional de associatividade.[6][11] O matemático húngaro-canadense János Aczél ofereceu uma longa prova da equação de associatividade.[12]

Ver também

Referências

  1. a b Arnborg, Stefan; Sjödin, Gunnar (29 de maio de 2001). «On the foundations of Bayesianism» (PDF). AIP Conference Proceedings. Consultado em 6 de fevereiro de 2018 
  2. a b Arnborg, Stefan; Sjödin, Gunnar (2003). «What is the plausibility of probability?» (PDF). Numerisk analys och datalogi, Kungl Tekniska Högskolan. Consultado em 6 de fevereiro de 2018 
  3. a b Arnborg, Stefan; Sjödin, Gunnar (2000). «Bayes Rules in Finite Models» (PDF). Numerisk analys och datalogi, Kungl Tekniska Högskolan. Consultado em 6 de fevereiro de 2018 
  4. a b Halpern, Joseph (1999). «A counterexample to theorems of Cox and Fine». Journal of Artificial intelligence Research. Consultado em 6 de fevereiro de 2018 
  5. Halpern, Joseph (1999). «Technical Addendum, Cox's theorem Revisited». Journal of Artificial Intelligence Research. Consultado em 6 de fevereiro de 2018 
  6. a b c Jaynes, Edwin (2003). Probability Theory: The Logic of Science (PDF). Cambridge: Cambridge University Press. 95 páginas. Consultado em 6 de fevereiro de 2018 
  7. Hardy, Michael. «Scaled Boolean algebras». Advances in Applied Mathematics. 29 (2): 243–292. doi:10.1016/s0196-8858(02)00011-8 
  8. Dupré, Maurice J.; Tipler, Frank J. (2009). «New axioms for rigorous Bayesian probability». Bayesian Analysis (em inglês). 4 (3): 599–606. ISSN 1936-0975. doi:10.1214/09-ba422 
  9. Cox, Richard Threlkeld (1946). «Probability, Frequency and Reasonable Expectation». American Journal of Physics. Consultado em 6 de fevereiro de 2018 
  10. Cox, Richard Threlkeld (1961). The algebra of probable inference. Baltimore,: Johns Hopkins Press. ISBN 9780801869822. OCLC 1037825 
  11. Abel, Niels Henrik (1826). «Untersuchung der Functionen zweier unabhängig veränderlichen Größen x und y, wie f(x, y), welche die Eigenschaft haben, daß f(z, f (x,y)) eine symmetrische Function von z, x und y ist». Journal für die reine und angewandte Mathematik. Consultado em 6 de fevereiro de 2018 
  12. J., Aczél, (1966). Lectures on functional equations and their applications. New York: Academic Press. ISBN 9780080955254. OCLC 297771518 
  • Portal da matemática