HWI-Ungleichung

Die HWI-Ungleichung ist eine Funktionalungleichung aus der Theorie des optimalen Transportes, welche die relative Entropie eines Wahrscheinlichkeitsmaßes bezüglich eines Referenzmaßes durch die Wasserstein-Distanz mit quadratischen Transportkosten und die relative Fisher-Information nach oben beschränkt. Sie impliziert eine Transport-Ungleichung von Talagrand und eine logarithmische Sobolew-Ungleichung für gaußsche Maße.

Die Gleichung wurde 2000 von Felix Otto und Cédric Villani bewiesen.[1]

HWI-Ungleichung

Vorbereitung

Sei

  • ( E , d ) {\displaystyle (E,d)} ein polnischer Raum mit Borel-σ-Algebra B ( E ) {\displaystyle {\mathcal {B}}(E)} ,
  • P ( E ) {\displaystyle {\mathcal {P}}(E)} der Raum der Wahrscheinlichkeitsmaße auf ( E , B ( E ) ) {\displaystyle (E,{\mathcal {B}}(E))} .
  • P n ( E ) {\displaystyle {\mathcal {P}}_{n}(E)} der Raum der Wahrscheinlichkeitsmaße auf ( E , B ( E ) ) {\displaystyle (E,{\mathcal {B}}(E))} mit endlichem n {\displaystyle n} -ten Moment.
  • B ( E × E ) , P ( E × E ) {\displaystyle {\mathcal {B}}(E\times E),{\mathcal {P}}(E\times E)} definieren wir analog für den Produktraum E × E {\displaystyle E\times E} ,
  • d x {\displaystyle dx} das Lebesgue-Maß,
  • C p ( A , B ) {\displaystyle C^{p}(A,B)} der Raum der p {\displaystyle p} -mal stetig differenzierbaren Funktionen der Form f : A B {\displaystyle f:A\to B} ,
  • I n {\displaystyle I_{n}} die n {\displaystyle n} -dimensionale Identitätsmatrix.

Seien μ , ν P ( E ) {\displaystyle \mu ,\nu \in {\mathcal {P}}(E)} , dann nennen wir ein π P ( E × E ) {\displaystyle \pi \in {\mathcal {P}}(E\times E)} eine Kopplung von ( μ , ν ) {\displaystyle (\mu ,\nu )} , falls μ {\displaystyle \mu } und ν {\displaystyle \nu } seine Marginalen sind, das heißt π ( d x × E ) = μ ( d x ) {\displaystyle \pi (dx\times E)=\mu (dx)} und π ( E × d x ) = ν ( d x ) {\displaystyle \pi (E\times dx)=\nu (dx)} . Mit ( μ , ν ) {\displaystyle \textstyle \prod (\mu ,\nu )} notieren wir den Raum aller Kopplungen von ( μ , ν ) {\displaystyle (\mu ,\nu )} .

Wir nehmen nun an, dass μ {\displaystyle \mu } absolut stetig bezüglich ν {\displaystyle \nu } ist. Dann definieren wir weiter

  • H ( μ ν ) {\displaystyle H(\mu \mid \nu )} die relative Entropie
H ( μ ν ) = E log ( d μ d ν ) d μ = E d μ d ν log ( d μ d ν ) d ν {\displaystyle H(\mu \mid \nu )=\int _{E}\log \left({\frac {d\mu }{d\nu }}\right)d\mu =\int _{E}{\frac {d\mu }{d\nu }}\log \left({\frac {d\mu }{d\nu }}\right)d\nu } ,
  • W p ( μ ν ) {\displaystyle W_{p}(\mu \mid \nu )} die Wasserstein-Distanz
W p ( μ ν ) = inf π Π ( μ , ν ) ( E × E d ( x , y ) p d π ( x , y ) ) 1 / p {\displaystyle W_{p}(\mu \mid \nu )=\inf \limits _{\pi \in \Pi (\mu ,\nu )}\left(\int _{E\times E}d(x,y)^{p}d\pi (x,y)\right)^{1/p}} ,
  • I ( μ ν ) {\displaystyle I(\mu \mid \nu )} die relative Fisher-Information
I ( μ ν ) = E | log ( d μ d ν ) | 2 d μ = 4 E | d μ d ν | 2 d μ {\displaystyle I(\mu \mid \nu )=\int _{E}\left|\nabla \log \left({\frac {d\mu }{d\nu }}\right)\right|^{2}d\mu =4\int _{E}\left|\nabla {\sqrt {\frac {d\mu }{d\nu }}}\right|^{2}d\mu } .

HWI-Ungleichung auf ℝn

Sei nun E = R n {\displaystyle E=\mathbb {R} ^{n}} und V C 2 ( R n , R ) {\displaystyle V\in C^{2}(\mathbb {R} ^{n},\mathbb {R} )} . Nehme an, dass ν P 2 ( E ) {\displaystyle \nu \in {\mathcal {P}}_{2}(E)} von der Form

ν ( d x ) = e V d x {\displaystyle \nu (dx)=e^{-V}dx}

und μ {\displaystyle \mu } absolut stetig bezüglich ν {\displaystyle \nu } ist. Weiter soll für die Hesse-Matrix

Hess ( V ) k I n {\displaystyle \operatorname {Hess} (V)\geq kI_{n}}

für ein k R {\displaystyle k\in \mathbb {R} } gelten.

Dann gilt die HWI-Ungleichung[2][3]

H ( μ ν ) W 2 ( μ ν ) I ( μ ν ) k 2 W 2 ( μ ν ) 2 . {\displaystyle H(\mu \mid \nu )\leq W_{2}(\mu \mid \nu ){\sqrt {I(\mu \mid \nu )}}-{\frac {k}{2}}W_{2}(\mu \mid \nu )^{2}.}

Falls V {\displaystyle V} konvex ist, dann gilt

H ( μ ν ) W 2 ( μ ν ) I ( μ ν ) . {\displaystyle H(\mu \mid \nu )\leq W_{2}(\mu \mid \nu ){\sqrt {I(\mu \mid \nu )}}.}

Eigenschaften

Falls k > 0 {\displaystyle k>0} , dann impliziert die HWI-Ungleichung die logarithmische Sobolew-Ungleichung mit Konstante k {\displaystyle k} sowie die Talagrand-Ungleichung mit Konstante k {\displaystyle k} auf R n {\displaystyle \mathbb {R} ^{n}} , notiert mit L S E ( k ) {\displaystyle LSE(k)} respektive T ( k ) {\displaystyle T(k)} für Maße der Form[2]

ν ( d x ) = e V d x {\displaystyle \nu (dx)=e^{-V}dx}

HWI-Ungleichung auf riemannschen Mannigfaltigkeiten

Es existiert auch eine Variante für glatte, zusammenhängende, vollständige riemannsche Mannigfaltigkeiten.[4]

Literatur

  • Cédric Villani: Topics in Optimal Transportation. Hrsg.: American Mathematical Society. Vereinigte Staaten 2021, ISBN 978-1-4704-6726-5, S. 301. 

Einzelnachweise

  1. Felix Otto und Cédric Villani: Generalization of an Inequality by Talagrand and Links with the Logarithmic Sobolev Inequality. In: Journal of Functional Analysis. Band 173, Nr. 2, 2000, S. 361–400, doi:10.1006/jfan.1999.3557. 
  2. a b Felix Otto und Cédric Villani: Generalization of an Inequality by Talagrand and Links with the Logarithmic Sobolev Inequality. In: Journal of Functional Analysis. Band 173, Nr. 2, 2000, S. 367, doi:10.1006/jfan.1999.3557. 
  3. Cédric Villani: Topics in Optimal Transportation. Hrsg.: American Mathematical Society. Vereinigte Staaten 2021, ISBN 978-1-4704-6726-5, S. 301. 
  4. Ivan Gentil, Christian Léonard, Luigia Ripani, Luca Tamanini: An entropic interpolation proof of the HWI inequality. In: Stochastic Processes and their Applications. Band 130, Nr. 2, 2020, S. 907–923, doi:10.1016/j.spa.2019.04.002, arxiv:1807.06893.