文脈自由言語

文脈自由言語(ぶんみゃくじゆうげんご)とは、次のような再帰的な生成規則をもつ文脈自由文法によって、与えられた言語の長さ n に対して O(n3) の時間で認識される形式言語プッシュダウン・オートマトンで受理可能な言語と等価である。

  • S → E.
  • E → T | E - T | E + T | (E).
  • T → T * E | T / E | id | num.

ある言語が文脈自由言語でないことを証明するために文脈自由言語の反復補題が使われることがある。

基本的な文脈自由言語 L = { a n b n : n 1 } {\displaystyle L=\{a^{n}b^{n}:n\geq 1\}} は、偶数個の文字から成る文字列で構成され、各文字列の前半は a で、後半は b で構成される。L を生成する文法は S a S b   |   a b {\displaystyle S\to aSb~|~ab} であり、プッシュダウン・オートマトン M = ( { q 0 , q 1 , q f } , { a , b } , { a , z } , δ , q 0 , { q f } ) {\displaystyle M=(\{q_{0},q_{1},q_{f}\},\{a,b\},\{a,z\},\delta ,q_{0},\{q_{f}\})} に受容される。ここで δ {\displaystyle \delta } は以下のように定義される。

δ ( q 0 , a , z ) = ( q 0 , a ) {\displaystyle \delta (q_{0},a,z)=(q_{0},a)}
δ ( q 0 , a , a ) = ( q 0 , a ) {\displaystyle \delta (q_{0},a,a)=(q_{0},a)}
δ ( q 0 , b , a ) = ( q 1 , x ) {\displaystyle \delta (q_{0},b,a)=(q_{1},x)}
δ ( q 1 , b , a ) = ( q 1 , x ) {\displaystyle \delta (q_{1},b,a)=(q_{1},x)}
δ ( q 1 , b , z ) = ( q f , z ) {\displaystyle \delta (q_{1},b,z)=(q_{f},z)}
ここで z は初期スタック記号、x はポップ動作を意味する。

例えば、数式など(プログラミング言語などにおける)の括弧の対応は S S S   |   ( S )   |   λ {\displaystyle S\to SS~|~(S)~|~\lambda } というような規則になる。数式などはだいたい文脈自由言語である。

閉包属性

LP を文脈自由言語、D正規言語としたとき、以下も全て文脈自由言語である(閉じている)。

  • Lクリーネ閉包 L {\displaystyle L^{*}}
  • L準同型 φ(L)
  • LP の連結 L P {\displaystyle L\circ P}
  • LP の和集合 L P {\displaystyle L\cup P}
  • L と(正規言語) D積集合 L D {\displaystyle L\cap D}

しかし、積集合や差集合に関しては閉じていない。これらの操作の具体的な内容については形式言語の情報工学的定義を参照されたい。

積集合操作で閉じていないことの証明

文脈自由言語は積集合において閉じていない。この証明は参考文献にある Sipser 97 の練習問題となっている。まず、2つの文脈自由言語 A = { a m b n c n m , n 0 } {\displaystyle A=\{a^{m}b^{n}c^{n}\mid m,n\geq 0\}} B = { a n b n c m m , n 0 } {\displaystyle B=\{a^{n}b^{n}c^{m}\mid m,n\geq 0\}} を用意する。これらの積集合 A B = { a n b n c n n 0 } {\displaystyle A\cap B=\{a^{n}b^{n}c^{n}\mid n\geq 0\}} に対して文脈自由言語の反復補題を用いることで、それが文脈自由言語でないことを示すことができる。

決定性属性

文脈自由言語についての以下の問題は決定不能である。

  • 等価性: 2つの文脈自由文法 A と B が与えられたとき、 L ( A ) = L ( B ) {\displaystyle L(A)=L(B)} か?
  • L ( A ) L ( B ) = {\displaystyle L(A)\cap L(B)=\emptyset } か?
  • L ( A ) = Σ {\displaystyle L(A)=\Sigma ^{*}} か?
  • L ( A ) L ( B ) {\displaystyle L(A)\subseteq L(B)} か?

文脈自由言語についての以下の問題は決定可能である。

  • L ( A ) = {\displaystyle L(A)=\emptyset } か?
  • L(A) は有限か?
  • メンバーシップ: ある単語 w を与えたとき w L ( A ) {\displaystyle w\in L(A)} か?(メンバーシップ問題は多項式時間で決定可能である。CYK法を参照されたい)

参考文献

  • Michael Sipser (1997年). Introduction to the Theory of Computation. PWS Publishing. ISBN 0-534-94728-X  Chapter 2: Context-Free Languages, pp.91–122.