Haskell 98 Report: 式

The Haskell 98 Report
top | back | next | contents | function index

3 式

この節では、Haskell の式の構文と非形式的セマンティクスについて説明する。また、必要な個所では、Haskell カーネルへの変換についても説明する。let 式の場合をのぞけば、これらの変換は静的なセマンティクスと動的なセマンティクスの両方を保存する。これらの変換のなかで用いられる自由変数と構成子は常に Prelude で定義されたものを参照する。たとえば、リストの内包表記(3.11 節) の変換で使用される "concatMap" の意味は Prelude で定義された concatMap である。これは、識別子 "concatMap" がそのリスト内包表記が使われているスコープにあるかどうかは関係なく、また、もしスコープ内にあった場合でもそれが束縛されているものには関係ない。

以下の構文には、優先レベルのインデックスが(右肩に)ついた非終端記号の族がいくつかある。同様に非終端記号 op、varop および conop にはインデックスが 2 つ付くものがある。片方の文字 l および r は、それぞれ左結合性、右結合性を、文字 n は結合性がないことを示し、もう一方は優先レベルを示している。優先レベル変数 i は 0 から 9 までの範囲であり、結合性変数 a は {l, r, n} のうちどれかである。したがって、たとえば、

aexp -> ( expⁱ⁺¹ qop^(a,i) )

は i について 10 通り、a について 3 通りの全部で 30 通りの式が生成される。


exp	`->`	exp⁰ `::` [context `=>`] type	(expression type signature)
	`\|`	exp⁰
expⁱ	`->`	expⁱ⁺¹ [qop^(n,i) expⁱ⁺¹]
	`\|`	lexpⁱ
	`\|`	rexpⁱ
lexpⁱ	`->`	(lexpⁱ \| expⁱ⁺¹) qop^(l,i) expⁱ⁺¹
lexp⁶	`->`	`-` exp⁷
rexpⁱ	`->`	expⁱ⁺¹ qop^(r,i) (rexpⁱ \| expⁱ⁺¹)
exp¹⁰	`->`	`\` apat₁ ... apat_n `->` exp	(lambda abstraction, n>=1)
	`\|`	`let` decls `in` exp	(let expression)
	`\|`	`if` exp `then` exp `else` exp	(conditional)
	`\|`	`case` exp `of` `{` alts `}`	(case expression)
	`\|`	`do` `{` stmts `}`	(do expression)
	`\|`	fexp
fexp	`->`	[fexp] aexp	(function application)
aexp	`->`	qvar	(variable)
	`\|`	gcon	(general constructor)
	`\|`	literal
	`\|`	`(` exp `)`	(parenthesized expression)
	`\|`	`(` exp₁ `,` ... `,` exp_k `)`	(tuple, k>=2)
	`\|`	`[` exp₁ `,` ... `,` exp_k `]`	(list, k>=1)
	`\|`	`[` exp₁ [`,` exp₂] `..` [exp₃] `]`	(arithmetic sequence)
	`\|`	`[` exp `\|` qual₁ `,` ... `,` qual_n `]`	(list comprehension, n>=1)
	`\|`	`(` expⁱ⁺¹ qop^(a,i) `)`	(left section)
	`\|`	`(` lexpⁱ qop^(l,i) `)`	(left section)
	`\|`	`(` qop^(a,i)_<-> expⁱ⁺¹ `)`	(right section)
	`\|`	`(` qop^(r,i)_<-> rexpⁱ `)`	(right section)
	`\|`	qcon `{` fbind₁ `,` ... `,` fbind_n `}`	(labeled construction, n>=0)
	`\|`	aexp_<qcon> `{` fbind₁ `,` ... `,` fbind_n `}`	(labeled update, n >= 1)

中置演算子を含くむ式は演算子の結合性 (4.4.2 節を見よ)により曖昧性がとりのぞかれる。同じ優先レベルの演算子が括弧なしで連続するときには、構文エラーを避けるためには、そのどちらの演算子も左もしくは右結合性をもたなければならない。括弧のない式 "x qop^(a,i) y qop^(b,j) z" では i=j で、 a=b=l または a=b=r ではなければ、"x qop^(a,i) y" のまわりか、"y qop^(b,j) z" のまわりに括弧が必要である。

符号反転演算子は Haskell では唯一の前置演算子で、プレリュード内で中置の - 演算子と同じ優先レベルをもつものとして定義されている。 (4.4.2 節, 図 4.1 を参照せよ)

この文法はλ抽象、let式、条件式の拡張については曖昧である。この曖昧さは各構成ができるだけ右へ拡張されるというメタ規則により解決される。

構文解析の例を以下にしめす。

これは	このように構文解析される
`f x + g y`	`(f x) + (g y)`
`- f x + y`	`(- (f x)) + y`
`let { ... } in x + y`	`let { ... } in (x + y)`
`z + let { ... } in x + y`	`z + (let { ... } in (x + y))`
`f x y :: Int`	`(f x y) :: Int`
`\ x -> a+b :: Int`	`\ x -> ((a+b) :: Int`)

構文解析に関するノート let/lambda メタルールにある結合性の相互関連は構文解析が難しい。例えば、式 let x = True in x == x == True は、次のような意味にはならない。 let x = True in (x == x == True) なぜなら、(==) は結合性をもたない演算子であるから、この式は以下のように構文解析されなければならないからだ。 (let x = True in (x == x)) == True しかしながら、実装では、結合性を扱うためにうまく構文解析後のパスをうまく使うことができる。プログラマは let/lmabda メタルールの結合性(の欠如)の相互関係を含むような構成を避けたほうが良い。

明解であることを旨とし、この節の以下の部分では式の構文を優先レベルなしでしめすこととする。

3.1 エラー

式の評価中のエラー(_|_ と表示する)は、停止しないことと Haskell のプログラムには、区別できない。 Haskell は遅延評価の言語であるから、すべての Haskell の型は _|_ を含む。すなわち、すべての型の値は、必要があれば、結果がエラーになる計算に束縛されうる。評価時のエラーは、ただちにプログラムは停止させ、ユーザが補足することはできない。プレリュードでは、このようなエラーを直接引き起こすための関数が 2 つ用意されている。 error :: String -> a undefined :: a error の呼び出しはプログラムの実行を停止させ、オペレーティングシステムに適切なエラー表示を返す。この関数は、同時に文字列をなんらかのシステムに依存した方法で画面に表示する。undefined が使われた場合のエラーメッセージはコンパイラが生成する。

3.2 変数、構成子、演算子、リテラル

aexp	`->`	qvar	(variable)
	`\|`	gcon	(general constructor)
	`\|`	literal


gcon	`->`	`()`
	`\|`	`[]`
	`\|`	`(,`{`,`}`)`
	`\|`	qcon
var	`->`	varid \| `(` varsym `)`	(variable)
qvar	`->`	qvarid \| `(` qvarsym `)`	(qualified variable)
con	`->`	conid \| `(` consym `)`	(constructor)
qcon	`->`	qconid \| `(` gconsym `)`	(qualified constructor)
varop	`->`	varsym \| `varid `	(variable operator)
qvarop	`->`	qvarsym \| `qvarid `	(qualified variable operator)
conop	`->`	consym \| `conid `	(constructor operator)
qconop	`->`	gconsym \| `qconid `	(qualified constructor operator)
op	`->`	varop \| conop	(operator)
qop	`->`	qvarop \| qconop	(qualified operator)
gconsym	`->`	`:` \| qconsym

Haskell では中置記法をサポートする特別な構文が用意されている。 演算子は中置構文(3.4 節) で適用できる関数であり、また、セクション (3.5 節)を使って部分適用可能である。

演算子は、+ や $$ のような演算子シンボル、あるいは、`op` のように、通常の識別子をバッククオートでかこったもののどちらかである。たとえば、前置適用 op x y のように書くかわりに x `op` y のように中置適用に書くこともできる。もし、`op` に対して、結合性宣言がなければ、これはデフォルトで最も高い優先どと左結合性をもつ。 ( 4.4.2 節を見よ。)

その逆に、演算子シンボルは括弧でかこむことで通常の識別に変換することができる。たとえば、(+) x y は x + y と同等である。また foldr (*) 1 xs は foldr (\x y -> x*y) 1 xs と同等である。

組み込み型のいくつかの構成子に対しては、命名に特別な構文を用いる。これは、gcon および literal の生成ルールに現われる。これらについては 6.1 節で説明する。

整数リテラルは、Integer 型の対応する値への、関数 fromInteger の適用を表現している。同様に、浮動小数リテラルは fromRational の Rational (すなわち、 Ratio Integer) 型の値への適用を表わす。

変換:

整数リテラル i は fromInteger i と同等でる。ここでは fromInteger は Num クラスのメソッドである(6.4.1 節を見よ)。

小数リテラルは fromRational (n Ratio.% d) と同等である。ここでは、 fromRational は Fractional のメソッドであり、 Ratio.% は Ratio ライブラリに定義されているように、二つの整数から有理数を構築する。整数 n と d は n/d = f となるように選ばれる。

3.3 カリー化された適用とラムダ抽象

fexp	`->`	[fexp] aexp	(function application)
exp	`->`	`\` apat₁ ... apat_n `->` exp	(lambda abstraction, n>=1)

関数適用は、 e₁e₂ と書く。適用は左結合性をもつので、(f x) y の括弧は省略することができる。e₁ はデータ構成子である可能性もあるので、データ構成子の部分適用は許されている。

ラムダ抽象は \ p₁ ... p_n -> e と書く。ここで、p_i はパターンである。 \x:xs->x のような式は構文としては正しくない。正しくは、 \(x:xs)->x と書く。

パターンの集合は線形でなければならない。すなわち、集合の中で 2 回以上出現してはならない。

変換:

以下の同一性が保存される:

\ p₁ ... p_n -> e = \ x₁ ... x_n -> case (x₁, ..., x_n) of (p₁, ..., p_n) -> e

ここで、x_i は新しい識別子である。

3.17.3 節で解説するが、この case 式とパターン照合のセマンティクスを組合せるこの変換は、もし、パターン照合に失敗すると、_|_となる。

3.4 演算子適用

exp	`->`	exp₁ qop exp₂
	`\|`	`-` exp	(prefix negation)
qop	`->`	qvarop \| qconop	(qualified operator)

e₁ qop e₂ という形式は二項演算子 qop の式 e₁ および e₂ への中置適用である。

特別な形式 -e は前置の符号判定演算子を表わす。この演算子は Haskell における唯一の前置演算子であり、 negate (e)という意味の構文である。二項演算子 - はプレリュード中の - の定義への参照を必要としない。モジュールシステムにより再束縛される。いっぽうで、単項演算子 - は常にプレリュード中で定義された negate 関数を参照する。 - 演算子の局所的な意味と単項の符号反転演算との間にはなんの結びつきもない。

前置の符号反転演算子はプレリュード中に定義されている中置演算子 - と同じ優先順位である (表 2 を見よ)。 e1-e2 は二項演算子 e1-e2 の中置適用として構文解析されるので、これを単項演算子として構文解析させるためには、 e1(-e2) と表記しなければならない。(-) は、他のすべての中置演算子と同様に、 (\ x y -> x-y) という意味の構文であり、 (\ x -> -x)ということではない。後者の意味を用いるのなら negate を使わなければならない。

変換:

以下の同一性が保存される:

e₁ op e₂	=	`(`op`)` e₁ e₂
`-`e	=	`negate` (e)

3.5 セクション

aexp	`->`	`(` expⁱ⁺¹ qop^(a,i) `)`	(left section)
	`\|`	`(` lexpⁱ qop^(l,i) `)`	(left section)
	`\|`	`(` qop^(a,i)_<-> expⁱ⁺¹ `)`	(right section)
	`\|`	`(` qop^(r,i)_<-> rexpⁱ `)`	(right section)

セクション は ( op e ) あるいは ( e op ) のように書く。ここで、op は二項演算子であり、e は式である。セクションは二項演算子の部分適用をあらわすのに便利な構文である。

セクションに適用される構文上の優先順位は以下の通りである。 (op e) は、 (x op e) が、(x op (e)) として構文解析されるとき、そのときに限り、正しい。 (e op) についても同様である。たとえば、 (*a+b) は構文上あやまりであるが、(+a*b) および (*(a+b)) は構文上正しい。(+) は左結合性をもつので、(a+b+) は構文的に正しいが、(+a+b) は正しくない。後者は (+(a+b)) と書くことで正しい構文になる。

もうひとつ例をあげよう。次の式 (let n = 10 in n +) は、正しくない。それは、let/lambda メタルール (3 章)により、式 (let n = 10 in n + x) は、 (let n = 10 in (n + x)) と構文解析され、 ((let n = 10 in n) + x) と構文解析されるわけではないからである。

- は文法上、特別扱いで、(- exp) はセクションではなく、前節で説明したように前置の符号反転演算子の適用である。しかしながら、subtract 関数は、プレリュードでは (subtract exp) が上で許されていなかったセクションの代りにつかえるように定義されている。式 (+ (- exp)) を同じ目的で使用できる。

変換:

以下の同一性が保存される

`(`op e`)`	=	`\` x `->` x op e
`(`e op`)`	=	`\` x `->` e op x

ここで、op は二項演算子、e は式、x は e 中で自由変数ではない。

3.6 条件式

exp -> if exp₁ then exp₂ else exp₃

条件式は if e₁ then e₂ else e₃ という形式をもち、 e₁ の値が True のとき、 e₂ の値を返し、e₁ が False のとき e₃ を返す。それ以外の場合には _|_ を返す。

変換:

以下の同一性が保存される

if e₁ then e₂ else e₃ = case e₁ of { True -> e₂ ; False -> e₃ }

ここで、True および False はプレリュードで定義されている Bool 型の無引数データ構成子である。 e₁ の型は Bool でなければならず、 e₂ および e₃ は同じ型で、当該の条件式全体の型でなければならない。

3.7 リスト

exp	`->`	exp₁ qop exp₂
aexp	`->`	`[` exp₁ `,` ... `,` exp_k `]`	(k>=1)
	`\|`	gcon
gcon	`->`	`[]`
	`\|`	qcon
qcon	`->`	`(` gconsym `)`
qop	`->`	qconop
qconop	`->`	gconsym
gconsym	`->`	`:`

リストは [e₁,..., e_k] のように書く。ここで k>=1 である。リスト構成子は : であり、空リストは [] と書きあらわす。リスト上の標準的な演算はプレリュードであたえられている(6.1.3 節をみよ。また、8 章の特に、 8.1 節を見よ)。

変換:

次の同一性が保存される:

[e₁, ..., e_k] = e₁ : (e₂ : ( ... (e_k : [])))

ここで、 : and [] プレリュードに定義されているように、リストの構成子である。 (6.1.3 節を見よ。) e₁ から、e_k の型はすべて同じ(これを t としよう)でなければならない。そして式全体の型は [t] である。 (4.1.2 節を見よ。)

構成子の「:」は、[] も同様で、リストの構築専用に予約されている。これはこの言語の構文の一部と考えられ、隠蔽や再定義はできない。: は右結合性をもつ演算子で、その優先レベルは 5 (4.4.2) 節を見よ)である。

3.8 タプル


aexp	`->`	`(` exp₁ `,` ... `,` exp_k `)`	(k>=2)
	`\|`	qcon
qcon	`->`	`(,`{`,`}`)`

タプル は (e₁,..., e_k) と書き、任意の長さ k>=2 をとりうる。n-タプルの構成子は (,...,) と書き表わす。ここで、コンマは n-1 個である。したがって、 (a,b,c) および (,,) a b c は同じ値をあらわす。タプル上の標準演算はプレリュードで定義されている (6.1.4 節および 8 章を見よ)。

変換:

k>=2 に対して (e₁, ..., e_k) は、プレリュードの定義により k-タプルのインスタンスであり、変換を必要としない。もし、t₁ から t_k までが、それぞれ e₁ から e_k までの型をもつならタプル全体の型は (t₁, ..., t_k) である(4.1.2 節を見よ)。

3.9 ユニット式と括弧でくくられた式

aexp	`->`	gcon
	`\|`	`(` exp `)`
gcon	`->`	`()`

(e) という形式は単なる 括弧でくくられた式であり、e と同等である。 ユニット式 () は () 型 (4.1.2 節を見よ)の、 _|_ 以外の唯一の要素である。これは無引数タプルとみなすことができる。 (6.1.5 節を見よ。)

変換:

(e) は e と同等である。

3.10 数列

aexp -> [ exp₁ [, exp₂] .. [exp₃] ]

数列[e₁, e₂ ..e₃] は型 t の値のリストを表す。ここで、各 e_i の型は t であり、t は Enum クラスのインスタンスである。

変換:

数列は以下の同一性を満す。

`[` e₁`.. ]`	=	`enumFrom` e₁
`[` e₁`,`e₂`.. ]`	=	`enumFromThen` e₁ e₂
`[` e₁`..`e₃ `]`	=	`enumFromTo` e₁ e₃
`[` e₁`,`e₂`..`e₃ `]`	=	`enumFromThenTo` e₁ e₂ e₃

ここで enumFrom、enumFromThen、 enumFromTo および、enumFromThenTo は Enum クラスのクラスメソッドであり、プレリュードで定義されている(図 6.1 を見よ)。

これ故、数列のセマンティクスは型 t の対するインスタンス宣言に全面的に依存する。どの Prelude 型が Enum クラスのインスタンスであるかの詳細は図 6.3.4 節を見よ。

3.11 リスト内包表記

aexp	`->`	`[` exp `\|` qual₁ `,` ... `,` qual_n `]`	(リスト内包表記, n>=1)
qual	`->`	pat `<-` exp	(生成器)
	`\|`	`let` decls	(局所宣言)
	`\|`	exp

リストの内包表記は [ e | q₁, ..., q_n ],n>=1, という形式を持つ。ここでは、q_i という限定子は以下のいずれかである。

生成器、形式は p <- e。ここで、p は型 t のパターン (3.17 節を見よ)であり、 e は型 [t] の式
ガード、Bool 型の任意の式
局所束縛、生成される式 e 、あるいは、後につづくガードあるいは生成器で使用される新しい定義を供給する。

このような、リストの内包表記は、限定子リストのなかの入れ子になった、深さ優先評価によって作られた一連の環境のなかで e を評価することで作りだされた要素のリストを返す。変数の束縛は通常のパターン照合のルール(3.17 節を見よ)にしたがって起こり、もし、照合が失敗すればそのリストの要素は単にスキップされる。したがって、 [ x | xs <- [ [(1,2),(3,4)], [(5,4),(3,2)] ], (3,x) <- xs ] は [4,2] というリストになる。もし、限定子がガードなら、先行するパターン照合が成功するためには、そのガードが評価されて True にならねばならない。通常とおなじようにリストの内包表記中の束縛は外側の束縛を覆い隠す。たとえば、

[ x | x <- x, x <- x ] = [ z | y <- x, z <- y]

変換:

リストの内包表記は以下の同一性を満す。これはカーネルへの変換時にも用いられる。

`[` e `\| True ]`	=	`[`e`]`
`[` e `\|` q `]`	=	`[` e `\|` q`, True ]`
`[` e `\|` b`,` Q `]`	=	`if` b `then` `[` e `\|` Q `]` `else []`
`[` e `\|` p `<-` l`,` Q `]`	=	`let ok` p `=` `[` e `\|` Q `]`
		`ok _ = []`
		`in concatMap ok` l
`[` e `\| let` decls`,` Q `]`	=	`let` decls `in` `[` e `\|` Q `]`

ここで e のとりうる範囲は式、p のとりうる範囲はパターン、l のとりうる範囲はリスト値の式、b のとりうる範囲はブール式、decls は宣言リスト、q は限定子の、 Q は限定子のリストである。 ok は新しい変数である。関数 concatMap および真理値 True はプレリュードで定義されている。

リスト内包表記の変換に示されているように let によって束縛された変数は完全な多相型になる。一方で、<- で定義された変数はラムダ束縛であるので単相型になる。 (4.5.4 節を見よ。)

3.12 let 式

exp -> let decls in exp

Let 式 は let { d₁ ; ... ; d_n } in e という一般形式を持ち、入れ子でレキシカルスコープで相互再帰的な宣言リスト (このような let は他の言語ではよく letrec と呼ばれる) を持つ。宣言のスコープ(有効範囲)は、式 e および宣言の右辺である。宣言については 4 章を参照のこと。パターン束縛は遅延照合となる。すなわち暗黙の ~ がパターンを反駁不可にする。たとえば、 let (x,y) = undefined in e は x あるいは y が評価されるまでは実行時エラーを起こさない。

変換:

式 let { d₁ ; ... ; d_n } in e₀ の動的セマンティクスは次の変換により捕捉される。すべての型シグネチャーを除いた後、各宣言 d_i は p_i = e_i という形式の等式に変換される。ここで、 p_i および e_i はパターンおよび再帰的に 4.4.3 節の変換を使う式である。一旦変換が行われると以下の同等性が保持さる。これはカーネルへの変換として用いられる。

内で自由変数としてあらわれない。

`let {`p₁`=`e₁`;` ... `;` p_n`=`e_n`} in` e₀	=	`let (~`p₁`,` ... `,~`p_n`) = (`e₁`,` ... `,`e_n`) in` e₀
`let` p `=` e₁ `in` e₀	=	`case` e₁ `of ~`p `->` e₀
		ここでは内の変数が e₁
`let` p `=` e₁ `in` e₀	=	`let` p `= fix ( \ ~`p `->` e₁`) in` e₀

ここで fix は最小不動点演算子である。反駁不可パターン ~p の使い方に注意すること。この変換は静的セマンティクスを保存しない、なぜなら、case の使用が束縛変数の完全な多相型付けをはばんでいるからである。let 式での束縛の静的セマンティクスは 4.4.3 節で解説する。

3.13 case 式


exp	`->`	`case` exp `of` `{` alts `}`
alts	`->`	alt₁ `;` ... `;` alt_n	(n>=1)
alt	`->`	pat `->` exp [`where` decls]
	`\|`	pat gdpat [`where` decls]
	`\|`		(empty alternative)
gdpat	`->`	gd `->` exp [ gdpat ]
gd	`->`	`\|` exp⁰

case 式は一般的には以下の形式を持つ。

case e of { p₁ match₁ ; ... ; p_n match_n }

ここで、各 match_i は以下の一般的形式をもつ。

	`\|` g_i1	`->` e_i1
	...
	`\|` g_{im_i}	`->` e_{im_i}
	`where` decls_i

( gd に対する構文ルールでは、"|" は終端シンボルであり、選択肢のためのメタシンボルではないことに注意 ) 各選択肢 p_i match_i はパターン部 p_i および照合部 match_i から構成される。各照合部はさらにガード部 g_ij とボディ部 e_ij (expressions) の対のならびから構成される。同様に、当該ガード部および当該選択肢の式を有効範囲とする付加的な束縛 (decls_i) が続く。以下の形式

pat -> exp where decls

は次のものの省略形として扱う。

	pat `\| True`	`->` exp
	`where` decls

case 式は少くとも 1 つの選択肢を持たねばならない。また、各選択肢は少くとも 1 つのボディ部をもたなければならない。各ボディ部は同じ型でなければならず、この型が当該 case 式全体の型である。

case 式は、式 e を個別の選択肢にパターン照合することによって評価される。選択肢は上から下へ順に試される。e が選択肢最初に成功した照合により対応するボディ部の評価がおこなわれる。このとき、当該の case 式の環境はその選択肢を照合するときに作られた束縛と、その選択肢に対応する decls_i とによって拡張される。もし、照合がすべて失敗すると結果は _|_ になる。パターン照合については 3.17 節で解説し、3.17.3 節で、case 式の形式的セマンティクスをについても解説する。

構文解析に関するノート 次の式 case x of { (a,_) | let b = not a in b :: Bool -> a } は正しく構文解析できる巧妙な例である。曖昧でない単一の構文解析、すなわち、 case x of { (a,_) | (let b = not a in b :: Bool) -> a } を持つ。しかしながら、Bool -> a 句は型の構文としては正当であり、先読みが制限された構文解析器では誤ってこの選択にたどりつくことがありえる。それゆえ、このプログラム拒否れる。それ故、プログラマは、型シグネチャーでおわるガードは避けべきである。実際それが、 gd が exp ではなく exp⁰ をを含む理由である

3.14 do 式

exp	`->`	`do` `{` stmts `}`	(do expression)
stmts	`->`	stmt₁ ... stmt_n exp [`;`]	(n>=0)
stmt	`->`	exp `;`
	`\|`	pat `<-` exp `;`
	`\|`	`let` decls `;`
	`\|`	`;`	(empty statement)

do 式はモナドプログラミングの習慣的な構文である。次のような式 putStr "x: " >> getLine >>= \l -> return (words l) を以下のような古典的な書き方にすることができる。 do putStr "x: " l <- getLine return (words l) となる。

変換:

do 式は以下の同一性を満し、これらは、空の stmtsを除去した後、カーネルへの変換に用いることができる。

`do {`e`}`	=	e
`do {`e`;`stmts`}`	=	e `>> do {`stmts`}`
`do {`p `<-` e`;` stmts`}`	=	`let ok` p `= do {`stmts`}`
		`ok _ = fail "..."`
		`in` e `>>= ok`
`do {let` decls`;` stmts`}`	=	`let` decls `in do {`stmts`}`

"..." はコンパイラのエラーメッセージをあらわしている。これは fail に渡される。パターン照合失敗の個所を示すようにすることが多い。関数 >>、>>=、および、 fail はMonad クラスの演算でありプレリュードで定義されている。また、ok は初出の識別子である。

do の変換で示されているように、let で束縛された変数は完全な多相型である。一方、<- で定義されている変数はラムダ束縛であるので、単相型である。

3.15 フィールドラベルをもつデータ型

データ型宣言は、その型の構成要素のいくつかあるいはすべてにフィールドラベルを定義することができる( 4.2.1 節を見よ)。これらのフィールドラベルは、データ型全体の構造とは独立に、構築、選択、更新することが可能である。

同じスコープで、異るデータ型が同じフィールド名を共有することはできない。ひとつのフィールドラベルはひとつの構成子中に高々1度しか使えない。しかしながら、同じフィールド名はひとつのデータ型の中で、すべての構築子のなかで、同じ型付けのフィールドに対して、一度以上使うことができる。最後の要点を説明すると、 data S = S1 { x :: Int } | S2 { x :: Int } -- OK data T = T1 { y :: Int } | T2 { y :: Bool } -- NG ここで、S は正しいが、T は正しくない、それは y は後者では型付けの整合性がとれていないからである。

3.15.1 フィールドの選択

aexp -> qvar

フィールド名は選択子関数として使用する。変数として使用するときは、フィールド名はオブジェクトからそのフィールドを取り出す関数として働く。選択子はトップレベルの束縛なので局所変数によって覆い隠される。しかし、同じ名前の他のトップレベルの束縛とは衝突することは出来ない。局所変数による隠蔽は選択子関数にのみ効果があり、レコード構築 (3.15.2 節)や更新 (3.15.3 節)では、フィールドドラベルを普通の変数と混同してはならない。

変換:

フィールドラベル f は以下のような定義の選択子関数を導入する。

f x = case x of { C₁ p₁₁ ...p_1k -> e₁ ; ... ; C_n p_n1 ...p_nk -> e_n }

ここで C₁ ...C_n は f というラベルをもつフィールド含むすべての構成子で、 p_ij は f が C_i の j 番目のフィールドのラベルであるときはy、さもなければ _、そして、 e_i は C_i のいくつかのフィールドのラベルが f のとき y となり、さもなければ、undefined となる。

3.15.2 フィールドラベルを用いた構築

aexp	`->`	qcon `{` fbind₁ `,` ... `,` fbind_n `}`	(labeled construction, n>=0)
fbind	`->`	qvar `=` exp

ラベルの付いたフィールドをもつ構成子は構成要素が位置ではなく名前で指定される値を構成するのに使用できる。宣言リストで用いるブレースとは違い、これらはレイアウトの支配を受けない。{ および } は明示的に書かねばならない。(これはフィールドパターンおよびフィールド更新のときにも真である。) フィールド名を用いた構築は以下の制約にしたがう：

指定した構成子のフィールドラベルとして宣言したものだけが言及の対象となる。
フィールド名を2度以上言及することはできない。
言及されないフィールドは ⊥ に初期化される。
正格フィールド(その型の宣言に ! が付いているもの)が構築時に言及されなかった場合にはコンパイルエラーが起きる。正格フィールドについては 4.2.1 節で議論する。

式 F {} は F がデータコンストラクタであるなら、F がレコード構文 (この場合、F は正格フィールドをもたない -- 上の三番目の項目をみよ)で定義されいるかどうかにかかわらず、 F _|_₁ ... _|__n を表わす。なお、n は F の引数の数である。

変換:

束縛 f = v において、フィールド f は v のラベルである。

C { bs } = C (pick^C₁ bs undefined) ...(pick^C_k bs undefined)

ここで k は C の引数の数。

補助関数 pick^C_i bs d は以下のように定義される。

もし、構成子 C の i番目の構成要素のフィールド名が f であり、f=v が束縛リスト bs 中に出現するなら、pick^C_i bs d は v である。さもなければ、 pick^C_i bs d はデフォルト値 d である。

3.15.3 フィールドラベルを用いた更新

aexp -> aexp_<qcon> { fbind₁ , ... , fbind_n } (labeled update, n>=1)

フィールドラベルを持つ、データ型に属する値は非破壊的に更新することができる。これにより、指定したフィールドの値がそれまでの値と置き換えた新しい値がつくられる。更新は次のような方法に限られる。

すべてのラベルは同じデータ型からのものでなくてはならない。
すくなくとも 1 つの構成子は更新に際して言及されたすべてのラベルを定義していなければならない。
2 度以上言及されるラベルはない。
更新すべき値がすべての指定したラベルを含んでいない場合には実行時エラーが起こる。

変換:

前述の pick を用いて、

e `{` bs `}`	=	`case` e `of`
		C₁ v₁ ... v_k₁ `->` C₁ (pick^C₁₁ bs v₁) ... (pick^C₁_k₁ bs v_k₁)
		...
		C_j v₁ ... v_{k_j} `->` C_j (pick^C_j₁ bs v₁) ... (pick^C_j_{k_j} bs v_{k_j})
		`_ -> error "Update error"`

ここで、 {C₁,...,C_j} は b に現れるすべてのラベルを含む構成子の集合であり、 k_i は C_iの引数の数である。

以下はラベル付きフィールドを使った例である。 data T = C1 {f1,f2 :: Int} | C2 {f1 :: Int, f3,f4 :: Char}

式	変換
`C1 {f1 = 3}`	`C1 3 undefined`
`C2 {f1 = 1, f4 = 'A', f3 = 'B'}`	`C2 1 'B' 'A'`
`x {f1 = 1}`	`case x of C1 _ f2 -> C1 1 f2`
	`C2 _ f3 f4 -> C2 1 f3 f4`

フィールド f1 は T の二つの構成子に共通している。この例は、フィールドラベル記法による構成子を使った式を同等のフィールドラベルのない構築子を使った式へ変換する。もし、更新のなかで使用するフィールド名の集合、たとえば、x {f2 = 1, f3 = 'x'} を定義する単一構成子がなければ、コンパイル時エラーとなる。

3.16 式の型シグネチャ

exp -> exp :: [context =>] type

式の型シグネチャは e :: t という形式をもつ。ここで、e は式、t は型 (4.1.2節)である。式の型シグネチャは式を明示的に型付けするのに用い、多重定義 (4.3.4 節を見よ)によっておこる型の曖昧さを解決するために用いることができる。当該の式の値はまさに exp の値である。一般の型シグネチャ (4.4.1 節を見よ)と同様に、式 exp から導出される主型よりもより特殊な型を宣言することができる。しかし、主型より一般的なものや主型と比較できないような型を指定するとエラーとなる。

変換:

e :: t = let { v :: t; v = e } in v

3.17 パターン照合

パターンは、ラムダ抽象、関数定義、パターン束縛、リスト内包表記、do 式、case 式に出現する。しかしながら、これらのうち、最初の5つは最終的には、case 式に変換される。それゆえ、パターン照合のセマンティクスは case 式対するもので十分である。

3.17.1 パターン

パターンの構文は以下のとおり:


pat	`->`	var `+` integer	(successor pattern)
	`\|`	pat⁰
patⁱ	`->`	patⁱ⁺¹ [qconop^(n,i) patⁱ⁺¹]
	`\|`	lpatⁱ
	`\|`	rpatⁱ
lpatⁱ	`->`	(lpatⁱ \| patⁱ⁺¹) qconop^(l,i) patⁱ⁺¹
lpat⁶	`->`	`-` (integer \| float)	(negative literal)
rpatⁱ	`->`	patⁱ⁺¹ qconop^(r,i) (rpatⁱ \| patⁱ⁺¹)
pat¹⁰	`->`	apat
	`\|`	gcon apat₁ ... apat_k	(arity gcon = k, k>=1)
apat	`->`	var [`@` apat]	(as pattern)
	`\|`	gcon	(arity gcon = 0)
	`\|`	qcon `{` fpat₁ `,` ... `,` fpat_k `}`	(labeled pattern, k>=0)
	`\|`	literal
	`\|`	`_`	(wildcard)
	`\|`	`(` pat `)`	(parenthesized pattern)
	`\|`	`(` pat₁ `,` ... `,` pat_k `)`	(tuple pattern, k>=2)
	`\|`	`[` pat₁ `,` ... `,` pat_k `]`	(list pattern, k>=1)
	`\|`	`~` apat	(irrefutable pattern)
fpat	`->`	qvar `=` pat

構成子の引数の数は、それに対応するサブパターンの数と一致しなければならない。部分適用された構成子に対して一致することはできない。

すべてのパターンは線型でなければならない。すなわち、一つの変数は 2 度以上出現してはならない。例えば: f (x,x) = x -- ILLEGAL; x が 2度パターンのなかで使われている

var@pat という形式のパターンはアズパターンとよばれ、var を pat でマッチした値に対する名前として使用することができる。例えば、 case e of { xs@(x:rest) -> if x==0 then rest else xs } は以下と同等である。 let { xs = e } in case xs of { (x:rest) -> if x==0 then rest else xs }

_ という形式のパターンはワイルドカードであり、パターンの一部が右辺で参照されないような場合に便利である。その場所を示す以外では使われない認識子のようなものである。たとえば、 case e of { [x,_,_] -> if x==0 then True else False } は以下と同等である。 case e of { [x,y,z] -> if x==0 then True else False }

3.17.2 パターン照合の非形式的セマンティクス

パターンは値に対して照合される。パターンを照合しようする場合、つぎの 3 つのうちの一つが起こる。失敗、成功して当該パターンの各変数の束縛を返す、発散(すなわち、_|_ が返る)。パターン照合は以下のルールに従い、左から右へ、外から内へと進む。

値 v に対するパターン var の照合は常に成功し、 var を v に束縛する。
値 v に対するパターン ~apat の照合は常に成功する。v の apat への照合が成功すれば、 apat 中の自由変数は対応する値に束縛される。もし、v の apat への照合が失敗するか、発散すれば、apat 中の自由変数は _|_ に束縛される。(束縛は評価を強制しない)。

操作的にいえば、パターン ~apat 上の照合は、パターン apat 中の変数のひとつが使用されるまでは起こらないということである。使用の時点でパターン全体がその値に照合され、もし、照合が失敗あるいは発散すれば、計算全体が失敗あるいは発散する。
値のワイルドカードパターン _ への照合は常に成功するが、束縛は起こらない。
ある値へのパターン con pat の照合は、con が newtype で定義されたものであれば、その値が、
- もし、con v という形式をもつなら pat は v と照合する
- もし、値が _|_ なら pat は _|_ と照合する
すなわち、newtype に対応する構成子は値の型の変更をのみ提供する。
con が data により定義された構成子でるとすると、パターン con pat₁...pat_n のある値への照合は、その値に依存する:
- もし、その値が con v₁...v_n という形式をもつなら、サブパターンはデータ値の構成要素に対して左から右へ照合する。すべての照合が成功すれば、照合全体は成功する。最初に失敗あるいは発散したところから順に照合全体の失敗あるいは発散が発生する。
- もし、その値が _|_ であれば、照合は発散する。
ラベル付フィールドをもちいた構成子に対する照合は、フィールドがフィールドリストで名前付けられた順番に照合されるということを除けば、通常の構成子パターンの照合と同じである。リストアップされているすべてのフィールドはその構成子によって宣言されていなければならない。フィールドは 2度以上名付けられてはいけない。パターンによって名付けられていないフィールドは( _ と照合され)無視される。
数値、文字あるいは文字列リテラルのパターン k の値 v への照合は、v == k であれば成功する。ここで、 == はそのパターンの型で多重定義されているものとする。もしこのテストが発散すれば照合は発散する。

数値リテラルの解釈は 3.2 節で解説したとおりである。すなわち、多重定義された fromInteger あるいは fromRational を Integer 型あるいは Rational 型のリテラル (resp) に適用して、適切な型に変換する。
パターン n+k (ここで n は変数、 k は正の整数リテラル) の値 v への照合は、x >= k であるときに成功し、結果として、n を x - k に束縛する。また、それ以外の場合には照合は失敗する。さらに関数 >= および - は多重定義される。これは、当該パターンの型に依存する。もし、比較が発散すれば、照合は発散する。

リテラル k の解釈は整数のリテラルのみが許されることを除けば、数値リテラルの解釈と同じである。
アズパターン var @ apat の値 v への照合は、var の v への束縛をともなった上で、 apat の v への照合の結果となる。apat の v への照合が失敗または発散した場合、全体のマッチングも同様に失敗または発散する。

自明な静的型制約(たとえば、文字の真理値への照合はエラーになるなど) 以外に、次のような静的なクラス制約が保存される。

整数リテラルのパターンは、Num クラスの値にだけ照合可能である。
小数リテラルのパターンは、Fractional クラスの値にだけ照合可能である。
n+k パターンは、Integral クラスの値にだけ照合可能である。

多くのひとが n+k パターンは使うべきではないと感じている。これらのパターンは Haskell の将来のバージョンでは変更されるか取り除かれる可能性がある。

２種類のパターンを分けたほうよいばあいある。反駁不可能パターン の照合は非正格である。当該パターンは、対象となる値が _|_ であっても照合する。反駁可能パターン の照合は正格である。対象になる値が _|_ である場合には、その照合は発散する。反駁不可能パターンは次のようなものである。変数、ワイルドカード、 N が newtype で定義された構成子であり、apat が反駁不可能(4.2.3 節をみよ) である場合の N pat、apat が反駁不可能であるかまたは(apat が反駁不可能であるかどうかにかかわらず) ~apat という形式をもつもの。

いくつか例をあげよう

パターン ['a','b'] を ['x',_|_] に照合しようとすれば、'a' は 'x' への照合に失敗し、結果は失敗照合となる。しかし、パターン ['a','b'] を [_|_,'x'] に照合しようとすれば、'a' の _|_ への照合が、全体の照合を発散させる。
以下の例は、反駁可能照合 vs. 反駁不可能照合の例示である。 (\ ~(x,y) -> 0) _|_ => 0 (\ (x,y) -> 0) _|_ => _|_(\ ~[x] -> 0) [] => 0 (\ ~[x] -> x) [] => _|_(\ ~[x,~(a,b)] -> x) [(0,1),_|_] => (0,1) (\ ~[x, (a,b)] -> x) [(0,1),_|_] => _|_(\ (x:xs) -> x:x:xs) _|_ => _|_(\ ~(x:xs) -> x:x:xs) _|_ => _|_:_|_:_|_
以下のような宣言を考える。 newtype N = N Bool data D = D !Bool 次の例は、data と newtype の型宣言によるパターン照合の違いを示したものである。 (\ (N True) -> True) _|_ => _|_(\ (D True) -> True) _|_ => _|_(\ ~(D True) -> True) _|_ => True その他の例は 4.2.3 節にある。

case 式のトップレベルでのパターンと、関数あるはパターン束縛でのトップレベルパターンは 0 ないしそれ以上の対応するガード部を持つことができる。ガード部は、すべての引数のパターン照合が成功したあとにのみ評価される真理値式であり、パターン照合全体が成功したときには必ず真となる。ガード部の環境は、case 式選択肢、関数定義、あるいはそれがむすびつけているパターン束縛と同じ環境である。

ガード部のセマンティクスは明らかに関数あるいは case 式の正格性というような性質に影響をあたえる。特に反駁不可能パターン以外ではガード部があれば評価される。たとえば、 f :: (Int,Int,Int) -> [Int] -> Int f ~(x,y,z) [a] | (a == y) = 1 では a と y の両方がガード部の == によって評価される。

3.17.3 パターン照合の形式的セマンティクス

case 式以外のすべてのパターン照合構成のセマンティクスは、それら構成に case 式を関連づける同等性を与えることで定義する。 case 式そのもののセマンティクスは、図3--4 中の一連の同等性を与えることにより定義される。どの実装もこの同等性を保持するようにしなければならない。効率のよくないコード生成につながるので、この同等性は直接用いることが期待されているわけではない。

(a)	`case` e `of {` alts `}` = `(\`v `-> case` v `of {` alts `})` e
	v は新しい変数
(b)	`case` v `of {` p₁ match₁`;` ... `;` p_n match_n `}`
	= `case` v `of {` p₁ match₁ `;`
	`_ ->` ... `case` v `of {`
	p_n match_n `;`
	`_ -> error "No match" }`...`}`
	各 match_i は以下の形式をもつ。
	`\|` g_i,1 `->` e_i,1 `;` ... `; \|` g_{i,m_i} `->` e_{i,m_i} `where {` decls_i `}`
(c)	`case` v `of {` p `\|` g₁ `->` e₁ `;` ...
	`\|` g_n `->` e_n `where {` decls `}`
	`_ ->` e' `}`
	= `case` e' `of`
	`{`y `->` (y は新しい変数)
	`case` v `of {`
	p `-> let {` decls `} in`
	`if` g₁ `then` e₁ ... `else if` g_n `then` e_n `else` y `;`
	`_ ->` y `}}`
(d)	`case` v `of { ~`p `->` e`; _ ->` e' `}`
	= `(\`x₁ ... x_n `->` e `) (case` v `of {` p`->` x₁ `})` ... `(case` v `of {` p `->` x_n`})`
	x₁, ..., x_n はすべて p 内の変数
(e)	`case` v `of {` x`@`p `->` e`; _ ->` e' `}`
	= `case` v `of {` p `-> ( \` x `->` e `)` v `; _ ->` e' `}`
(f)	`case` v `of { _ ->` e`; _ ->` e' `}` = e

図 3

case 式のセマンティクス(その１)

(g)	`case` v `of {` K p₁ ...p_n `->` e`; _ ->` e' `}`
	= `case` v `of {`
	K x₁ ...x_n `-> case` x₁ `of {`
	p₁ `->` ... `case` x_n `of {` p_n `->` e `; _ ->` e' `}` ...
	`_ ->` e' `}`
	`_ ->` e' `}`
	p₁, ..., p_n のうち、少くともひとつは変数ではなく、x₁, ..., x_n は新しい変数
(h)	`case` v `of {` k `->` e`; _ ->` e' `}` = `if (`v`==`k`) then` e `else` e'
	k は数値リテラル、文字リテラル、あるいは、文字列リテラル
(i)	`case` v `of {` x `->` e`; _ ->` e' `}` = `case` v `of {` x `->` e `}`
(j)	`case` v `of {` x `->` e `}` = `( \` x `->` e `)` v
(k)	`case` N v `of {` N p `->` e`; _ ->` e' `}`
	= `case` v `of {` p `->` e`; _ ->` e' `}`
	N は `newtype` の構成子
(l)	`case` _\|_ `of {` N p `->` e`; _ ->` e' `}` = `case` _\|_ `of {` p `->` e `}`
	N は `newtype` の構成子
(m)	`case` v `of {` K `{` f₁ `=` p₁ `,` f₂ `=` p₂ `,` ... `} ->` e `; _ ->` e' `}`
	= `case` e' `of {`
	y `->`
	`case` v `of {`
	K `{` f₁ `=` p₁ `} ->`
	`case` v `of {` K `{` f₂ `=` p₂ `,` ... `} ->` e `; _ ->` y `};`
	`_ ->` y `}}`
	f₁, f₂, ... は構成子 K のフィールド。 y は新しい変数
(n)	`case` v `of {` K `{` f `=` p `} ->` e `; _ ->` e' `}`
	= `case` v `of {`
	K p₁ ... p_n `->` e `; _ ->` e' `}`
	p_i は、もし、K の i 番目の構成要素のラベルが f であるならば、p、そうでなければ、`_`
(o)	`case` v `of {` K `{} ->` e `; _ ->` e' `}`
	= `case` v `of {`
	K `_` ... `_ ->` e `; _ ->` e' `}`
(p)	`case (`K' e₁ ... e_m`) of {` K x₁ ... x_n `->` e`; _ ->` e' `}` = e'
	K と K' はそれぞれ n 引数と m 引数の別の `data` 構成子
(q)	`case (`K e₁ ... e_n`) of {` K x₁ ... x_n `->` e`; _ ->` e' `}`
	= `(\`x₁ ... x_n `->` e`)` e₁ ... e_n
	K は n 引数の `data` 構成子
(r)	`case` _\|_ `of {` K x₁ ... x_n `->` e`; _ ->` e' `}` = _\|_
	K は n 引数の `data` 構成子
(s)	`case` v `of {` x`+`k `->` e`; _ ->` e' `}`
	= `if` v `>=` k `then (\`x `->` e`) (`v`-`k`) else` e'
	k は数値リテラル

図 4

case 式のセマンティクス(その２)

図 3.1-- 3.2 では e、e' および e_i は式、 g および g_i は真理値式、 p および p_i はパターン v、x および x_i は変数、 K および K' は代数的データ型 (data) 構成子(タプルコンストラクタを含む)、N は newtype 構成子、k は文字、文字列、あるいは数値のリテラルである。

規則 (b) は、ガード部を実際に含むかどうかにかかわらず、一般のソース言語の case 式に対応する。もしガード部が書かれていなければ、 True に match_i 形式のガード部 g_i,j を置き換える。そのあとに続く、同等性は、 case 式の結果をより単純な、簡単な形式にするものである。

図 4 の規則 (h) は多重定義された == を含む。多重定義された定数に対するパターン照合の意味を定義するのはこの規則である。

これらの同等性すべて静的セマンティクスを保存するものである。規則 (d)、(e)、(j)、(q) そして (s) は let ではなくλを用いている。このことは、case によって束縛される変数は、単相的に型付けされることを示している(4.1.4 節を見よ)

The Haskell 98 Report
top | back | next | contents | function index
December 2002