A Gentle Introduction to Haskell: Functions

やさしい Haskell 入門 ( Version 98 )
back next top

3 関数

Haskell は関数型言語ですから、関数が主役だろうという想像ができます。まさにそのとおりです。この節では Haskell における関数の貌をいくつか見ていきます。

先ず、ふたつの引数を足す関数の定義を考えましょう。 add :: Integer -> Integer -> Integer add x y = x + y これは、カリー化(curry)された関数の一例です。(「カリー 」という呼び名はこの概念を有名にした、Haskell Curry から来ています。 アンカリー化(uncurry)された関数をえるには、タプルを使います。 add (x,y) = x + y しかし、こうしてしまうと、この add は1引数の関数になってしまいます。) 関数 add の適用は add e₁ e₂ という形式になります。これは、 (add e₁) e₂ と同等の式です。なぜかというと関数適用は左結合性をもつからです。いいかえれば、関数 add を最初の引数に適用すると、新しい関数ができて、これをふたつめの引数に適用するということです。このことは、関数 add の型 Integer->Integer->Integer とも整合がとれています。この型は、Integer->(Integer->Integer) と同等のものです。ここで、 -> は右結合性をもっています。実際この add を使うと前とはちがうやり方で inc を定義することができます。 inc = add 1 この例は、カリー化された関数の部分適用 (partial application) の一例であり、関数が返りの値となる例のひとつです。今度は関数を引数としてわたす例を考えてみましょう。よくしられた map 関数が完璧な例です。 map :: (a->b) -> [a] -> [b] map f [] = [] map f (x:xs) = f x : map f xs [関数適用はどんな中置演算子よりも高い優先順位をもっています。そのため、2 つめの等式の右辺は (f x) : (map f xs) のように構文解析されます。] この map 関数は多相型であり、その型は、最初の引数が関数であることを明示しています。さらに、2つの a は同じ型にインスタンス化されなければならないことに注意してください。 ( b についても同じです。) map の使用例をみると、リストの要素をそれぞれ1だけ増加させることができます。

map (add 1) [1,2,3] => [2,3,4]

これらの例は関数が第一級の対象であることを示しています。このような使いかたをする関数はふつう高階 (higher-order) 関数とよばれます。

3.1 ラムダ抽象

等式を使わずにラムダ抽象 (lambda abstraction) を使って無名関数を定義することができます。たとえば、inc と同等の関数は \x -> x+1 と書くことができます。同様に、add と同等の関数は \x -> \y -> x+y と書けます。入れ子になったラムダ抽象は簡略化して、\x y -> x+y と書いても同じことです。そして、 inc x = x+1 add x y = x+y という等式は、 inc = \x -> x+1 add = \x y -> x+y という等式を簡略化して書いたものと同等ということです。この同等性についてはこれから説明します。

一般に x があって、その型が t₁ で、exp の型が t₂ である場合、\x->exp の型は t₁->t₂ ということになります。

3.2 中置演算子

中置演算子は関数なので、等式を使って定義することができます。たとえば、リストの連結演算子を定義すると、このようになります。 (++) :: [a] -> [a] -> [a] [] ++ ys = ys (x:xs) ++ ys = x : (xs++ys)[中置演算子の字句は、すべて「記号」で構成されます。これは、英数字で構成される一般の識別子とは対照的です ( §2.3 )。 Haskell にはマイナス( - )をのぞき前置演算子はありません。マイナス( - )は前置演算子にも、中置演算子にもなります。]

もうひとつ、関数上の重要な中置演算子、関数合成( function composition )の例を見てみましょう。 (.) :: (b->c) -> (a->b) -> (a->c) f . g = \ x -> f (g x)

3.2.1 セクション

中置演算子はまさに関数ですから、関数と同じように、部分適用が可能です。 Haskell では中置演算子の部分適用のことをセクション ( section )といいます。例を見ましょう。

(x+) = \y -> x+y

(+y) = \x -> x+y

(+) = \x y -> x+y

[ここでの括弧は必須です。]

上の例の最後のセクションの形式は中置演算子から同等の関数値へ変換する働きをします。この形式は中置演算子を関数の引数として渡すときに便利な方法です。たとえば、map (+) [1,2,3] のようにします。(読者の皆さんはここで、関数のリストが返されていることを確かめてください。) 関数の型を与える際にも必要になります。これはすでに (++) および (.) の例で示しましたね。さて、これですでに定義した add が (+)、inc が (+1) で定義できることがわかります。実際これらの定義がすっきりします。 inc = (+ 1) add = (+)

中置演算子を関数値に変換できましたが、それでは、その逆は可能なのでしょうか。可能です。関数値をバッククウォートで括るだけです。たとえば、 x `add` y は、add x y と同じです。 (これは、add がバッククオート で括るのであって、文字の場合のアポストロフィ(あるいはシングルクウォート)で括るわけではありません。つまり、'f' は文字で、`f` は中置演算子です。幸い、ほとんどの ASCII 端末ではこのふたつを区別できるようになっています。(手で書くとそうはいかないようです。) 関数によっては、中置演算子にしたほうが読みやすくなります。たとえば、リストの要素かどうかを調べる述語関数 elem がその例です。x `elem` xs は直観的に「x が属しているのは xs である。( x is an element of xs )」と読めます。

[前置/中置演算子 - のセクションについてはいくつかの特別なルールがあります。(§3.5,§3.4)。]

ここまでで、読者のみなさんは関数の定義のしかたにいろいろあって、混乱したかもしれません。これらの定義のメカニズムのサポートを決定するにあたっては、歴史的な慣習も部分的には反映されていますし、一貫性を確保したい(たとえば、中置演算子と普通の関数の取り扱いなど)という要望も反映されています。

3.2.2 結合性宣言

結合性宣言( fixity declaration ) はすべての中置演算子と中置構築子 ( `elem` のような一般の識別子に由来するものも含む)に対しておこなうことができます。この宣言では 0 から 9 までの優先レベル( 9 が最強です。一般の関数適用の優先レベルは 10 と仮定されています。)と、右結合性、左結合性をもつ、あるいは結合性をもたない、という指定をします。例をあげると ++ と . の結合性宣言は、 infixr 5 ++ infixr 9 . です。両方とも右結合性が指定されています。++ は優先レベル 5 で . は優先レベル 9 と指定されています。左結合性は infixl を使って指定し、結合性のないことは infix で指定します。おなじ結合性宣言で 1 つ以上の演算子の結合性について指定できます。もし、ある演算子に対して、結合性宣言をしない場合はデフォルトで infixl 9 が指定されたことになります。( 結合性ルールの定義の詳細については §5.6 参照のこと。)

3.3 関数は非正格

bot が次のように定義されているとしましょう。 bot = bot bot は停止しない式です。このような停止しない式の値を抽象的に _|_(ボトムと読む)と表わします。ある種の実行時エラーになる式、たとえば、1/0 のような式もこの値を持ちます。このようなエラーは回復不可能で、プログラムはこれ以上継続することはできなくなります。I/O システムのエラー(たとえば、EOF エラーなど)は回復可能で、べつの方法で取り扱います。(このような I/O エラーは、実はエラーではなく、例外です。例外についての詳細は 7 節でふれます。)

関数 f が正格 ( strict ) であるとは、停止しない式に適用されれば、その適用式も停止しないことをいいます。いいかえると、 f bot が _|_ の時でかつその時にかぎり、f は正格であるといいます。ほとんどのプログラミング言語では、すべての関数が正格です。ただ、 Haskell では違います。簡単な例、つねに 1 を返す関数 const1 を考えましょう。定義は、 const1 x = 1 です。const1 bot の値は Haskell では 1 です。操作的な観点からいうと、const1 はその引数の値を「必要」としないので、引数は決して評価されません。だから停止しない計算に陥いることがないのです。こういうわけで、非正格関数は「遅延関数 ( lazy function ) 」とも呼ばれ、その引数の評価については「遅延評価」とか「必要呼び評価」とかいわれています。

Haskell では、エラーや停止しない値は、意味論的に同じものですから、上の引数にはエラーも含まれています。たとえば、 const1 (1/0) もちゃんと評価されて 1 になります。

非正格関数は多くの場面で、たいへん役に立ちます。そのなかで、主要な利点は、プログラマが評価の順に気をくばらなくてもよい、ということです。計算上高価な値を、必要もないのに余分な計算をしなければならないかもしれない、などと心配せずに関数へ渡すことができます。重要な例のひとつは、無限の ( infinite ) データ構造です。

もうひとつ別のやりかたで非正格関数を説明しましょう。Haskell は伝統的な言語のように代入 ( assignment ) ではなく、定義 ( definition ) を用いて計算をすすめます。たとえば、 v = 1/0 のような宣言は、「 v を 1/0 と定義する」と読みます。これは、「 1/0 を計算し、その結果を v へ格納する」とは読みません。v の値(定義)が必要になったときにのみゼロ除算エラーが発生します。宣言それだけでは計算は起こりません。代入を必要とするプログラミングではその代入の順序に細心の注意をはらう必要があります。プログラムの意味は代入がおこる順序に依存します。一方、定義はずっと単純で、プログラムの意味には影響あたえず、どのような順で出現してもかまいません。

3.4 「無限の」データ構造

Haskell の非正格な性質の利点のひとつは、データコンストラクタもが非正格であることです。このことはべつに驚くべきことではありません。コンストラクタは特殊な関数にすぎません(ふつうの関数との違いは、パターンマッチで使われるということです)。たとえば、リストの構築子、: は非正格です。

非正格の構築子で(概念的に)無限の( infinite )データ構造を定義することができます。これは、1 の無限リストです。 ones = 1 : ones さらに面白いのは、numsFrom 関数です。 numsFrom n = n : numsFrom (n+1) numsFrom n は n から始まる無限の整数リストです。これを使って、平方数の無限リストを構成することができます。 squares = map (^2) (numsFrom 0) (ここで、セクションの使いかたに注目してください。^ は中置の指数演算子です。)

当然のことながら、実際の計算では、そこから、有限の部分を取り出したいわけです。Haskell ではこの用途で使える関数があらかじめたくさん定義されています。take、takeWhile、filter 等々です。Haskell の定義には多くの組み込みの関数や型が含まれています。これらを「標準プレリュード( Standard Prelude )」と呼びます。標準プレリュード全体は、Haskell Report の付録 A にあります。リスト上の数多くの有用な関数が PreludeList の部分にありますので、参照してください。例をあげましょう。take はリストから最初の n 個の要素を取り出します。

take 5 squares => [0,1,4,9,16]

上にあげた、ones の定義は、循環リスト( circular list )の例です。ほとんどの場合、遅延性は効率の面で非常に重要です。表現が本当の循環リストとして実装されるので、空間が節約できます。

循環性を使用した別の例をみてみましょう。フィボナッチ数列はつぎのような循環数列をつかって効率よく計算することができます。 fib = 1 : 1 : [ a+b | (a,b) <- zip fib (tail fib) ] ここで、zip は標準プレリュードにある関数で、引数のふたつのリストの要素を互いにペアにしたリストを返す関数です。 zip (x:xs) (y:ys) = (x,y) : zip xs ys zip xs ys = [] 無限リスト fib が自分自身をつかってどのように定義されているかに注目してください。「自分の尻尾をおいかける」ような定義になっていますね。実際、この計算を絵にえがくと図 1 のようになります。

図 1

無限リストの応用のさらにもうひとつの例については 4.4 節を参照のこと

3.5 エラー関数

Haskell には error という組み込みの関数があります。この関数の型は String->a です。これはすこしばかり奇妙な関数です。型からすると、この関数の返す値の型は多相の型で実際の型がわかりません。この型の引数を受けとるわけではないからです。

すべての型によって「共有」される値 _|_ というのが存在します。実際、意味論的には、error の返す値は常にこの値です(すべてのエラーの値は _|_ であることを思い出してください)。しかし、実装はチェックのための error の文字列引数を印字するというのが妥当なところでしょう。それで、この関数は、なにか「誤りがあった場合」、プログラムを停止させたいときに便利です。たとえば、標準プレリュードでは、head の定義は以下のようになっています。 head (x:xs) = x head [] = error "head{PreludeList}: head []"

A Gentle Introduction to Haskell, Version 98
back next top