IoPLMaterials

Edit this page Report an issue

多相的 let の型推論

前節までの実装で実現される型(システム)は単相的であり,ひとつの変数をあたかも複数の型を持つように扱えない.例えば,

let f = fun x -> x  in
if f true then f 2 else 3;;

のようなプログラムは,f が,if の条件部では $\mathbf{bool} \rightarrow \mathbf{bool}$として,また,then 節では $\mathbf{int} \rightarrow \mathbf{int}$ として使われているため, 型推論に失敗してしまう.本節では,上記のプログラムなどを受理するよう let 多相 (let polymorphism) を実装する.

本節を理解するためには OCaml の多相型の知識があったほうがよい.例えば,以下の二つのプログラムがどのように型付けされるか,あるいはされないかが理解できているだろうか.

OCaml入門テキスト 4.2.1 節を復習してから,この先を読むことをおすすめする.

多相性と型スキーム

OCaml インタプリタに let f = fun x -> x;; を入力すると,その型は 'a -> 'a であると表示される.ここで現れる型変数 'a は,以前に導入したような後でその正体が判明する(今のところは)未知の型を表しているわけではなく,「どんな型にでも置き換えてよい」ことを示すための,いわば「穴ボコ」につけた名前である.そのために,'aint で置き換えて int->int として扱うことで整数に適用できる関数の型としたり,'abool で置き換えて bool->bool として真偽値に適用する関数の型としたりすることができる.このように,OCaml の型変数には「今のところ未確定で後で正体が判明する型変数( 単相的 (monomorphic))な型変数)」と「どんな型にでも置き換えてよい型変数( 多相的 (polymorphic) な型変数)」の二種類がある.

この二種類を区別するために,多相的な型変数は $\forall \alpha.$ で束縛することにしよう.$\forall \alpha.$ が型の前に付けられた表現を 型スキーム (type scheme) と呼んで,型とは区別することにする.より正確には,型$\tau$の前に有限個の$\forall \alpha$が付けられた表現$\forall \alpha_1. \forall \alpha_2. \dots \forall \alpha_n. \tau$を型スキームと呼ぶ.(この型スキームを,型変数の列$(\alpha_1,\dots,\alpha_n)$をベクトル表記を借りて$\vec{\alpha}$と書くことにして,以下では$\forall \vec{\alpha}. \tau$と書くことにする.)例えば $\forall \alpha. \alpha \rightarrow \alpha$ は(型ではなく)型スキームである

型スキーム$\forall \vec{\alpha}. \tau$は,型変数の列$\vec{\alpha}$に相当する型を受け取って型を返す,いわば型から型への関数のようなものと見ることができる.例えば,型スキーム$\forall \alpha. \alpha \rightarrow \alpha$は,型$\mathbf{int}$を受け取ったら型$\mathbf{int} \rightarrow \mathbf{int}$を返し,型$\mathbf{bool}$を受け取ったら型$\mathbf{bool} \rightarrow \mathbf{bool}$を返すものと見ることができる.このように見ると,上記のプログラムでは,

ことで f の多相的な振る舞いを捉えることができる.

より形式的には,型$\tau$と型スキーム$\sigma$の定義を以下のように変更する.

\[\begin{array}{rcl} \tau & ::= & \alpha \mid \mathbf{int} \mid \mathbf{bool} \mid \tau_1 \rightarrow \tau_2 \\ \sigma & ::= & \tau \mid \forall \alpha.\sigma \end{array}\]

新しく導入された型スキーム $\sigma$ が(上の説明の通り)型 $\tau$ の前に有限個の $\forall\alpha$ がついた形になっていることを確認されたい.また,型 $\tau$ は型スキームともみなせることに注意されたい.($\forall \alpha.$がひとつもついていない型スキームである.)型スキーム中,$\forall$のついている型変数を 束縛されている (bound) といい,束縛されていない型変数(これらは単相的な型変数である)を (自由である (free),という. 例えば $\forall \alpha. \alpha \rightarrow \alpha \rightarrow \beta$ において,$\alpha$ は束縛されており,$\beta$ は自由である.

その上で,型環境 $\Gamma$ を(変数の型への束縛の集合ではなく)変数の_型スキームへの_束縛の集合とする.これにより,let で束縛された変数には型スキーム$\forall\vec{\alpha}.\tau$を持たせておき,使用する際に$\vec{\alpha}$を適切な型で置き換えることで,多相的な振る舞いを型システムの上で表現することができる.

型と型スキームの区別

ここまでの説明から分かるように,これから導入する型システムでは型と型スキームを区別する.この区別は,技術的には,型に相当するメタ変数 $\tau$ と型スキームに相当するメタ変数$\sigma$を区別していることから生じており,この区別のために$(\forall \alpha.\alpha) \rightarrow (\forall \alpha.\alpha)$ のような表現は型とはみなされないようになっている.

なぜより素直(?)に,型の構文を

\[\begin{array}{rcl} \tau & ::= & \alpha \mid \mathbf{int} \mid \mathbf{bool} \mid \tau_1 \rightarrow \tau_2 \mid \forall \alpha. \tau \end{array}\]

として,型と型スキームを区別しない型システムを作らないのだろうか?一つの理由は,型推論問題の決定可能性の要請である. このように型と型スキームを区別しない型システムを設計すると,より多くのプログラムを型付け可能とすることができ,型システムの表現力は上がるのだが,型推論問題が決定不能になることが知られている.型と型スキームを区別し(あとで見るように)多相性のある変数を導入できる場所を letlet rec に制限することで,実行時型エラーを含まない十分に多くのプログラムを型付け可能とすることができ,なおかつ型推論問題を決定可能とすることが可能となる.

型スキームを表す OCaml の型と,補助関数の定義

以下は syntax.ml に追加すべき,型スキームを表す型と,以下で使う補助関数の定義(の一部)である.

(* type scheme *)
type tysc = TyScheme of tyvar list * ty

let tysc_of_ty ty = TyScheme ([], ty)

let freevar_tysc tysc = ...

型スキームを表す型 tysc は唯一のコンストラクタ TyScheme を持つヴァリアント型である.$\forall \alpha_1 \dots \forall \alpha_n. \tau$ に対応する型スキームは $\mathtt{TyScheme}([\alpha_1; \dots; \alpha_n], \tau)$で表現される.関数 freevar_tysc は,この Exercise で実装した関数 freevar_ty の拡張で,型スキーム$\sigma$を受け取り,$\sigma$に自由に出現する型変数の集合を計算する関数である.$\forall \vec{\alpha}$が型変数列$\vec{\alpha}$を束縛するため,型スキーム$\forall\vec{\alpha}.\tau$中に出現する自由な型変数の集合は,型$\tau$中に出現する型変数の集合から$\vec{\alpha}$中の型変数をすべて除いたものになる.tysc_of_ty ty は,型 ty を型スキーム TyScheme([],ty) に変換する関数である.

型付け規則の拡張

変数のための規則

次に,型付け規則をどのように拡張すればよいのか考えてみよう.型環境が変数から$\underline{型スキーム}$への部分関数であることを思い出されたい.変数のための規則は以下の通りになっている.

\[\begin{array}{c} \Gamma(x) = \forall \alpha_1,\dots,\alpha_n. \tau\\ \rule{10cm}{1pt}\\ \Gamma \vdash x : [\alpha_1\mapsto\tau_1,\ldots,\alpha_n\mapsto\tau_n]\tau \end{array} \textrm{T-PolyVar}\]

すなわち,型環境中で$x$が束縛されている先の型スキームを$\forall \alpha_1,\dots,\alpha_n.\tau$とすると,$\tau$中の$\alpha_1,\dots,\alpha_n$を任意の型$\tau_1,\dots,\tau_n$で置き換えて得られる型を$x$の型としてよい.(まさにこれがやりたかったことである.)例えば,$\Gamma(f) = \forall \alpha.\alpha \rightarrow \alpha$ とすると,

\[\Gamma \vdash f : \mathbf{int} \rightarrow \mathbf{int}\]

\[\Gamma \vdash f : (\mathbf{int} \rightarrow \mathbf{int}) \rightarrow (\mathbf{int} \rightarrow \mathbf{int})\]

といった型判断を導出することができる.

なお,あとで定義する型推論アルゴリズムは,プログラム全体に型が付くように適切な $\tau_1,\dots,\tau_n$を選ばなければならない.しかしながら,型付け規則を定義する段階においては,適切な$\tau_1,\dots,\tau_n$は何なのかを気にする必要はない.このように,型付け規則は数学的にきれいな形で書いておいて,型推論アルゴリズムで適切な$\tau_1,\dots,\tau_n$を選ぶ等の作業を頑張るといった戦略は,型システム関係の研究では頻出である.

let (rec) 式に関する規則

さて,$\mathbf{let}$ に関しては,大まかには以下のような規則になるはずである.

\[\begin{array}{c} \Gamma \vdash e_1 : \tau_1 \quad \Gamma, x:\forall \alpha_1.\dots\forall \alpha_n. \tau_1 \vdash e_2 : \tau_2\\ \rule{10cm}{1pt}\\ \Gamma \vdash \mathbf{let}\ x\ = e_1\ \mathbf{in}\ e_2 : \tau_2 \end{array} \textrm{T-PolyLet?}\]

この型付け規則では,$e_1$の型 $\tau_1$ から型スキーム $\forall \alpha_1.\dots\forall \alpha_n. \tau_1$ を作り,$x$をこの型スキームに束縛して,それを使って $e_2$ の型付けをすればいいことを示している.では,$\alpha_1,\ldots,\alpha_n$としてどのような型変数を選べばよいだろうか.もちろん,これらの型変数は,$\tau_1$に現れる型変数から選ぶのだが,任意の型変数を $\forall$ で束縛してよいわけではない.束縛してよい型変数は, $\Gamma$ に自由に出現しない型変数のみ である.$\Gamma$ 中に自由に現れる型変数は,その後の型推論の過程で正体がわかって特定の型に置き換えられる可能性があるので,ここで任意におきかえられるものとみなしてはまずいのである.例えば,

(fun y ->
  let f = fun () -> y in
  f () + 1)
true

という式を考え,その型推論の経過を追ってみよう.(ちなみに,この式を OCaml インタプリタに入力すると型エラーとなる.また,現在の体型には unit 型がないが,あるものと思って読んで欲しい.)

ここで$\alpha$ を $\forall$で束縛してよい(つまり多相的に使って良い)だろうか.もし型環境で f を型スキーム$\mathbf{unit} \rightarrow \alpha$に束縛してf () + 1を型推論すると,$\alpha$を$\mathbf{unit}$で具体化することが許されるため,f () は型$\mathbf{int}$を持つことができ,したがってf () + 1 に型$\mathbf{int}$を与えることができる.y の型は $\alpha$ だったので,(fun y -> let f = fun () -> y in f () + 1)は型$\alpha \rightarrow \mathbf{int}$を持つだろう.この関数に渡されているのはtrueであるから,関数適用式全体の型としては$\mathbf{int}$が$\alpha = \mathbf{bool}$という制約とともに生成されるが,これは単一化可能であるから,式全体の型はめでたく$\mathbf{int}$と推論される.すなわち,この式は型付け可能である.

しかし,この式の評価を追ってみよう.trueyに渡されているので,f()を受け取ってtrueを返す関数となる.したがって,f () + 1 を評価しようとすると true + 1を評価することになり,実行時型エラーがおきる. つまり,型付け可能な式を評価すると実行時型エラーが起きるので,この型システムは健全ではない

何がおかしかったのだろうか.$\alpha$が f のスコープの外側で宣言されている y の型であったことである.スコープの外側で宣言されている変数の型は,その変数が外側でどのように使われているかに依存して決まるため,後になって特定の型にしなければならない場合がある.(実際にこの例では ytrue が渡ってくるため,y の型を$\mathbf{bool}$としなければならないことが,後になって分かる.)そのため,$\forall$をつけて多相性を持たせてはならないのである.というわけで,正しい型付け規則は,付帯条件をつけて,

\[\begin{array}{c} \Gamma \vdash e_1 : \tau_1 \quad \Gamma, x:\forall \alpha_1.\cdots\forall \alpha_n. \tau_1 \vdash e_2 : \tau_2 \\ \mbox{($\alpha_1,\ldots,\alpha_n$ は $\tau_1$ に自由に出現する型変数で $\Gamma$ には自由に出現しない)}\\ \rule{20cm}{1pt}\\ \Gamma \vdash \mathbf{let}\ x = e_1 \mathbf{in}\ e_2 : \tau_2 \end{array} \textrm{T-PolyLet}\]

となる.「$\Gamma$に自由に出現しない」という条件で,スコープ外で宣言された変数の型として使われている型変数が多相性を持たないように制限している.

型推論アルゴリズム概要

ここまでのところが理解できれば,実は型推論の実装に対する変更はそんなに多くはない.メジャーな変更が必要なのは変数式に関するケースと let 式に関するケースである.以下にコードの変更点を示す.

typing.ml

(* New! 型環境は型スキームへの束縛に *)
type tyenv = tysc Environment.t

(* New! 型スキームは束縛変数を含むので「自由に出現する型変数の集合」の計算方法を変える必要がある. *)
let rec freevar_tyenv tyenv = ...

(* New! 下の説明を参照 *)
let closure ty tyenv subst =
  let fv_tyenv' = freevar_tyenv tyenv in
  let fv_tyenv =
    MySet.bigunion
      (MySet.map
          (fun id -> freevar_ty (subst_type subst (TyVar id)))
          fv_tyenv') in
  let ids = MySet.diff (freevar_ty ty) fv_tyenv in
    TyScheme (MySet.to_list ids, ty)

let rec ty_exp tyenv = function
     Var x ->
      (try 
	    (* New! T-Var への変更を反映 *)
        let TyScheme (vars, ty) = Environment.lookup x tyenv in
        let s = List.map (fun id -> (id, TyVar (fresh_tyvar ()))) vars in
          ([], subst_type s ty)
       with Environment.Not_bound -> err ("variable not bound: " ^ x))
   | ...
   | LetExp (id, exp1, exp2) -> ... (* がんばって実装せよ*)

let ty_decl tyenv = function
    Exp e -> let (_, ty) = ty_exp tyenv e in (tyenv, ty) (* New! *)
  | Decl (id, e) -> ...

まず,変数式に関するケースを考えよう.型変数に代入する型(型付け規則中の$\tau_1,\ldots,\tau_n$)はこの時点では未知であり,変数が他の部分でどう使われるかに依存して決定される.そのため,ここでは$\tau_1,\dots,\tau_n$に相当する新しい型変数を用意し,それらを使って具体化を行う.

次に let 式のケースである.ここでは,$e_1$ の型推論で得られた$e_1$ の型 $\tau$ を型スキーム化する必要がある.型スキームする際に$\textrm{T-PolyLet}$の付帯条件を満たすように多相性を持たせる型変数を決定する必要がある.この計算を行うための補助関数として closure を定義している.これは,型$\tau$ と型環境 $\Gamma$と型代入 $S$ から,条件「$\alpha_1,\ldots,\alpha_n$は $\tau$ に自由に出現する型変数で $S\Gamma$ には自由に出現しない」を満たす型スキーム $\forall \alpha_1.\cdots.\forall \alpha_n. \tau$を求める関数である.型代入 $S$を引数に取るのは,型推論の実装に便利なためである.

main.ml

let rec read_eval_print env tyenv =
  print_string "# ";
  flush stdout;
  let decl = Parser.toplevel Lexer.main (Lexing.from_channel stdin) in
  let (newtyenv, ty) = ty_decl tyenv decl in (* New! *)
  let (id, newenv, v) = eval_decl env decl in
    Printf.printf "val %s : " id;
    pp_ty ty;
    print_string " = ";
    pp_val v;
    print_newline();
    read_eval_print newenv newtyenv (* New! *)

TODO: ここまで書いた

Exercise 4.4.1 [**]

多相的 let 式・宣言ともに扱える型推論アルゴリズムの実装を完成させよ.

Exercise 4.4.2 [*]

以下の型付け規則を参考にして,再帰関数が多相的に扱えるように,型推論機能を拡張せよ.

\[\begin{array}{c} \Gamma, f: \tau_1 \rightarrow \tau_2, x: \tau_1 \vdash e_1 : \tau_2 \quad \Gamma, f:\forall\alpha_1,\ldots,\alpha_n.\tau_1 \rightarrow \tau_2 \vdash e_2 : \tau \\ \mbox{($\alpha_1,\ldots,\alpha_n$ は $\tau_1$ もしくは $\tau_2$ に自由に出現する型変数で $\Gamma$ には自由に出現しない)}\\ \rule{23cm}{1pt}\\ \Gamma \vdash \mathbf{let\ rec}\ f = \mathbf{fun}\ x \rightarrow e_1 \mathbf{in}\ e_2 : \tau \end{array} \textrm{T-LetRec}\]

Exercise 4.4.3 [***]

OCaml では,$: \tau$ という形式で,式や宣言された変数の型を指定することができる.この機能を扱えるように処理系を拡張せよ.

Exercise 4.4.4 [**]

型エラーが起こった際にエラー箇所が指摘できるように実装を改善せよ.

Exercise 4.4.5 [*****]

実験3SW履修者向け: この問題は現在リポジトリ内に入っていないので,提出する際にはあらかじめ Slack で相談してください.

型推論時にエラーが発生した際に,元のプログラムのうち型エラーに関係している場所以外を ... に変更してユーザに表示せよ.これにより,型エラーの原因をある意味わかりやすく表示することができる.例えば

let rec f = fun x -> fun y ->
  let w = y + 1 in
    w :: y

に対して

... y ->
  ... y + ...
    ... :: y

が出力されるとよい.これにより,y が整数としてもリストとしても使われているのが型エラーの原因であると分かる.これは 型エラースライシング (type-error slicing) と呼ばれている手法で,Christian Haack, Joe B. Wells: Type Error Slicing in Implicitly Typed Higher-Order Languages. ESOP 2003: 284-301で提案されている手法である.