Type, Type System, Type Inference などの話題

型推論

nobsun(2004/09/23 00:54:22 JST): 括弧なしで、

> main = putStr “Hello,” ++ " ほげさん!\n"

と書くと何故、叱られるかというと。関数適用の結合力は、二項演算子 ++ の結合力より強いので、上は

> main = (putStr “Hello,”) ++ " ほげさん!\n"

と解釈されてしまいます。(putStr “Hello,”) の型は IO () で、" ほげさん!\n" の型は String です。これは、++ の型 [a] -> [a] -> [a] というのに矛盾します。で、エラー。

Haskellの型推論のシステムが、上のように型を推論してくれて、プログラマの意図と実際に書かれたプログラムとの齟齬を教えてくれます。こんなのが実行時エラーだったらやだよねぇ。型推論マンセー！

WiLiKi:Shiro (2004/09/23 11:24:53 JST): でもでも、最初の関数の型が [Char] -> [Char] だったら、エラーは出ないよね。プログラマの意図を完全に表現しきるのは無理なんだから、結局程度問題ってことにならない? (いや、型推論があるのはうらやましいんだけどさ。)

nobsun(2004/09/24 15:42:36 JST): Haskell では、実行可能なプログラムは、「プログラム全体」を通して、型の整合性がとれていることが保証されています。もちろん、2 + 3 という意図と 2 * 3 というプログラム(算譜)の表現の齟齬を型で発見するのは無理ですが、2 + length “Hello” という意図と、算譜に表れた 2 + “Hello” のタイポによるバグは、型推論で発見可能です。まぁ。程度の問題といってしまうと確かにそうなんだけど。これが、相当にでかい差だと思いますよ。

上の例だと putStr の型が [Char] -> [Char] だったら、++ とは矛盾しないけど、今度は、main と矛盾しますよね。main は特別な名前の変数で、main はプログラムの外側とやりとりをするアクションなので型は必ず IO a です。

一般にHaskellでは、型の整合さえとれていれば、実行可能なので、実は、プログラマの意図とは違うプログラムができる可能性はあります。しかし、バグは、プログラマが自分の意図が正しいという前提のもとでは、算譜に転写するときに入り込むものです。それゆえ、その間違いを犯したあとでも、プログラム全体で、型の整合がとれていることは稀だといっていいでしょう。

制約の強さの度合

Shiro(2004/09/24 18:31:04 JST): 一般的に動的型付けに対する静的型付けのそういうメリットを否定するつもりではなく、むしろ静的型付けの枠組のスペクトルの中で、Haskellが選んでいる現在の形に対して、Haskellerがどういう評価をしているかに興味があっての発言です。Haskellの現在の標準の選択は、広い意味での静的型付けの唯一の解では無いはずで、「プログラマの意図」の表現の度合で測ればより緩いものもよりきついものもあるはずですよね。それを指して「程度問題」と言いました。

例えば、absの型は Num a => a -> a となっていますね。logの型は Floating a => a -> a です。従って、 log(-abs(-3)) という式の評価が出来ないことは、実行時までわかりません。でも、absの値域やlogの定義閾が型で表現されていたとすれば、上記の式が不正であることはコンパイル時に検出できるでしょう。

別の例として、文字列処理ライブラリを作っているとします。非常に多くの関数が [Char] -> [Char] という型を持つことでしょう。そのようなドメインでは、「バグがあったら型の整合がとれることは稀」とは言えないと思います。実は、動的型付けもこのスペクトルの一番端にあるでしょう。可変長引数の話を置いておけば、全ての関数は Anything -> Anything ってことでOK。

現実には、普通に使い易い落としどころを探っていって今の形に落ち着いているんだと思うんですね。緩くしてゆけば、プログラマの意図とは違うプログラムが実行できてしまう可能性が増える。きつくして行くと、プログラムがますます書き難くなってゆく(表現が冗長になり、型システムを納得させるのも難しくなる)。 Haskellの現在の形は、もともとはその最適化のカーブの極大点にすぎないでしょう。

しかし、そこに「本質的」な差異があるとすれば、それは何なのでしょうか。

(例えば、全てはチューリングマシンだと言ってしまえば全ては程度問題になってしまいますが、再帰が出来るかできないかというポイントは、そのスペクトルにおいてひとつのギャップになってると思うんですよ。現在のHaskellの型システムが落ち着いた背景に、どちらにシフトするにせよギャップがあるんで、かなり必然的にここに落ちるんだ、みたいな背景があるのかなあ、とか。)

nobsun(2004/09/27 11:08:33 JST): うまく、まとめられませんが。とりあえず、つらつらと。

私の場合は、Haskellの型システムは、「なかなか、いいんじゃない」という感じです。Haskellの型推論は単純で、そのアルゴリズムはプログラマが自分でやってもできる程度のものでしょう。ならば、そのくらいのチェック作業は、処理系がやってくれてもいいかなと思います。

では、型推論の前提となる静的な強い型付けが、プログラミングのしやすさにどれほど制約を与えているかというと、これはプログラミングスタイルによると思います。関数的に書くときには、型を意識しますので、静的な強い型付けはむしろあたりまえ、型推論機構があるのも当然(ないと不便)と思います。

型推論機構があることで、型が抽象化の強力な道具となり、プログラマの意図の一部を型に載せることができます。もちろん、なにもかもが型に載るわけではありませんし、値に依存するような型は使えると便利でしょうけど、今のところ決定版というべき実装法はありません。

「バグがあるとすれば、それは型のバグである」ということがいいたいのではなく、タイポでは型のバグになることが多く、そのくらいはコンパイル時に弾けるほうが良いでしょう、ということを言おうとしました。もちろん、2 + 3 とすべきところを 2 * 3 としたという類いのバグまではカバーしきれませんね。

文字列処理ライブラリを作っているとすると、API としては多くの関数が [Char] -> [Char] になるでしょうが、その関数の多くは、高階関数をつかって合成されるでしょう。高階関数は型としては、ずっと複雑で、合成の際に引数順などの誤りを型でチェックできると楽ができると思いませんか？

私自身には、静的型付けを「きつくして行くと、プログラムがますます書き難くなってゆく」という感覚があまりありません。表現が冗長になる度合にもよりますが、型システムを納得させられないようなものは、私の場合、自明なバグである可能性が高いので、そのようなものはさっさと弾いてもらうほうがいいのです。

Haskell の型システムのおとしどころは、機械的な静的型付けが実用的な範囲で実装可能であるというところでしょうか。 (実際、Haskellの型システムの基本は変ることはないでしょうけど、すこしずつ進化はしています。Haskell 98 の仕様にはない機能が Hugs や GHC に追加されていて、一部は事実上の標準になっています。)

再帰の可不可と同様のギャップが静的型付け、動的型付けの間にあるといえるかどうかちょっとわからないです。スペクトルの端にあるか中間にあるかは決定的にちがうような気もするしそうではないような気もします。ただ、関数の型による抽象化を(意識的に)行うプログラミングスタイルかどうかの違いはあるとおもいます。

Shiro: ふむ。納得です。静的型という制約を、抽象化のための思考の道具として使うわけですね。動的型では、やはり思考がランタイムでの値中心になりがちなように思います。

高階関数の合成に関しては、静的型が圧倒的に有利だと思います。動的型だと人間の頭で追わないとだめだし。引数順の誤りは、同じ議論になるので(引数が同じ型だったら? という)アレですが、引数の数だけでもチェックできたらずいぶん違うと思います

Last modified : 2009/06/08 05:53:43 JST

Old/sampou.org/Type

Type

型推論

制約の強さの度合