Hikers Guide to Haskell

Haskellの歩き方

この文章は、発展編! Haskellで「型」のポテンシャルを最大限に引き出すには?【第二言語としてのHaskell】 - エンジニアHub|若手Webエンジニアのキャリアを考える!の「【超発展編】もっと勉強したい人のために!」を新しい情報に合わせて加筆・更新したものです。
Haskellの入門書などで学習した人が、知っておくと良いトピックについて網羅するよう努めています。

なお、Haskellの学習コンテンツの一覧やその他日本語の情報については、リンク集もご覧ください。

大原則

すべてを完全に理解しようとは思わないでください。
Haskellはもともとプログラミング言語の研究者が作ったという背景があるためか、日夜新しい機能や概念が実験されています。
それらは追いかけるだけでも大変ですし、理解しようにも抽象度が高く、難しい概念がたくさんあります。
自分にとって有益なものを、詳しい人たちの解説を待ちながら使うのでもよいでしょう(その割には日本語の解説が少なくて恐縮ですが…)

ポイントフリースタイル、あるいは様々なスタイルとの付き合い方

「Haskellは上級者のコードほどコードゴルフのようになって読みづらい」みたいな声をたまに聞きます。
これは一面の真実で、Haskellはポイントフリースタイルなどを駆使することで、同じコードをすごく短くも書ければ、長めに書くこともできるようになっている言語です。
失敗しながら学ぶHaskell入門」でも追々触れる予定ですが、そうした、短く書くための機能がたくさんあります。
そうした機能を駆使したコードを指して「上級者のコードほど読みづらい」という認識が生まれるのではないかと推測しています。

いずれにしてもここで大事なことは、「短く書ける人を上級者と呼ぶな」ということです。
当然Haskellに限った話ではありませんが、短すぎるコードは読みづらいコードになりがちです。
ポイントフリースタイルなどを勉強して、より簡潔に、より本質的な部分のみを書けるようになることはHaskellerとして重要なことです。
しかし同時に、コードの読み手のことを考えて、理解できるコードを書くことは、プログラマーとして極めて重要なことです。
「読み手」はプロジェクトや場面によって変わるわけですから、それぞれの習熟度や好みに合わせて書き分ける、という至極当たり前のことは、Haskellerの常識としても広めていきましょう。

もちろん、そうして選択肢が多いために、「逐一書き方を考えなくてはならない」ところはHaskellを現場に導入する上での障害になり得ます。心得ておきたいものですね。

ちなみに、HLintというツールは、そうしたHaskellの(主に構文以外の)スタイルを統一する上で、必要不可欠なツールです。
デフォルトでも冗長な書き方を改善するための指摘をたくさんしてくれますし、細かく設定すれば「この関数はこのモジュール以外では使わないでください」などというプロジェクト固有のルールも強制できます。
これはスタイルの問題以上に有益なもので、「危険な関数を避けて、それをラップしたバージョンのみを使う」といった、バグを防ぐための習慣も作り出せるのです。 詳細は、素晴らしき HLint を使いこなすをご覧ください。

言語拡張との付き合い方

Haskell製のライブラリーのソースコードやサンプルコードを眺めていると、冒頭で次のような行をたくさん目にすると思います。

{-# LANGUAGE FlexibileInstances #-}
{-# LANGUAGE MultiParamTypeClasses #-}
{-# LANGUAGE OverloadedStrings #-}
{-# LANGUAGE TemplateHaskell #-}
{-# LANGUAGE TypeFamilies #-}
...

これらは、言語拡張と呼ばれている機能を有効にする、特殊なコメントです。
言語拡張は、Haskellの標準として定められた機能に対して、(主に)GHCが加えた新しい機能です。
言語拡張は、初見では何のために有効にされたのかわからず、面食らってしまうことも多いと思います。
しかし、ご安心ください。
一部を除いて、言語拡張を有効にして起こる悪影響はあまりありません。
GHCが提供するHaskellに対する言語拡張は、ライブラリーが必要としているものであればとりあえずコピペして使いましょう。

ドキュメントやパッケージの調べ方

パッケージの名前や、概要から検索したい場合は

※このセクションはもともと最近のHaskell製パッケージのドキュメント事情について簡単に - Qiitaからコピペして、若干修正しました。

  • Hackageから検索するか、
  • Stackageのトップから「browse packages」というリンクをクリックして、LTS-Haskellに載っているパッケージをページ内検索してください。
  • 実は、次のセクションで紹介するHoogleなどの検索エンジンも、パッケージの名前による検索をサポートしています。

2つめのStackageは、LTS-Haskellに載っているパッケージのみの一覧なので、Hackageに公開されているすべてのパッケージが載っているわけではありません。
詳しくはtanakhさんの記事のこのへんが参考になるかと思います。

どこかのパッケージに入っている、関数の名前や関数のシグネチャ(型)から検索したい場合は

実際にHaskellでプログラムを書いていくと、「こんな型の関数がほしい」「こんな名前の関数ないかな」などと感じるケースが頻繁に出てくるでしょう。
そのような場合に便利なのが下記のサイトです。

いずれも、関数の名前や関数の型から調べることができる、ほかのプログラミング言語ではちょっと珍しいタイプのドキュメント検索エンジンです。

たとえばfilter関数の型は(a -> Bool) -> [a] -> [a]ですが、 これを上記のHoogleで検索してみると、filter関数以外にもたくさんの関数がヒットするのがわかります。

ただ、3つとも収録されている内容が異なる場合があります。
新しいバージョンがでた場合に、ドキュメントの生成が追いついていないことがあるためです。
どれを使うべきか簡単に言うと、stackを主に使って開発する場合には、上記のStackageのHoogleを使うのが個人的なおすすめです(筆者自身これを最もよく使います)。
どれかを使ってみて目的の関数が見つからなかった場合は、ほかのエンジンを試してみてください。

情報収集に役立つサイト

  • Haskell Antenna
    QiitaのHaskellタグが着いた記事や、日本人のHaskellerによるブログのRSSを収集したサイトです。
    昔はHerokuの無料プランで運用していたため非常に反応が遅かったですが、今はGitHub Pages上の静的サイトを定期的に更新する、という運用に変えたため、非常に速くなりました。
  • Haskell Weekly 話題になったHaskellの記事や新しいHaskell製パッケージを、毎週紹介してくれるサービスです。 メールで購読もできます。
  • 日本HaskellユーザーグループのSlack Workspace
    各種チャンネルで、日夜情報のやりとりをしています。
    登録はこちらからどうぞ

デバッグの仕方

(要検証): 標準で付いているDebug.Traceパッケージのほか、debugというサードパーティーのパッケージが便利そうです。GHC標準のデバッガーは、正直あまり使いやすくないのでおすすめしません…。

パッケージとの付き合い方

これはHaskellに限った話ではないですが、パッケージ(特に、そのまま実行できるプログラムではなく、プログラムが依存するライブラリー)を選ぶときの基準について簡単に説明します。

同じテーマについて解説した記事がHaskell for all: How I evaluate Haskell packagesにもあります。
共通する部分もありますが、こちらの方がより詳細で、詳しい人向けです。

一番に大事なことは、あなたがそのパッケージを使えることです。
Haskellには高度で便利なパッケージがたくさんありますが、抽象度が高すぎて使い方がわかりづらかったり、同じような目的のパッケージが複数見つかる、といったことがしばしばあります。
そうした状況で、対象のパッケージを使うか使わないか判断するためには、やはりドキュメントを読んでその使い方をあなたが理解できるか否か、という点にあります。
特に以下の点に注目してみてください。

  • 関数の型を見て、使い方がなんとなくわかるか
    • Haskellでは、関数の型、つまりどんな型の値を受け取ってどんな型の値を返すか、といった情報が、重要なドキュメントになることがしばしばあります。
      十分に単純なパッケージでは、それだけで十分な場合も多いです。GHCiなどに頼りつつ、「とりあえず型を合わせたらどんな挙動になるか」確認してみるのも良いでしょう。
  • サンプルコードや使い方の説明を見てなんとなくわかるか
    • 一方、特に抽象度の高いパッケージでは、型宣言がすごく複雑だったりして、型を見てもよくわからない、といったことがしばしばあります。
      そうした場合は、逆にサンプルコードなどを見て、使い方が推測できるか考えてみてください。
      ここで仕組みを完璧に理解する必要はないでしょう。よくできたパッケージは、雰囲気で使っても型さえあっていれば正しく動作して然るべきです。
  • (同じ目的のパッケージがほかに存在している場合に)競合との違いを明確にしているか。
    • 後発のパッケージでこれを明確にしていないものは、作者のモチベーションが低いか、あるいはそもそも競合の存在に気づかないうちに作った、つまり車輪の再発明をしてしまった可能性があります。

これらの情報を見てもわからない、あるいはそもそも載っていない場合は、無理にそのパッケージを使おうとしないでください。
どうしても必要なのであれば、リンク集に上げたteratailやStack Overflowなどの質問サイト、Haskell-jpのSlack Workspaceにある、#questionsチャンネルで質問してみると良いでしょう。
Slack Workspaceについては、こちらから登録してください

要素技術

ビルドツール

stack、あるいはcabal-installというツールがよく使われています。どちらも、内部でCabalというライブラリを使用しています。
結論から言うと、とりあえず無難に使うならstack、なんですが、それぞれについてざっくり紹介しておきます。

cabal-installは、ほかのプログラミング言語にもあるようなパッケージマネージャーの機能を備えています。
Javaで言うところのMaven, Rubyで言うところのRubyGems, などといったところです。
HackageというウェブサイトにアップロードされたHaskell製のパッケージ(ライブラリーやアプリケーション)を簡単にビルド・インストールできるようにしてくれます。

stackはStackageというウェブサイトに書かれた、「resolver」と呼ばれる「この組み合わせなら必ずビルドできるバージョン」のパッケージ群を使用することで、パッケージの依存関係を確実に解決できるような後発のツールです。 stackができる前は、「cabal地獄」などと呼ばれる、「パッケージの依存関係を解決できず、まともにインストールできない」といった事態がしばしば発生していました。
ちなみに、実際にパッケージをダウンロードするのはHackageからです。

これらのツールをより深く使いこなすには、下記の公式ドキュメントに加え、日本語での解説も読んでみてください。

Webアプリケーション

HaskellでWebアプリケーションを作る上で、昨今よく使われるライブラリーは次の3つかと思います。

ServantはいわゆるRESTfulなAPIに特化したフレームワークです。
Yesodに比べて、サーバー側のコードについてフレームワークがやってくれることが少ないみたい1ですが、代わりに、専用の言語内DSLでAPIの仕様を記述するだけで、JavaScriptをはじめとした、クライアント側がそのAPIにアクセスするためのコードを自動生成してくれる、という珍しい機能があります。

対するYesodは、いわゆるRailsをきっかけに広まったような、「フルスタックWebアプリケーションフレームワーク」を標榜しています。
その分、Servantよりも手早く開発するのを支援してくれるでしょう。

ただしServant, Yesod, 共通した困った特徴があります。
それぞれがHaskellの高度な機能を利用した独特なDSLを提供しているため、仕組みがわかりづらい、という点です。
Servantは、「型レベルプログラミング」と呼ばれる、GHCの言語拡張を使った仕組みを駆使して、型宣言だけでREST APIの仕様を記述できるようにしています。
YesodもGHCの言語拡張をたくさん使っているのに加え、特に変わった特徴として、TemplateHaskellやQuasiQuoteという仕組みを利用して、独自のDSLを提供しています。
それぞれ、見慣れたHaskellと多かれ少なかれ異なる構文で書かなければいけない部分があるのです。
つまり、これらのうちどちらかを使う以上、どちらかの魔法を覚えなければならないのです。

その点、Spockは幾分マシです。
一部の型宣言にTypeFamiliesというこれまたGHCの言語拡張を使用してはいるものの、概ねRubyのSinatraをHaskellのdo記法でそのまま再現したようなDSLで書くことができるので、まだとっつきやすいかと思います。
YesodやServantにあるような高度な機能はありませんが、とりあえずHaskellでWebアプリケーションを作ってみたい、という方のはじめの一歩としてはちょうどいいかもしれません。

Monad

MonadはHaskellの学習における鬼門とも言われています。
これを読んでいる皆さんの中にも、Monadで消耗しちゃった人がいらっしゃるかも知れません。
MonadをHaskellの一機能として理解する上で最も大事なことは、「Monad」というコンセプトがなんなのかを正確に理解することより、各種の具体的なMonadの使い方を理解することに時間を割くことです。
そうしていけば、やがて「なんとなく」つかめるかと思います。
実用上は本当に「なんとなく」でよいのです。

ポイントとして、下記の、一見すると何の共通点もないような処理をdoという魔法の構文糖で実現してくれるもの、という点を抑えておきましょう。
それらが必要になったときに、その使い方を知れば良いのです。

  • 入出力処理 (IO Monad)
  • 処理が失敗した場合などにブロックから脱出すること (Maybe MonadやEither Monad)
  • 何重にもネストされたmap関数やconcatMap関数をフラットにすること (リスト Monad)
  • ブロックで暗黙に共有している変数の参照や更新(ダイナミックスコープのシミュレーション) (State Monad, Reader Monad, Writer Monad)
  • などなど

なお、Monadは、「圏論」という数学の一分野における「モナド」という概念に由来してはいるものの、HaskellのMonadを使いこなすために圏論を理解する必要はまったくありません。「プログラミングのためのモナド」として、圏論のモナドとは分けて考えてもいいぐらいでしょう。

Monad Transformer

Monadを使いこなせるようになると、複数のMonadの機能を同時に(同じdoブロックで)使用したくなることがあります。
Monad Transformerは、既存のMonadを組み合わせることで、そうしたニーズを満たすための仕組みです。

Monad Transformerの比較的わかりやすい解説としては、「Monad Transformers Step by Step」という記事が有名です。

ここでも軽くポイントに触れておきます。

mtlについて

最もよく使われているMonad Transformerのライブラリーは、mtlパッケージが提供しています。
各種Monad Transformerの機能を型クラスで抽象化することにより、複数のMonad Transformerを積み重ねた場合でも、積み重ねた各層のMonad Transformerの機能に簡単にアクセスさせてくれます。

具体的には、以下のルールを大雑把に覚えておくと良いでしょう。

  • ReaderTStateTなどのように、HogeTという形式の名前の型が、実際にHogeの機能を提供するMonad Transformer。
  • MonadReaderMonadStateなどのように、MonadHogeという形式の名前の型クラスが、Hogeの機能を提供するMonad Transformerを、抽象化した型クラス。
  • ReaderT r (StateT s (HogeT m)) aのように、HogeTを一段でも重ねているMonad Transformerは、すべてMonadHogeのインスタンスとなっているため、HogeTが提供する機能をそのまま使用できる。
  • こうした慣習は、mtlパッケージ以外でも広く採用されている。なのでMonadFooBarという型クラスを見かけたらFooBarという機能を実装したMonad全般を抽象化した型クラスとなっていることが多い。

この機能の詳細は、先ほどのMonad Transformers Step by Stepの原文が後半で解説してくれています。
仕組みが気になった場合は是非読んでみてください!

よく見る HogeHogeTFooBarMについて

あなたは「Monad Transformer」という概念に出遭う前に、Hspechaskelinerelational-recordなどの内部DSLを提供するパッケージを通じて、Monad Transformerをすでに使っているかも知れません。
これらのパッケージが提供するSpecMInputTなど見慣れないMonadっぽいものを見つけても、「何じゃこりゃ!?どんなMonadやねん?」などと戸惑わないでください。
先に挙げたパッケージのように、こうした型はパッケージごとに固有のものが存在していることがあります。
基本的にはこれらの型は、何かのMonadを組み合わせたものに別名をつけた、あるいはnewtypeでラップしただけのものです。
newtypeでラップすることで、内部構造を隠蔽しているんですね。
その点を知っておくと、こうしたライブラリーへの理解が深まり、何をしているのかイメージしやすくなるでしょう。

ちなみに、「Webアプリケーション」の節で紹介した、spockのSpockMや、ServantのHandlerもそうです。調べてませんがYesodにも同じようなものがあるのではないかと。

lensライブラリー

lensは、「任意のデータ構造に対するjQuery」ともいわれる巨大なユーティリティーライブラリーです。 さまざまなデータ構造、特に複雑に入れ子になった構造に対して自由自在にアクセスしたり、中身を一部だけ書き換えたバージョンを返したりといった処理を、非常に簡潔に書くことができます。

日本語の入門資料としては、下記がおすすめです。 lensを導入するモチベーション、基本的な使い方、さらにlensの仕組みまで踏み込んで説明されています。

lensについてもigrepの個人的な所感を一つ。
lensは確かに便利ですが、その分学習コストが高く、特に複雑な操作を行うTraversalなどの機能に至っては、実際のアプリケーションで使われることはそんなに多くありません。
そもそも特定の入れ子構造に依存した処理というのは、対象のデータ構造の変更に弱く、ある程度の規模のアプリケーションでは、避けるべきものです。
なので、実際によく使われるのは比較的使い方がわかりやすい、Lens型のみであることが多いです。
そんなに深く知りたくもないな、という方は、そのあたりの機能のみを押さえておくといいでしょう。すべてを理解しようとは思わないことです。

そうした需要を反映してか、よく使う機能に絞ることで、依存関係を軽くしたlensライブラリーが、いくつもあります。
その中では、microlensがおすすめです。
競合との比較も明確にしていますし、なによりドキュメントが充実しています。

それでもlens沼にハマることで得られる知識の応用方法と言えば、HTMLのスクレイピングだったり、一部分だけ書き換えると言った、書き捨てのスクリプトでの、複雑な入れ子構造の書き換えでしょう。
実はそうした用途に特化したツールが(まだ開発中で、Hackageにも公開されてませんが)あります。
refactorioというツールです。
refactorioはlensライブラリーと、lensでJSONやHTML, HaskellやJavaScriptなどのソースコードを操作する各種のライブラリーを組み合わせることで、そうしたソースコードの一括置換を支援してくれます。
具体的には、引数で指定した、HaskellのByteString -> ByteStringな式を評価し、その結果を指定したディレクトリーにあるファイルすべてに適用することで、一括置換してくれます。
その引数で指定する式で、lensライブラリーをはじめとする、各種のライブラリーを自動で使えるようにしてくれる、というものです。

まだまだあるぞ!

Wikiなので、適宜紹介したいトピックを追記してください。


  1. とはいえ、昔に比べてServantを補助するライブラリーは増えたみたいなので、それらを自分で組み合わせれば、それなりに楽ができそうではありますが。