コンピュータ将棋とデリバティブ・モデル

IS将棋・東大将棋・棚瀬将棋の開発者であり、コンピュータ将棋選手権 の準優勝者である 棚瀬寧 氏は、私の大学学部学科の同期である。在学中に彼からIS将棋の開発に誘われたが、当時、別プロジェクトに参加していたことと、将棋が強くないことを理由に断ってしまった。そのコンピュータ将棋について最近よく思いを致す。その理由は

  • 5月に 2008 コンピュータ将棋選手権があった
  • フジテレビで ハチワンダイバー が放映されている (土曜 23:10)

からだと思っていたのだが、底流にある真の理由にようやく気がついた。

きわめてよく似ているのだ、コンピュータ将棋といま理論・実務で携わっているデリバティブ・モデルというものが。

  • パスと場が戦略 *1 のバリューを決める
  • パスが (局所的に) 結合可能 *2 である
  • ひとつひとつの状態遷移にはさほど大きな意味はない、が、総体としては極めて大きな意味をもつ
  • パスの先を眺めれば複雑で予想しがたい、が、期待値 *3 は (不正確かもしれないが) なんとなく見える

両者は似ているというより、コンピュータ将棋はある意味、離散デリバティブ・モデルそのもの *4 といえる。そして、差し手がほぼ無限にあるためにコンピュータ将棋が突き当たる水平線効果というもの (見通せる先に限界が来ること) が、これは複雑なデリバティブで解析解が導出しづらいことに相当する。

解析解が導出しづらい場合、デリバティブ評価ではモンテカルロ・シミュレーションを行う。将棋には解析解が存在しないので、コンピュータ将棋では水平線効果に突き当たろうともパス探索、すなわち、先読みをするしかない。ドラマにおける先読み〜ハチワン・ダイブ〜の映像はまさしくこのモンテカルロ・シミュレーションを表現しているように見える。

将棋は何度も挫折したから嫌いだ。しかし、プロジェクト参加を断った身ながら、コンピュータ将棋というものにはいまだにとても強い興味がある。長い時を経てそれに類似するデリバティブ・モデルにいま携わるようになった奇縁に思いを致すと、要するに戦略の解析というものが、ライフワークにしてもよいと思うほど、好きなのかもしれない。

*1:将棋でいえば差し手、デリバティブ・モデルでいえばオプション。

*2:結合可能とは A → B という手順でも B → A という手順でも同じ場に行き着くということ。

*3:将棋でいえば対局者の実力差や盤面の有利不利、デリバティブ・モデルでいえばモンテカルロ・シミュレーションの収束値。

*4:そもそも将棋は、成るか不成か、攻めるか守るか、さまざまなリアル・オプションを行使していくゲームである。