最近、話題になっている「その数学が戦略を決める」(イアン・エアーズ著、山形浩生訳、文藝春秋刊、1714円+税)を読みました。
膨大なデータを用いた回帰分析や無作為抽出テストといった統計的手法を用いて今後起こりそうな確率を予測し、それに基づいて企業や政府、消費者が意思決定を行うようになっていることを書いた本です。
こうした計算が扱う範囲は幅広く、ある年に作られたワインがビンテージワインになるかどうか、野球のドラフトで選択すべき選手、映画がヒットする確率、有効な教育方法の検証、支援すべき開発プロジェクトの見極めなど、多岐にわたっているそうです。
大変内容の濃い本なので、関心のある人は絶対読むべし。
さて、本書では、統計技法に関して「ニューラルネットワーク」について事例している箇所があります。
ニューラルネットワークとは、コンピュータが人間の神経細胞のように情報を処理する仕組みで、コンピュータは過去のデータを使って方程式のスイッチを訓練し、最適の重み付けを行うようにプログラミングされています。
その事例紹介として、本書のなかではアリゾナ大学の研究者たちがグレイハウンド・レースの勝ち犬を予測するニューラルネットワークを構築したことが書かれています。
日ごとの競技シート何千件に基づき、五十以上の変数をそこに与えた-犬の身体属性、トレーナー、そしてもちろん、各種条件のもとでその犬がどのくらいの戦績を収めたか。(中略)それからニューラル推計プロセスが、同じ歴史データをもとにちがった重みをあれこれ何度も試した-ときには何百回も-そして相互接続する方程式の重みづけのどれがもっとも正確な推計を出すかを確かめたのだ。その訓練で得られた重みを使って、将来のドッグレース100試合の結果を彼らは予測した。(「その数学が戦略を決める」第6章 なぜいま絶対計算の波が起こっているのか P.192)
その結果、人間の予想家がマイナスを出すなかで、アリゾナ大学のコンピュータはプラスのリターンをはじき出したのです。その結果、アメリカではいまや多くの賭け屋がニューラル予想に頼っている由。
おお、それはすごい。日本ではニューラル予想はないのか。
と思ったら、身近なところにありました。JRA-VANが提供している「データマイニング予測」は、まさにニューラルネットワークを使った予測です。
その検証結果はこちらのページのとおり。
すごい。データマイニング数値の高い馬の単勝を買うと、1点買い~5点買いの全てのパターンにおいて、通算で収支はプラスになっています。確率的に回収率は75%(単・複の場合は80%)に収斂していくはずの中央競馬で、119%から154%の回収率を記録するとはすばらしい。
で、早速先週の土日、中山開催を中心にデータマイニング予測の数値が高い馬の単勝を買ってみたところ、見事にプラス収支。単勝なので一攫千金のようなことはありませんが、ニューラル予測の優秀さに感心しました。