◆データ解析研究所 −[まずは道具立て]−
まずはデータ解析に欠かせないツールについて考えてみましょう。
パソコン このページの先頭へ

ThinkPad T60(262323I)




・PCオンライン
ショップリスト
もはやこれなしでは現在公開している指数の計算や予想はとてもできません。詳細なデータをいつまででも覚えている記憶力や、数多くのの計算を繰り返しこなす能力のありがたみは、手作業で集計をしたことのある方ならわかっていただけると思います。

これまでにいろいろなプログラムやマクロを作ったおかげで、指数算出と単勝予想を行い、その結果をもとにした公開用.htmlファイルの編集、それから成績管理の資料となる一覧表の作成までを40分程度でできるようになりました。

といっても、特に高性能なパソコンが必要というわけではありません。わたくしが使っているのは、エプソンダイレクトで買ったパソコンで、CPU:2.4Ghz、メモリ:256MBの、買った当時としてはごく普通の構成のものです。

もちろん速いに越したことはありませんが、使おうとするソフトが問題なく動作するスペックであれば大丈夫。性能よりもむしろどう使いこなすかを考えたほうが良いと思います。
ソフトウェア このページの先頭へ





・OFFICEソフトをチェック
パソコンが準備できたら、こんどはデータを処理するためのソフトについて考えてみましょう。

わたくしの場合、データ解析用としてはマイクロソフトのACCESSとEXCELを、主に下記の用途で使っています。

 <ACCESS>
  ・過去データ管理、指数計算〜ランク付けのメインプログラム
  ・上記算出データをもとにした出走馬のスクリーニング(選抜、選考)プログラム
  ・予想とレース結果情報の管理・集計プログラム

 <EXCEL>
  ・HTMLファイル編集マクロ
  ・予想とレース結果情報の編集マクロ(上記管理・集計プログラムで使用)
  ・その他各種資料の管理

解析の主力は所謂データベースソフトのACCESSです。データベースとそれを操作するための機能やプログラミングの環境が一体になっていますので、あれこれと環境を整える手間が省けて助かります。

あまり玄人受けするツールとはいえないかもしれませんが、これまで特に不足を感じたこともありません。もっとも、解析システムそのものを公開するつもりで作ってはいませんので、見栄えを気にする必要もなかったこともありますが…。

一方のEXCELでは解析結果とレースの結果を集計したり、マクロでちょっとしたプログラムを組んだりと便利に使っています。

大量データを扱うことは難しいと思いますが、EXCELでもデータを蓄積してシート上に簡易な操作画面を作って処理を行うことも可能ですので、始めのうちはこれを使って構想を練るのが良いかも知れません。

より本格的なツールを選ぶなら、VBやOracleなど様々なものがありますし、Javaなど無料で使うことのできるツールもあります。

実は以前Javaを使ってシステムを再構築しようと目論んだことがありましたが、慣れないツールだったこともあってデータ解析よりも「Javaで作ること」そのものが目的になってしまいそうになり結局途中で諦めました。

いろいろ試してこれ!というツールが見つかったら、浮気をしないで解析に専念した方が良さそうです。
参考書・情報源 このページの先頭へ





・その他参考図書リスト
ちょっとしたデータの集計や管理であれば良いのですが、本格的な解析のためのプログラミングを何の予備知識もなしに始めるのはかなり大変です。

システム関係の仕事をされている方であれば大きな問題はなと思いますが、初心者の場合、始めからソフトを使いこなすというわけにはいかないと思います。

できれば周囲に「良い師匠」を見つけて、あれこれ教えてもらうのが理想的ですが、そうもいかない場合は自分で何とかするしかありません。技術的な情報を得るには、

 ・参考書を読んでコツコツ勉強。
 ・Web上の関連サイトで情報を得る。


の2本立てになると思います。

参考書については、EXCELやACCESSなどのメジャーなソフトであれば選ぶのが大変なくらいたくさんの種類の本が出版されています。本のレベルもいろいろ揃っていますので、自分にあったものを探してじっくり勉強しましょう。

一方のWeb上では、各種ソフトについて様々なサイトが運営されています。ソフトの名前と知りたいことを入力して検索すると、特殊な問題でもない限りは解決方法を見つけることができます。また掲載されている情報も、ソフトのヘルプよりずっと具体的で分かりやすいものが多いので、わたくしもときどき利用しています。