RVM(Relevance Vector Machine)を使って、プロ野球で打率は得点に影響していないことを示す

最終更新日:

チーム打率とチーム得点の関係
2018年のプロ野球のペナントレースの、約1/4が終了した(2018/05/16現在)。
今シーズンのペナントレースは、例年以上にチーム間の得点力の差が顕著に現れている。
そして、
「あの埼玉の山賊打線はチーム打率が~~」
みたいな話がネット上でよく話題になっている。
しかし、チーム打率は本当にそのチームの得点力を反映しているのだろうか?
実際のデータを見てみよう。
2018/05/15の試合前時点での、12球団の「チーム打率」と「チーム得点(1試合あたり)」の散布図である。
線は回帰直線を表している。
すると、概ね「打率が高いチームほどよく得点している」という傾向が見て取れるが、
広島と巨人
日ハムとDeNAと中日
など、「チーム打率は大きく違うのに、得点力はほぼ同じ」であるような組み合わせがいくつか存在していることが分かる。
チーム打率は、本当にそのチームの得点力に影響しているのだろうか?
そこで、RVM(Relevance Vector Machine)を用いて、「チームの得点力に直接影響している指標は何か」を暴き出すことにした。
RVM(Relevance Vector Machine)について
RVM(Relevance Vector Machine、またの名を「関連ベクトルマシン」)についての解説。
以降、データは
\phi({\bf x}_{n}) = (x_{(n, 1)}, …, x_{(n, M-1)}, 1)^T\in \mathbb{ R }^M (n = 1, …, N) \\
t_{n}\in \mathbb{ R } (n = 1, …, N)
が手元に与えられている状態とする。
また、$\Phi$を以下のように定義する。
\Phi = \left( \begin{array}{ccccc} \phi({\bf x}_{1})^T \\ \vdots \\ \phi({\bf x}_{i})^T \\ \vdots \\ \phi({\bf x}_{N})^T\end{array}\right) \in \mathbb{ R }^{N \times M}
通常の線形回帰モデル
通常の線形回帰モデルでは、
p(t|{\bf x}, {\bf w}, \beta) = N(t|y({\b

サイト名: Qiita

無料メールマガジン登録

週1回、注目のAIニュースやイベント情報を
編集部がピックアップしてお届けしています。

こちらの規約にご同意のうえチェックしてください。

規約に同意する