ExcelだけでSteam登録ゲームの統計分析を行う | ゲヲログ2.0

ExcelだけでSteam登録ゲームの統計分析を行う



ExcelでSteamのコンテンツの概要を読み取ってコンテンツの特徴量を機械学習の手法を使わずに割り出す。統計上重複はあるものの、ジャンルにおけるタイトル数は以上のグラフで表される。なお、データセットはここから落とした。次に、対応しているOS数を累計で円グラフに落とし込む。

Windows対応タイトル表記が圧倒的に多いのがわかる。しかしながら、その中で併記されているものも多めであることもわかる。察するにWindows対応タイトルの中にこの程度の割合でMac/Linux対応タイトルも表記されているのだろう。次にゲームの所有者数とプレイヤー推定人数との比較を線グラフで示す。

当然オーナー数のほうが多くなるが、ここで一定の指数が見て取れる。オンライン対応タイトルだと推定プレイヤー数も多くなっている。実際シングルゲームのほうで開きが大きく、両者の統計量が乖離しているのである。オンライン対応タイトルはよく継続してプレイされる傾向にあるのだろう。最後にメタスコアの上位タイトルの平均を見ていこう。

一貫して人気タイトルだけがメタスコアの高さを保っているわけではないことがわかる。例えば、Top10タイトルでは85程度のスコアが出ているが、実際これが11~20位では落ち込み80スコアを切っている。次の10位では逆にジャンプアップしていて、その後のタイトルは平均をとったように推移する。このプロット結果は奥谷の仮説をかなり類似しているといっていいだろう。