【サルでも読めるヒストグラム】今更聞けないSteamのレビューヒストグラムの見方をチョー具体的に説明する | ページ 4 | ゲヲログ2.0

【サルでも読めるヒストグラム】今更聞けないSteamのレビューヒストグラムの見方をチョー具体的に説明する



時系列ヒストグラムは分かりやすい事例ですけど、別にヒストグラムではx軸(横軸)に時間軸を取らずともいいのです。例えば、10-20 20-30 30-40 40-50 50-60 60-70 70-80 80-90 90-100というように100点満点テストの度数分布を表したい場合でもヒストグラムが使えますね。そして60点未満が赤点(多くの大学でD評価とするところ)である場合、一目瞭然でGPA算出傾向のための(GPAそのものはこのヒストグラムでは表せないけど)S/A/B/Cの分布判断が一目で理解できる…というわけですね。

(。´・ω・)ん?まだわからん?大丈夫だ、わかるように具体的に説明してやるから。

これは、Pramen P. Shresthaさんによる論文資料(でいいんだよな?)で示されたその事例です。度数(Frequency)が分布してますね。100点のScoreものは一人もないです。一番多いのが50~70点付近だということがわかりますよね!まぁスコア的にはそこそこの難易度だったということが伺い知れますよね。低スコア赤点のものもけっこういることもわかるわけです。(以下:画像引用)

先に言及したGPAそのものを表すには、別のヒストグラムを作る必要があるでしょう。GPAは0-1 1-2 2-3 3-4で最高値が4(全てS評価の場合4になる)ですから、次のようなヒストグラムになるよね!※なお、ちょっと難しいですが,,,この場合相対頻度(Relative Frequency)としてy軸を出していることに注意は必要です。(以下:Carlos Matránさんの論文資料から引用)

さて、これでお分かりいただけたでしょうか?