三章のとおりですが選手を指定してみた他(表題のとおり…A・ロッド/プホールズ*現役/バリー・ボンズの三名)、ここだけコードを変えてます。600本塁打までを見て、TRUEを返してくれる領域だけ切り取ります(最初から数字でフィルターかけりゃいいじゃんって思うかもしれんけど、テーブルの様子を伺いながらできるようにしました)。
その後、500本塁打を表すプロットに横線を入れて誰が一番早いねん!あいや、MLBでは500本塁打クラブってのがあるそうです。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 |
PlayerInfo <- bind_rows(get_birthyear("Albert Pujols"), get_birthyear("Alex Rodriguez"), get_birthyear("Barry Bonds") ) Batting %>% inner_join(PlayerInfo, by = "playerID") %>% mutate(Age = yearID - birthyear) %>% select(Player, Age, HR) %>% group_by(Player) %>% mutate(CHR = cumsum(HR)) %>% mutate(CHR.T_F = cumsum(HR) <= 600) -> HRdata HRdata <- filter(HRdata, CHR.T_F == "TRUE") ggplot(HRdata, aes(x = Age, y = CHR, linetype = Player)) + geom_line() + geom_hline(yintercept = 500, linetype = "dashed", color="red") |
さて、気になるプロット結果ですが…こうなりあした、あい。
検証すると…まずA・ロッドは18歳でメジャーデビューしてるので、はじめの方やけに早いスタートだなぁ、と思いますがその分がしっかりとデータに反映されているようです。
500本塁打達成年齢は、Wikipediaより三名がそれぞれ、
A・ロッド(32歳)
プホールズ(34歳)
バリー・ボンズ(36歳)
だそうです。
確かに、グラフのプロットの交わる点を見ると、A・ロッドが一番500本塁打達成まで早いです。32歳ぐらいだね。今回メンツに入れてみた最有力候補となる唯一の現役選手プホールズは34歳付近で達成してます。以外にも、MLB歴史上最多HR達成数を誇る、かの有名なボンズは36歳とかなり遅めなんですね!確かにプロット結果に表れています(もちろん整数値になりますが、コード上のテーブル HRdata も同じようになっておりまっす)。
現時点でA・ロッド(引退済)よりもプホールズのほうがHR数多い、しかも現役なんで、ボンズ(同じく引退済)のデータも含めると、500本塁打までの道のりがその後も、それまでのペースのとおり、順調にいくとは限らないという事が読み取れると思います。