統計

統計

【サッカー統計オタ話】プレミア屈指の快速ドリブラー 三苫薫 その驚異のスタッツのソースはどこか? ~三苫能力検証編~

これはGOAL Japanのツイートから見て取れるデータなんすけど、肝心のsourceが全く書かれていないのが問題です。Twitterによる短文ツイートと言えども、単にこれだけ書かれてファクトチェックなどしようがないだろうが!って感じですが。よってsourceを調べてみました。 🇯🇵🏴󠁧󠁢󠁥󠁮󠁧󠁿圧巻のスタッツ📊#三笘薫、#プレミアリーグ でもトップレベルのドリブラーに!英メディアが90分平均におけるスタッツを紹介。・敵ボックス内でのタッチ数:7.67回(5位)・一対一勝利数:2.19回(4位)・オープンプレーでのアシスト期待値:0.26回(3位)— GOAL Japan (@GoalJP_Official) January 16, 2023 というわけで、Goal.comが日本語のsourceになってて、さらにその大本のsourceはSquakaというイギリス産フットボール系データサイトの大御所であるらしい。できる限りでいいから、詳細を調べてみるぞ!結果から言うと... 強く意気込んだはいいが、直接的sourceは見つかりませんでした,,, 次ページ~ソー...
統計

【連載:クマでも読めるブックレビュー】「Rによる人口分析入門」中澤港~R併用した人口学入門の傑著・定本

統計ライブラリー 人口分析入門  |朝倉書店 神戸大学の中澤先生による、Rによる人口分析本。 概要 まず、冒頭では、日本の社会保障税一体改革の杜撰さが指摘されています。曰く、『人口減社会で需要減が巻き起こるのは当然のことで、それを見越して需給の計算をしなかったのは”愚行”である』とのことです。けっこう厳しい指摘が入ってますね。これは、中国人起業家の宋も言っていますが、常識で考えれば、増えた世代も負担すべき世代になれば社会の重しになるのは事実でありまして...中澤先生なんかは、このあたりの人口学のご専門なようで、かなり貴重で踏み込んだ意見がけっこう書いてあります。統計ライブラリーシリーズにしては珍しく手厳しいコメントが多くある書だと感じます。中澤先生によると、日本では人類学と人口学が、細分化・専門化されていない、とのことです。たしかにその通りだなぁと。アメリカではふたつがデュアル・ディグリーになっていることも珍しくはないそうです。重ねて言いますが、これはかなり適切かつ辛辣な※だなぁと思い、感心させていただいた次第です。 データの出自とグラフプロットの手法...
統計

回転寿司チェーン業界はデータサイエンスの”踊り場”か?

思ったんですけど、寿司屋とか外食チェーン店ってのはおそらくデータサイエンスのちょうどいいところを突いている業種だと思うんですよ。おそらく今回の騒動はなにか社内外の政治的な活動、つまり民間企業政治の典型的な事例になる可能性があると、あたしは思います。 例えば、仕入れ値・売値・売り方・およびそのノウハウ...典型的な回帰直線系のデータサイエンスがすごく合理性を持つ業種だと思うのです。いわば野球(セイバーメトリクスといわれる分野です)と同じようにデータサイエンスのお得意領域、明らかにその”踊り場”なんですよね。 ネタの仕込みは職人に任せればいい話なので、やはりデータサイエンスの活用事例、特に成功事例・その店舗の事例を真似ていけば、確実に既存の先行他社に追いつくチャンスはあると思ったのでしょう。これはある意味合理的な思考方法だと思います。そりゃ当然ですね、別会社・社外で成功している事例を見て、それを真似て自社にしかできないことをアレンジして実行すれば、確実に成功する確率統計的な一番の基礎部分の話なので。 おそらく後発社の躍進のきっかけを作りたかったのでしょうね。そして、より...
統計

Tsukumo製PCケース69JDのサイドパネルに12cmUSBファン*2を付けたハナシ【冷却性能評価】

69JDを簡単に改造してアレンジした記録を残す。 G-GEARのミドルタワーケース69JDをいじってます。結構楽しい。☟これです。 実は、あたしついさっき知ったんだけどフロントにファン隠れてます。サイドパネル両方を外し、徐々にフロントパネルを外していきます。すると( ゚Д゚)<あれ?フロントファンあるやん、うんこファンじゃないやん...ということが判明。そして上画像のように再度上下にファンを追加。追加したファンは☟これです。 Amazon | upHere 12cm USB冷却ファン USB扇風機 ミニ送風機 PCケースファン 2基連結 900-1300RPM 3段階調節 静音タイプ【N12U04】 | novonest | ケースファン 通販 他の条件はできる限り平均化してみました。ファンの冷却効果測定を見てみる。ベンチマーク(3DMark)とリアルタイムの温度測定プログラム(HWMonitor)を併用してみて実験した限りですが...さて結果はどう出るか?ほぼベンチマーク稼働開始と温度測定のリセットのタイミングを合わせてみたところ、ベンチマーク...
統計

TOPIX構成銘柄から小型株(TOPIX Small 1 & 2)を絞り込んで抽出する方法

これはめっちゃくちゃ簡単です。東証上場基準改変は骨抜きだそうですがw。まぁとりあえず、改変に従って、いろいろと見直されるようなので、そのあたりは日本取引所のサイトを参照してくらさい(日本取引所グループ)。あと小型株・中型株・大型株の解説は大和アセットマネジメントのサイトがかなりわかりやすいです(大和アセットマネジメント株式会社)。 ではどう抽出するか?これはExcelで提供されているTOPIX銘柄の一覧(上述の取引所グループのリンクから手に入れられます)をFILTER関数を使い、抽出するってだけのことっす。次のコマンドを同じTOPIX銘柄一覧の記載されたExcelファイルの任意の位置で実行してください。 =FILTER(A:G,(F:F="TOPIX Small 1")+(F:F="TOPIX Small 2")) これはor条件式である+をFILTER内で使っているということです。A~Gの中でFにTOPIX Small 1もしくは(or)TOPIX Small 2の記載があるものを抽出してまとめる...というだけのことです。ではこれの応用は考えられないか?...
統計

2020[Q1]~2021[Q3]までの主要e-SportsタイトルランキングTop10推移(PCゲーム)を折れ線グラフにまとめその動向を考察してみた。

今回のお題 主要e-SportsタイトルTOP10ランキング(PCゲーム)推移をまとめその動向を考察する回です。ソースはこの分野で一番有力とされている、TEO(The Esports Observer)によるランキング付けを参考にしています。このランキングは、タイトルの持つパワーを示す指標indexを公開していることで有名で、そのindexは種々の評価割合で算出されています。 パワーインデックス勘定の割合 大体その勘定の割合としては... ・月別アクティブプレイヤー 30% ・プライズプール(賞金総額) 25% ・e-Sports視聴時間 20% ・通常時のタイトル視聴時間 15% ・タイトル配信数 5% ・トーナメントの数 5% という内容になっていて、この割合はほぼほぼ毎統計の回でそれほど変わらんようです。 この手の統計指標を見るときに必ず気を付けたい点 ただし注意したいのは、このindexが絶対的な値ではないということです。例えば、先日、群馬県がとある調査会社の県別魅力度ランキングで下位に位置し、山本一太...
統計

【馬鹿企画】漫画「ハイスコアガール」第5巻~矢口なみえvs業田先生の回を言語統計的に分析する

【序論】 漫画「ハイスコアガール」の勘所は、少なくとも部分的にはゲームをめぐって大人たちがどのようにゲーマである若者に接するかという点にある。そこが押切蓮介の有能なところなのだが、これを客観的に指標化出来たら素晴らしい企画になるのでは?と思ったことがこの記事のハシリである。 【解析手法】 主にユーザーローカルのウェブサイト解析ツールから定量的に分析できればと思い行った。ハイスコアガール第5巻クレジット29よりすべて引用させていただき、データはテキスト、特に矢口春雄の母・なみえと大野家の鬼教師・業田先生との論争を題に取ってみた。ぶっちゃけ、『パンケーキ作ってみた』に続く、事実上の馬鹿企画である。 【解析内容】 まず、クレジット29における、矢口なみえと業田先生との間(部分的には春雄との会話も含まっている)でかわされた言葉の単語レベルでの解析から入る。なみえは相手の固有名詞を多く述べ、また、なみえにとっては物語の肝となる自らの考える”教育方針”について意見していることが端的に見て取れる。対して、業田先生は晶に対する懸念を主に述べており、春雄についても直接...
統計

にじさんじ総本山ANYCOLOR上場から一週間内での時価総額推移を観察する

※本記事は、YouTubeライバー支援および開発を主業にしている、にじさんじ運営・総本山ANYCOLOR社(ANYCOLOR Inc.)の6/9からの上場後一週間での時価総額推移を表・グラフにまとめてみて各種メディア報道との内容の比較考察を行う...という企画記事です。 プロの投機家のかたからは杜撰に見えるだろうけど、どうか寛大な目で見てね(^_-)-☆ ANYCOLOR時価総額推移~表算出結果 前にMSについてまったく同じ記事を書いたが復習しておこう。 今、 時価総額 = 株式単価 × 発行済株式数 という方程式が成立する。ANYCOLORの上場はつい先日だったので発行済株式数にはあまりこだわらなくていいはずで、そうして算出した時価総額を各社プレスによる報道と照らし合わせて照合することで、矛盾がないかを確認してみる。ANYCOLORの発行済株式数(上場時)と現在の発行済株式数はあまり変わらんだろうから出回っている統計より(関連リンク)、 発行済株式数 = 29,993,435(株) と現状まで考えていいだろう(とりあえずは)。...
統計

バイオインフォマティック研究について思いついた素朴な疑問

あたしが課題に取り組んできてこの分野でわかったことはいくつかある。 ①ドライ系本流のバイオインフォマティクスで得られる知見には限界性がある 一番に挙げておきたいのは、バイオインフォマティクスの主流派であるドライ系の研究は、統計的手法に終始していて応用性に乏しいことがままある、ということだ。例えば、実験を伴う研究にバイオインフォマティクスを応用する研究者と生データは拝借するだけの研究者では当然前者のほうが有効である。なんつったって、自分の個性が如実に出る入力データを加味した個性的な研究ができる。自分でデータを集めることができる、できない、では当然前者のほうが有利だしオリジナリティあふれる研究デザインが可能だ。例えば、BCGとコロナウイルスの関係性を紐解くうえで、単にマッピングの技術を応用するだけでは、その有効作用をうまくことはかることはできないことは簡単に頭に思い浮かぶだろう。ここに、細胞株ごとの割合や実際の生化学的反応の度合いを持ち込んだほうがずっと疫学的な側面に実験科学の側面を持たせうることができるのは当然のことだ。決して、バイオインフォマティクスは単なる地政学ではない...
統計

ここ15年でMSの時価総額はどれぐらい伸びたのか?

時価総額の計算は簡単で、掛け算ができれば誰でも計算できる。今、 時価総額 = 株式単価 × 発行済株式数 という方程式が成立する。MSがXbox20周年記念ということで注目を浴びているので、これを例にとってみよう。 ここでは、年単位で発行済株式数が出算されていたので(YCHARTS)、通常、市場終株単価を利用するところを、大まかに幅をとって年単位での株単価をとり(MacroTrends)、計算機に入れた。だから、大まかな時価総額を求めたといえる。 計算の結果示されるチャートがどれだけ妥当か比較しながら見てみよう。 西暦MS 発行済株式数(十億株)MS 年平均株単価($)発行済株式数 * 年平均株単価(十億$)200510.90625.871282.1491200610.53126.2908276.868420079.88630.4459300.988220089.4726.6475252.351820098.99622.9766206.697520108.92727.0584241.550320118.59326.0522223.866620128.50...