Jリーグの経営分析を始めるにあたって、先ずはデータの収集から始めなくてはいけません。
Jリーグは、各クラブの経営情報(損益計算書、貸借対照表)も開示されていますが、まずは試合情報を利用して分析を始めたいと思います。
今後は、経営情報も加味した分析に広げていく予定です。
今後分析をする対象データについて、紹介していきます。
Jリーグの試合に関する分析データ
Jリーグ公式サイトでは、毎年のクラブの経営情報とは別に、1992年以降の全ての試合のデータが開示されています。
会員などの限定公開ではないので、誰でも閲覧可能になっています。
試合情報には、対戦カードや結果、試合に出場した選手といった基本情報に加えて、試合の開始時間や天気、温度の情報も合わせて掲載されています。
天気などは入場者数に影響を与えそうな情報ですね。
クラブの経営情報、試合に関する情報は、Jリーグ内部の情報になります。
経営分析をするには、地域の経済の状況や人口など外部の情報も加味しなくてはいけません。
人口100万人の都市のクラブと10万人の都市のクラブでは、入場者数にも違いがありそうです。
スポンサーとなく企業が、地域にどれだけあるのかも気になります。
野球チームやBリーグのチームなど、スポーツ観戦として競合する相手がいるかどうかも影響を与える可能性があります。
今後は、外部情報となる地域情報も収集しながら分析を進めていきたいと思います。
最初は、Jリーグ公式サイトから収集できる試合情報だけを利用して分析を始めます。
Jリーグの公式サイトには、データをCSVファイルなどでダウンロードするような機能はありません。
だからと言って、1992年からの全ての試合のデータを手作業で集めようとすると膨大な時間がかかってしまいます。
そこで、自動でデータの収集を行うことができるRPAツールを利用しました。
RPAとは、定型的な作業を自動で行うことができるパソコン上のロボットの事です。
一括でデータを収集できない場合、RPAなどを利用したデータ収集はとても強力です。
データ分析とは少し外れてしまいますが、RPAの選び方や使い方についても今後紹介予定です。
分析対象とするJリーグの試合データ
経営分析の対象とするJリーグのデータは、次のようになります。
対象データ
◆ 対象期間:2010年~2020年の11年間
Jリーグでは、2010年~2020年の11年の間に、合計10,074試合が開催されています。
各年のカテゴリー別の試合数を表にしたものです。
J1は、11年間、毎年306試合の開催されています。
J2は、2010年と2011年にチーム数が増えました。2012年以降は年間462試合の開催です。
J3は、2014年からのリーグがスタートしました。
天気の種類
入場者数に影響を与える事象として予測されるのが天気です。
試合開催日は、どんな天気が多かったでしょうか?
Jリーグの天気に関する記録は、かなり細かいです。
試合の中で天気に変化があった内容を、細かく登録されています。
例えば、「雨のち曇りのち晴」や「曇り一時晴一時雨」などです。
ずっと天気を見ている人がいるのかもしれません。
Jリーグの分析対象期間の天気の一覧を表にしました。
かなりの数になります。全部で76パターンあります。
雨時々霧一時雷雨の天気は、試合をする選手も観戦するサポーターも大変な試合ですね。
この試合は、2017年10月29日に開催された「沼津 - C大阪23」の試合です。
データ分析をする際に、全てのパターンで分類すると数が多くなりすぎてしまい、傾向を掴むのが難しくなってしまいます。
そこで、簡略化する為に「のち~」を全部取って、最初の天気で試合数を集計することにしました。
例えば、次のように天気を変換して集計しています
【集計例】
◆ 晴のち雪のち雨 → 「雨」として集計
◆ 晴のち曇一時雨 → 「晴」として集計
簡略版として、天気を集計して表にすると次のようになります。
簡略版で表現すると、晴と曇りの試合が圧倒的に多くなります。
雨が降った試合は、それぞれのカテゴリーで10%ほどです。
10回試合を見に行くと、1回雨の天気に当たるという事になります。
「曇のち雪」のような天気は、曇りに集約してしまったことが影響しているかもしれませんが、雪が降っていた試合は意外に少なく、11年間でも12試合しかありません。
Jリーグでは、度々論争になりますが、春秋制の恩恵ですね。
欧米に合わせて、冬に試合を開催するようになるともっと増えそうです。
特に最近は、東北にもJリーグのチームが増えてきました。
屋内は札幌ドームと大分の大銀ドームです。
J3に屋内があるのは、大分がJ3に降格したことがあったからですね。
大分は、一度J3への降格を味わいましたが、今はJ1に復帰しました。
11年間で1番暑かった試合と寒かった試合
データを収集した結果で、1番暑かった試合と寒かった試合を紹介したいと思います。
11年間で1番暑かったのは、2019/7/20にいわぎんスタジアムで開催された「岩手 - 群馬」の試合でした。
気温は36.2℃まで上がりました。
東北で開催された試合が、1番暑かったというのは意外です。
ただし、これは試合環境に秘密があります。
この試合の開催時間は15:03でした。岩手といえども、夏は暑いですね。
岩手は照明設備がなかった為、夏でも昼間に開催されたことが、Jリーグで1番暑い日に開催された試合となった原因でした。
2021年2月に照明が設置される予定なので、今後は炎天下の中での開催はなさそうです。
逆に1番寒い日に行われた試合が、2020/12/16にアルウィンで開催された「松本 - 東京V」でした。
気温は-3.3℃コロナの影響で平日夜開催でした。雪も降っていました。
DAZNからも寒さが伝わってきたのを覚えています。
暑いのも大変ですが、氷点下もサッカーをするには過酷な環境です。
収集した試合データを利用して、まずはリーグ全体の分析を俯瞰的に始めてみたいと思います。
分析には、ツールを利用しました。
統計の分野では有名なRです。フリーソフトなので誰でも利用可能です。
データ分析には同じくフリーソフトのpythonも有名です。
pythonの方が利用ユーザが多そうなので、後々はpythonも使ってみたいと思います。
Jリーグ全体の傾向を知る方法として、代表値の分析から始めて行きます。
合わせて読みたい 代表値分析偏
データ分析に興味があるけれど、どうやって始めて良いか分からないと悩んでいる方も多いと思います。
私がデータ分析を勉強する上で、役に立った本をこちらの記事で紹介しています。
これまで、全くデータ分析をやったことがない人には、導入本としておすすめです。
データ分析に興味がある方は、こちらの記事を参考にしてみて下さいね。
-
【初心者におすすめ】データ分析を始める時に最初に読むべき3冊
本記事では、初めてデータ分析を始める時に、最初に読むべき3冊の本を紹介します。 データ分析に必要な最低限の知識を習得して、すぐに分析が始められることを重視して書籍を厳選しました。 データ分析の勉強を始 ...
続きを見る