ブンデスリーガマッチファクトスキル:AWSでの機械学習を使用したサッカー選手の資質の定量化

ソースノード: 1195672

多くのスポーツと同様に、サッカーでも個々の選手についての議論は常に楽しみの一部です。 「最高の得点者は誰ですか?」 または「ディフェンダーの王は誰ですか?」 はファンの間で常に議論されている問題であり、ソーシャルメディアがこの議論を増幅させます。 アーリング・ハーランド、ロベルト・レヴァンドフスキ、トーマス・ミュラーだけでもインスタグラムに合計50万人のフォロワーがいると考えてみてください。 多くのファンは、レヴァンドフスキやハーランドのようなスター選手が生み出す驚異的な統計を知っていますが、このような話は氷山の一角にすぎません。

ブンデスリーガでは約 600 人の選手が契約しており、各チームには独自のチャンピオン、つまり試合で発揮される特定のスキルを発揮するために導入される選手がいることを考えてみましょう。 たとえば、FCアウグスブルクのミヒャエル・グレゴリッチュを見てください。 この記事を書いている時点(第21節)で、彼は21/22シーズンに1.7ゴールを決めているが、偉大なゴールスコアラーについての会話で誰も彼の名前を挙げたくない。 しかし、詳しく見てみましょう。グレゴリッチュが今シーズンに持っていたすべての得点チャンスの期待ゴール (xGoals) 値を累積すると、得られる数値は 194 になります。 これは、ゴール内シュートのパフォーマンスが +3.2% 上回り、予想よりも 1.6 ゴール多く得点したことを意味します。 これに対し、レヴァンドフスキはわずか 7 ゴール (+XNUMX%) のパフォーマンスを上回りました。 何という偉業でしょう! グレゴリッチュがアウグスブルクに特別なスキルをもたらしたのは明らかだ。

では、ブンデスリーガの個々の選手、そのスキル、試合結果への影響に関する隠されたストーリーを明らかにするにはどうすればよいでしょうか? Skill と呼ばれる AWS を利用した新しいブンデスリーガ マッチファクトに参加してください。 スキルは、イニシエーター、フィニッシャー、ボールウィナー、スプリンターという XNUMX つの特定のカテゴリーのスキルを持つプレーヤーを識別するために、DFL と AWS による詳細な分析を通じて開発されました。 この投稿では、これら XNUMX つのスキルを詳しく説明し、それらが AWS インフラストラクチャにどのように実装されるかについて説明します。

もう XNUMX つの興味深い点は、これまでブンデスリーガの試合結果が互いに独立して開発されていることです。 Skill は、上に構築されたストリーミング アーキテクチャを使用して、複数のブンデスリーガの試合結果の出力をリアルタイムで結合する初のブンデスリーガの試合結果です。 アマゾンマネージドストリーミングカフカ (アマゾンMSK).

イニシエータ

イニシエーターとは、貴重な XNUMX 番目と XNUMX 番目のアシストを数多く実行するプレーヤーです。 これらのアシストの価値を特定して定量化するために、新しい指標 xAssist を導入しました。 これは、ゴールにシュートする前の最後のパスと最後から XNUMX 番目のパスを追跡し、それぞれの xGoals 値をそれらのアクションに割り当てることによって計算されます。 優れたイニシエーターは、難易度の高いパスを成功裏に完了することで、困難な状況下でもチャンスを生み出します。 特定のパスを完了するのがどれほど難しいかを評価するには、既存の xパス モデル。 この指標では、オープンプレーから正確なアシストで得点チャンスを生み出す選手に焦点を当てるため、クロスとフリーキックを意図的に除外しています。

スキルスコアは次の式で計算されます。

現在のランク 1 のイニシエーター、トーマス ミュラーを例として見てみましょう。 この記事の執筆時点 (第 9.23 節) で、彼は 21 の xAssist 値を収集しました。これは、ゴールに向かってシュートを打った次の選手への彼のパスが合計 9.23 の xGoal 値を生成したことを意味します。 90 分あたりの xAssist の比率は 0.46 です。 これは今シーズンの彼の合計プレー時間から計算できますが、これは驚くべきことであり、プレー時間は 1,804 分を超えています。 3.80番目のアシストとして、彼は合計0.19の値を生み出しました。これは、90分間あたり38秒のアシストに換算されます。 合計すると、最初のアシスト58本のうち11本が難しいパスだった。 そして28番目のアシストとして、パスXNUMX本中XNUMX本も難しいパスだった。 これらの統計により、トーマス ミュラーはイニシエーター ランキングで一気に XNUMX 位に躍り出ました。 比較のために、次の表に現在の上位 XNUMX つの値を示します。

.. xアシスト xアシストパー90 xセカンドアシスト xSecondAssistper90 難しいパスアシスト 難しいパスアシスト2 最終的なスコア
トーマス・ミュラー – ランク 1 9.23 0.46 3.80 0.18 38 11 0.948
セルジュ・ニャブリ – ランク 2 3.94 0.25 2.54 0.16 15 11 0.516
フロリアン・ヴィルツ – ランク 3 6.41 0.37 2.45 0.14 21 1 0.510

フィニッシャー

フィニッシャーとは、ゴールを決めることに非常に優れたプレーヤーのことです。 彼はシュート効率が高く、プレー時間に応じて多くのゴールを達成しました。 スキルは、実際に得点されたゴールと、予想されるゴール (xGoals) との差に基づいています。 これにより、チャンスがうまく活用されているかどうかを評価できます。 XNUMX 人のストライカーが同じゴール数を持っていると仮定しましょう。 彼らは同じくらい強いですか? それとも、一方が簡単な状況から得点し、もう一方が困難な状況でゴールするのでしょうか? シュート効率を使えば、これに答えることができます。得点したゴールが xGoals の数を超えている場合、プレーヤーはパフォーマンスを上回っており、平均よりも効率的なシューターであると言えます。 この差の大きさによって、射手の効率が平均をどれだけ上回るかを定量化できます。

スキルスコアは次の式で計算されます。

フィニッシャーとしては、よりゴールに重点を置きます。 次の表は、現在のトップ XNUMX を詳しく示しています。

.. 目標 ゴールあたり90 ショット効率 最終的なスコア
ロベルト・レヴァンドフスキ – ランク1 24 1.14 1.55 0.813
アーリング・ハーランド – ランク 2 16 1.18 5.32 0.811
パトリック・シック – ランク 3 18 1.10 4.27 0.802

ロベルト・レヴァンドフスキは今シーズン24ゴールを決めて首位に立っている。 ハーランドの方がシュート効率が高いとはいえ、得点の重み付けを高くしているため、ハーランドが90位になるにはまだ十分ではありません。 これは、レヴァンドフスキが非常に高い得点を記録しているにもかかわらず、受けたアシストの質と量の両方から大きな利益を得ていることを示しています。 パトリック・シックはハーランドよりもXNUMXゴール多く得点しているが、XNUMX分あたりのゴール率は低く、シュート効率も低い。

スプリンター

スプリンターは高い最高速度に達する身体能力を持っており、他の選手よりも頻繁に最高速度に達します。 この目的のために、プレーヤーの現在のシーズンの全試合の平均最高速度を評価し、90 分あたりのスプリントの頻度などの指標を含めます。 スプリントは、プレーヤーが 4.0 m/s の最低ペースで 6.3 秒以上走り、この間に少なくとも 6.3 m/s の最高速度に達した場合にカウントされます。 スプリントの継続時間は、最初と最後に 1 m/s のしきい値に到達するまでの時間によって特徴付けられ、認識されるには少なくとも 4.0 秒の長さである必要があります。 新しいスプリントは、ペースが再び XNUMX m/s のしきい値を下回った後にのみ発生したと考えられます。

スキルスコアは次の式で計算されます。

この公式を使用すると、選手のスプリントをさまざまな方法で評価でき、選手が生み出す最高速度だけを調べるだけでなく、さらに踏み込んだ評価を行うことができます。 たとえば、ジェレマイア サン ジュストの今シーズンの記録は 36.65 km/h です。 しかし、彼のスプリントの頻度を見ると、試合ごとに平均して 36.08 回しかスプリントしていないことがわかります。 一方、アルフォンソ・デイビスはサン・ジュスト(最高速度31km/h)ほど速くないかもしれませんが、XNUMX試合あたりXNUMX回という驚異的なスプリントを実行します。 彼はより高い平均速度でより頻繁にスプリントを行い、ピッチ上でチームにスペースを広げます。

ボールの勝者

この能力を持つプレーヤーは、合計および各プレー時間の両方で、相手チームにボールを失わせます。 彼は地上戦と空中戦で数多くの勝利を収め、頻繁にボールを盗んだりインターセプトしたりして、彼自身が安全なボールコントロールを生み出し、チームが反撃する可能性を生み出します。

スキルスコアは次の式で計算されます。

この記事の執筆時点で、ボールの235位獲得者はダニーロ・ソアレスです。 彼は合計235回の防衛戦を行っています。 75回の防衛戦のうち、対面で相手を破って51回勝利している。 彼は今シーズン、ディフェンスバックとしてのプレーポジションで32ボールをインターセプトしており、勝率は約2.4%となっている。 平均すると、90分間にXNUMX個のボールをインターセプトした。

スキル例

Skill Bundesliga Match Fact により、ブンデスリーガ選手の能力と強みを明らかにすることができます。 スキルランキングでは、ゴールなど従来の統計のランキングではこれまで注目されなかった選手にスポットライトが当たることになる。 たとえば、ミハエル・グレゴリッチュのような選手を考えてみましょう。 グレゴリッチュはFCアウグスブルクのストライカーで、第21節の時点でフィニッシャーランキング663位となっている。彼はこれまでに97ゴールを決めているが、得点ランキングのトップに立つことはできない。 しかし、彼はわずか XNUMX 分のプレー時間でこれを達成しました。 これらのゴールのXNUMXつは、アウグスブルクがベルリンでのアウェーでの敗戦を回避するのに役立ったXNUMX分の終盤の同点ゴールだった。

Skill Bundesliga Match Fact を通じて、各選手のさまざまな資質を認識することもできます。 その一例がドルトムントのスター、アーリング・ハーランドです。彼はスプリンターとフィニッシャーのバッジも獲得しており、現在ブンデスリーガのスプリンターの中でXNUMX位に位置しています。

これらの指標はすべて、プレーヤーの動きデータ、ゴール関連データ、ボールアクション関連データ、パス関連データに基づいています。 この情報をデータ パイプラインで処理し、スキルごとに必要な関連統計を抽出することで、すべての指標の発展をリアルタイムで計算できるようになります。 前述の統計の多くはピッチ上の時間によって正規化されており、プレー時間はほとんどないものの、プレー中に驚くほど優れたパフォーマンスを発揮する選手を考慮することができます。 メトリクスの組み合わせと重みが 10 つのスコアに結合されます。 結果は、XNUMX つのプレイヤー スキルに関する全プレイヤーのランキングです。 トップ XNUMX にランクインしたプレーヤーにはスキル バッジが与えられ、ファンが彼らがチームにもたらす卓越した資質をすぐに認識できるようにします。

実装とアーキテクチャ

これまでに開発されたブンデスリーガのマッチファクトは互いに独立しており、位置データとイベントデータの取り込みと独自の計算のみに依存しています。 ただし、新しいブンデスリーガ マッチ ファクト スキルではこれが変わります。このスキルは、xGoals や xPass などの既存のマッチ ファクトによって生成されたデータに基づいてスキル ランキングを計算します。 XNUMX つのイベントの結果、おそらくゴールに入る可能性が低い信じられないようなゴールは、フィニッシャーのスキル ランキングに大きな影響を与える可能性があります。 したがって、基礎となるデータが更新されるたびに、常に最新のスキル ランキングを提供するアーキテクチャを構築しました。 スキルのリアルタイム更新を実現するために、Apache Kafka のマネージド AWS サービスである Amazon MSK をデータストリーミングおよびメッセージングのソリューションとして使用します。 このようにして、さまざまなブンデスリーガの試合結果から最新のイベントや更新情報をリアルタイムで伝えることができます。

Skill の基礎となるアーキテクチャは、次の XNUMX つの主要な部分で構成されます。

  • An Amazon Aurora サーバーレスクラスター 既存の一致ファクトのすべての出力を保存します。 これには、たとえば、ブンデスリーガ マッチ ファクトの導入以降に発生した各パス (xPass、プレーヤー、対象レシーバーなど) またはショット (xGoal、プレーヤー、ゴール) のデータが含まれます。
  • 中央 AWSラムダ この関数は、ブンデスリーガの試合結果の出力を Aurora データベースに書き込み、更新があったことを他のコンポーネントに通知します。
  • 個々のスキルの Lambda 関数がスキル ランキングを計算します。 これらの関数は、特定のスキルの計算に新しいデータが利用可能になるたびに実行されます。
  • Amazon MSK Kafka クラスターは、これらすべてのコンポーネント間の通信の中心点として機能します。

次の図は、このワークフローを示しています。 各ブンデスリーガの試合結果は、イベントが更新されると (ショット イベントの xGoals 値の更新など)、イベント メッセージをただちに Kafka に送信します。 中央ディスパッチャー Lambda 関数は、ブンデスリーガの試合結果がそのようなメッセージを送信し、このデータをデータベースに書き込むたびに自動的にトリガーされます。 次に、新しいデータを含む別のメッセージを Kafka 経由で Kafka に送り返し、これが個々のスキル計算関数のトリガーとして機能します。 これらの関数は、このトリガー イベントと基礎となる Aurora クラスターからのデータを使用して、最新のスキル ランキングを計算して公開します。 このプロジェクト内での Amazon MSK の使用の詳細については、Set Piece Threat ブログ投稿を参照してください。

まとめ

この投稿では、新しいブンデスリーガ マッチファクト スキルを使用して、リアルタイムで以前の独立したブンデスリーガ マッチファクトを構築および組み合わせることにより、XNUMX つのコア プレーヤーの次元でブンデスリーガの選手を客観的に比較できるようにする方法を示しました。 これにより、解説者もファンも同様に、これまで気づかれていなかった選手の能力を明らかにし、ブンデスリーガのさまざまな選手が果たす役割に光を当てることができます。

新しいブンデスリーガのマッチファクトは、ブンデスリーガのサッカー専門家と AWS データサイエンティストによる綿密な分析の結果であり、客観的なパフォーマンスデータに基づいてサッカー選手の資質を抽出して分類したものです。 プレーヤーのスキルバッジは、ブンデスリーガ アプリのラインナップとプレーヤーの詳細ページに表示されます。 放送では、プレーヤーのスキルが解説者に提供されます。 データストーリーファインダー また、プレーヤーの交代時やプレーヤーがそれぞれのランキングのトップ 10 に上がったときにファンに視覚的に表示されます。

この真新しいブンデスリーガマッチファクトを楽しんでいただき、ゲームへの新しい洞察を提供してくれることを願っています。 AWSとブンデスリーガのパートナーシップの詳細については、次のWebサイトをご覧ください。 AWSのブンデスリーガ!


著者について

サイモン・ロルフェス 中央ミッドフィールダーとしてブンデスリーガで288試合をプレーし、41ゴールを決め、ドイツで26キャップを獲得しました。 現在、RolfesはBayer 04 Leverkusenでスポーティングディレクターを務めており、プロプレーヤーの名簿、スカウティング部門、クラブの青少年育成を監督および開発しています。 サイモンはまた、AWSが提供する最新のブンデスリーガマッチファクトについてBundesliga.comに毎週コラムを書いています

ルーク・フィグドール は、AW​​S プロフェッショナル サービス チームのシニア スポーツ テクノロジー スペシャリストです。 彼は、ブンデスリーガや F1 などの選手、クラブ、リーグ、メディア企業と協力して、機械学習を使用してデータを使ってストーリーを伝えることを支援しています。 余暇には、心について、また心理学、経済学、AI の交差点について学ぶことが好きです。

パスカル・キューナー は、AW​​S プロフェッショナル サービス チームのクラウド アプリケーション開発者です。 彼はさまざまな業界の顧客と協力して、アプリケーション開発、DevOps、インフラストラクチャを通じて顧客がビジネス成果を達成できるよう支援しています。 彼はスポーツに非常に情熱を持っており、余暇にはバスケットボールやサッカーを楽しんでいます。

タレク・ハシェミ は、AW​​S プロフェッショナル サービス内のコンサルタントです。 彼のスキルと専門分野には、アプリケーション開発、データ サイエンス、機械学習、ビッグ データが含まれます。 ハンブルクに拠点を置き、クラウド内でのデータ駆動型アプリケーションの開発において顧客をサポートしています。 AWS に入社する前は、航空や通信などのさまざまな業界でコンサルタントも務めていました。 彼は、顧客がデータ/AI をクラウドに移行できるようにすることに情熱を注いでいます。

ヤクブ・ミハルチク Sportec Solutions AG のデータ サイエンティストです。 数年前、彼はサッカーをするよりも数学の勉強を選びましたが、後者は自分には十分ではないという結論に達しました。 現在、彼は機械学習手法を適用して、この美しいゲームについてより深い洞察を得ることで、プロとしてのキャリアの中でこれら両方の情熱を組み合わせています。 余暇には、今でも XNUMX 人制フットボールをしたり、犯罪映画を見たり、映画音楽を聴いたりすることを楽しんでいます。

ハビエル・ポベダ-パンター は、AW​​SProfessionalServicesチーム内のEMEAスポーツ顧客向けのデータサイエンティストです。 彼は、観客スポーツの分野の顧客がデータを革新して活用できるようにし、機械学習とデータサイエンスを通じて、高品質のユーザーとファンの体験を提供します。 彼は余暇に幅広いスポーツ、音楽、AIへの情熱を追っています。

タイムスタンプ:

より多くの AWS機械学習