Bundesliga Match Fact Skill: AWS에서 기계 학습을 사용하여 축구 선수 자질 정량화

소스 노드 : 1195672

많은 스포츠와 마찬가지로 축구에서도 개별 선수에 대한 토론은 항상 재미의 일부였습니다. “최고의 득점자는 누구입니까?” 또는 "수비수의 왕은 누구입니까?" 팬들이 끊임없이 토론하는 질문이며 소셜 미디어는 이 논쟁을 증폭시킵니다. Erling Haaland, Robert Lewandowski, Thomas Müller만 해도 인스타그램 팔로워 수가 50천만 명에 달합니다. 많은 팬들은 Lewandowski와 Haaland와 같은 스타 플레이어가 만들어낸 놀라운 통계 스타 플레이어를 알고 있지만 이와 같은 이야기는 빙산의 일각에 불과합니다.

거의 600명의 선수가 Bundesliga에 계약되어 있고 각 팀에는 경기에서 특정 기술을 가져오기 위해 소개되는 선수가 있는 고유한 챔피언이 있습니다. FC 아우크스부르크의 미하엘 그레고리취를 예로 들 수 있습니다. 이 글을 쓰는 현재(21일 경기), 그는 21/22 시즌에 1.7골을 기록했는데, 이는 누구도 위대한 골잡이에 대한 대화에서 그를 언급하지 않을 것입니다. 그러나 자세히 살펴보겠습니다. Gregoritsch가 이번 시즌에 가진 모든 득점 기회의 예상 골(xGoals) 값을 누적하면 얻을 수 있는 수치는 194입니다. 이것은 그가 예상보다 3.2골 더 많은 골을 넣었다는 것을 의미합니다. 이에 비해 레반도프스키는 1.6골(+7%)만 초과 달성했습니다. 이 얼마나 대단한 일인가! 분명히 Gregoritsch는 Augsburg에 특별한 기술을 제공합니다.

그렇다면 개별 분데스리가 선수, 그들의 기술, 경기 결과에 대한 영향에 대한 모든 숨겨진 이야기를 어떻게 밝힐 수 있을까요? Skill이라는 AWS에서 제공하는 새로운 Bundesliga Match Fact를 입력하십시오. 기술은 DFL 및 AWS의 심층 분석을 통해 개발되어 이니시에이터, 마무리 선수, 볼 위너 및 단거리 선수의 XNUMX가지 특정 범주에서 기술을 보유한 선수를 식별합니다. 이 게시물에서는 이러한 XNUMX가지 기술에 대해 자세히 설명하고 AWS 인프라에서 구현하는 방법에 대해 설명합니다.

또 다른 흥미로운 점은 지금까지 Bundesliga Match Facts가 서로 독립적으로 개발되었다는 것입니다. Skill은 구축된 스트리밍 아키텍처를 사용하여 실시간으로 여러 Bundesliga Match Fact의 출력을 결합한 최초의 Bundesliga Match Fact입니다. Amazon 관리형 스트리밍 카프카 (아마존 MSK).

창시자

이니시에이터는 중요한 첫 번째 및 두 번째 어시스트를 많이 수행하는 플레이어입니다. 이러한 지원의 가치를 식별하고 수량화하기 위해 새로운 메트릭 xAssist를 도입했습니다. 골을 넣기 전 마지막 패스와 두 번째 패스를 추적하고 해당 동작에 각각의 xGoals 값을 할당하여 계산됩니다. 좋은 개시자는 높은 난이도로 패스를 성공적으로 완료함으로써 어려운 상황에서도 기회를 만듭니다. 주어진 패스를 완료하는 것이 얼마나 어려운지 평가하기 위해 기존 엑스패스 모델. 이 지표에서 우리는 의도적으로 크로스와 프리킥을 제외하여 오픈 플레이에서 정확한 어시스트로 득점 기회를 생성하는 선수에 초점을 맞춥니다.

스킬 점수는 다음 공식으로 계산됩니다.

현재 랭크 1 이니시에이터인 Thomas Müller를 예로 들어 보겠습니다. 그는 이 글(경기일 9.23)을 기준으로 21의 xAssist 값을 수집했습니다. 즉, 골을 넣은 다음 선수를 위한 그의 패스는 총 9.23의 xGoal 값을 생성했습니다. 90분당 xAssist 비율은 0.46입니다. 이는 그의 이번 시즌 총 플레이 시간으로 계산할 수 있는데, 이는 1,804분이 넘는 놀라운 플레이 시간입니다. 두 번째 어시스트로 그는 3.80분당 0.19초 어시스트에 해당하는 총 90을 기록했습니다. 총 38개의 첫 번째 어시스트 중 58개가 어려운 패스였습니다. 그리고 두 번째 어시스트로 그의 11개 패스 중 28개도 어려운 패스였습니다. 이러한 통계를 통해 Thomas Müller는 개시자 순위에서 XNUMX위를 차지했습니다. 비교를 위해 다음 표는 현재 상위 XNUMX개의 값을 나타냅니다.

.. xAssist xAssistper90 xSecondAssist xSecondAssistper90 어려움 통과 지원 어려움 통과 지원2 최종 점수
토마스 뮐러 - 순위 1 9.23 0.46 3.80 0.18 38 11 0.948
세르주 그나브리 – 2등급 3.94 0.25 2.54 0.16 15 11 0.516
플로리안 비르츠 – 3등급 6.41 0.37 2.45 0.14 21 1 0.510

치명적 타격

피니셔는 득점력이 뛰어난 선수입니다. 그는 높은 슛 효율을 가지고 있으며 자신의 플레이 시간에 따라 많은 골을 달성합니다. 기술은 득점한 실제 골과 예상 골(xGoals)과의 차이를 기반으로 합니다. 이를 통해 기회가 잘 ​​활용되고 있는지 평가할 수 있습니다. 두 명의 스트라이커가 같은 골 수를 가지고 있다고 가정해 봅시다. 그들은 똑같이 강합니까? 아니면 그들 중 하나는 쉬운 상황에서 득점하고 다른 하나는 어려운 상황에서 끝내나요? 슛 효율성을 통해 이에 대한 답을 얻을 수 있습니다. 득점한 골이 xGoals의 수를 초과하는 경우 선수는 성과가 뛰어나고 평균보다 더 효율적인 슈터입니다. 이 차이의 크기를 통해 사수의 효율성이 평균을 능가하는 정도를 수량화할 수 있습니다.

스킬 점수는 다음 공식으로 계산됩니다.

피니셔의 경우 목표에 더 중점을 둡니다. 다음 표에서는 현재 상위 XNUMX개 항목을 자세히 살펴봅니다.

.. 목표 목표Per90 샷 효율성 최종 점수
로버트 레반도프스키 – 랭킹 1 24 1.14 1.55 0.813
얼링 홀란드 – 2등급 16 1.18 5.32 0.811
패트릭 쉬크 – 3등급 18 1.10 4.27 0.802

로베르트 레반도프스키는 이번 시즌 24골을 터뜨리며 90위를 기록했습니다. 홀란드가 슛 효율이 더 높지만 득점에 더 높은 가중치를 주기 때문에 홀란드가 XNUMX위를 하기에는 아직 충분하지 않습니다. 이것은 Lewandowski가 비록 그가 예외적으로 좋은 득점을 했음에도 불구하고 받은 도움의 질과 양 모두에서 높은 이익을 얻었다는 것을 나타냅니다. Patrick Schick은 Haaland보다 XNUMX골을 더 많이 넣었지만 XNUMX분당 득점률이 낮고 슛 효율이 낮습니다.

단거리 주자

단거리 선수는 높은 최고 속도에 도달할 수 있는 신체적 능력이 있으며 다른 사람보다 더 자주 그렇게 합니다. 이를 위해 우리는 현재 시즌의 모든 게임에서 평균 최고 속도를 평가하고 다른 지표 중에서 90분당 스프린트 빈도를 포함합니다. 스프린트는 선수가 최소 4.0m/s의 속도로 6.3초 이상 달리고 이 시간 동안 최소 6.3m/s의 최고 속도에 도달하면 계산됩니다. 스프린트의 지속 시간은 1 m/s 임계값에 도달한 첫 번째 시간과 마지막 시간 사이의 시간으로 특징지어지며 승인되려면 최소 4.0초 이상 길어야 합니다. 새로운 스프린트는 페이스가 다시 XNUMXm/s 임계값 아래로 떨어진 후에 발생한 것으로 간주할 수 있습니다.

스킬 점수는 다음 공식으로 계산됩니다.

이 공식을 통해 플레이어의 스프린트를 볼 수 있는 여러 가지 방법을 평가하고 이 플레이어가 생성하는 최고 속도를 보는 것 이상으로 나아갈 수 있습니다. 예를 들어 Jeremiah St. Juste의 현재 시즌 기록은 36.65km/h입니다. 그러나 그의 스프린트 빈도를 보면 경기당 평균 스프린트 횟수가 36.08회에 불과하다는 것을 알 수 있습니다! 반면 Alphonso Davies는 St. Juste만큼 빠르지 않을 수 있지만(최고 속도 31km/h), 경기당 XNUMX개의 스프린트를 수행합니다! 그는 훨씬 더 높은 평균 속도로 에서 훨씬 더 자주 전력 질주하여 경기장에서 팀을 위한 공간을 제공합니다.

공 우승자

이 능력을 가진 선수는 상대 팀에게 총체적으로 그리고 그의 플레이 시간에 따라 볼 손실을 입힙니다. 그는 많은 수의 지상 및 공중 결투에서 승리하고 자주 공을 훔치거나 가로채어 안전한 볼 컨트롤을 만들고 팀이 역습할 가능성을 만듭니다.

스킬 점수는 다음 공식으로 계산됩니다.

이 글을 쓰는 시점에서 볼의 235등 우승자는 다닐로 소아레스입니다. 그는 총 235개의 수비 결투를 가지고 있습니다. 75번의 수비적 결투 중 51번을 이겼고, 대결에서 상대를 꺾었다. 그는 이번 시즌 수비수로 뛰면서 32개의 공을 가로채서 약 2.4%의 승률을 기록하고 있다. 평균적으로 그는 90분당 XNUMX개의 공을 가로채었다.

스킬 예시

Skill Bundesliga Match Fact를 통해 Bundesliga 선수들의 능력과 강점을 공개할 수 있습니다. 기술 순위는 골과 같은 기존 통계 순위에서 이전에는 눈에 띄지 않았을 수 있는 플레이어를 스포트라이트로 만듭니다. 예를 들어 Michael Gregoritsch와 같은 선수를 예로 들어 보겠습니다. Gregoritsch는 FC Augsburg의 스트라이커로, 매치데이 21일 현재 결승전 랭킹 663위를 기록하고 있습니다. 그는 지금까지 97골을 넣었고, 이는 그를 어떤 골 득점 순위에서도 XNUMX위를 차지하지 못할 것입니다. 그러나 그는 단 XNUMX분 만에 이를 성공시켰습니다! 이 골 중 하나는 아우크스부르크가 베를린 원정에서 패하지 않도록 도운 후반 XNUMX분 동점골이었습니다.

Skill Bundesliga Match Fact를 통해서도 선수 개개인의 다양한 자질을 알아볼 수 있습니다. 이것의 한 예는 단거리 선수와 완주 선수의 배지를 획득한 도르트문트 스타 Erling Haaland이며 현재 분데스리가 단거리 선수 중 XNUMX위입니다.

이 모든 지표는 선수의 움직임 데이터, 골 관련 데이터, 볼 동작 관련 데이터 및 패스 관련 데이터를 기반으로 합니다. 우리는 이 정보를 데이터 파이프라인에서 처리하고 기술별로 필요한 관련 통계를 추출하여 모든 메트릭의 발전을 실시간으로 계산할 수 있습니다. 앞서 언급한 많은 통계는 경기 시간에 따라 정규화되어 경기 시간이 거의 없지만 경기할 때 놀라운 성과를 내는 선수를 고려할 수 있습니다. 메트릭의 조합과 가중치는 단일 점수로 결합됩니다. 결과는 10명의 플레이어 기술에 대한 모든 플레이어의 순위입니다. 상위 XNUMX위 안에 든 플레이어는 팬이 스쿼드에 제공하는 뛰어난 자질을 신속하게 식별할 수 있도록 기술 배지를 받습니다.

구현 및 아키텍처

현재까지 개발된 Bundesliga Match Facts는 서로 독립적이며 위치 및 이벤트 데이터 수집과 자체 계산에만 의존합니다. 그러나 이것은 xGoals 또는 xPass와 같이 기존 Match Facts에서 생성된 데이터를 기반으로 기술 순위를 계산하는 새로운 Bundesliga Match Fact Skill에 대해 변경됩니다. 한 이벤트의 결과, 들어갈 확률이 낮은 놀라운 골이 피니셔 스킬 순위에 큰 영향을 미칠 수 있습니다. 따라서 기본 데이터가 업데이트될 때마다 항상 최신 기술 순위를 제공하는 아키텍처를 구축했습니다. 기술에 대한 실시간 업데이트를 달성하기 위해 Apache Kafka용 관리형 AWS 서비스인 Amazon MSK를 데이터 스트리밍 및 메시징 솔루션으로 사용합니다. 이러한 방식으로 다른 Bundesliga Match Facts는 최신 이벤트와 업데이트를 실시간으로 전달할 수 있습니다.

Skill의 기본 아키텍처는 네 가지 주요 부분으로 구성됩니다.

  • An Amazon Aurora 서버리스 클러스터 기존 일치 사실의 모든 출력을 저장합니다. 여기에는 예를 들어 Bundesliga Match Facts 도입 이후 발생한 각 패스(예: xPass, 선수, 의도된 리시버) 또는 슛(xGoal, 선수, 골)에 대한 데이터가 포함됩니다.
  • 중앙 AWS 람다 함수는 Bundesliga Match Fact 출력을 Aurora 데이터베이스에 쓰고 다른 구성 요소에 업데이트가 있음을 알립니다.
  • 각 개별 스킬에 대한 Lambda 함수는 스킬 순위를 계산합니다. 이러한 기능은 특정 기술의 계산을 위해 새 데이터를 사용할 수 있을 때마다 실행됩니다.
  • Amazon MSK Kafka 클러스터는 이러한 모든 구성 요소 간의 통신 중심점 역할을 합니다.

다음 다이어그램은 이 워크플로를 보여줍니다. 각 Bundesliga Match Fact는 이벤트에 대한 업데이트(예: 샷 이벤트에 대한 업데이트된 xGoals 값)가 있을 때마다 이벤트 메시지를 Kafka에 즉시 보냅니다. 중앙 디스패처 Lambda 함수는 Bundesliga Match Fact가 이러한 메시지를 보내고 이 데이터를 데이터베이스에 쓸 때마다 자동으로 트리거됩니다. 그런 다음 새 데이터가 포함된 Kafka를 통해 다른 메시지를 Kafka로 다시 보냅니다. Kafka는 개별 기술 계산 기능에 대한 트리거 역할을 합니다. 이러한 함수는 이 트리거 이벤트의 데이터와 기본 Aurora 클러스터를 사용하여 최신 기술 순위를 계산하고 게시합니다. 이 프로젝트에서 Amazon MSK를 사용하는 방법에 대해 자세히 알아보려면 Set Piece Threat 블로그 게시물을 참조하십시오.

요약

이 게시물에서 우리는 새로운 Bundesliga Match Fact Skill을 통해 XNUMX가지 핵심 선수 차원에서 Bundesliga 선수를 객관적으로 비교할 수 있게 되었으며, 실시간으로 이전 독립 Bundesliga Match Facts를 구축하고 결합하는 방법을 보여주었습니다. 이를 통해 해설자와 팬 모두 이전에는 발견하지 못한 선수의 능력을 발견하고 다양한 분데스리가 선수가 수행하는 역할에 대해 밝힐 수 있습니다.

새로운 분데스리가 경기 정보는 객관적인 성과 데이터를 기반으로 축구 선수의 자질을 추출하고 분류하기 위해 분데스리가의 축구 전문가와 AWS 데이터 과학자가 심층 분석한 결과입니다. 선수 기술 배지는 라인업과 분데스리가 앱의 선수 세부 정보 페이지에 표시됩니다. 방송에서는 해설자를 통해 선수 스킬을 제공합니다. 데이터 스토리 파인더 선수 교체 시와 선수가 각각의 상위 10위 순위로 올라갈 때 팬에게 시각적으로 표시됩니다.

이 새로운 분데스리가 경기 사실을 즐기고 게임에 대한 새로운 통찰력을 제공하기를 바랍니다. AWS와 Bundesliga 간의 파트너십에 대해 자세히 알아보려면 다음을 방문하십시오. AWS의 분데스리가!


저자에 관하여

사이먼 롤 페스 독일 국가대표로 분데스리가 288경기에 출전해 41골 26경기를 뛰었다. 현재 Rolfes는 바이엘 04 레버쿠젠에서 스포르팅 디렉터로 일하면서 프로 선수 명단, 스카우트 부서 및 클럽의 청소년 개발을 감독하고 개발합니다. Simon은 또한 Bundesliga.com에 AWS에서 제공하는 최신 Bundesliga Match Facts에 대한 주간 칼럼을 씁니다.

루크 피그 도르 AWS Professional Services 팀의 수석 스포츠 기술 전문가입니다. 그는 선수, 클럽, 리그 및 Bundesliga 및 Formula 1과 같은 미디어 회사와 협력하여 머신 러닝을 사용하여 데이터로 스토리를 전달할 수 있도록 돕습니다. 여가 시간에 그는 마음과 심리학, 경제학, AI의 교차점에 대해 모두 배우는 것을 좋아합니다.

파스칼 퀴너 AWS Professional Services 팀의 클라우드 애플리케이션 개발자입니다. 그는 다양한 산업 분야의 고객과 협력하여 애플리케이션 개발, DevOps 및 인프라를 통해 비즈니스 결과를 달성할 수 있도록 지원합니다. 그는 스포츠에 매우 열정적이며 여가 시간에 농구와 축구를 즐깁니다.

타렉 하스케미 AWS Professional Services의 컨설턴트입니다. 그의 기술과 전문 분야에는 애플리케이션 개발, 데이터 과학, 기계 학습 및 빅 데이터가 포함됩니다. 함부르크에 기반을 두고 있는 그는 클라우드 내에서 데이터 기반 애플리케이션을 개발하는 고객을 지원합니다. AWS에 합류하기 전에는 항공 및 통신과 같은 다양한 산업 분야의 컨설턴트이기도 했습니다. 그는 클라우드로의 데이터/AI 여정에서 고객을 지원하는 데 열정적입니다.

야쿱 미할치크 Sportec Solutions AG의 데이터 과학자입니다. 몇 년 전 그는 축구보다 수학 공부를 선택했는데, 축구를 잘 하지 못한다는 결론에 이르렀습니다. 이제 그는 이 아름다운 게임에 대한 더 나은 통찰력을 얻기 위해 기계 학습 방법을 적용하여 전문 경력에서 이 두 가지 열정을 결합합니다. 여가 시간에는 여전히 XNUMX인제 축구를 하고 범죄 영화를 보고 영화 음악을 듣는 것을 즐깁니다.

하비에르 포베다 판터 AWS Professional Services 팀 내 EMEA 스포츠 고객을 위한 데이터 과학자입니다. 그는 관중 스포츠 분야의 고객이 데이터를 혁신하고 활용하여 기계 학습 및 데이터 과학을 통해 고품질 사용자 및 팬 경험을 제공할 수 있도록 지원합니다. 그는 여가 시간에 광범위한 스포츠, 음악 및 AI에 대한 열정을 따릅니다.

타임 스탬프 :

더보기 AWS 기계 학습