Kỹ năng xác thực trận đấu Bundesliga: Định lượng phẩm chất của cầu thủ bóng đá bằng cách sử dụng máy học trên AWS

Nút nguồn: 1195672

Trong bóng đá, cũng như nhiều môn thể thao, các cuộc thảo luận về từng cầu thủ luôn là một phần thú vị. "Ai là cầu thủ ghi bàn tốt nhất?" hoặc "Ai là vua của các hậu vệ?" là những câu hỏi được người hâm mộ tranh luận lâu năm và phương tiện truyền thông xã hội khuếch đại cuộc tranh luận này. Chỉ cần xem xét rằng chỉ riêng Erling Haaland, Robert Lewandowski và Thomas Müller đã có tổng cộng 50 triệu người theo dõi trên Instagram. Nhiều người hâm mộ đều biết đến những con số thống kê đáng kinh ngạc mà những cầu thủ ngôi sao như Lewandowski hay Haaland tạo ra, nhưng những câu chuyện như thế này chỉ là phần nổi của tảng băng chìm.

Hãy xem xét rằng gần 600 cầu thủ còn hợp đồng ở Bundesliga và mỗi đội đều có nhà vô địch của riêng mình — những cầu thủ được giới thiệu để mang lại một kỹ năng cụ thể cần có trong một trận đấu. Hãy xem Michael Gregoritsch của FC Augsburg chẳng hạn. Tính đến thời điểm viết bài này (ngày 21 trận đấu), anh ấy đã ghi được năm bàn thắng trong mùa giải 21/22, không phải là điều có thể khiến bất kỳ ai nhắc đến anh ấy trong cuộc trò chuyện về những chân sút vĩ đại. Nhưng hãy xem xét kỹ hơn: nếu bạn tích lũy các giá trị bàn thắng dự kiến ​​(x Bàn thắng) của tất cả các cơ hội ghi bàn mà Gregoritsch có được trong mùa giải này, con số bạn nhận được là 1.7. Điều này có nghĩa là anh ấy đã thực hiện quá mức các cú sút trúng đích của mình tới + 194%, ghi nhiều hơn 3.2 bàn so với dự kiến. Trong khi đó, Lewandowski chỉ ghi 1.6 bàn (+ 7%). Thật là một kỳ tích! Rõ ràng Gregoritsch mang đến một kỹ năng đặc biệt cho Augsburg.

Vậy làm cách nào để chúng ta làm sáng tỏ tất cả những câu chuyện ẩn giấu về từng cầu thủ Bundesliga, kỹ năng của họ và tác động đến kết quả trận đấu? Tham gia Thông tin trận đấu Bundesliga mới do AWS cung cấp có tên Kỹ năng. Kỹ năng đã được phát triển thông qua phân tích chuyên sâu của DFL và AWS để xác định những người chơi có kỹ năng trong bốn hạng mục cụ thể: người khởi xướng, người dứt điểm, người đoạt bóng và người chạy nước rút. Bài đăng này cung cấp thông tin chi tiết về bốn kỹ năng này và thảo luận về cách chúng được triển khai trên cơ sở hạ tầng AWS.

Một điểm thú vị nữa là từ trước đến nay, Bundesliga Match Facts được phát triển độc lập với nhau. Kỹ năng là Sự kiện trận đấu Bundesliga đầu tiên kết hợp đầu ra của nhiều Sự kiện trận đấu Bundesliga trong thời gian thực bằng cách sử dụng kiến ​​trúc phát trực tuyến được xây dựng trên Kafka phát trực tuyến được quản lý trên Amazon (Amazon MSK).

Người khởi xướng

Người khởi xướng là người chơi thực hiện nhiều đường kiến ​​tạo có giá trị thứ nhất và thứ hai. Để xác định và định lượng giá trị của những hỗ trợ đó, chúng tôi đã giới thiệu chỉ số xAssist mới. Nó được tính toán bằng cách theo dõi đường chuyền cuối cùng và đường chuyền thứ hai trước khi sút vào khung thành và chỉ định giá trị xGoals tương ứng cho các hành động đó. Một người khởi xướng tốt tạo ra cơ hội trong những hoàn cảnh khó khăn bằng cách hoàn thành thành công các đường chuyền với tỷ lệ độ khó cao. Để đánh giá mức độ khó để hoàn thành một đường chuyền nhất định, chúng tôi sử dụng xPass người mẫu. Trong chỉ số này, chúng tôi chủ ý loại trừ những quả tạt và đá phạt để tập trung vào những cầu thủ tạo ra cơ hội ghi bàn bằng những pha kiến ​​tạo chính xác từ các pha chơi mở.

Điểm kỹ năng được tính theo công thức sau:

Hãy xem người khởi xướng Xếp hạng 1 hiện tại, Thomas Müller, làm ví dụ. Anh ấy đã thu thập giá trị xAssist là 9.23 tính đến thời điểm viết bài này (ngày 21 trận đấu), có nghĩa là các đường chuyền của anh ấy cho các cầu thủ tiếp theo sút vào khung thành đã tạo ra tổng giá trị xGoal là 9.23. Tỷ lệ xAssist trên 90 phút là 0.46. Con số này có thể được tính từ tổng thời gian thi đấu của anh ấy trong mùa giải hiện tại, thật đáng chú ý - hơn 1,804 phút thi đấu. Với tư cách là pha kiến ​​tạo thứ hai, anh ấy tạo ra tổng giá trị là 3.80, tương đương với 0.19 giây hỗ trợ mỗi 90 phút. Tổng cộng, 38 trong số 58 pha kiến ​​tạo đầu tiên của anh là những đường chuyền khó. Và là một pha kiến ​​tạo thứ hai, 11 trong số 28 đường chuyền của anh ấy cũng là những đường chuyền khó. Với những thống kê này, Thomas Müller đã tự vươn lên vị trí đầu tiên trong bảng xếp hạng người khởi xướng. Để so sánh, bảng sau đây trình bày các giá trị của ba giá trị hàng đầu hiện tại.

.. xHỗ trợ xAssistper90 xSecondAssist xSecondAssistper90 Khó khăn Khó khănPassesAssisted2 Điểm cuối cùng
Thomas Müller - Hạng 1 9.23 0.46 3.80 0.18 38 11 0.948
Serge Gnabry - Hạng 2 3.94 0.25 2.54 0.16 15 11 0.516
Florian Wirtz - Hạng 3 6.41 0.37 2.45 0.14 21 1 0.510

Bộ hoàn thiện

Một người dứt điểm là một cầu thủ ghi bàn đặc biệt giỏi. Anh ấy có hiệu suất sút cao và ghi được nhiều bàn thắng tương ứng với thời gian thi đấu của mình. Kỹ năng này dựa trên số bàn thắng thực tế ghi được và sự khác biệt của nó so với mục tiêu mong đợi (x Mục tiêu). Điều này cho phép chúng tôi đánh giá xem liệu các cơ hội có được khai thác tốt hay không. Giả sử rằng hai tiền đạo có cùng số bàn thắng. Chúng có mạnh như nhau không? Hay một trong số họ ghi bàn từ những tình huống dễ dàng trong khi người kia hoàn thành trong những tình huống khó khăn? Với hiệu quả bắn, điều này có thể được trả lời: nếu số bàn thắng ghi được vượt quá số bàn thắng, một người chơi đang thực hiện quá mức và là người bắn hiệu quả hơn mức trung bình. Thông qua mức độ của sự khác biệt này, chúng tôi có thể định lượng mức độ mà hiệu quả của một game bắn súng vượt qua mức trung bình.

Điểm kỹ năng được tính theo công thức sau:

Đối với người về đích, chúng tôi tập trung nhiều hơn vào các mục tiêu. Bảng sau đây cung cấp cái nhìn sâu hơn về ba công ty hàng đầu hiện tại.

.. Các mục tiêu Bàn thắng 90 Hiệu quả sút Điểm cuối cùng
Robert Lewandowski - Hạng 1 24 1.14 1.55 0.813
Erling Haaland - Hạng 2 16 1.18 5.32 0.811
Patrik Schick - Hạng 3 18 1.10 4.27 0.802

Robert Lewandowski đã ghi 24 bàn mùa này, giúp anh ấy đứng ở vị trí đầu tiên. Mặc dù Haaland có hiệu suất sút cao hơn, nhưng điều đó vẫn chưa đủ để Haaland được xếp ở vị trí đầu tiên, vì chúng tôi đánh giá cao hơn về tỷ lệ ghi bàn. Điều này cho thấy rằng Lewandowski thu được lợi nhuận cao từ cả chất lượng và số lượng các đường kiến ​​tạo nhận được, mặc dù anh ấy ghi bàn đặc biệt xuất sắc. Patrick Schick đã ghi nhiều hơn Haaland hai bàn, nhưng có hiệu suất ghi bàn / 90 phút thấp hơn và hiệu suất sút thấp hơn.

Người chạy nước rút

Vận động viên chạy nước rút có khả năng thể chất để đạt tốc độ tối đa cao và làm như vậy thường xuyên hơn những người khác. Vì mục đích này, chúng tôi đánh giá tốc độ cao nhất trung bình trên tất cả các trò chơi trong mùa giải hiện tại của người chơi và bao gồm tần suất chạy nước rút mỗi 90 phút, cùng các chỉ số khác. Một nước rút được tính nếu một người chơi chạy với tốc độ tối thiểu 4.0 m / s trong hơn hai giây và đạt vận tốc tối thiểu là 6.3 m / s trong thời gian này. Thời gian của nước rút được đặc trưng bởi thời gian giữa lần đầu tiên và lần cuối cùng đạt đến ngưỡng 6.3 m / s và cần phải dài ít nhất 1 giây để được xác nhận. Một cuộc chạy nước rút mới chỉ có thể được coi là đã xảy ra sau khi tốc độ đã giảm xuống dưới ngưỡng 4.0 m / s một lần nữa.

Điểm kỹ năng được tính theo công thức sau:

Công thức cho phép chúng tôi đánh giá nhiều cách mà chúng tôi có thể xem xét các cuộc chạy nước rút của người chơi và đi xa hơn là chỉ nhìn vào tốc độ tối đa mà những người chơi này tạo ra. Ví dụ, Jeremiah St. Juste có kỷ lục mùa hiện tại là 36.65 km / h. Tuy nhiên, nếu nhìn vào tần suất chạy nước rút của anh ấy, chúng ta thấy anh ấy chỉ chạy nước rút trung bình 36.08 lần mỗi trận! Mặt khác, Alphonso Davies có thể không nhanh bằng St. Juste (tốc độ tối đa 31 km / h), nhưng thực hiện XNUMX nước rút đáng kinh ngạc mỗi trận! Anh ấy chạy nước rút thường xuyên hơn với tốc độ trung bình cao hơn nhiều, mở ra không gian cho đồng đội trên sân.

Người chiến thắng bóng

Một cầu thủ có khả năng này gây ra các tổn thất bóng cho đội đối phương, cả về tổng số và tương ứng với thời gian thi đấu của anh ta. Anh ấy thắng nhiều trong các pha tranh chấp bóng bổng và trên không, và thường xuyên cướp hoặc đánh chặn bóng, tự mình kiểm soát bóng an toàn và khả năng cho đội của mình phản công.

Điểm kỹ năng được tính theo công thức sau:

Theo văn bản này, người đoạt bóng ở vị trí đầu tiên là Danilo Soares. Anh ta có tổng cộng 235 pha tranh chấp tay đôi. Trong số 235 trận đấu tay đôi phòng ngự, anh đã thắng 75, đánh bại đối thủ trong một trận đối đầu. Anh ấy đã đánh chặn 51 đường bóng trong mùa giải này ở vị trí hậu vệ biên, mang lại tỷ lệ thắng khoảng 32%. Trung bình, anh đánh chặn 2.4 pha tắc bóng mỗi 90 phút.

Ví dụ kỹ năng

Sự kiện trận đấu kỹ năng Bundesliga cho phép chúng tôi tiết lộ khả năng và điểm mạnh của các cầu thủ Bundesliga. Bảng xếp hạng Kỹ năng đưa người chơi vào tâm điểm mà trước đây có thể không được chú ý trong bảng xếp hạng thống kê thông thường như mục tiêu. Ví dụ, lấy một cầu thủ như Michael Gregoritsch. Gregoritsch là tiền đạo của FC Augsburg, người đứng thứ sáu trong bảng xếp hạng về đích tính đến ngày 21. Anh ấy đã ghi được năm bàn thắng cho đến nay, điều này sẽ không giúp anh ấy đứng đầu bất kỳ bảng xếp hạng ghi bàn nào. Tuy nhiên, anh ấy đã làm được điều này chỉ sau 663 phút thi đấu! Một trong những bàn thắng đó là bàn gỡ hòa muộn màng ở phút 97 giúp Augsburg tránh khỏi trận thua ngay trên sân khách tại Berlin.

Thông qua sự kiện trận đấu kỹ năng Bundesliga, chúng ta cũng có thể nhận ra những phẩm chất khác nhau của mỗi cầu thủ. Một ví dụ về điều này là ngôi sao Dortmund, Erling Haaland, người cũng đã giành được huy hiệu vận động viên chạy nước rút và về đích, và hiện đang xếp thứ sáu trong số những vận động viên chạy nước rút Bundesliga.

Tất cả các chỉ số này đều dựa trên dữ liệu chuyển động của cầu thủ, dữ liệu liên quan đến mục tiêu, dữ liệu liên quan đến hành động của quả bóng và dữ liệu liên quan đến đường chuyền. Chúng tôi xử lý thông tin này trong các đường ống dẫn dữ liệu và trích xuất các thống kê liên quan cần thiết cho mỗi kỹ năng, cho phép chúng tôi tính toán sự phát triển của tất cả các chỉ số trong thời gian thực. Nhiều thống kê nói trên được bình thường hóa theo thời gian trên sân, cho phép xem xét những cầu thủ có ít thời gian thi đấu nhưng lại thể hiện tốt một cách đáng kinh ngạc khi họ thi đấu. Các kết hợp và trọng số của các chỉ số được kết hợp thành một điểm số. Kết quả là xếp hạng cho tất cả người chơi về bốn kỹ năng của người chơi. Những người chơi xếp hạng trong top 10 sẽ nhận được một huy hiệu kỹ năng để giúp người hâm mộ nhanh chóng xác định những phẩm chất đặc biệt mà họ mang lại cho đội của mình.

Thực hiện và kiến ​​trúc

Sự kiện trận đấu Bundesliga đã được phát triển cho đến thời điểm này là độc lập với nhau và chỉ dựa trên việc nhập dữ liệu vị trí và sự kiện, cũng như tính toán của riêng họ. Tuy nhiên, điều này thay đổi đối với Kỹ năng xác thực trận đấu Bundesliga mới, tính toán thứ hạng kỹ năng dựa trên dữ liệu được tạo ra bởi Dữ liệu trận đấu hiện có, chẳng hạn như x Bàn thắng hoặc xPass. Kết quả của một sự kiện, có thể là một mục tiêu khó tin với cơ hội đi tiếp thấp, có thể có tác động đáng kể đến xếp hạng kỹ năng của người về đích. Do đó, chúng tôi đã xây dựng một kiến ​​trúc luôn cung cấp bảng xếp hạng kỹ năng cập nhật nhất bất cứ khi nào có bản cập nhật cho dữ liệu cơ bản. Để cập nhật các kỹ năng theo thời gian thực, chúng tôi sử dụng Amazon MSK, một dịch vụ AWS được quản lý cho Apache Kafka, làm giải pháp nhắn tin và truyền dữ liệu. Bằng cách này, các Sự kiện trận đấu Bundesliga khác nhau có thể thông báo các sự kiện và thông tin cập nhật mới nhất theo thời gian thực.

Kiến trúc cơ bản cho Kỹ năng bao gồm bốn phần chính:

  • An Cụm máy chủ Amazon Aurora lưu trữ tất cả các kết quả đầu ra của dữ kiện đối sánh hiện có. Điều này bao gồm, ví dụ, dữ liệu cho mỗi đường chuyền (chẳng hạn như xPass, cầu thủ, người nhận dự định) hoặc cú sút (xGoal, cầu thủ, bàn thắng) đã xảy ra kể từ khi sự kiện trận đấu Bundesliga ra đời.
  • Một trung tâm AWS Lambda chức năng ghi kết quả của Kết quả trận đấu Bundesliga vào cơ sở dữ liệu Aurora và thông báo cho các thành phần khác rằng đã có bản cập nhật.
  • Một hàm Lambda cho mỗi kỹ năng riêng lẻ sẽ tính toán xếp hạng kỹ năng. Các hàm này chạy bất cứ khi nào có sẵn dữ liệu mới để tính toán kỹ năng cụ thể.
  • Cụm Amazon MSK Kafka đóng vai trò là điểm giao tiếp trung tâm giữa tất cả các thành phần này.

Sơ đồ sau minh họa quy trình làm việc này. Mỗi sự kiện trận đấu Bundesliga ngay lập tức gửi một tin nhắn sự kiện đến Kafka bất cứ khi nào có cập nhật cho một sự kiện (chẳng hạn như giá trị X Bàn thắng được cập nhật cho một sự kiện sút). Chức năng điều phối trung tâm Lambda được tự động kích hoạt bất cứ khi nào Diễn biến trận đấu Bundesliga gửi một thông báo như vậy và ghi dữ liệu này vào cơ sở dữ liệu. Sau đó, nó gửi một tin nhắn khác qua Kafka chứa dữ liệu mới trở lại Kafka, nó đóng vai trò như một kích hoạt cho các chức năng tính toán kỹ năng cá nhân. Các chức năng này sử dụng dữ liệu từ sự kiện kích hoạt này, cũng như cụm Aurora bên dưới, để tính toán và công bố bảng xếp hạng kỹ năng mới nhất. Để có cái nhìn sâu hơn về việc sử dụng Amazon MSK trong dự án này, hãy tham khảo bài đăng trên blog Set Piece Threat.

Tổng kết

Trong bài đăng này, chúng tôi đã chứng minh cách Kỹ năng xác định trận đấu Bundesliga mới giúp so sánh khách quan các cầu thủ Bundesliga trên bốn khía cạnh cầu thủ cốt lõi, xây dựng và kết hợp các Dữ kiện trận đấu Bundesliga độc lập trước đây trong thời gian thực. Điều này cho phép các nhà bình luận cũng như người hâm mộ khám phá khả năng của những cầu thủ chưa được chú ý trước đây và làm sáng tỏ vai trò của các cầu thủ Bundesliga khác nhau.

Thông tin trận đấu mới của Bundesliga là kết quả phân tích chuyên sâu của các chuyên gia bóng đá Bundesliga và các nhà khoa học dữ liệu AWS để chắt lọc và phân loại phẩm chất của cầu thủ bóng đá dựa trên dữ liệu hiệu suất khách quan. Các huy hiệu kỹ năng của cầu thủ được hiển thị trong đội hình và trên các trang chi tiết của cầu thủ trong ứng dụng Bundesliga. Trong chương trình phát sóng, các kỹ năng của người chơi được cung cấp cho các bình luận viên thông qua công cụ tìm câu chuyện dữ liệu và hiển thị trực quan cho người hâm mộ khi thay thế cầu thủ và khi một cầu thủ tiến lên xếp hạng top 10 tương ứng.

Chúng tôi hy vọng rằng bạn thích sự kiện trận đấu Bundesliga hoàn toàn mới này và nó cung cấp cho bạn những hiểu biết mới về trò chơi. Để tìm hiểu thêm về quan hệ đối tác giữa AWS và Bundesliga, hãy truy cập Bundesliga trên AWS!


Về các tác giả

Simon Rolfes đã chơi 288 trận tại Bundesliga ở vị trí tiền vệ trung tâm, ghi được 41 bàn thắng và có 26 lần khoác áo đội tuyển Đức. Hiện tại Rolfes giữ chức vụ Giám đốc thể thao tại Bayer 04 Leverkusen, nơi ông giám sát và phát triển đội hình cầu thủ chuyên nghiệp, bộ phận tuyển trạch và phát triển đội trẻ của câu lạc bộ. Simon cũng viết các cột hàng tuần trên Bundesliga.com về các trận đấu Bundesliga mới nhất được cung cấp bởi AWS

Luuk Figdor là Chuyên gia Công nghệ Thể thao Cấp cao trong nhóm Dịch vụ Chuyên nghiệp AWS. Anh ấy làm việc với các cầu thủ, câu lạc bộ, giải đấu và các công ty truyền thông như Bundesliga và Công thức 1 để giúp họ kể những câu chuyện bằng dữ liệu bằng cách sử dụng máy học. Khi rảnh rỗi, anh ấy thích tìm hiểu tất cả về tâm trí và sự giao thoa giữa tâm lý học, kinh tế học và AI.

Pascal Kühner là Nhà phát triển ứng dụng đám mây trong Nhóm dịch vụ chuyên nghiệp của AWS. Anh ấy làm việc với khách hàng trong các ngành để giúp họ đạt được kết quả kinh doanh thông qua phát triển ứng dụng, DevOps và cơ sở hạ tầng. Anh ấy rất đam mê thể thao và thích chơi bóng rổ và bóng đá khi rảnh rỗi.

Tareq Haschemi là nhà tư vấn trong Dịch vụ Chuyên nghiệp của AWS. Các kỹ năng và lĩnh vực chuyên môn của anh ấy bao gồm phát triển ứng dụng, khoa học dữ liệu, máy học và dữ liệu lớn. Có trụ sở tại Hamburg, anh ấy hỗ trợ khách hàng phát triển các ứng dụng theo hướng dữ liệu trong đám mây. Trước khi gia nhập AWS, ông cũng là nhà tư vấn trong nhiều ngành khác nhau như hàng không và viễn thông. Anh ấy rất đam mê hỗ trợ khách hàng trong hành trình dữ liệu / AI của họ lên đám mây.

Jakub Michalczyk là Nhà khoa học dữ liệu tại Sportec Solutions AG. Vài năm trước, anh ấy chọn môn toán học thay vì chơi bóng đá, vì anh ấy đi đến kết luận, anh ấy không đủ giỏi môn toán sau này. Giờ đây, anh kết hợp cả hai niềm đam mê này trong sự nghiệp chuyên nghiệp của mình bằng cách áp dụng các phương pháp học máy để có cái nhìn sâu sắc hơn về trò chơi tuyệt đẹp này. Khi rảnh rỗi, anh ấy vẫn thích chơi bóng bảy người, xem phim tội phạm và nghe nhạc phim.

Javier Poveda-Panter là Nhà khoa học dữ liệu cho khách hàng thể thao EMEA trong nhóm Dịch vụ Chuyên nghiệp của AWS. Anh ấy cho phép khách hàng trong lĩnh vực thể thao của khán giả đổi mới và tận dụng dữ liệu của họ, mang lại trải nghiệm chất lượng cao cho người dùng và người hâm mộ thông qua máy học và khoa học dữ liệu. Anh ấy theo đuổi niềm đam mê của mình với nhiều môn thể thao, âm nhạc và AI trong thời gian rảnh rỗi.

Dấu thời gian:

Thêm từ Học máy AWS