מיומנות עובדת משחק בבונדסליגה: כימות תכונות של שחקן כדורגל באמצעות למידת מכונה ב-AWS

צומת המקור: 1195672

בכדורגל, כמו בענפי ספורט רבים, דיונים על שחקנים בודדים תמיד היו חלק מהכיף. "מי הסקורר הטוב ביותר?" או "מי הוא מלך המגינים?" הן שאלות שמתווכחות תמידית על ידי מעריצים, והמדיה החברתית מעצימה את הדיון הזה. רק קחו בחשבון שלארלינג האלנד, רוברט לבנדובסקי ותומס מולר לבד יש 50 מיליון עוקבים ביחד באינסטגרם. אוהדים רבים מודעים לסטטיסטיקה המדהימה ששחקנים כמו לבנדובסקי והאלנד יוצרים, אבל סיפורים כמו זה הם רק קצה הקרחון.

קחו בחשבון שכמעט 600 שחקנים נמצאים בחוזה בבונדסליגה, ולכל קבוצה יש אלופות משלה - שחקנים שמוצגים כדי להביא מיומנות ספציפית למשחק. תראה למשל את מייקל גרגוריטש מ-FC Augsburg. נכון לכתיבת שורות אלה (יום משחק 21), הוא כבש חמישה שערים בעונת 21/22, לא משהו שיגרום לאף אחד להזכיר אותו בשיחה על כובשי השערים הגדולים. אבל בואו נסתכל מקרוב: אם תצבור את ערכי השער הצפויים (xGoals) מכל סיכויי ההבקעה שהיו לגרגוריץ' העונה, הנתון שתקבל הוא 1.7. המשמעות היא שהוא עשה ביצועים מוגזמים בזריקות שלו לשער ב-+194%, וכבש 3.2 שערים יותר מהצפוי. לשם השוואה, לבנדובסקי הציג יתר על המידה ב-1.6 שערים בלבד (+7%). איזה הישג! ברור שגרגוריץ' מביא מיומנות מיוחדת לאוגסבורג.

אז איך נשפוך אור על כל הסיפורים הנסתרים על שחקני בונדסליגה בודדים, כישוריהם והשפעתם על תוצאות המשחקים? היכנסו ל-Bundesliga Match Fact החדש המופעל על ידי AWS בשם Skill. מיומנות פותחה באמצעות ניתוח מעמיק על ידי DFL ו-AWS כדי לזהות שחקנים עם כישורים בארבע קטגוריות ספציפיות: יוזם, מסיים, מנצח כדור ואצן. פוסט זה מספק צלילה עמוקה לתוך ארבעת המיומנויות הללו ודן כיצד הם מיושמים בתשתית AWS.

נקודה מעניינת נוספת היא שעד עכשיו, עובדות משחק בבונדסליגה פותחו באופן עצמאי אחד מהשני. Skill היא עובדת ה-Bundesliga Match Fact הראשונה המשלבת את הפלט של מספר עובדות התאמה בונדסליגה בזמן אמת באמצעות ארכיטקטורת סטרימינג הבנויה על אמזון מנוהל הזרמת קפקא (אמזון MSK).

יוזם

יוזם הוא שחקן שמבצע מספר גבוה של אסיסטים ראשונים ושניים יקרי ערך. כדי לזהות ולכמת את הערך של האסיסטים הללו, הצגנו את המדד החדש xAssist. זה מחושב על ידי מעקב אחר המסירה האחרונה והשנייה אחרונה לפני ירי לעבר השער, והקצאת ערך xGoals המתאים לפעולות אלו. יוזם טוב יוצר הזדמנויות בנסיבות מאתגרות על ידי השלמת מעברים בהצלחה בדרגת קושי גבוהה. כדי להעריך כמה קשה להשלים מעבר נתון, אנו משתמשים בקיים שלנו xPass דֶגֶם. במדד זה, אנו לא כוללים בכוונה הצלבות ובעיטות חופשיות כדי להתמקד בשחקנים שמייצרים הזדמנויות להבקיע עם האסיסטים המדויקים שלהם ממשחק פתוח.

ציון המיומנות מחושב עם הנוסחה הבאה:

הבה נסתכל על יוזם הדרגה 1 הנוכחי, תומס מולר, כדוגמה. הוא אסף ערך xAssist של 9.23 נכון לכתיבת שורות אלה (יום משחק 21), כלומר המסירות שלו עבור השחקנים הבאים שירו ​​בשער יצרו ערך xGoal כולל של 9.23. יחס xAssist ל-90 דקות הוא 0.46. ניתן לחשב זאת מתוך סך זמן המשחק שלו בעונה הנוכחית, וזה מדהים - מעל 1,804 דקות משחק. כאסיסט שני, הוא יצר ערך כולל של 3.80, שמתורגם ל-0.19 שניות ל-90 דקות. בסך הכל, 38 מתוך 58 האסיסטים הראשונים שלו היו מסירות קשות. וכאסיסט שני, 11 מתוך 28 המסירות שלו היו גם מסירות קשות. עם הסטטיסטיקה הזו, תומאס מולר הזניק את עצמו למקום הראשון בדירוג היוזמים. לשם השוואה, הטבלה הבאה מציגה את הערכים של שלושת הראשונים הנוכחיים.

.. xAssist xAssistper90 xSecondAssist xSecondAssistper90 DifficultPassesAssisted DifficultPassesAssisted2 ציון סופי
תומאס מולר - מקום 1 9.23 0.46 3.80 0.18 38 11 0.948
סרג' גנאברי - מקום 2 3.94 0.25 2.54 0.16 15 11 0.516
פלוריאן וירץ - מקום 3 6.41 0.37 2.45 0.14 21 1 0.510

גימור

מסיים הוא שחקן שמצליח בצורה יוצאת דופן בכיבוש שערים. יש לו יעילות זריקה גבוהה והוא משיג שערים רבים בהתאם לזמן המשחק שלו. המיומנות מבוססת על שערים שהובקעו בפועל וההבדל שלה לשערים צפויים (xGoals). זה מאפשר לנו להעריך אם הסיכויים מנוצלים היטב. נניח שלשני חלוצים יש אותו מספר שערים. האם הם חזקים באותה מידה? או שאחד מהם מבקיע מנסיבות קלות ואילו השני מסיים במצבים מאתגרים? עם יעילות זריקות, ניתן לענות על זה: אם השערים שהובקעו עולים על מספר ה-xGoals, שחקן מבצע ביצועים מוגזמים והוא יורה יעיל יותר מהממוצע. באמצעות גודל ההבדל הזה, אנו יכולים לכמת את המידה שבה היעילות של היורה מנצחת את הממוצע.

ציון המיומנות מחושב עם הנוסחה הבאה:

עבור המסיים, אנו מתמקדים יותר ביעדים. הטבלה הבאה נותנת מבט מקרוב על שלושת הראשונים הנוכחיים.

.. שערים יעדים לפי 90 ShotEfficiency ציון סופי
רוברט לבנדובסקי - מקום 1 24 1.14 1.55 0.813
ארלינג האלנד – דרגה 2 16 1.18 5.32 0.811
פטריק שיק - מקום 3 18 1.10 4.27 0.802

רוברט לבנדובסקי כבש העונה 24 שערים, מה שמציב אותו במקום הראשון. למרות שלהאלנד יש יעילות זריקה גבוהה יותר, זה עדיין לא מספיק להאלנד להיות מדורג ראשון, כי אנחנו נותנים משקל גבוה יותר לשערים שהובקעו. זה מעיד שלבנדובסקי מרוויח מאוד הן מאיכות והן מכמות האסיסטים שקיבלו, למרות שהוא מבקיע מצוין. פטריק שיק כבש שני שערים יותר מהאלנד, אבל יש לו שער נמוך יותר ל-90 דקות ויעילות קליעה נמוכה יותר.

אצן

לאצן יש את היכולת הפיזית להגיע למהירות מרבית גבוהה, ולעשות זאת לעתים קרובות יותר מאחרים. למטרה זו, אנו מעריכים את המהירויות הגבוהות הממוצעות בכל המשחקים בעונה הנוכחית של השחקן וכוללים את תדירות הספרינטים ל-90 דקות, בין שאר המדדים. ספרינט נספר אם שחקן רץ בקצב מינימלי של 4.0 מ' לשנייה במשך יותר משתי שניות, ומגיע למהירות שיא של לפחות 6.3 מ' לשנייה בזמן זה. משך הספרינט מאופיין בזמן שבין הפעם הראשונה והאחרונה שמגיעים לסף 6.3 מ"ש, וצריך להיות באורך של שנייה אחת לפחות כדי לקבל אישור. ספרינט חדש יכול להיחשב כאילו התרחש רק לאחר שהקצב ירד שוב מתחת לסף של 1 מ"ש.

ציון המיומנות מחושב עם הנוסחה הבאה:

הנוסחה מאפשרת לנו להעריך את הדרכים הרבות שבהן אנו יכולים להסתכל על ספרינטים של שחקנים, ולהרחיק לכת מאשר רק להסתכל על המהירויות הגבוהות שהשחקנים הללו מייצרים. לדוגמה, ל-Jeremia St. Juste יש את שיא העונה הנוכחי של 36.65 קמ"ש. עם זאת, אם נסתכל על תדירות הספרינטים שלו, נמצא שהוא רץ רק תשע פעמים בממוצע בכל משחק! אלפונסו דייויס לעומת זאת אולי לא מהיר כמו סנט ג'וסטה (מהירות מרבית 36.08 קמ"ש), אבל מבצע 31 ספרינטים מדהימים למשחק! הוא דוחק בתדירות גבוהה הרבה יותר במהירות ממוצעת גבוהה בהרבה, ופותח מקום לקבוצתו על המגרש.

מנצח בכדור

שחקן בעל יכולת זו גורם לאיבוד כדור לקבוצה היריבה, הן בסך הכל והן בהתאמה לזמן המשחק שלו. הוא זוכה במספר גבוה של דו-קרב קרקע ואוויר, והוא גונב או מיירט את הכדור לעתים קרובות, יוצר שליטה בטוחה בכדור בעצמו, ואפשרות לקבוצתו להתקפת נגד.

ציון המיומנות מחושב עם הנוסחה הבאה:

נכון לכתיבת שורות אלה, הזוכה בכדור במקום הראשון הוא דנילו סוארס. יש לו בסך הכל 235 דו-קרב הגנתיים. מתוך 235 הדו-קרב ההגנתיים, הוא ניצח 75, והביס את היריבים בהתמודדות. הוא יירט 51 כדורים העונה בעמדת המשחק שלו כמגן מגן, מה שהעניק לו שיעור ניצחונות של כ-32%. בממוצע, הוא יירט 2.4 כדורים ל-90 דקות.

דוגמה למיומנות

עובדת ה-Skill Bundesliga Match Fact מאפשרת לנו לחשוף את היכולות והחוזקות של שחקני בונדסליגה. דירוג המיומנות שם שחקנים באור הזרקורים שאולי נעלמו מעיניהם קודם לכן בדירוג של סטטיסטיקות קונבנציונליות כמו שערים. לדוגמה, קחו שחקן כמו מייקל גרגוריץ'. גרגוריץ' הוא חלוץ של FC Augsburg שהגיע למקום השישי בדירוג המסיימים נכון ליום המשחקים ה-21. הוא כבש חמישה שערים עד כה, מה שלא היה שם אותו בראש כל דירוג כיבוש שערים. עם זאת, הוא הצליח לעשות זאת תוך 663 דקות משחק בלבד! אחד השערים הללו היה שער השוויון המאוחר בדקה ה-97 שעזר לאוגסבורג להימנע מהפסד החוץ בברלין.

דרך ה-Skill Bundesliga Match Fact, אנו יכולים גם לזהות איכויות שונות של כל שחקן. אחת הדוגמאות לכך היא כוכב דורטמונד, ארלינג האלנד, שזכה גם בתג האצן והמסיים, וכרגע הוא ממוקם במקום השישי בין ספרינטרים בבונדסליגה.

כל המדדים הללו מבוססים על נתוני תנועת שחקנים, נתונים הקשורים לשער, נתונים הקשורים לפעולת כדור ונתונים הקשורים למסירה. אנו מעבדים מידע זה בצנרת נתונים ומחלצים את הנתונים הסטטיסטיים הרלוונטיים הדרושים לכל מיומנות, מה שמאפשר לנו לחשב את הפיתוח של כל המדדים בזמן אמת. הרבה מהסטטיסטיקות שהוזכרו לעיל מנורמלות לפי זמן על המגרש, מה שמאפשר להתחשב בשחקנים שיש להם מעט זמן משחק אך ביצועים טובים בצורה מדהימה כשהם משחקים. השילובים והמשקלים של המדדים משולבים לציון אחד. התוצאה היא דירוג של כל השחקנים על ארבעת כישורי השחקנים. שחקנים המדורגים בין 10 הראשונים מקבלים תג מיומנות כדי לעזור לאוהדים לזהות במהירות את התכונות יוצאות הדופן שהם מביאים לקבוצות שלהם.

יישום וארכיטקטורה

עובדות משחק בבונדסליגה שפותחו עד לנקודה זו אינן תלויות זו בזו ומסתמכות רק על קליטת נתוני מיקום ואירועים, כמו גם חישובים משלהן. עם זאת, זה משתנה עבור ה-Bundesliga Match Fact Skill החדשה, אשר מחשבת דירוג מיומנויות על סמך נתונים שהופקו מ-Match Facts קיימות, כמו למשל xGoals או xPass. לתוצאה של אירוע אחד, אולי מטרה מדהימה עם סיכויים נמוכים להיכנס, יכולה להיות השפעה משמעותית על דירוג מיומנויות המסיים. לכן, בנינו ארכיטקטורה שתמיד מספקת את דירוג הכישורים המעודכן ביותר בכל פעם שיש עדכון לנתונים הבסיסיים. כדי להשיג עדכונים בזמן אמת למיומנויות, אנו משתמשים באמזון MSK, שירות AWS מנוהל עבור Apache Kafka, כפתרון הזרמת נתונים והודעות. בדרך זו, עובדות משחק שונות בבונדסליגה יכולות לתקשר את האירועים והעדכונים האחרונים בזמן אמת.

הארכיטקטורה הבסיסית של מיומנות מורכבת מארבעה חלקים עיקריים:

  • An אשכול אמזון Aurora Serverless מאחסן את כל התפוקות של עובדות התאמה קיימות. זה כולל, למשל, נתונים עבור כל מסירה (כגון xPass, שחקן, מקלט מיועד) או זריקה (xGoal, שחקן, גול) שקרו מאז הצגת עובדות המשחק בבונדסליגה.
  • מרכזי AWS למבדה function כותבת את פלטי Bundesliga Match Fact לתוך מסד הנתונים של Aurora ומודיעה לרכיבים אחרים שיש עדכון.
  • פונקציית Lambda עבור כל מיומנות בודדת מחשבת את דירוג המיומנויות. פונקציות אלו פועלות בכל פעם שזמינים נתונים חדשים לחישוב המיומנות הספציפית.
  • אשכול MSK Kafka של אמזון משמש כנקודת תקשורת מרכזית בין כל הרכיבים הללו.

התרשים הבא ממחיש זרימת עבודה זו. כל עובדת משחק בבונדסליגה שולחת מיד הודעת אירוע לקפקא בכל פעם שיש עדכון לאירוע (כגון ערך xGoals מעודכן עבור אירוע זריקה). פונקציית ה-Lambda של השולח המרכזי מופעלת אוטומטית בכל פעם שעובדת משחק בבונדסליגה שולחת הודעה כזו וכותבת את הנתונים הללו למסד הנתונים. לאחר מכן הוא שולח הודעה נוספת דרך קפקא המכילה את הנתונים החדשים בחזרה לקפקא, המשמשת כטריגר לפונקציות חישוב המיומנויות האישיות. פונקציות אלה משתמשות בנתונים מאירוע טריגר זה, כמו גם מאשכול ה-Aurora הבסיסי, כדי לחשב ולפרסם את דירוג הכישורים החדשים ביותר. למבט מעמיק יותר על השימוש באמזון MSK במסגרת פרויקט זה, עיין בבלוג של Set Piece Threat.

<br> סיכום

בפוסט זה, הדגמנו כיצד מיומנות העובדות החדשה של הבונדסליגה מאפשרת להשוות באופן אובייקטיבי בין שחקני בונדסליגה בארבעה מימדים של שחקני ליבה, תוך בנייה ושילוב של עובדות משחק בבונדסליגה עצמאיות לשעבר בזמן אמת. זה מאפשר לפרשנים ולאוהדים כאחד לחשוף את יכולות השחקנים שלא הבחינו בהם בעבר ולשפוך אור על התפקידים שממלאים שחקני בונדסליגה שונים.

עובדת ה-Bundesliga Match Fact החדשה היא תוצאה של ניתוח מעמיק על ידי מומחי הכדורגל של הבונדסליגה ומדעני הנתונים של ה-AWS כדי לזקק ולסווג את איכויות שחקני הכדורגל על ​​סמך נתוני ביצועים אובייקטיביים. תגי כישורי שחקן מוצגים בהרכב ובדפי הפרטים של השחקנים באפליקציית הבונדסליגה. בשידור, מיומנויות נגן מסופקות לפרשנים דרך ה מאתר סיפורי נתונים ומוצג ויזואלי לאוהדים בהחלפת שחקן וכאשר שחקן עולה לדירוג 10 הראשונים בהתאמה.

אנו מקווים שתיהנו מעובדת הבונדסליגה החדשה הזו ושהיא מספקת לכם תובנות חדשות על המשחק. למידע נוסף על השותפות בין AWS לבונדסליגה, בקר בונדסליגה ב-AWS!


על הכותבים

סיימון רולפס שיחק 288 משחקי בונדסליגה כקשר מרכזי, כבש 41 שערים וכבש 26 כיבושים עבור גרמניה. כיום רולפס משמש כמנהל ספורטיבי ב- Bayer 04 לברקוזן, שם הוא מפקח ומפתח את סגל השחקנים המקצוענים, מחלקת הסקאוטינג ופיתוח הנוער של המועדון. סיימון גם כותב טורים שבועיים באתר Bundesliga.com על העובדות העדכניות ביותר על משחקי הבונדסליגה, המופעל על ידי AWS

לוק פיגור הוא מומחה בכיר לטכנולוגיות ספורט בצוות השירותים המקצועיים של AWS. הוא עובד עם שחקנים, מועדונים, ליגות וחברות מדיה כמו הבונדסליגה ופורמולה 1 כדי לעזור להם לספר סיפורים עם נתונים באמצעות למידת מכונה. בזמנו הפנוי, הוא אוהב ללמוד הכל על המוח ועל המפגש בין פסיכולוגיה, כלכלה ובינה מלאכותית.

פסקל קוהנר הוא מפתח יישומי ענן בצוות השירותים המקצועיים של AWS. הוא עובד עם לקוחות בכל תעשיות כדי לעזור להם להשיג את התוצאות העסקיות שלהם באמצעות פיתוח יישומים, DevOps ותשתיות. הוא נלהב מאוד מספורט ונהנה לשחק כדורסל וכדורגל בזמנו הפנוי.

טארק הסכימי הוא יועץ בשירותים מקצועיים של AWS. הכישורים ותחומי ההתמחות שלו כוללים פיתוח יישומים, מדעי נתונים, למידת מכונה וביג דאטה. מבוסס בהמבורג, הוא תומך בלקוחות בפיתוח יישומים מונעי נתונים בתוך הענן. לפני שהצטרף ל-AWS, הוא היה גם יועץ בתעשיות שונות כמו תעופה וטלקומוניקציה. הוא נלהב לאפשר ללקוחות במסע הנתונים/AI שלהם לענן.

יעקב מיכלצ'יק הוא מדען נתונים ב- Sportec Solutions AG. לפני מספר שנים הוא בחר בלימודי מתמטיקה על פני משחק כדורגל, מכיוון שהגיע למסקנה, הוא לא היה מספיק טוב באחרונים. כעת הוא משלב את שתי התשוקות הללו בקריירה המקצועית שלו על ידי יישום שיטות למידת מכונה כדי לקבל תובנה טובה יותר על המשחק היפה הזה. בזמנו הפנוי, הוא עדיין נהנה לשחק כדורגל של שבעה צדדים, לצפות בסרטי פשע ולהאזין למוזיקה קולנועית.

חאבייר פובדה-פנטר הוא מדען נתונים עבור לקוחות ספורט EMEA בצוות השירותים המקצועיים של AWS. הוא מאפשר ללקוחות בתחום ספורט הצופים לחדש ולהפיק תועלת מהנתונים שלהם, תוך מתן חוויות משתמש ואוהדים באיכות גבוהה באמצעות למידת מכונה ומדעי הנתונים. הוא עוקב אחר התשוקה שלו למגוון רחב של ספורט, מוזיקה ובינה מלאכותית בזמנו הפנוי.

בול זמן:

עוד מ למידת מכונות AWS