Bundesliga Match Fact Skill: jalkapalloilijan ominaisuuksien määrittäminen AWS:n koneoppimisen avulla

Lähdesolmu: 1195672

Jalkapallossa, kuten monissa urheilulajeissa, keskustelu yksittäisistä pelaajista on aina ollut osa hauskaa. "Kuka on paras maalintekijä?" tai "Kuka on puolustajien kuningas?" ovat kysymyksiä, joista fanit keskustelevat jatkuvasti, ja sosiaalinen media vahvistaa tätä keskustelua. Ajattele vain, että Erling Haalandilla, Robert Lewandowskilla ja Thomas Müllerillä on Instagramissa yhteensä 50 miljoonaa seuraajaa. Monet fanit ovat tietoisia Lewandowskin ja Haalandin kaltaisten uskomattomien tilastojen luomisesta, mutta tällaiset tarinat ovat vain jäävuoren huippu.

Ajattele, että lähes 600 pelaajalla on sopimus Bundesliigassa, ja jokaisella joukkueella on omat mestarinsa – pelaajat, jotka esitellään tuodakseen tietyn taidon otteluun. Katso esimerkiksi Michael Gregoritsch FC Augsburgista. Tätä kirjoittaessa (pelipäivä 21) hän on tehnyt viisi maalia kaudella 21/22, mikä ei saisi kenenkään mainitsemaan hänet keskustelussa loistavista maalintekijöistä. Mutta katsotaanpa tarkemmin: jos keräät kaikkien Gregoritschilla tällä kaudella olleen maalintekomahdollisuuksien odotetut maaliarvot (xGoals), saat luvun 1.7. Tämä tarkoittaa, että hän suoriutui maalia kohden tehdyissä laukauksissaan +194 % ja teki 3.2 maalia odotettua enemmän. Vertailun vuoksi Lewandowski suoriutui yli vain 1.6 maalilla (+7 %). Mikä saavutus! Selvästi Gregoritsch tuo Augsburgiin erityisen taidon.

Joten miten voimme paljastaa kaikki piilotetut tarinat yksittäisistä Bundesliiga-pelaajista, heidän taidoistaan ​​ja vaikutuksista otteluiden tuloksiin? Osallistu uuteen Bundesliga Match Fact -tapahtumaan, joka toimii AWS:n avulla nimeltä Skill. Taitoa on kehitetty DFL:n ja AWS:n perusteellisella analyysillä tunnistaakseen pelaajat, joilla on taitoja neljässä eri kategoriassa: aloittaja, viimeistely, pallon voittaja ja pikajuoksija. Tämä viesti tarjoaa syvän sukellus näihin neljään taitoon ja keskustelee siitä, kuinka ne toteutetaan AWS-infrastruktuurissa.

Toinen mielenkiintoinen seikka on, että tähän asti Bundesliigan ottelufakteja on kehitetty toisistaan ​​riippumatta. Skill on ensimmäinen Bundesliga Match Fact, joka yhdistää useiden Bundesliga Match Factien tulokset reaaliajassa käyttämällä suoratoistoarkkitehtuuria, joka on rakennettu Amazonin hallinnoima suoratoisto Kafka (Amazon MSK).

aloittaja

Aloittaja on pelaaja, joka antaa suuren määrän arvokkaita ensimmäistä ja toista syöttöä. Näiden apujen arvon tunnistamiseksi ja kvantifioimiseksi otimme käyttöön uuden xAssist-mittarin. Se lasketaan seuraamalla viimeistä ja toiseksi viimeistä syöttöä ennen maaliin tehtyä laukausta ja määrittämällä kyseisille toimille vastaava xGoals-arvo. Hyvä alullepanija luo mahdollisuuksia haastavissa olosuhteissa suorittamalla onnistuneesti läpäisyjä korkealla vaikeusasteella. Arvioimme, kuinka vaikeaa tietyn passin suorittaminen on, käytämme olemassa olevaa xPass malli. Tästä mittarista jätämme tarkoituksella pois ristit ja vapaapotkut keskittyäksemme pelaajiin, jotka luovat maalintekopaikkoja tarkalla syöttöllään avoimesta pelistä.

Taitopisteet lasketaan seuraavalla kaavalla:

Katsotaanpa esimerkkinä nykyistä Rank 1 -aloitteentekijää Thomas Mülleriä. Hän on kerännyt xAssist-arvon 9.23 tätä kirjoittaessa (ottelupäivä 21), mikä tarkoittaa, että hänen syötönsä seuraaville maalia ampuneille pelaajille ovat tuottaneet xGoal-arvoksi yhteensä 9.23. xAssist per 90 minuuttia -suhde on 0.46. Tämä voidaan laskea hänen kuluvan kauden kokonaispeliajasta, mikä on huomattavaa - yli 1,804 3.80 minuuttia peliaikaa. Toisena syöttönä hän tuotti kokonaisarvon 0.19, mikä tarkoittaa 90 sekunnin syöttöä 38 minuuttia kohti. Kaiken kaikkiaan 58 hänen 11 ensisyöttöstään oli vaikeita syöttöjä. Ja toisena syöttönä 28 hänen XNUMX syötöstään oli myös vaikeita syöttöjä. Näillä tilastoilla Thomas Müller on noussut ykkössijalle aloittajien rankingissa. Vertailun vuoksi seuraava taulukko esittää nykyisen kolmen parhaan arvot.

.. xAssist xAssistper90 xSecondAssist xSecondAssistper90 DifficultPasses Assisted Difficult Passes Assisted2 Lopullinen tulos
Thomas Müller – Sija 1 9.23 0.46 3.80 0.18 38 11 0.948
Serge Gnabry – Sija 2 3.94 0.25 2.54 0.16 15 11 0.516
Florian Wirtz – Sija 3 6.41 0.37 2.45 0.14 21 1 0.510

viimeistelijä

Viimeistelijä on pelaaja, joka on poikkeuksellisen hyvä maalintekoon. Hänellä on korkea laukaisutehokkuus ja hän saavuttaa monia maaleja peliaikansa mukaan. Taito perustuu todellisiin tehtyihin maaleihin ja sen eroon odotettuihin maaleihin (xGoals). Tämän avulla voimme arvioida, käytetäänkö mahdollisuuksia hyvin. Oletetaan, että kahdella hyökkääjällä on sama määrä maaleja. Ovatko he yhtä vahvoja? Vai tekeekö toinen heistä maalin helpoissa olosuhteissa, kun taas toinen tekee maalin haastavissa tilanteissa? Laukaisutehokkuudella tähän voidaan vastata: jos tehdyt maalit ylittävät xGoals-määrän, pelaaja on ylisuorituskykyinen ja on keskimääräistä tehokkaampi ampuja. Tämän eron suuruuden avulla voimme kvantifioida, missä määrin ampujan tehokkuus ylittää keskiarvon.

Taitopisteet lasketaan seuraavalla kaavalla:

Viimeistelijän osalta keskitymme enemmän maaleihin. Seuraavassa taulukossa tarkastellaan lähemmin nykyistä kolmea parasta.

.. Tavoitteet Tavoitteet per 90 ShotEfficiency Lopullinen tulos
Robert Lewandowski – Sija 1 24 1.14 1.55 0.813
Erling Haaland – Sija 2 16 1.18 5.32 0.811
Patrik Schick – Sija 3 18 1.10 4.27 0.802

Robert Lewandowski on tehnyt tällä kaudella 24 maalia, mikä nostaa hänet ensimmäiselle sijalle. Vaikka Haalandilla on korkeampi laukaisutehokkuus, se ei silti riitä Haalandille ykkössijalle, koska annamme tehdyille maaleille korkeamman painoarvon. Tämä osoittaa, että Lewandowski hyötyy suuresti sekä vastaanotettujen syöttöjen laadusta että määrästä, vaikka hän tekeekin poikkeuksellisen hyvin. Patrick Schick on tehnyt kaksi maalia enemmän kuin Haaland, mutta hänellä on pienempi maali 90 minuuttia kohden ja heikompi laukaisutehokkuus.

Pikajuoksija

Pikajuoksijalla on fyysinen kyky saavuttaa suuria huippunopeuksia, ja tekee niin useammin kuin muut. Tätä tarkoitusta varten arvioimme pelaajan kuluvan kauden kaikkien pelien keskimääräiset huippunopeudet ja otamme mukaan muiden mittareiden ohella sprinttien tiheyden 90 minuutissa. Sprintti lasketaan, jos pelaaja juoksee vähintään 4.0 m/s nopeudella yli kaksi sekuntia ja saavuttaa tänä aikana vähintään 6.3 m/s huippunopeuden. Sprintin kestolle on ominaista aika ensimmäisen ja viimeisen 6.3 m/s kynnyksen saavuttamisen välillä, ja sen on oltava vähintään 1 sekunti pitkä, jotta se kuitataan. Uuden sprintin voidaan katsoa tapahtuneen vasta, kun vauhti on jälleen pudonnut alle 4.0 m/s kynnyksen.

Taitopisteet lasketaan seuraavalla kaavalla:

Kaavan avulla voimme arvioida monia tapoja, joilla voimme tarkastella pelaajien sprinttejä, ja mennä pidemmälle kuin vain katsoa näiden pelaajien tuottamia huippunopeuksia. Esimerkiksi Jeremiah St. Justella on nykyisen kauden ennätys 36.65 km/h. Kuitenkin, jos katsomme hänen sprinttiään, huomaamme, että hän sprinttii keskimäärin yhdeksän kertaa ottelua kohden! Alphonso Davies toisaalta ei ehkä ole yhtä nopea kuin St. Juste (huippunopeus 36.08 km/h), mutta suorittaa huikeat 31 sprinttiä ottelua kohden! Hän sprinttii paljon useammin paljon suuremmalla keskinopeudella, mikä avaa joukkueelleen tilaa kentällä.

Pallon voittaja

Pelaaja, jolla on tämä kyky, aiheuttaa pallon menetyksiä vastustajajoukkueelle sekä kokonaismäärässä että peliaikansa mukaan. Hän voittaa suuren määrän maa- ja ilmakaksintaisteluja, ja hän varastaa tai katkaisee pallon usein, mikä luo itselleen turvallisen pallonhallinnan ja mahdollisuuden joukkueelleen vastahyökkäykseen.

Taitopisteet lasketaan seuraavalla kaavalla:

Tätä kirjoittaessa ykköspallon voittaja on Danilo Soares. Hänellä on yhteensä 235 puolustuskaksintaistelua. 235 puolustuksen kaksintaistelusta hän on voittanut 75 ja voittanut vastustajat kohtaamisissa. Hän on katkaissut tällä kaudella 51 palloa pelipaikallaan puolustavana puolustajana, mikä antaa hänelle noin 32 prosentin voittoprosentin. Hän katkaisi keskimäärin 2.4 palloa 90 minuutissa.

Taitoesimerkki

Skill Bundesliga Match Fact antaa meille mahdollisuuden paljastaa Bundesliigan pelaajien kyvyt ja vahvuudet. Skill-sijoitukset asettavat pelaajat valokeilaan, jotka ovat ehkä jääneet aiemmin huomaamatta tavanomaisten tilastojen, kuten maalien, rankingissa. Otetaan esimerkiksi pelaaja, kuten Michael Gregoritsch. Gregoritsch on FC Augsburgin hyökkääjä, joka sijoittui maalinteossa kuudenneksi pelipäivänä 21. Hän on tehnyt tähän mennessä viisi maalia, mikä ei nostaisi häntä minkään maalinteon kärjessä. Hän onnistui kuitenkin tekemään tämän vain 663 pelissä! Yksi näistä maaleista oli myöhäinen tasoitus 97. minuutilla, mikä auttoi Augsburgia välttämään vierastappion Berliinissä.

Skill Bundesliga Match Factin avulla voimme myös tunnistaa jokaisen pelaajan erilaisia ​​ominaisuuksia. Eräs esimerkki tästä on Dortmundin tähti Erling Haaland, joka on myös ansainnut pikajuoksijan ja viimeistelijän merkin ja on tällä hetkellä kuudenneksi Bundesliigan pikajuoksijassa.

Kaikki nämä mittarit perustuvat pelaajien liiketietoihin, maaliin liittyviin tietoihin, pallotoimintoihin liittyviin tietoihin ja syöttötietoihin. Käsittelemme nämä tiedot dataputkissa ja poimimme tarvittavat asiaankuuluvat tilastot taitokohtaisesti, jotta voimme laskea kaikkien mittareiden kehityksen reaaliajassa. Monet edellä mainituista tilastoista on normalisoitu kentällä vietetyn ajan mukaan, mikä mahdollistaa sellaisten pelaajien huomioimisen, joilla on vähän peliaikaa, mutta jotka pelaavat hämmästyttävän hyvin. Mittareiden yhdistelmät ja painotukset yhdistetään yhdeksi pistemääräksi. Tuloksena on kaikkien pelaajien sijoitus neljän pelaajan taitojen perusteella. 10 parhaan joukkoon sijoittuneet pelaajat saavat taitomerkin, joka auttaa faneja tunnistamaan nopeasti joukkueisiinsa tuomat poikkeukselliset ominaisuudet.

Toteutus ja arkkitehtuuri

Bundesliigan ottelufaktit, jotka on kehitetty tähän asti, ovat toisistaan ​​riippumattomia ja perustuvat vain sijainti- ja tapahtumatietojen nielemiseen sekä omiin laskelmiinsa. Tämä muuttuu kuitenkin uuteen Bundesliga Match Fact Skill -taitoon, joka laskee taitojen sijoitukset olemassa olevien Match Facts -tietojen, kuten xGoals tai xPass, tuottamien tietojen perusteella. Yhden tapahtuman lopputuloksella, mahdollisesti uskomattomalla maalilla pienillä mahdollisilla sisäänpääsymahdollisuuksilla, voi olla merkittävä vaikutus viimeistelijän taitojen sijoitukseen. Siksi rakensimme arkkitehtuurin, joka tarjoaa aina ajantasaisimmat taitosijoitukset aina, kun taustalla olevia tietoja päivitetään. Saavuttaaksemme taitojen reaaliaikaiset päivitykset käytämme Amazon MSK:ta, Apache Kafkan hallittua AWS-palvelua, tiedon suoratoisto- ja viestintäratkaisuna. Tällä tavalla eri Bundesliigan ottelufaktit voivat viestiä viimeisimmistä tapahtumista ja päivityksistä reaaliajassa.

Skilln taustalla oleva arkkitehtuuri koostuu neljästä pääosasta:

  • An Amazon Aurora -palvelinton klusteri tallentaa kaikki olemassa olevien ottelutietojen tulokset. Tämä sisältää esimerkiksi tiedot jokaisesta syötöstä (kuten xPass, pelaaja, vastaanottaja) tai laukauksesta (xGoal, pelaaja, maali), joka on tapahtunut Bundesliigan ottelufaktien käyttöönoton jälkeen.
  • Keskeinen AWS Lambda toiminto kirjoittaa Bundesliga Match Fact -tulosteet Aurora-tietokantaan ja ilmoittaa muille komponenteille päivityksestä.
  • Lambda-funktio jokaiselle yksittäiselle taidolle laskee taitojen sijoituksen. Nämä toiminnot suoritetaan aina, kun uusia tietoja on saatavilla tietyn taidon laskemista varten.
  • Amazon MSK Kafka -klusteri toimii keskeisenä viestintäpisteenä kaikkien näiden komponenttien välillä.

Seuraava kaavio havainnollistaa tätä työnkulkua. Jokainen Bundesliigan ottelufakta lähettää välittömästi tapahtumaviestin Kafkalle aina, kun tapahtumaan tulee päivitys (kuten päivitetty xGoals-arvo laukaustapahtumalle). Lambda-keskustoiminto käynnistyy automaattisesti aina, kun Bundesliga Match Fact lähettää tällaisen viestin ja kirjoittaa tiedot tietokantaan. Sitten se lähettää Kafkan kautta uuden viestin, joka sisältää uudet tiedot, takaisin Kafkalle, joka toimii laukaisevana yksittäisille taitolaskentatoiminnoille. Nämä funktiot käyttävät tämän trigger-tapahtuman tietoja sekä taustalla olevaa Aurora-klusteria uusimpien taitosijoitusten laskemiseen ja julkaisemiseen. Jos haluat tarkempaa tarkastella Amazon MSK:n käyttöä tässä projektissa, katso Set Piece Threat -blogiviesti.

Yhteenveto

Tässä viestissä osoitimme, kuinka uusi Bundesliga Match Fact Skill mahdollistaa Bundesliiga-pelaajien objektiivisen vertaamisen neljän ydinpelaajaulottuvuuden perusteella. Se perustuu entisiin itsenäisiin Bundesliigan ottelutietoihin ja yhdistää niitä reaaliajassa. Näin kommentaattorit ja fanit voivat paljastaa aiemmin huomaamattomia pelaajien kykyjä ja valottaa rooleja, joita useat Bundesliigan pelaajat täyttävät.

Uusi Bundesliiga Match Fact on Bundesliigan jalkapalloasiantuntijoiden ja AWS:n datatieteilijöiden perusteellisen analyysin tulos, jonka tarkoituksena on selvittää ja luokitella jalkapalloilijoiden ominaisuudet objektiivisten suoritustietojen perusteella. Pelaajien taitomerkit näkyvät kokoonpanossa ja pelaajatietosivuilla Bundesliiga-sovelluksessa. Lähetyksessä pelaajataitoja tarjotaan kommentoijille kautta datatarinoiden etsintä ja näytetään visuaalisesti faneille pelaajan vaihdon yhteydessä ja kun pelaaja nousee vastaavaan top 10 -sijoitukseen.

Toivomme, että pidät tästä upouudesta Bundesliiga Match Factista ja että se tarjoaa sinulle uusia näkemyksiä pelistä. Lisätietoja AWS:n ja Bundesliigan kumppanuudesta on osoitteessa Bundesliiga AWS:llä!


Tietoja Tekijät

simon rolfes pelasi 288 Bundesliiga-ottelua keskikenttäpelaajana, teki 41 maalia ja voitti 26 ottelua Saksan maajoukkueessa. Tällä hetkellä Rolfes toimii urheilujohtajana Bayer 04 Leverkusenissa, jossa hän valvoo ja kehittää ammattilaispelaajaluetteloa, partioosastoa ja seuran nuorisokehitystä. Simon kirjoittaa myös viikoittaisia ​​kolumneja Bundesliga.com-sivustolle viimeisimmistä AWS:n tuottamista Bundesliga-otteluista

Luuk Figdor on vanhempi urheiluteknologian asiantuntija AWS Professional Services -tiimissä. Hän työskentelee pelaajien, seurojen, liigojen ja mediayritysten, kuten Bundesliigan ja Formula 1:n, kanssa auttaakseen heitä kertomaan tarinoita datan avulla koneoppimisen avulla. Vapaa-ajallaan hän haluaa oppia kaiken mielestä ja psykologian, talouden ja tekoälyn risteyskohdasta.

Pascal Kühner on pilvisovelluskehittäjä AWS Professional Services -tiimissä. Hän työskentelee asiakkaiden kanssa eri toimialoilla auttaakseen heitä saavuttamaan liiketoimintansa sovelluskehityksen, DevOpsin ja infrastruktuurin avulla. Hän on erittäin intohimoinen urheiluun ja nauttii koripallon ja jalkapallon pelaamisesta vapaa-ajallaan.

Tareq Haschemi on konsultti AWS Professional Services -palvelussa. Hänen taitojaan ja osaamisalueitaan ovat sovelluskehitys, datatiede, koneoppiminen ja big data. Hän työskentelee Hampurissa ja tukee asiakkaita datapohjaisten sovellusten kehittämisessä pilven sisällä. Ennen AWS:lle tuloaan hän oli myös konsulttina eri aloilla, kuten ilmailussa ja televiestinnässä. Hän on intohimoinen mahdollistaakseen asiakkaiden datan/AI-matkan pilveen.

Jakub Michalczyk on tietotutkija Sportec Solutions AG:ssa. Useita vuosia sitten hän valitsi matematiikan opinnot jalkapallon pelaamisen sijaan, koska hän tuli siihen tulokseen, ettei hän ollut tarpeeksi hyvä jälkimmäisessä. Nyt hän yhdistää nämä molemmat intohimot ammattiuransa avulla soveltamalla koneoppimismenetelmiä saadakseen paremman käsityksen tästä kauniista pelistä. Vapaa-ajallaan hän pelaa edelleen jalkapalloa, katselee rikoselokuvia ja kuuntelee elokuvamusiikkia.

Javier Poveda-Panter on EMEA-alueen urheiluasiakkaiden tietotutkija AWS Professional Services -tiimissä. Hän antaa yleisöurheilun asiakkaille mahdollisuuden innovoida ja hyödyntää tietojaan tarjoamalla laadukkaita käyttäjä- ja fanikokemuksia koneoppimisen ja datatieteen avulla. Hän seuraa intohimoaan monenlaista urheilua, musiikkia ja tekoälyä kohtaan vapaa-ajallaan.

Aikaleima:

Lisää aiheesta AWS-koneoppiminen