Modelul AI Magika de identificare a fișierelor Google open source

Modelul AI Magika de identificare a fișierelor Google open source

Nodul sursă: 2484550

Google a deschis Magika, un identificator de fișier intern bazat pe învățare automată, ca parte a Inițiativei sale de apărare cibernetică AI, care își propune să ofere apărătorilor rețelelor IT și altora instrumente automatizate mai bune.

Elaborarea conținutului real al unui fișier trimis de utilizator este poate mai dificil decât pare. Nu este sigur să presupunem tipul de fișier din, să zicem, extensia sa și să te bazezi pe euristică și reguli create de om - cum ar fi cele din libmagic – a identifica natura reală a unui document din datele sale este, în opinia Google, „consumatoare de timp și predispusă la erori”.

Practic, dacă cineva încarcă un .JPG în serviciul tău online, vrei să fii sigur că este o imagine JPEG și nu un script care se preface ca unul, care te-ar putea mușca ulterior în fund. Introduceți Magika, care folosește un model antrenat pentru a identifica rapid tipurile de fișiere din datele fișierelor, și este o abordare pe care Big G crede că funcționează suficient de bine pentru a fi utilizată în producție. Magika este, ni s-a spus, folosit de Gmail, Google Drive, Navigarea sigură a Chrome și VirusTotal pentru a identifica și direcționa corect datele pentru procesare ulterioară.

Kilometrajul dvs. poate varia. Libmagic, unul, ar putea funcționa suficient de bine pentru tine. În orice caz, Magika este un exemplu în care Google folosește în interior inteligența artificială pentru a-și consolida securitatea și speră că și alții pot beneficia de această tehnologie. Un alt exemplu ar fi RETVec, care este un model de procesare a textului în mai multe limbi utilizat pentru a detecta spam-ul. Acest lucru vine într-un moment în care suntem cu toții avertizați că răufăcătorii se pare că folosesc mai mult software-ul de învățare automată pentru a automatiza intruziunile și cercetarea vulnerabilităților.

Factorii politici, profesioniștii în securitate și societatea civilă au șansa de a înclina în sfârșit echilibrul securității cibernetice de la atacatori la apărători cibernetici

„AI se află la o răscruce definitivă – una în care factorii de decizie, profesioniștii în securitate și societatea civilă au șansa de a înclina în sfârșit echilibrul securității cibernetice de la atacatori la apărători cibernetici”, Phil Venables, director de securitate a informațiilor la Google Cloud, și Royal Hansen, director al inginerie pentru confidențialitate, siguranță și securitate, a spus vineri. 

„Într-un moment în care actorii rău intenționați experimentează cu inteligența artificială, avem nevoie de acțiuni îndrăznețe și în timp util pentru a modela direcția acestei tehnologii.”

Perechea crede Magika poate fi folosit de apărătorii rețelei pentru a identifica, rapid și la scară, adevăratul conținut al fișierelor, ceea ce reprezintă un prim pas în analiza malware și detectarea intruziunilor. Pentru a fi sincer, acest model de învățare profundă ar putea fi util pentru oricine trebuie să scaneze documente furnizate de utilizator: videoclipurile care sunt de fapt executabile, de exemplu, ar trebui să declanșeze o alarmă și să necesite o inspecție mai atentă. Atașamentele de e-mail care nu sunt ceea ce spun că sunt ar trebui puse în carantină. Înțelegi ideea.

Mai general vorbind, în contextul securității cibernetice, modelele AI nu numai că pot inspecta fișierele pentru conținut suspect și cod sursă pentru vulnerabilități, ele pot, de asemenea, genera patch-uri pentru a remedia erori, au afirmat Googlers. Inginerii mega-corpului au experimentat zodia Gemeni pentru a îmbunătăți, de asemenea, fuzzingul automat al proiectelor open source.

Google susține că Magika este cu 50 la sută mai precis în identificarea tipurilor de fișiere decât sistemul anterior de reguli realizate manual, necesită milisecunde pentru a identifica un tip de fișier și se spune că are o precizie de cel puțin 99 la sută în teste. Cu toate acestea, nu este perfect și nu reușește să clasifice tipurile de fișiere aproximativ trei la sută din timp. Este licențiat sub Apache 2.0, codul este aici, iar modelul său cântărește 1 MB.

Îndepărtându-se de Magika, Fabrica de ciocolată va, de asemenea, ca parte a acestei noi inițiative de apărare cibernetică AI, să colaboreze cu 17 startup-uri din Marea Britanie, SUA și Europa și le va instrui să folosească aceste tipuri de instrumente automate pentru a-și îmbunătăți securitatea. 

De asemenea, își va extinde Programul de seminarii de securitate cibernetică de 15 milioane USD pentru a ajuta universitățile să formeze mai mulți studenți europeni în domeniul securității. Mai aproape de casă, a promis 2 milioane de dolari în granturi pentru a finanța cercetarea în infracțiunile cibernetice, precum și modele mari de limbaj pentru a sprijini cadrele universitare de la Universitatea din Chicago, Carnegie Mellon și Stanford.

„Revoluția AI este deja în curs. În timp ce oamenii aplaudă pe bună dreptate promisiunea unor noi medicamente și descoperiri științifice, suntem, de asemenea, încântați de potențialul AI de a rezolva provocările de securitate generaționale, aducându-ne în același timp aproape de lumea digitală sigură, sigură și de încredere pe care o merităm”, au concluzionat Venables și Hansen. ®

Timestamp-ul:

Mai mult de la Registrul