HawkEye 360 ​​forudsiger fartøjsrisiko ved hjælp af Deep Graph Library og Amazon Neptune

Kildeknude: 1133735

Dette indlæg er skrevet af Ian Avilez og Tim Pavlick fra HawkEye 360.

HawkEye 360 ​​er en kommerciel radiofrekvens (RF) konstellation, data og analyseudbyder. Deres signaler af interesse inkluderer meget højfrekvente (VHF) push-to-talk-radioer, maritime radarsystemer, Automatic Identification System (AIS) beacons, nødbeacons og mere. Bibliotekets signaler af interesse vil fortsætte med at vokse over tid.

Deres Mission Space tilbud, som blev frigivet i februar 2021, giver brugerne mulighed for intuitivt at visualisere RF-signaler og analyser. Gennem en intuitiv grænseflade kan missionsanalytikere identificere aktivitet, forstå tendenser og forbedre maritim situationsbevidsthed ved at afsløre uset menneskelig adfærd og ulovlige fartøjsaktiviteter såsom smugling, piratkopiering, ulovligt fiskeri og menneskesmugling.

Dette indlæg opsummerer samarbejdet mellem HawkEye 360 ​​og Amazon Machine Learning (ML) Solutions Lab at indbygge maskinlæring (ML)-kapaciteter i deres analytiske arbejdsgange. Samarbejdet omfattede to trin:

  1. Opret en Amazon Neptun grafdatabase bestående af alle de skibe, der er registreret i verden for at forstå forholdet mellem fartøjer og for at analysere, hvordan fartøjerne hænger sammen.
  2. Brug Deep Graph Library (DGL) til at oprette en risikoscore for hvert fartøj. Denne fartøjsrisiko bruges til at forudsige, hvor sandsynligt et fartøj er til at gøre noget mistænkeligt ved at udlede risiko gennem associationer med andre mistænkelige fartøjer.

Oversigt

Tusindvis af skibsfartøjer rejser rundt i verden hver dag. At finde de få dårlige skuespillere kan være tidskrævende og udfordrende for analytikere. At forstå, hvordan fartøjsnetværk fungerer, er vigtigt for at hjælpe analytikere med at bestemme, hvilken slags fartøjsadfærd de ser i deres område. Disse data kan hjælpe analytikere med at informere deres teams om, hvilken tvivlsom adfærd de kan forvente fra fartøjer i nærheden af ​​dem, og finde ud af, om nogen fartøjer kan være involveret i risikable eller uhyggelige aktiviteter. For eksempel, hvis flere fartøjer er i operationsområdet, vil en analytiker måske gerne vide, hvem disse fartøjer har interageret med tidligere. Disse oplysninger kan være nyttige til at identificere eventuelle indirekte relationer mellem de relevante fartøjer. Eksistensen af ​​disse relationer på tværs af fartøjsnetværket gør det til et godt eksempel på en grafdatabase kombineret med deep learning-teknikker til at udlede relationer. HawkEye 360 ​​valgte Neptune som deres grafdatabase til at gemme relationsoplysninger og DGL for deres grafiske neurale netværk (GNN) kapacitet.

HawkEye 360s data indeholder følgende oplysninger om fartøjer:

  • Rendezvous mellem fartøjer, der samles på havet
  • Fartøjsoplysninger, herunder ejerskab, ledelse og driftsforhold
  • Fartøjer, der er forsvundet fra AIS i et betydeligt stykke tid

Brug af Neptun som grafdatabase

Neptune er en hurtig, pålidelig, fuldt administreret grafdatabase, der er optimeret til lagring af komplekse relationer og forespørgsler på grafen med millisekunders latency. HawkEye 360 ​​brugt Amazon SageMaker Neptune-notebooks med dets indbyggede grafiske notesbogsbibliotek til at behandle datasættet og oprette CSV-datasæt, der var klar til at blive indlæst i Neptune-klyngen. For mere information om Neptuns dataformater, se Indlæs dataformater. Med den grafiske notesbog Jupyter magiske funktion %load, HawkEye 360 ​​indlæste dataene i Neptun-klyngen.

Med graph notebook-biblioteket var HawkEye 360 ​​i stand til at forespørge på de underliggende grafdata i Gremlin-forespørgselssprog ved hjælp af %%gremlin fungere. Følgende billede er et eksempel på en forespørgsel, der kan køres.

Med Neptune var HawkEye 360-teamet i stand til straks at se skjulte forbindelser mellem fartøjer i netværket. For eksempel kan analytikere typisk kun se skibe, der interagerer med hinanden i dataene. Grafer kan tage analysen et skridt videre ved at afdække forhold mellem kar, der er tre eller flere hop (eller noder) væk fra hinanden.

Med dataene i Neptune skabte HawkEye 360 ​​en risikoscore pr. fartøj for at identificere risikoen for, at et givet fartøj vil deltage i mistænkelig adfærd. Dette gør det muligt for analytikere at identificere alle risikable skibe i interesseområdet. En højere risikoscore i interesseområdet peger mod, at fartøjet engagerer sig i uhyggelige aktiviteter baseret på forholdet til andre ufarlige fartøjer.

Brug af Deep Graph Library til at forudsige fartøjsrisiko

Det første skridt til at forudsige fartøjsrisiko er at oprette grafdatasættet. DGL'en forventer, at node-id-dataene er rangordensdata med heltal, der starter fra nul. Datasættet bruger tre forskellige typer noder:

  • Fartøjsknudepunkter
  • Ejervirksomhedsknudepunkter
  • Skibs flag noder

Fordi der er forskellige nodetyper, brugte HawkEye 360 ​​en heterogen graf til at rumme blandede datatyper. De brugte relationer som kanter til at oprette grafdatasættet vha dgl.heterograph. Den heterogene graf bestod af grundsandhedsværdier for ca. 1% af knudepunkterne. Med disse noder formulerede HawkEye 360 ​​et semi-overvåget nodeklassificeringsproblem for at klassificere fartøjsrisiko. Semi-superviseret læring består af datasæt med mærkede og umærkede data. De mærkede data i datasættet bruges til træning af modellen, og modellen forudsiger etiketterne for de umærkede data.

Træning af en Relational Graph Convolutional Network-model

Da dataene er heterogene, valgte HawkEye 360 ​​at bruge en heterogen Relational Graph Convolutional Network (R-GCN) grafalgoritme til modeltræning. I en R-GCN-algoritme bruger hver kanttype forskellige vægte, og kun kanter af samme relationstype r er forbundet med den samme vægt W_r. Med R-GCN-algoritmen trænede HawkEye 360 ​​modellen ved at bruge jordsandhedsværdier for en delmængde af noderne for at finde og klassificere alle fartøjer med en risikoscore.

Brug af eksisterende kendt karadfærd til at udlede ny adfærd fra ukendte kar, gør det muligt for HawkEye 360 ​​at skabe indsigt. Analytikere kan afgøre, hvilke fartøjer der er mere tilbøjelige til at engagere sig i mistænkelig adfærd blot ved deres tilknytning til kendte mistænkelige fartøjer.

Konklusion

ML Solutions Lab og HawkEye 360-teamet arbejdede tæt sammen om at bygge grafdataene i Neptun og modellere dataene for at finde risici for nærliggende skibe. Grafnetværkene i Neptune- og GNN-modellerne gør det muligt for HawkEye 360 ​​at afsløre skjulte forhold mellem fartøjer, som ellers ville gå tabt i det enorme hav af kompleksitet. Dette gør det muligt for HawkEye 360s nye flagskibsprodukt, Mission Space, at identificere, hvilke fartøjer der har potentialet til at engagere sig i mistænkelig aktivitet og giver brugerne mulighed for nemt at identificere, hvor de skal fokusere deres opmærksomhed og undersøge nærmere.

I dag kan kunderne også bruge Amazon Neptune ML, som giver en strømlinet måde at skabe, træne og anvende ML-modeller på Neptune-data på i timer i stedet for uger uden behov for at lære nye værktøjer og ML-teknologier.

For mere information om HawkEye 360's Mission Space-tilbud, se Mission Space. For mere information om, hvordan AWS understøtter kunder og partnere i satellit- og rumfartsindustrien, se AWS Aerospace og Satellit.

Hvis du vil have hjælp til at fremskynde brugen af ​​ML i dine produkter og tjenester, skal du kontakte Amazon ML Solutions Lab.


Om forfatterne

Tim Pavlick, PhD, er VP of Product hos HawkEye 360. Han er ansvarlig for udformningen, skabelsen og produktiseringen af ​​alle HawkEye ruminnovationer. Mission Space er HawkEye 360's flagskibsprodukt, der inkorporerer alle data og analyser fra HawkEye-porteføljen i én intuitiv RF-oplevelse. Dr. Pavlicks tidligere bidrag på opfindelsen omfatter Myca, IBM's AI Career Coach, Grit PTSD-monitor for veteraner, IBM Defence Operations Platform, Smarter Planet Intelligent Operations Center, AI-detektion af farlige hadefulde ytringer på internettet og STORES elektroniske madbestillingssystem til amerikansk militær. Dr. Pavlick modtog sin ph.d. i kognitiv psykologi fra University of Maryland College Park.

Ian Avilez er Data Scientist med HawkEye 360. Han arbejder med kunder for at fremhæve den indsigt, der kan opnås ved at kombinere forskellige datasæt og se på disse data på forskellige måder.

Gaurav Rele er dataforsker ved Amazon ML Solution Lab, hvor han arbejder med AWS-kunder på tværs af forskellige vertikaler for at accelerere deres brug af machine learning og AWS Cloud-tjenester til at løse deres forretningsmæssige udfordringer.

Dan Ford er dataforsker ved Amazon ML Solution Lab, hvor han hjælper AWS National Security-kunder med at bygge state-of-the-art ML-løsninger.

Kilde: https://aws.amazon.com/blogs/machine-learning/hawkeye-360-predicts-vessel-risk-using-the-deep-graph-library-and-amazon-neptune/

Tidsstempel:

Mere fra AWS Machine Learning Blog