HawkEye 360 ​​прогнозирует судовой риск с помощью библиотеки Deep Graph и Amazon Neptune

Исходный узел: 1133735

Этот пост написан в соавторстве с Яном Авилезом и Тимом Павликом из HawkEye 360.

HawkEye 360 ​​— это коммерческая радиочастотная (РЧ) группировка, поставщик данных и аналитики. Их интересующие сигналы включают очень высокочастотные (VHF) рации, морские радиолокационные системы, маяки автоматической системы идентификации (AIS), аварийные маяки и многое другое. Библиотека сигналов интереса будет продолжать расти с течением времени.

Их Миссия Космос предложение, выпущенное в феврале 2021 года, позволяет пользователям интуитивно визуализировать РЧ-сигналы и аналитику. С помощью интуитивно понятного интерфейса аналитики миссии могут выявлять активность, понимать тенденции и улучшать осведомленность о морской обстановке, выявляя невидимое поведение людей и незаконную деятельность судов, такую ​​как контрабанда, пиратство, незаконный промысел и торговля людьми.

Этот пост подводит итоги совместной работы HawkEye 360 ​​и Лаборатория решений Amazon Machine Learning (ML) внедрять возможности машинного обучения (ML) в свои аналитические рабочие процессы. Сотрудничество включало два этапа:

  1. Создать Амазонка Нептун графическая база данных, состоящая из всех судов, зарегистрированных в мире, чтобы понять взаимосвязь между судами и проанализировать, как суда связаны друг с другом.
  2. Используйте библиотеку Deep Graph (DGL), чтобы создать оценку риска для каждого судна. Этот риск судна используется для прогнозирования вероятности того, что судно совершит что-то подозрительное, путем вывода о риске на основе ассоциации с другими подозрительными судами.

Обзор

Тысячи морских судов ежедневно путешествуют по миру. Поиск нескольких злоумышленников может занять много времени и стать сложной задачей для аналитиков. Понимание того, как работают сети судов, важно, чтобы помочь аналитикам определить, какое поведение судов они наблюдают в своем районе. Эти данные могут помочь аналитикам информировать свои группы о том, какое сомнительное поведение они могут ожидать от судов, находящихся рядом с ними, и выяснить, могут ли какие-либо суда участвовать в рискованных или гнусных действиях. Например, если в районе операций находится несколько судов, аналитик может захотеть узнать, с кем эти суда взаимодействовали в прошлом. Эта информация может быть полезна для выявления любых косвенных связей между интересующими сосудами. Существование этих взаимосвязей в сети судов делает его отличным вариантом использования графовой базы данных в сочетании с методами глубокого обучения для вывода взаимосвязей. HawkEye 360 ​​выбрала Neptune в качестве своей графовой базы данных для хранения информации о взаимосвязях и DGL для своих возможностей графовой нейронной сети (GNN).

Данные HawkEye 360 ​​содержат следующую информацию о судах:

  • Свидание между судами, собравшимися в море
  • Информация о судне, включая право собственности, управление и операционные отношения
  • Суда, исчезнувшие из АИС на значительное время

Использование Neptune в качестве графовой базы данных

Neptune — это быстрая, надежная, полностью управляемая база данных графов, оптимизированная для хранения сложных взаимосвязей и выполнения запросов к графу с миллисекундной задержкой. HawkEye 360 ​​подержанный Создатель мудреца Амазонки Записные книжки Neptune со встроенной библиотекой графических записных книжек для обработки набора данных и создания наборов данных CSV, готовых для загрузки в кластер Neptune. Дополнительные сведения о форматах данных Neptune см. Загрузка форматов данных. С волшебной функцией графического ноутбука Jupyter %load, HawkEye 360 ​​загрузил данные в кластер Neptune.

С библиотекой блокнота графов HawkEye 360 ​​мог запрашивать базовые данные графа на языке запросов Gremlin, используя %%gremlin функция. Следующее изображение является одним из примеров запроса, который можно выполнить.

С помощью Neptune команда HawkEye 360 ​​смогла сразу увидеть скрытые связи между судами в сети. Например, обычно аналитики могут видеть в данных только те сосуды, которые взаимодействуют друг с другом. Графики могут продвинуть анализ на шаг вперед, раскрывая отношения между сосудами, которые находятся на расстоянии трех или более прыжков (или узлов) друг от друга.

Используя данные в Neptune, HawkEye 360 ​​создал оценку риска для каждого судна, чтобы определить риск того, что данное судно будет вести себя подозрительно. Это позволяет аналитикам идентифицировать все опасные суда в интересующей области. Более высокий показатель риска в интересующей области указывает на то, что судно участвует в незаконных действиях, основанных на отношениях с другими гнусными судами.

Использование библиотеки Deep Graph для прогнозирования риска сосуда

Первым шагом к прогнозированию риска судна является создание набора графических данных. DGL ожидает, что данные идентификатора узла будут данными порядка ранжирования с целыми числами, начинающимися с нуля. В наборе данных используются три разных типа узлов:

  • Узлы сосуда
  • Узлы компании-владельца
  • Узлы флага корабля

Поскольку существуют разные типы узлов, HawkEye 360 ​​использовал гетерогенный граф для размещения смешанных типов данных. Они использовали отношения в качестве ребер для создания набора данных графа, используя дгл.гетерограф. Неоднородный граф состоял из наземных значений истинности примерно для 1% узлов. С помощью этих узлов HawkEye 360 ​​сформулировал задачу классификации полуконтролируемых узлов для классификации рисков судов. Полууправляемое обучение состоит из наборов данных с помеченными и неразмеченными данными. Размеченные данные в наборе данных используются для обучения модели, а модель прогнозирует метки для неразмеченных данных.

Обучение модели сверточной сети реляционного графа

Поскольку данные разнородны, HawkEye 360 ​​решил использовать разнородный Сверточная сеть реляционного графа (R-GCN) алгоритм графа для обучения модели. В алгоритме R-GCN каждый тип ребра использует разные веса, и только ребра одного и того же типа отношения r связаны с одним и тем же весом. W_r. С помощью алгоритма R-GCN HawkEye 360 ​​обучил модель, используя наземные истинные значения для подмножества узлов, чтобы найти и классифицировать все суда с оценкой риска.

Использование существующего известного поведения сосудов для определения нового поведения неизвестных сосудов позволяет HawkEye 360 ​​получать ценные сведения. Аналитики могут определить, какие суда с большей вероятностью будут вести себя подозрительно, просто по их связи с известными подозрительными судами.

Заключение

Лаборатория ML Solutions Lab и команда HawkEye 360 ​​тесно сотрудничали, чтобы построить графические данные в Neptune и смоделировать данные, чтобы найти риски для близлежащих кораблей. Сети графов в моделях Neptune и GNN позволяют HawkEye 360 ​​выявлять скрытые взаимосвязи между судами, которые в противном случае были бы потеряны в огромном море сложности. Это позволяет новому флагманскому продукту HawkEye 360, Mission Space, определять, какие суда потенциально могут быть вовлечены в подозрительную деятельность, и позволяет пользователям легко определить, на чем следует сосредоточить свое внимание и продолжить расследование.

Сегодня клиенты также могут использовать Amazon Нептун ML, который обеспечивает упрощенный способ создания, обучения и применения моделей машинного обучения к данным Neptune за часы, а не недели, без необходимости изучения новых инструментов и технологий машинного обучения.

Для получения дополнительной информации о предложении HawkEye 360 ​​Mission Space см. Миссия Космос. Дополнительные сведения о том, как AWS поддерживает клиентов и партнеров в спутниковой и аэрокосмической отрасли, см. AWS Aerospace и спутник.

Если вам нужна помощь в ускорении использования машинного обучения в ваших продуктах и ​​услугах, свяжитесь с Лаборатория решений Amazon ML.


Об авторах

Тим Павлик, доктор философии, является вице-президентом по продукту в HawkEye 360. Он отвечает за концепцию, создание и реализацию всех космических инноваций HawkEye. Mission Space — флагманский продукт HawkEye 360, объединяющий все данные и аналитику из портфолио HawkEye в одном интуитивно понятном интерфейсе. Предыдущие вклады доктора Павлика в изобретения включают Myca, карьерного тренера IBM по искусственному интеллекту, монитор посттравматического стрессового расстройства для ветеранов, IBM Defense Operations Platform, Smarter Planet Intelligent Operations Center, обнаружение AI опасного разжигания ненависти в Интернете и электронную систему заказа еды STORES для военные США. Доктор Павлик получил докторскую степень в области когнитивной психологии в Колледж-Парке Университета Мэриленда.

Ян Авилез — Data Scientist в HawkEye 360. Он работает с клиентами, чтобы выделить идеи, которые можно получить, комбинируя разные наборы данных и рассматривая эти данные по-разному.

Гаурав Реле — специалист по данным в лаборатории решений Amazon ML, где он работает с клиентами AWS в разных вертикалях, чтобы ускорить использование ими машинного обучения и облачных сервисов AWS для решения своих бизнес-задач.

Дэн Форд — специалист по данным в лаборатории решений Amazon ML, где он помогает клиентам AWS National Security создавать современные решения ML.

Источник: https://aws.amazon.com/blogs/machine-learning/hawkeye-360-predicts-vessel-risk-using-the-deep-graph-library-and-amazon-neptune/

Отметка времени:

Больше от Блог машинного обучения AWS