HawkEye 360 ​​dự đoán rủi ro tàu bằng Thư viện đồ thị sâu và Amazon Neptune

Nút nguồn: 1133735

Bài đăng này được đồng viết bởi Ian Avilez và Tim Pavlick từ HawkEye 360.

HawkEye 360 ​​là nhà cung cấp chòm sao, dữ liệu và phân tích tần số vô tuyến (RF) thương mại. Các tín hiệu quan tâm của họ bao gồm radio bấm để nói tần số rất cao (VHF), hệ thống radar hàng hải, đèn hiệu Hệ thống nhận dạng tự động (AIS), đèn hiệu khẩn cấp, v.v. Các tín hiệu của thư viện quan tâm sẽ tiếp tục phát triển theo thời gian.

Của họ Không gian sứ mệnh sản phẩm được phát hành vào tháng 2021 năm XNUMX, cho phép người dùng trực quan hóa các tín hiệu và phân tích RF. Thông qua giao diện trực quan, các nhà phân tích nhiệm vụ có thể xác định hoạt động, hiểu xu hướng và cải thiện nhận thức về tình huống hàng hải bằng cách tiết lộ hành vi vô hình của con người và các hoạt động bất hợp pháp của tàu như buôn lậu, cướp biển, đánh bắt trái phép và buôn người.

Bài đăng này tóm tắt nỗ lực hợp tác giữa HawkEye 360 ​​và Phòng thí nghiệm Giải pháp Máy học (ML) của Amazon để xây dựng các khả năng học máy (ML) vào quy trình công việc phân tích của họ. Sự hợp tác bao gồm hai bước:

  1. tạo một Sao Hải vương Amazon cơ sở dữ liệu đồ thị bao gồm tất cả các tàu đã đăng ký trên thế giới để hiểu mối quan hệ giữa các tàu và phân tích xem các tàu có liên quan với nhau như thế nào.
  2. Sử dụng Thư viện đồ thị sâu (DGL) để tạo điểm rủi ro cho từng tàu. Rủi ro tàu này được sử dụng để dự đoán khả năng một tàu làm điều gì đó đáng ngờ bằng cách suy luận rủi ro thông qua mối liên hệ với các tàu đáng ngờ khác.

Giới thiệu chung

Hàng ngàn tàu vận chuyển đi khắp thế giới mỗi ngày. Việc tìm ra một vài tác nhân xấu có thể tốn nhiều thời gian và thách thức đối với các nhà phân tích. Hiểu cách thức hoạt động của mạng lưới tàu thuyền là rất quan trọng để giúp các nhà phân tích xác định loại hành vi của tàu thuyền mà họ đang thấy trong khu vực của họ. Dữ liệu này có thể giúp các nhà phân tích thông báo cho nhóm của họ về những hành vi đáng ngờ mà họ có thể mong đợi từ các tàu ở gần họ và tìm hiểu xem có tàu nào có thể tham gia vào các hoạt động rủi ro hoặc bất chính hay không. Ví dụ: nếu nhiều tàu đang ở trong khu vực hoạt động, một nhà phân tích có thể muốn biết những tàu đó đã tương tác với ai trong quá khứ. Thông tin này có thể hữu ích để xác định bất kỳ mối quan hệ gián tiếp nào giữa các tàu quan tâm. Sự tồn tại của các mối quan hệ này trên mạng tàu làm cho nó trở thành một trường hợp sử dụng tuyệt vời cho cơ sở dữ liệu đồ thị kết hợp với các kỹ thuật học sâu để suy ra các mối quan hệ. HawkEye 360 ​​đã chọn Sao Hải Vương làm cơ sở dữ liệu đồ thị của họ để lưu trữ thông tin về mối quan hệ và DGL cho khả năng mạng thần kinh đồ thị (GNN) của họ.

Dữ liệu của HawkEye 360 ​​chứa các thông tin sau về tàu:

  • Điểm hẹn giữa các tàu thuyền tập trung trên biển
  • Thông tin về tàu, bao gồm các mối quan hệ sở hữu, quản lý và điều hành
  • Các tàu đã biến mất khỏi AIS trong một khoảng thời gian đáng kể

Sử dụng sao Hải Vương làm cơ sở dữ liệu đồ thị

Neptune là một cơ sở dữ liệu đồ thị nhanh, đáng tin cậy, được quản lý đầy đủ, được tối ưu hóa để lưu trữ các mối quan hệ phức tạp và truy vấn đồ thị với độ trễ tính bằng mili giây. HawkEye 360 ​​đã qua sử dụng Amazon SageMaker Sổ ghi chép Neptune, với thư viện sổ ghi chép đồ thị tích hợp, để xử lý tập dữ liệu và tạo tập dữ liệu CSV đã sẵn sàng để tải vào cụm Neptune. Để biết thêm thông tin về các định dạng dữ liệu của Sao Hải Vương, hãy xem Tải định dạng dữ liệu. Với chức năng kỳ diệu Jupyter sổ ghi chép biểu đồ %load, HawkEye 360 ​​đã tải dữ liệu vào cụm Sao Hải Vương.

Với thư viện sổ tay đồ thị, HawkEye 360 ​​có thể truy vấn dữ liệu đồ thị bên dưới bằng ngôn ngữ truy vấn Gremlin bằng cách sử dụng %%gremlin chức năng. Hình ảnh sau đây là một ví dụ về truy vấn có thể chạy được.

Với Neptune, nhóm HawkEye 360 ​​có thể ngay lập tức nhìn thấy các kết nối ẩn giữa các tàu trong mạng. Ví dụ: các nhà phân tích thông thường chỉ có thể thấy các mạch tương tác với nhau trong dữ liệu. Đồ thị có thể đưa quá trình phân tích tiến thêm một bước bằng cách khám phá mối quan hệ giữa các mạch cách xa nhau từ ba bước nhảy (hoặc nút) trở lên.

Với dữ liệu ở Neptune, HawkEye 360 ​​đã tạo điểm rủi ro cho mỗi tàu để xác định rủi ro mà một tàu nhất định sẽ thực hiện hành vi đáng ngờ. Điều này cho phép các nhà phân tích xác định tất cả các tàu rủi ro trong lĩnh vực quan tâm. Điểm rủi ro cao hơn trong lĩnh vực quan tâm chỉ ra tàu tham gia vào các hoạt động bất chính dựa trên mối quan hệ với các tàu bất chính khác.

Sử dụng Thư viện đồ thị sâu để dự đoán rủi ro tàu

Bước đầu tiên để dự đoán rủi ro tàu là tạo tập dữ liệu biểu đồ. DGL mong đợi dữ liệu ID nút là dữ liệu thứ tự xếp hạng với các số nguyên bắt đầu từ XNUMX. Bộ dữ liệu sử dụng ba loại nút khác nhau:

  • hạch tàu
  • Nút công ty chủ sở hữu
  • Nút cờ tàu

Do có các loại nút khác nhau nên HawkEye 360 ​​đã sử dụng biểu đồ không đồng nhất để chứa các loại dữ liệu hỗn hợp. Họ đã sử dụng các mối quan hệ làm cạnh để tạo tập dữ liệu biểu đồ bằng cách sử dụng dgl.hetograph. Biểu đồ không đồng nhất bao gồm các giá trị thực cơ bản cho khoảng 1% số nút. Với các nút này, HawkEye 360 ​​đã xây dựng bài toán phân loại nút bán giám sát để phân loại rủi ro tàu. Học bán giám sát bao gồm các bộ dữ liệu có dữ liệu được gắn nhãn và không được gắn nhãn. Dữ liệu được gắn nhãn trong tập dữ liệu được sử dụng để huấn luyện mô hình và mô hình dự đoán nhãn cho dữ liệu chưa được gắn nhãn.

Đào tạo mô hình Mạng tích chập đồ thị quan hệ

Vì dữ liệu không đồng nhất nên HawkEye 360 ​​đã chọn sử dụng một dữ liệu không đồng nhất Mạng chuyển đổi đồ thị quan hệ (R-GCN) thuật toán đồ thị để đào tạo mô hình. Trong thuật toán R-GCN, mỗi loại cạnh sử dụng các trọng số khác nhau và chỉ các cạnh của cùng một loại quan hệ r được liên kết với cùng một trọng số W_r. Với thuật toán R-GCN, HawkEye 360 ​​đã đào tạo mô hình bằng cách sử dụng các giá trị thực cơ bản cho một tập hợp con các nút để tìm và phân loại tất cả các tàu có điểm rủi ro.

Sử dụng hành vi của các tàu đã biết hiện có để suy ra hành vi mới từ các tàu chưa biết cho phép HawkEye 360 ​​tạo ra thông tin chuyên sâu. Các nhà phân tích có thể xác định tàu nào có nhiều khả năng thực hiện hành vi đáng ngờ hơn chỉ bằng cách liên kết chúng với các tàu đáng ngờ đã biết.

Kết luận

Phòng thí nghiệm giải pháp ML và nhóm HawkEye 360 ​​đã hợp tác chặt chẽ để xây dựng dữ liệu biểu đồ trong Neptune và lập mô hình dữ liệu để tìm ra rủi ro cho các tàu gần đó. Các mạng biểu đồ trong các mô hình Neptune và GNN cho phép HawkEye 360 ​​tiết lộ các mối quan hệ tiềm ẩn giữa các tàu mà nếu không sẽ bị mất trong biển phức tạp rộng lớn. Điều này cho phép sản phẩm hàng đầu mới của HawkEye 360, Mission Space, xác định tàu nào có khả năng tham gia vào hoạt động đáng ngờ và cho phép người dùng dễ dàng xác định nơi cần tập trung chú ý và điều tra thêm.

Ngày nay, khách hàng cũng có thể sử dụng Amazon Sao Hải Vương ML, cung cấp một cách hợp lý để tạo, đào tạo và áp dụng các mô hình ML trên dữ liệu Neptune trong vài giờ thay vì vài tuần mà không cần tìm hiểu các công cụ và công nghệ ML mới.

Để biết thêm thông tin về việc cung cấp Mission Space của HawkEye 360, hãy xem Không gian sứ mệnh. Để biết thêm thông tin về cách AWS hỗ trợ khách hàng và đối tác trong ngành vệ tinh và hàng không vũ trụ, hãy xem Hàng không vũ trụ và vệ tinh AWS.

Nếu bạn muốn được hỗ trợ trong việc đẩy nhanh việc sử dụng ML trong các sản phẩm và dịch vụ của mình, hãy liên hệ với Phòng thí nghiệm giải pháp Amazon ML.


Về các tác giả

Tim Pavlick, Tiến sĩ, là Phó Giám đốc Sản phẩm tại HawkEye 360. Ông chịu trách nhiệm về việc hình thành, sáng tạo và sản xuất tất cả các đổi mới không gian của HawkEye. Mission Space là sản phẩm chủ lực của HawkEye 360, kết hợp tất cả dữ liệu và phân tích từ danh mục HawkEye vào một trải nghiệm RF trực quan. Những đóng góp về phát minh trước đây của Tiến sĩ Pavlick bao gồm Myca, Huấn luyện viên nghề nghiệp AI của IBM, màn hình Grit PTSD dành cho Cựu chiến binh, Nền tảng Hoạt động Quốc phòng của IBM, Trung tâm Điều hành Thông minh Smarter Planet, AI phát hiện lời nói căm thù nguy hiểm trên internet và hệ thống đặt hàng thực phẩm điện tử STORES cho Quân đội Hoa Ky. Tiến sĩ Pavlick nhận bằng Tiến sĩ Tâm lý học Nhận thức tại Đại học Maryland College Park.

Ian Avilez là Nhà khoa học dữ liệu của HawkEye 360. Anh ấy làm việc với khách hàng để nêu bật những hiểu biết sâu sắc có thể đạt được bằng cách kết hợp các bộ dữ liệu khác nhau và xem xét dữ liệu đó theo nhiều cách khác nhau.

Gaurav phát hành là Nhà khoa học dữ liệu tại Amazon ML Solution Lab, nơi ông làm việc với khách hàng AWS trên các ngành dọc khác nhau để đẩy nhanh việc sử dụng máy học và các dịch vụ Đám mây AWS để giải quyết các thách thức kinh doanh của họ.

Đan Ford là Nhà khoa học dữ liệu tại Phòng thí nghiệm Giải pháp ML của Amazon, nơi anh ấy giúp khách hàng của AWS National Security xây dựng các giải pháp ML hiện đại.

Nguồn: https://aws.amazon.com/blogs/machine-learning/hawkeye-360-predicts-vessel-risk-using-the-deep-graph-library-and-amazon-neptune/

Dấu thời gian:

Thêm từ Blog Học máy AWS