Optus が AWS のネットワーク データ分析プラットフォームを使用してブロードバンドとモバイルのカスタマー エクスペリエンスを向上させる方法

ソースノード: 886719

これは、Optus IT イノベーション チームの開発マネージャーである Rajagopal Mahendran が共同執筆したゲスト ブログ投稿です。


Optus は、世界で最も急速に成長し、最もダイナミックな地域の 21 つで事業を展開し、10.4 か国に拠点を置く Singtel グループの一員です。 Optus は、中核となる通信サービスだけでなく、クラウド、サイバーセキュリティ、デジタル広告を含む広範なデジタル ソリューションを企業に提供し、エンターテインメントやモバイル金融サービスも何百万もの消費者に提供しています。 Optus は、1.1 万を超える顧客にモバイル通信サービスを提供し、1 万を超える家庭および企業にブロードバンド サービスを提供しています。さらに、Optus Sport は XNUMX 万人近いファンをプレミア リーグ、国際サッカー、フィットネス コンテンツに結びつけています。

この投稿では、Optus がどのように使用したかを見ていきます。 アマゾンキネシス AWS 上のデータレイクにネットワーク関連データを取り込んで分析し、顧客エクスペリエンスとサービス計画プロセスを向上させます。

課題

電気通信プロバイダーにとっての共通の課題は、サービスの品質と顧客が経験している問題を正確にリアルタイムで把握することです。ホーム ネットワークとブロードバンド接続の品質は、特に新型コロナウイルス感染症のパンデミック下で仕事、家族や友人とのつながり、エンターテイメントなどでホーム ネットワークへの依存が高まっていることを考慮すると、顧客の生産性と満足度に大きな影響を与えます。

さらに、ネットワーク運用チームや計画チームは、新しい展開を計画したり、現在のデバイス群を管理したりするための適切なデータや洞察にアクセスできないことがよくあります。

ネットワーク分析プラットフォームは、トラブルシューティングと計画のデータと洞察をほぼリアルタイムで Optus チームとその顧客に提供し、修正にかかる平均時間を短縮し、顧客エクスペリエンスを向上させるのに役立ちます。適切なデータと洞察があれば、サポート スタッフと顧客は、多くの質問をしてサポート コールを開始するのではなく、サービスと顧客のホーム ネットワークの最新かつ正確なビューを得ることができるため、顧客のエクスペリエンスが向上します。

Optus 内のサービス所有者チームは、このプラットフォームから得られた洞察と傾向を使用して、将来に向けてより適切な計画を立て、顧客に高品質のサービスを提供することもできます。

設計上の考慮事項

この課題とその要件に対処するために、当社は現在のバッチ収集および処理システムをストリームベースのほぼリアルタイムの処理システムに変換し、サポート システムと顧客アプリケーションが情報を提供できるようにするための API を導入するプロジェクトに着手しました。ネットワークとサービスのステータスの最新のスナップショット。

次の機能要件と非機能要件がありました。

  • 新しいプラットフォームは、将来の種類の顧客機器からのデータ キャプチャだけでなく、新しい取り込み方法 (新しいプロトコルと頻度) や新しい形式のデータもサポートできなければなりません。
  • データを利用して洞察を生成するために、複数のコンシューマ (サポート スタッフと顧客のアプリケーション、運用およびビジネスのレポート用のほぼリアルタイムの API) をサポートする必要があります。目的は、プラットフォームが問題を積極的に検出し、サポート スタッフと顧客に適切なアラートを生成することです。
  • データが到着すると、データからの洞察は数秒 (最大 5 秒) で API の形式で準備されます。
  • 新しいプラットフォームは、ノードやアベイラビリティーゾーンなどのインフラストラクチャの一部に障害が発生した場合でも、処理を継続できる十分な回復力を備えている必要があります。
  • デバイスとサービスの数の増加と、デバイスからのより頻繁な収集をサポートできます。
  • ビジネスとテクノロジーにわたる小規模な部門横断型チームがこのプラットフォームを構築し、実行します。長期的には、インフラストラクチャと運用上のオーバーヘッドを最小限に抑える必要があります。
  • パイプラインは可用性が高く、ダウンタイムなしで新しいデプロイメントを可能にする必要があります。

ソリューションの概要

プラットフォームの目標と設計上の考慮事項を念頭に置き、チームの不要な運用オーバーヘッドを回避し、中核的なビジネス ニーズに集中するために、可能な限り AWS の高次サービスとサーバーレス サービスを使用することにしました。これには、ストリームの取り込みと処理に Kinesis ファミリーのサービスを使用することが含まれます。 AWSラムダ 処理用。 Amazon DynamoDB, Amazon リレーショナル データベース サービス (Amazon RDS)、および Amazon シンプル ストレージ サービス (Amazon S3) データの永続化のため。そして AWS エラスティック Beanstalk & アマゾンAPIゲートウェイ アプリケーションと API の提供用。次の図は、ソリューション全体を示しています。

このソリューションは、事前定義された期間に数千の顧客ネットワーク機器 (ホーム ルーター) からログ ファイルを取り込みます。お客様の機器は、ログ ファイルを転送するために単純な HTTP PUT および POST リクエストを送信することしかできません。これらのファイルを受信するには、Auto Scaling グループで実行されている Java アプリケーションを使用します。 アマゾン エラスティック コンピューティング クラウド (Amazon EC2) インスタンス。いくつかの初期チェックの後、受信側アプリケーションはクレンジングとフォーマットを実行し、ログ ファイルを Amazon Kinesisデータストリーム.

さまざまなデバイスやファイル形式を柔軟にサポートできるよう、取り込みレイヤーでカスタム レシーバー アプリケーションを意図的に使用します。

アーキテクチャの残りの部分を理解するために、予想される洞察を見てみましょう。このプラットフォームは、次の XNUMX 種類の洞察を生成します。

  • 個々の洞察 – このカテゴリで回答される質問は次のとおりです。
    • 過去 15 分間に特定の顧客のデバイスで発生したエラーは何回ありますか?
    • 最後のエラーは何でしたか?
    • 特定の顧客の家では現在何台のデバイスが接続されていますか?
    • 特定の顧客デバイスによってキャプチャされた転送/受信レートはどれくらいですか?
  • 基本的な洞察 – グループまたはユーザー ベース全体に関するこのカテゴリの質問には次のものが含まれます。
    • 過去 24 時間にサービス中断を報告した顧客のデバイスは何台ありますか?
    • 過去 6 か月間で最も多くのエラーが発生したデバイスの種類 (モデル) はどれですか?
    • 昨夜、デバイスのグループでパッチを更新した後、エラーは報告されましたか?メンテナンスは成功しましたか?

アーキテクチャの一番上のレーンには、個々の洞察を生成するパイプラインが表示されます。

Lambda 関数のイベントソースマッピングは、Kinesis データストリームからのレコードを消費するように構成されています。この機能は、レコードを読み取り、フォーマットし、必要な洞察に基づいて準備します。最後に、結果を Amazon S3 の場所に保存し、Amazon S3 に保存されている実際のデータの概要とメタデータを保持する DynamoDB テーブルも更新します。

パフォーマンスを最適化するために、Lambda イベント ソース マッピングで XNUMX つのメトリクスを設定しました。

  • バッチサイズ – 各バッチで関数に送信するレコードの数を表示します。これは、より高いスループットの実現に役立ちます。
  • シャードごとの同時バッチ数 – 同じシャードからの複数のバッチを同時に処理するため、処理の高速化に役立ちます

最後に、API は API Gateway 経由で提供され、Elastic Beanstalk でホストされている Spring Boot アプリケーション上で実行されます。将来的には、API 呼び出し間で状態を保持する必要がある可能性があるため、サーバーレス アプリケーションの代わりに Elastic Beanstalk を使用します。

アーキテクチャの一番下のレーンは、基本レポートを生成するパイプラインです。

を使用しております Amazon Kinesis データ分析、ストリーミング データに対してステートフルな計算を実行し、指定された時間枠での転送速度やエラー率などの特定のメトリクスを要約します。これらの概要は、 アマゾンオーロラ ダッシュボードとレポートの目的に適したデータ モデルを備えたデータベース。

その後、分析情報は、Elastic Beanstalk 上で実行される Web アプリケーションを使用してダッシュボードに表示されます。

教訓

サーバーレスパターンと高次サービス、特に Lambda、Kinesis Data Streams、Kinesis Data Analytics、DynamoDB を使用することで、アーキテクチャに大きな柔軟性がもたらされ、大きなモノリスバッチジョブではなくマイクロサービスに移行することができました。

この移行は、運用およびサービス管理のオーバーヘッドを大幅に削減するのにも役立ちました。たとえば、リリース以来ここ数か月間、このプラットフォームの顧客はサービスの中断を経験していませんでした。

また、このソリューションにより、単一の小さなチームがシステムを開発して実行するという意味で、より多くの DevOps とアジャイルな作業方法を採用することができました。これにより、組織はこの分野でより機敏かつ革新的になれるようになりました。

また、開発と生産の過程で、共有する価値のあるいくつかの技術的なヒントも発見しました。

結果と利点

現在、お客様が経験している固定ネットワークとモバイル ネットワークのパフォーマンスをほぼリアルタイムで確認できるようになりました。以前は、遅延のあるバッチ モードで受信したデータのみ、また独自のネットワーク プローブと機器から送信されたデータのみがありました。

変更が発生したときのネットワークのほぼリアルタイムのビューにより、当社の運用チームは、より高い信頼性と頻度で顧客デバイス全体のアップグレードとメンテナンスを実行することもできます。

最後に、当社の計画チームはこれらの洞察を使用して、さまざまな機器やサービスの正確な最新のパフォーマンス ビューを作成します。これにより、当社のサービス計画チームはコストを最適化し、ベンダーやサービスプロバイダーとより適切に交渉し、将来の計画を立てることができるため、お客様により良い価格で高品質なサービスを提供することができます。

今後

ネットワーク分析プラットフォームは数か月間運用され、現在は安定しているため、より多くの洞察と新しい使用例が求められています。たとえば、大規模なイベント (スポーツ イベントなど) でのキャパシティをより適切に管理するためのモバイルの使用例を検討しています。目的は、当社のチームがデータ主導型となり、これらのイベントでのキャパシティのニーズにほぼリアルタイムで対応できるようにすることです。

もう XNUMX つの需要領域は、予知メンテナンスに関するものです。私たちは、AWS Machine Learning のサービス ポートフォリオを使用して、これらのパイプラインに機械学習を導入し、より迅速かつ正確に洞察を得ることができるようにしたいと考えています。


著者について

ラジャゴパル・マヘンドラン Optus IT イノベーション チームの開発マネージャーです。 Mahendran は、さまざまな組織で 14 年以上の経験があり、ビッグ データ、ストリーミング データ アプリケーション、モバイル、クラウド ネイティブ アプリケーションにおける実証済みのテクノロジから最先端のテクノロジを使用して、中規模から超大規模までのエンタープライズ アプリケーションを提供しています。彼の情熱は、より良い生活のためにテクノロジーを使用して革新的なアイデアを推進することです。余暇には、ブッシュウォーキングや水泳が大好きです。

モスタファ・サフィプール シドニーを拠点とする AWS のソリューションアーキテクトです。彼は顧客と協力して、テクノロジーと AWS を使用してビジネス成果を実現します。過去 XNUMX 年間にわたり、ANZ 地域の多くの大規模組織が AWS 上でデータ、デジタル、エンタープライズワークロードを構築できるよう支援してきました。

マスドゥール・ラハマン・サイエム AWS の分析スペシャリスト ソリューション アーキテクトです。彼は AWS の顧客と協力して、データおよび分析プロジェクトに関するガイダンスと技術支援を提供し、AWS を使用する際のソリューションの価値を向上させるのを支援しています。彼は分散システムに情熱を持っています。彼は読書も好きで、特に古典的な漫画本が好きです。

出典: https://aws.amazon.com/blogs/big-data/how-optus-improves-broadband-and-mobile-customer- experience-using-the-network-data-analytics-platform-on-aws/

タイムスタンプ:

より多くの AWS