AIでネットワークパフォーマンス異常検知を自動化:楽天シンフォニーの取り組み

通信サービス事業者にとって、ネットワークパフォーマンスの監視と異常検知は顧客満足度を維持する上で不可欠です。楽天シンフォニーは、AIを活用したネットワークパフォーマンス異常検知ユースケースを開発し、この課題に革新的なソリューションを提供しています。この記事では、このユースケースの詳細と、それがもたらすメリットについて解説します。

ネットワーク問題の特定:従来のアプローチとその課題
ネットワークの各システムには、パフォーマンスを監視するためのKPI(主要業績評価指標)が設定されています。従来、多くの通信事業者はこれらのKPIを手動で監視していました。しかし、このアプローチには以下のような課題がありました。
コストと人手がかかる: 手動監視には、多くの担当者と時間が必要です。
解決時間が長い: 問題発生から対応開始までに遅延が生じ、解決に時間がかかります。
顧客体験の低下: 長期化する問題解決は、顧客満足度の低下につながります。

AI/MLによる自動化:楽天シンフォニーのソリューション
楽天シンフォニーのネットワークパフォーマンス異常検知ユースケースは、AI/MLを活用してKPIデータをリアルタイムで追跡し、パフォーマンス状態を予測します。そして、異常があれば異常スコアを割り当て、その深刻度を示します。このプロセスにより、適切な担当チームへの迅速な通知と優先順位付けが可能になり、システム障害の発生前に問題を解決できる可能性が高まります。

このユースケースは、Rakuten Symphony Performance Monitorソフトウェアの一部として提供されます。このソフトウェアは、ネットワークデバイスや環境監視システム(EMS)から生のデータを収集し、ネットワークの健全性とパフォーマンスを追跡します。ユーザー定義のKPIや閾値、レポート機能やダッシュボードのためのBIフレームワークなど、高度なカスタマイズが可能です。

AIトレーニングと推論:Rakuten AIプラットフォームとの連携
AIのトレーニングと推論には、Rakuten AIプラットフォームが使用されます。このプラットフォームは、データ管理とAIモデリングプロセスを効率化するための直感的なツールを提供し、予測AIと生成AIの両方のモデルをサポートします。

このユースケースのAIモデルは以下の機能を備えています。
* 過去のKPIデータからベースラインメトリックを学習
* 新しいデータから継続的に学習
* 季節性や条件、トレンドを自動的に理解
* 各異常の重要度(重み)に基づいて異常スコアを関連付ける
* 検出された異常に基づいてネットワークチームにアラートを送信し、定義されたSLAに従って是正措置を講じる

多様なKPIの監視とユーザーフレンドリーなダッシュボード
このユースケースは、ドメインや地域を跨いでの時系列パターンを把握し、多数のKPIを監視できます。これにより、単一のKPI内の異常を検出するだけでなく、異常の原因となっている可能性のあるKPIについても洞察を提供します。また、ユーザーフレンドリーなダッシュボードが提供され、オペレーターは迅速かつ積極的に障害に対応できます。

実績と今後の展望
ネットワークパフォーマンス異常検知は、Rakuten Mobileネットワークで1年以上運用され、その価値を実証しています。現在、様々なチームへの展開が進んでいます。

顧客満足度向上への貢献
KPIを用いたネットワークパフォーマンスの把握は、ネットワークの運用状況と障害発生の可能性のある条件を判断する上で効果的です。しかし、手動によるデータ処理は時間がかかり、エラーが発生しやすいものです。ネットワークに影響が生じている時間は、顧客の不満につながり、解約の原因となります。楽天シンフォニーのネットワークパフォーマンス異常検知ユースケースは、AI/MLを活用することでパフォーマンスの問題を理解し、季節性を考慮しながら適切なチームにアラートを送信し、根本的な問題を解決します。このユースケースは、平均修復時間を大幅に短縮し、顧客満足度向上に大きく貢献します。

まとめ
楽天シンフォニーのAIによるネットワークパフォーマンス異常検知ソリューションの一番のアピールポイントは、「システム障害の発生前に問題を解決できる可能性を高め、平均修復時間を大幅に短縮し、顧客満足度向上に大きく貢献する」という点です。従来の手動監視では、どうしても人手と時間がかかり、問題発生から対応開始までに遅延が生じていました。これは顧客体験の低下に直結し、通信サービス事業者にとって大きな課題でした。楽天シンフォニーのソリューションは、AI/MLを活用することでこの課題を解決します。リアルタイムのKPIデータ追跡とパフォーマンス状態予測、異常スコアによる深刻度表示、適切な担当チームへの迅速な通知といった機能により、予防的な対応を可能にします。つまり、障害が顧客に影響を与える前に、問題を未然に防ぐことができるのです。さらに、AIは過去のデータから学習し、季節性やトレンドを自動的に理解することで、より精度の高い異常検知を実現します。これにより、誤検知を減らし、本当に対応が必要な問題に集中することができます。結果として、平均修復時間が短縮され、顧客はより安定したネットワークサービスを享受できるようになります。まさに、顧客満足度向上に直結するソリューションと言えるでしょう。


楽天シンフォニーのAI活用トップ25:ネットワークパフォーマンス異常検知
https://symphony.rakuten.com/blog/rakuten-symphonys-top-25-ai-initiatives-network-performance-anomaly-detection

Network Performance Anomaly Detection | Rakuten Symphony | Top 25 AI initiativesLearn more about Rakuten Symphony Network Performance Anomaly Detection use case which uses AI/ML to automate the monitoring of network performance KPIs to identify unusual pattern…