SA.

Work case

Network Monitoring System (Viễn thông)

Thiết kế kiến trúc monitoring phân tán để hợp nhất việc giám sát hạ tầng viễn thông rời rạc thành dashboard realtime và workflow vận hành rõ ràng.

Vai trò
Technical Lead
Xuất bản
Thẻ
viễn thông · monitoring · microservices · kafka · reliability

Node quản lý

1000+

Phạm vi giám sát mạng quy mô toàn quốc

Giảm downtime

-30%

Cải thiện khả năng quan sát và tốc độ phản hồi

Vấn đề

Giám sát hạ tầng viễn thông quy mô lớn bị phân mảnh và chậm. Team vận hành thiếu một góc nhìn realtime thống nhất trên các node mạng, khiến incident khó ưu tiên và tăng thời gian hiểu phạm vi ảnh hưởng.

Giải pháp

Placeholder kiến trúc giám sát mạng

Tôi thiết kế kiến trúc microservices phân tán để thu thập tín hiệu mạng, chuẩn hóa telemetry và đẩy dữ liệu vận hành vào dashboard realtime. Kafka xử lý luồng event, trong khi Prometheus và Zabbix hỗ trợ metrics, alerting và khả năng quan sát hạ tầng.

Quyết định kiến trúc

  • Collector phân tán giảm áp lực lên service trung tâm và giúp monitoring tiếp tục gần network edge hơn.
  • Kafka tách ingestion khỏi dashboard processing để spike telemetry không chặn trực tiếp trải nghiệm vận hành.
  • Prometheus và Zabbix được tích hợp để bổ sung cho monitoring, alerting và visibility hạ tầng.

Kết quả

  • Giảm downtime 30% nhờ phát hiện và phản hồi nhanh hơn.
  • Giám sát realtime trên 1000+ node.
  • Giúp team vận hành có góc nhìn hệ thống rõ hơn thay vì các đường monitoring rời rạc.