Tran Nghi's Site  - Make notes and share experience

Hệ thống giám sát cảnh báo sự cố

This post is also available in: English

(Bài viết sưu tầm) – Giới thiệu hệ thống giám sát cảnh báo sự cố

A) Nhu cầu:

Xu hướng hội nhập, tiến bộ khoa học kỹ thuật được áp dụng rộng rãi trong các doanh nghiệp đặc biệt việc ứng dụng công nghệ thông tin không còn xa lạ với mỗi doanh nghiệp từ nhỏ đến lớn. Nền thương mại điện tử phát triển mạnh, dịch vụ mua sắm online phát triển cho ra đời hàng loạt website bán hàng, giới thiệu sản phẩm, giáo dục, y tế ….

Sự phát triển game online, các nhà cung cấp dịch vụ đầu số… Bên cạnh sự phát triển về mặt tích cực đó nảy sinh ra những hình thức cạnh tranh xấu nhằm mục đích kinh tế dìm hàng đối thủ.

VD: hàng loạt website thương mại điện tử bị tấn công trong những năm qua.

Hạ tầng mạng, máy chủ cũng theo xu hướng đó ngày một trở lên to lớn điển hình là sự phát triển của các trung tâm IDC lớn như IDC vietttel, VDC… Tình trạng hoạt động của hệ thống trên phải luôn đươc đảm bảo thông suốt, đặc biệt là vấn đề phát hiện nguyên nhân sự cố để đội ngũ kỹ thuật có thể nhanh chóng khắc phục giảm thiểu tối đa thời gian time down và chi phí xây xựng hệ thống.

Vấn đề phát hiện cảnh báo sự cố nghĩ có vẻ đơn giản nhưng cần được bố trí hợp lý với hạ tầng mạng mỗi công ty sao cho hiệu quả nhất và chi phí rẻ nhất.

B) Triển khai:

Hiện nay bất cứ doanh nghiệp lớn hay nhỏ nào đều có 1 cơ sở hạ tầng mạng nhất định đi kèm là đội ngũ kỹ thuật riêng, hoặc có nhiều doanh nghiệp thuê đội ngũ kỹ thuật bên ngoài giám sát các tài nguyên về IT.

Vấn đề ở đây là không phải thời gian nào cũng có người giám sát một vài website hay vài con server .Thậm chí với những hệ thống lớn bố trí nhân sự trực cũng không thể nào phát hiện được lỗi khi sự cố xảy ra mà không nhờ các công nghệ hay giải pháp cảnh báo.

Điều đáng mừng là hiện nay có rất nhiều phần mềm hỗ trợ rất tốt cho việc cảnh báo sự cố hạ tầng IT.

1) Hệ thống cảnh báo sự cố thời gian thực:

+ Hiện nay có rất nhiều tool, software hỗ trợ cho việc cảnh báo theo thời gian thực.

Tác dụng: phát hiện sự cố và đưa ra cảnh báo dạng âm thanh hoặc tin nhắn, email cho đối tượng cần thông tin cảnh báo đó( có thể là nhân viên IT, chủ 1 website hay nhân viên trực….).

Ưu điểm của hệ thống này là cảnh báo kịp thời cho bên chịu trách nhiệm biêt được sự cố đang và đã xảy ra để lên kế hoạch xử lý kịp thời.

+ Một vài công cụ điển hình cảnh báo sự cố:

IPsentry:

Đây là phần mềm có tính phí chạy trên hệ điều hành window có tác dụng cảnh báo dạng âm thanh.Chức năng của nó khá đầy đủ bao gồm cảnh báo thông qua các giao thức: SMTP, DNS, ICMP-ping…. Việc cài đặt và cấu hình chương trình khá đơn giản.

Để tìm hiểu thêm về ipsentry các bạn có thể tự download về cài đặt nếu sử dụng lâu dài có thể dung key lậu hoặc mua bản quyền tùy vào hoàn cảnh.

Tin nhắn SMS:

Phương pháp này áp dụng cho những nhân viên không phải lúc nào cũng ngồi máy tính hoặc các đối tượng sở hữu một vài website không xây dựng hệ thống cảnh báo riêng.Nó cũng có thể áp dụng cho các đối tượng là chủ doanh nghiệp nhằm giám sát chất lượng hệ thống có đảm bảo qua đó đánh giá chất lượng làm việc nhân viên IT.

Hệ thống cảnh báo qua SMS được một số nhà cung cấp dịch vụ nội dung số chào bán để có thể sử dụng chức năng này người sử dụng phải trả một khoản phí nhất định.

Cách này tuy mất phí nhưng rất tiện lợi cho đối tượng sử dụng đặc biệt là không phải lúc nào cũng túc trực để theo dõi tình trạng của hạ tầng IT.

Cảnh báo qua email:

Cách này khá hay nhưng không hiệu quả vì không phải lúc nào cũng check mail liên tục được.

Cơ chế hoạt động của nó là các phần mềm giám sát sẽ đưa ra dạng cảnh báo dưới dạng email gửi tới các tài khoản được cấu hình sẵn.

Ví dụ: Hệ thống cảnh báo Nagios cho phép thiết lập cấu hình cảnh báo bằng âm thanh hoặc email khi có dấu hiệu bất thường về trạng thái hạ tầng IT.

2) Hệ thống cảnh báo,giám sát theo log, đồ thị:

Ưu điểm hệ thống này là lưu lại thông tin trạng thái sức khỏe của hạ tầng IT vào log dưới dạng biểu đồ.

Nhược điểm: một số phần mềm giám sát bắt buộc người chịu trách nhiệm phải check log thường xuyên nên chưa tự động hóa được.

Để nắm bắt được trạng thái hạ tầng IT trong khoảng thời gian vận hành và đánh giá được tình trạng cơ sở hạ tầng thì việc đưa các công cụ giám sát hiển thị dạng đồ thị rất quan trọng.

Ở đây mình xin nhắc tới luôn các công cụ hỗ trợ giám sát nổi tiếng và mạnh nhất:

Đầu tiên phải kể đến Nagios:

Nagios đã loại bỏ được tính thụ động của hệ thống giám sát lưu log nói chung vì nó được tích hợp hệ thổng cảnh báo bằng âm thanh và tiến xa hơn nó cho phép cảnh báo bằng email.

Đây là bộ công cụ phát triển trên nền tảng linux ( chạy tốt nhất trên centos) dưới dạng mã ngồn mở hoàn toàn miễn phí.

Việc cài đặt chương trình này khá phức tạp và yêu cầu cao về kiến thức linux cũng như sự hỗ trợ của các loại tài liệu cài đặt.

Nếu bạn không có kiến thức đủ để setup hệ thống cảnh báo như Nagios thì có thể tải bản Nagiosxi.Đây là bản ảo hóa Nagios được tích hợp sẵn trong hệ điều hành centos chỉ cần mở bằng máy ảo trên vmware workstation hoặc vmware esxi. Bản này dung thử 60 ngày còn listen của nó khá đắt chỉ nên sử dụng để học tập.

Link down:

https://www.nagios.com/downloads/nagios-xi/

Thiết bị: route, switch, server, website, các service dns,dhcp….

Chức năng tiêu biểu: Giám sát traffic qua các card mạng, thông số CPU, bộ nhớ ram, dung lượn ổ cứng, request đến data base…..

Hệ thống giám sát Cacti:

Chức năng và nguyen lý hoạt động của cacti khá giống nagios nhưng cacti dễ cài đặt hơn.

Tuy cacti không có đầy đủ các chức năng như nagios( vi dụ: giám sát lượng request đến server database).Nhưng giao diện dễ sử dụng nên được áp dụng rộng rãi trong hệ thống giám sát của các doanh nghiệp.

Hiện nay để giám sát lượng traffic của server khách hàng tại một số data center đã ứng dụng cacti vì tính dễ cấu hình cài đặt của nó.

Hệ thống PRTG network monitor:

Được phát triển trên cả nền tảng window là bản có thu phí.

Giao diện của chương trình này không được hoàn hảo như 2 hệ thống trên.

Ưu điểm là nó dễ cài đặt vì được phát triển cả trên window.Đây chính là lợi thế cho những bạn đang muốn tìm hiểu về chủ đề này mà không có kiến thức về linux.

– Ngoài ra còn rất nhiều phần mềm khác có chức năng giám sát cảnh báo khi hạ tầng IT xảy ra sự cố mình chỉ nêu lên 3 phần mềm tiêu biểu như trên.

3) Hệ thống giám sát tích hợp trong phần cứng:

– Nói đến các loại thiế bị này phải nhắc tơi thiết bị cảnh báo tấn công của bkav vừa phát hành (network inspector). Cụ thể nó hoạt động như thế nào mình cũng không rõ lắm. Các thiết bị cảnh báo tích hợp sẵn trong phần cứng có đặc điểm chạy ổn định, dễ sử dụng nhưng giá thành cũng là một vấn đề vì không phải doanh nghiệp nào cũng quan tâm đến vấn đề tấn công mạng hay phải cân nhắc để chi ra các khoản chi phí đầu tư hợp lý. Để phát triển được thị trường bắt buộc các doanh nghiệp phải tạo được uy tín với khách hang.

– Ngoài ra các thiết bị firewal đắt tiền của một số hãng như juniper, cisco, cũng có cơ chế cảnh báo sư cố khi băng thông quá hạn mức cho phép…

Bài viết trên mình tự soạn thảo theo kinh nghiệm giới thiệu một số mô hình giám sát hạ tầng IT chắc chắn còn nhiều thiếu sót.

Các hình ảnh chỉ mang tính minh họa.

Message