Nói về CloudIQ: Bây giờ chúng ta đang nói về khả năng quan sát cơ sở hạ tầng APEX AIOps

Giới thiệu

Tôi đã viết một số blog như một phần của loạt bài Talking CloudIQ . Bắt đầu từ blog này, tôi sẽ không thảo luận về CloudIQ nữa. Không phải vì tôi không thích nó hay vì nó đã biến mất, mà vì nó đã được đổi tên thành một phần của bộ Dell APEX AIOps mới và được cải tiến bằng Generative AI. Cái được gọi là CloudIQ hiện được gọi là APEX AIOps Infrastructure Observability. Đừng lo, những gì tồn tại dưới tên CloudIQ vẫn tồn tại và vẫn hỗ trợ toàn bộ danh mục cơ sở hạ tầng của Dell. Nó vẫn khả dụng mà không mất thêm phí đối với các tài sản theo hợp đồng ProSupport hoặc hợp đồng cao hơn.

Bộ phòng

Dell APEX AIOps là một bộ phần mềm quản lý sự cố và khả năng quan sát do AI điều khiển giúp đơn giản hóa các hoạt động CNTT. Vậy, nó thực sự là gì? Đó là sự tích hợp của Khả năng quan sát cơ sở hạ tầng, Khả năng quan sát ứng dụng và Quản lý sự cố.  

Tại sao lại thay đổi?

Với việc mua lại Moogsoft vào tháng 8 năm 2023, Dell đã mở rộng các ứng dụng dựa trên AIOps của mình để bao gồm quản lý vòng đời sự cố. Với thông báo gần đây về APEX AIOps tại Dell Technologies World 2024, chúng tôi đã công bố chức năng mới cung cấp khả năng quan sát toàn bộ ngăn xếp ứng dụng. Thông qua quan hệ đối tác với IBM, Infrastructure Observability sẽ tích hợp với phần mềm quan sát ứng dụng Instana phổ biến của IBM dưới dạng dịch vụ, đưa khả năng hiển thị ứng dụng trực tiếp vào giao diện người dùng AIOps Infrastructure Observability (trước đây là CloudIQ).

Khả năng quan sát cơ sở hạ tầng APEX AIOps

Như đã đề cập, tất cả các chức năng CloudIQ trước đây đều hoàn toàn nguyên vẹn như AIOps Infrastructure Observability. Đây vẫn là công cụ do AI điều khiển cung cấp khả năng giám sát chủ động cơ sở hạ tầng Dell của bạn. Công cụ này cung cấp thông tin chi tiết và khuyến nghị về tình trạng hệ thống, an ninh mạng và tính bền vững. Ví dụ, thuật toán AI cung cấp điểm số tình trạng dựa trên trạng thái của các thành phần, dung lượng, hiệu suất, cấu hình và bảo vệ dữ liệu của hệ thống. Ngoài ra còn có các khuyến nghị để khắc phục các sự cố ảnh hưởng đến hệ thống hoặc tránh các sự cố tiềm ẩn có thể ảnh hưởng đến hoạt động trong tương lai.

Sẽ sớm có một công cụ AI tạo sinh, được gọi là AIOps Assistant trong giao diện người dùng Infrastructure Observability. Công cụ này sẽ xây dựng câu trả lời cho các truy vấn của bạn về hệ thống Dell dựa trên hơn 133.000 bài viết trong cơ sở kiến ​​thức, sách trắng và nhiều hơn nữa!

Với sự hỗ trợ của webhook và REST API, thông tin từ AIOps Infrastructure Observability có thể tích hợp với các công cụ CNTT khác của bạn để cho phép tạo phiếu dịch vụ tự động, leo thang, cập nhật CMDB và khắc phục sự cố.

Hình 1. Trang chủ APEX AIOps Observability

Khả năng quan sát ứng dụng APEX AIOps

APEX AIOps Application Observability giúp bạn tối ưu hóa hiệu suất ứng dụng để giảm rủi ro, tăng tốc đổi mới và tăng năng suất bằng cách cung cấp khả năng quan sát toàn bộ ngăn xếp được tích hợp với cơ sở hạ tầng Dell của bạn. Việc tích hợp khả năng hiển thị ứng dụng vào giao diện người dùng Infrastructure Observability cho phép bạn xem cấu trúc ngăn xếp đầy đủ cho từng ứng dụng: lớp ứng dụng, cơ sở hạ tầng Dell cơ bản và trạng thái hoạt động của từng ứng dụng. Khả năng hiển thị này cho phép bạn xác định xem các sự cố ảnh hưởng đến ứng dụng có bắt nguồn từ cơ sở hạ tầng hay từ chính ứng dụng và cách xử lý. Bạn có thể nhanh chóng xem tổng quan về các ứng dụng của mình với tình trạng hoạt động và “tín hiệu vàng” của chúng: tỷ lệ cuộc gọi, tỷ lệ cuộc gọi lỗi và độ trễ.

Application Observability đã tích hợp các cảm biến hỗ trợ hơn 300 công nghệ lớp ứng dụng. Bao gồm các nền tảng đám mây và ảo hóa, hệ điều hành, proxy web, nhà cung cấp đám mây, kho dữ liệu, nền tảng nhắn tin, trình thu thập OSS, thiết bị di động, v.v.

Hình 2. Chế độ xem Ứng dụng quan sát AIOps

Quản lý sự cố APEX AIOps

AIOps Incident Management giúp bạn tối ưu hóa tính khả dụng của toàn bộ cơ sở hạ tầng (Dell, không phải Dell và cơ sở hạ tầng đám mây công cộng) thông qua quy trình vòng đời sự cố do AI điều khiển. Quản lý sự cố thu thập dữ liệu từ các công cụ CNTT của Dell và nhiều nhà cung cấp và sử dụng AI để giảm tiếng ồn sự kiện và cảnh báo thành các sự cố có thể hành động duy nhất, xác định nguyên nhân gốc rễ, cải thiện sự cộng tác và tự động hóa khắc phục. Điều này cung cấp cho các nhóm CNTT trên khắp các silo một bảng điều khiển duy nhất để kiểm tra nguyên nhân gốc rễ.

Nó được tích hợp sẵn với hơn 100 công cụ quản lý và giám sát CNTT của bên thứ ba phổ biến để thu thập dữ liệu. AIOps Incident Management cũng được tích hợp sẵn với nhiều công cụ ITSM phổ biến (ví dụ: ServiceNow, Remedy và JIRA) để khởi tạo phiếu dịch vụ có thể thực hiện được, các công cụ giao tiếp (bao gồm PagerDuty, Slack, Microsoft Teams) để cung cấp thông báo và leo thang, và các công cụ tự động hóa (như Ansible và Terraform) để khởi tạo hành động khắc phục tự động. Với tích hợp gốc với AIOps Observability Webhooks, một nguồn dữ liệu khác từ cơ sở hạ tầng Dell của bạn được tích hợp nhanh chóng vào AIOps Incident Management.

Hình 3. Phòng tình huống quản lý sự cố AIOps 

Phần kết luận

Trong khi CloudIQ đã được đổi tên thành APEX AIOps Infrastructure Observability, nó vẫn duy trì chức năng được đánh giá cao, tiếp tục mở rộng bộ tính năng và vẫn khả dụng cho các tài sản Dell của bạn theo hợp đồng ProSupport hoặc hợp đồng cao hơn. Bằng cách tích hợp Infrastructure Observability với các công cụ Application Observability và Incident Management, APEX AIOps Suite mới thành lập hiện cung cấp khả năng hiển thị toàn bộ ngăn xếp ứng dụng và quy trình quản lý sự cố. Những cải tiến này cung cấp cho bạn khả năng hiển thị trên toàn bộ ứng dụng và cơ sở hạ tầng cơ bản, khả năng giảm âm thanh cảnh báo trong môi trường nhiều nhà cung cấp, xác định nguyên nhân gốc rễ và thực hiện khắc phục tự động.