Kiến trúc và hoạt động của OneFS SupportAssist

Về cơ bản, SupportAssist dựa vào cơ sở hạ tầng và dịch vụ sau:

Dịch vụ Tên
Đông Nam Á Trình kích hoạt dịch vụ nhúng.
gạo_d Công cụ kết nối thông tin từ xa (RICE).
isi_crispies_d Điều phối viên cho các thiết bị ngoại vi dịch vụ ngẫu nhiên RICE bao gồm ESE Start.
Gconfig Cơ sở hạ tầng cấu hình tập trung OneFS.
MCP Chương trình điều khiển chính – khởi động, giám sát và khởi động lại các dịch vụ OneFS.
Tardis Dịch vụ cấu hình và cơ sở dữ liệu.
Nhật ký giao dịch Trình quản lý tác vụ cho RICE.

Trong số này, ESE, isi_crispies_d, isi_rice_d và Transaction Journal là những dịch vụ mới trong OneFS 9.5 và độc quyền cho SupportAssist. Ngược lại, Gconfig, MCP và Tardis đều là các dịch vụ cũ được nhiều thành phần OneFS khác sử dụng.

Remote Information Connectivity Engine (RICE) đại diện cho hệ sinh thái SupportAssist mới dành cho OneFS để kết nối với phần phụ trợ của Dell. Kiến trúc cấp cao như sau:

Dell’s Embedded Service Enabler (ESE) là cốt lõi của nền tảng kết nối và hoạt động như một môi giới truyền thông hợp nhất giữa cụm PowerScale và Dell Support. ESE chạy như một dịch vụ OneFS và khi khởi động, sẽ tìm kiếm máy chủ cổng tại chỗ. Nếu không tìm thấy, nó sẽ kết nối trở lại đường ống kết nối (SRS). Sau đó, dịch vụ thu thập sẽ tương tác với ESE để gửi dữ liệu đo từ xa, lấy các gói nâng cấp, truyền cảnh báo và sự kiện, v.v.

Tùy thuộc vào các tài nguyên có sẵn, ESE cung cấp chức năng cơ bản với các khả năng tùy chọn bổ sung để nâng cao khả năng bảo trì. ESE là đa luồng và mỗi loại tải trọng được xử lý bởi các luồng cụ thể. Ví dụ, các sự kiện được xử lý bởi các luồng sự kiện, các tải trọng nhị phân và có cấu trúc được xử lý bởi các luồng web, v.v. Trong OneFS, ESE được cài đặt vào /usr/local/ese và chạy dưới dạng người dùng và nhóm ‘ese’.

Trách nhiệm của isi_rice_d bao gồm lắng nghe những thay đổi của mạng, chọn các nút đủ điều kiện để giao tiếp, theo dõi thông báo từ CRISPIES và kích hoạt Trình quản lý tác vụ khi ESE sẵn sàng hoạt động.

Task Manager là thành phần cốt lõi của công cụ RICE. Trách nhiệm của nó là theo dõi các tác vụ đến được đưa vào nhật ký và chỉ định các công nhân thực hiện từng bước các tác vụ cho đến khi hoàn thành. Nó kiểm soát việc sử dụng tài nguyên (luồng Python) và phân phối các tác vụ đang chờ theo thứ tự ưu tiên.

Dịch vụ ‘isi_crispies_d’ tồn tại để đảm bảo rằng ESE chỉ chạy trên nút hoạt động RICE và không chạy ở bất kỳ nơi nào khác. Trên thực tế, nó hoạt động giống như một MCP chuyên biệt chỉ dành cho ESE và các dịch vụ liên quan đến RICE, chẳng hạn như IPA. Điều này đòi hỏi phải khởi động ESE trên nút hoạt động RICE, khởi động lại nếu nó bị sập trên nút hoạt động RICE và dừng rồi khởi động lại trên nút thích hợp nếu phiên bản hoạt động RICE di chuyển đến một nút khác. Chúng tôi đang sử dụng ‘isi_crispies_d’ cho mục đích này chứ không phải MCP, vì MCP không hỗ trợ dịch vụ chỉ chạy trên một nút tại một thời điểm.

Trách nhiệm cốt lõi của ‘isi_crispies_d’ bao gồm:

  • Bắt đầu và dừng ESE trên nút hoạt động RICE
  • Giám sát ESE và khởi động lại nếu cần. ‘isi_crispies_d’ khởi động lại ESE trên nút nếu nó bị sập. Nó sẽ thử lại một vài lần và sau đó thông báo cho RICE nếu không thể khởi động ESE.
  • Đang lắng nghe những thay đổi của gconfig và cập nhật ESE. Dừng ESE nếu không thể thực hiện thay đổi và thông báo cho RICE.
  • Giám sát các dịch vụ liên quan khác.

Trạng thái của ESE và các thiết bị ngoại vi dịch vụ RICE khác được lưu trữ trong cơ sở dữ liệu cấu hình OneFS tardis để RICE có thể kiểm tra. Tương tự, ‘isi_crispies_d’ giám sát cơ sở dữ liệu cấu hình OneFS Tardis để xem nút nào được chỉ định là nút ‘hoạt động’ RICE.

Daemon ‘isi_telemetry_d’ được khởi động bởi MCP và chạy khi SupportAssist được bật. Nó không nhất thiết phải chạy trên cùng một nút với phiên bản RICE và ESE đang hoạt động. Chỉ có một phiên bản ‘isi_telemetry_d’ sẽ hoạt động tại bất kỳ thời điểm nào và các nút khác sẽ chờ khóa.

Bạn có thể truy vấn trạng thái hiện tại và thiết lập của SupportAssist trên cụm PowerScale bằng cách sử dụng lệnh CLI ‘isi supportassist settings view’. Ví dụ:

# isi supportassist cài đặt xem
        Dịch vụ được kích hoạt: Có
       Trạng thái kết nối: đã bật
      ID phần mềm OneFS: ELMISL08224764
          Nhóm mạng: subnet0:pool0
        Chế độ kết nối: trực tiếp
           Máy chủ cổng: -
           Cổng vào: -
    Máy chủ cổng dự phòng: -
    Cổng sao lưu: -
  Bật Hỗ trợ từ xa: Có
Tạo trường hợp tự động: Có
       Đã bật tải xuống: Có

Bạn cũng có thể thực hiện việc này từ WebUI bằng cách điều hướng đến Quản lý cụm > Cài đặt chung > SupportAssist :

Bạn có thể bật hoặc tắt SupportAssist bằng cách sử dụng bộ lệnh CLI ‘isi services’. Ví dụ:

# dịch vụ isi isi_supportassist vô hiệu hóa
Dịch vụ 'isi_supportassist' đã bị vô hiệu hóa.
# dịch vụ isi isi_supportassist bật
Dịch vụ 'isi_supportassist' đã được bật.
# dịch vụ isi -a | grep supportassist
   isi_supportassist SupportAssist Monitor đã được bật

Bạn có thể kiểm tra các dịch vụ cốt lõi như sau:

# ps -auxw | grep -e 'gạo' -e 'giòn' | grep -v grep
root 8348 9,4 0,0 109844 60984 - Ss 22:14 0:00.06 /usr/libexec/isilon/isi_crispies_d /usr/bin/isi_crispies_d
gốc 8183 8.8 0.0 108060 64396 - Ss 22:14 0:01.58 /usr/libexec/isilon/isi_rice_d /usr/bin/isi_rice_d

Lưu ý rằng khi một cụm được cung cấp với SupportAssist, ESRS không còn có thể được sử dụng nữa. Tuy nhiên, những khách hàng chưa kết nối cụm của họ với Dell Support trước đây vẫn có thể cung cấp ESRS, nhưng sẽ được hiển thị thông báo khuyến khích họ áp dụng phương pháp hay nhất là sử dụng SupportAssist.

Ngoài ra, SupportAssist trong OneFS 9.5 hiện không hỗ trợ mạng IPv6, do đó các cụm được triển khai trong môi trường IPv6 nên tiếp tục sử dụng ESRS cho đến khi tích hợp SupportAssist IPv6 được giới thiệu trong bản phát hành OneFS trong tương lai.

Tác giả : Nick Trimbee