Công bố các bản nâng cấp không gây gián đoạn dựa trên Drain (NDU)

Trong quy trình làm việc NDU, các nút được khởi động lại hoặc dịch vụ giao thức phải tạm thời dừng lại. Cho đến nay, điều này đòi hỏi phải gián đoạn đối với các máy khách được kết nối với nút khởi động lại.

NDU dựa trên drain cung cấp cơ chế ngăn các nút khởi động lại hoặc khởi động lại dịch vụ giao thức cho đến khi tất cả các máy khách SMB ngắt kết nối khỏi nút. Vì một máy khách SMB duy nhất không ngắt kết nối có thể khiến quá trình nâng cấp bị trì hoãn vô thời hạn, nên giờ đây người dùng được cung cấp các tùy chọn để khởi động lại nút mặc dù máy khách vẫn đang hoạt động.

Bản nâng cấp dựa trên drain hỗ trợ các trường hợp sau và khả dụng cho WebUI, CLI và PAPI:

  • Giao thức SMB
  • Nâng cấp OneFS
  • Nâng cấp phần mềm
  • Cụm khởi động lại
  • Nâng cấp kết hợp (OneFS và phần mềm)

Nâng cấp dựa trên drain được xây dựng dựa trên quy trình nâng cấp song song, được giới thiệu trong OneFS 8.2.2.0, cung cấp hoạt động nâng cấp và khởi động lại nút song song trên các vùng lân cận nút. Nó nâng cấp tối đa một nút cho mỗi vùng lân cận tại bất kỳ thời điểm nào. Bằng cách đó, nó có thể rút ngắn thời gian nâng cấp và đảm bảo rằng người dùng cuối có thể tiếp tục truy cập vào dữ liệu của họ. Càng nhiều vùng lân cận nút trong một cụm, thì càng có nhiều hoạt động song song có thể xảy ra.

Hình 1 cho thấy cách thức hoạt động. Trong ví dụ này, có hai khu phố trong cụm PowerScale 6 nút. Các nút từ 1 đến 3 thuộc về Khu phố 1; Các nút từ 4 đến 6 thuộc về Khu phố 2.

Hình 1: Một ví dụ về NDU dựa trên Drain

Bạn có thể sử dụng lệnh sau để xác định mối tương quan giữa các nút PowerScale và vùng lân cận (miền lỗi):

# sysctl efs.lin.lock.initiator.coordinator_weights

Sau khi quá trình nâng cấp dựa trên drain được bắt đầu, nhiều nhất một nút từ mỗi lân cận sẽ nhận được lệnh đặt chỗ cho phép các nút nâng cấp đồng thời. OneFS sẽ không khởi động lại các nút này cho đến khi số lượng máy khách SMB là “0”. Trong ví dụ này, Node 3 và Node 4 nhận được lệnh đặt chỗ để nâng cấp cùng lúc. Tuy nhiên, có một kết nối SMB cho Node 3 và hai kết nối SMB cho Node 4. Chúng sẽ không thể khởi động lại cho đến khi các kết nối SMB đạt đến “0”. Ở giai đoạn này, có ba tùy chọn:

  • Chờ – Chờ cho đến khi số lượng kết nối SMB đạt đến “0” hoặc đạt đến giá trị thời gian chờ xả. Giá trị thời gian chờ xả là tham số có thể cấu hình cho mỗi quy trình nâng cấp. Đây là thời gian chờ tối đa. Nếu thời gian chờ xả được đặt thành “0”, nghĩa là phải chờ mãi mãi.
  • Delay drain – Thêm nút vào danh sách delay để trì hoãn việc xả client. Quá trình nâng cấp sẽ tiếp tục trên một nút khác trong vùng lân cận này. Sau khi tất cả các nút không bị delay được nâng cấp, OneFS sẽ quay lại nút trong danh sách delay.
  • Bỏ qua quá trình thoát – Ngừng chờ máy khách di chuyển khỏi nút thoát và khởi động lại ngay lập tức.

Để chạy NDU dựa trên drain, hãy làm theo các bước sau:

1. Trong OneFS CLI, hãy chạy lệnh sau để thực hiện nâng cấp dựa trên drain. Trong ví dụ này, chúng tôi đã đặt giá trị thời gian chờ drain là 60 phút và giá trị thời gian chờ alert là 45 phút. Điều này có nghĩa là nếu vẫn còn kết nối sau 45 phút, thông báo CELOG sẽ được kích hoạt cho quản trị viên.

# isi nâng cấp bắt đầu --parallel --skip-optional --install-image-path=/ifs /data/<tên-tệp-cài-đặt> --drain-timeout=60 phút --alert-timeout=45 phút

Dịch vụ thoát hiện đang chờ hành động tiếp theo (chờ, trì hoãn hoặc bỏ qua) từ người dùng cuối khi phát hiện có kết nối SMB đang hoạt động giữa máy khách và PowerScale.

2. Trong OneFS WebUI, điều hướng đến Nâng cấp trong Quản lý cụm . Trong cửa sổ này, bạn sẽ thấy nút đang chờ máy khách rút. Bạn có thể chỉ định Bỏ qua hoặc Trì hoãn . Trong trường hợp này, Bỏ qua được chọn như trong Hình 2. Trong cửa sổ nhắc, nhấp vào nút Bỏ qua để bỏ qua việc rút.

Hình 2. Bỏ qua các máy khách đang cạn kiệt

Phần kết luận

NDU dựa trên Drain có thể giảm thiểu tác động kinh doanh trong quá trình nâng cấp OneFS bằng cách cho phép bạn kiểm soát cách thức và thời điểm máy khách ngắt kết nối khỏi cụm PowerScale. Tính năng mới này có thể cải thiện đáng kể trải nghiệm người dùng và tính liên tục của doanh nghiệp.

Tác giả: Vincent Shen