Quy trình hoạt động của CloudPools

Tính năng Dell PowerScale CloudPools của OneFS cho phép phân tầng dữ liệu lạnh hoặc ít được truy cập để chuyển sang lưu trữ đám mây có chi phí thấp hơn. CloudPools mở rộng không gian tên PowerScale sang đám mây riêng hoặc đám mây công cộng. Đối với các nhà cung cấp đám mây được CloudPools hỗ trợ, hãy xem blog Nhà cung cấp đám mây được CloudPools hỗ trợ .

Blog này tập trung vào các quy trình hoạt động của CloudPools sau đây:

  • Lưu trữ
  • Nhớ lại
  • Đọc
  • Cập nhật

Lưu trữ

Hoạt động lưu trữ là quy trình CloudPools di chuyển dữ liệu tệp từ cụm PowerScale cục bộ sang lưu trữ đám mây. Tệp được lưu trữ bằng cách sử dụng Công việc SmartPools hoặc từ dòng lệnh. Quy trình lưu trữ CloudPools có thể tạm dừng hoặc tiếp tục.

Hình sau đây hiển thị quy trình làm việc của kho lưu trữ CloudPools.

Hình này minh họa quy trình làm việc của kho lưu trữ CloudPools: 1. Một tệp khớp với chính sách nhóm tệp. 2. Dữ liệu tệp được chia thành các khối Đối tượng dữ liệu đám mây (CDO). 3. Các khối được gửi từ cụm PowerScale lên đám mây. 4. Tệp được cắt ngắn thành tệp SmartLink và Đối tượng siêu dữ liệu đám mây (CMO) được ghi vào đám mây.

Hình 1. Quy trình lưu trữ

Chi tiết quy trình làm việc bao gồm:

  • Chính sách nhóm tệp trong Bước 1 chỉ định mục tiêu đám mây và các tham số cụ thể của đám mây. Các ví dụ về chính sách bao gồm:
  • Mã hóa : CloudPools cung cấp tùy chọn mã hóa dữ liệu trước khi dữ liệu được gửi đến bộ lưu trữ đám mây. Nó sử dụng mô-đun quản lý khóa PowerScale để mã hóa dữ liệu và sử dụng AES-256 làm thuật toán mã hóa. Lợi ích của mã hóa là chỉ dữ liệu được mã hóa mới được gửi qua mạng.
  • Nén : CloudPools cung cấp tùy chọn nén dữ liệu trước khi dữ liệu được gửi đến bộ lưu trữ đám mây. Nó thực hiện nén cấp khối bằng thư viện nén zlib. CloudPools không nén dữ liệu đã được nén.
  • Bộ nhớ đệm dữ liệu cục bộ : Bộ nhớ đệm được sử dụng để hỗ trợ đọc và ghi cục bộ các tệp SmartLink. Để tối ưu hóa hiệu suất, nó giảm chi phí băng thông bằng cách loại bỏ việc truy xuất dữ liệu tệp nhiều lần để đọc và ghi nhiều lần. Bộ nhớ đệm dữ liệu được sử dụng để lưu trữ tạm thời dữ liệu tệp từ bộ nhớ đám mây trên bộ nhớ đĩa PowerScale cho các tệp đã được CloudPools di chuyển khỏi cụm.
  • Lưu giữ dữ liệu : Lưu giữ dữ liệu là khái niệm được sử dụng để xác định thời gian lưu giữ các đối tượng đám mây trên bộ lưu trữ đám mây.
  • Khi các khối được gửi từ cụm PowerScale lên đám mây ở Bước 3, một tổng kiểm tra sẽ được áp dụng cho mỗi khối để đảm bảo tính toàn vẹn của dữ liệu.

Nhớ lại

Hoạt động thu hồi là quy trình CloudPools đảo ngược quy trình lưu trữ. Nó thay thế tệp SmartLink bằng cách khôi phục dữ liệu tệp gốc trên cụm PowerScale và xóa các đối tượng đám mây trong đám mây. Quy trình thu hồi chỉ có thể được thực hiện bằng dòng lệnh. Quy trình thu hồi CloudPools có thể bị tạm dừng hoặc tiếp tục.

Hình sau đây hiển thị quy trình làm việc của CloudPools. 

Hình này minh họa quy trình làm việc của việc thu hồi CloudPools: 1. OneFS truy xuất CDO từ đám mây đến cụm PowerScale. 2. Tệp SmartLink được thay thế bằng cách khôi phục dữ liệu tệp gốc. 3. Các đối tượng đám mây được xóa trong đám mây theo cách không đồng bộ nếu thời gian lưu giữ dữ liệu đã hết hạn.

Hình 2. Quy trình thu hồi

Đọc

Hoạt động đọc là quy trình CloudPools về truy cập dữ liệu của khách hàng, được gọi là truy cập nội tuyến. Khi khách hàng mở tệp để đọc, các khối được thêm vào bộ nhớ đệm trong tệp SmartLink được liên kết theo mặc định. Bộ nhớ đệm có thể bị vô hiệu hóa bằng cách đặt khả năng truy cập trong chính sách nhóm tệp cho CloudPools. Thiết lập khả năng truy cập được sử dụng để chỉ định cách dữ liệu được lưu trong bộ nhớ đệm trong các tệp SmartLink khi người dùng hoặc ứng dụng truy cập tệp SmartLink trên cụm PowerScale. Các giá trị được lưu trong bộ nhớ đệm (mặc định) và không có bộ nhớ đệm.

Hình sau đây hiển thị quy trình làm việc của CloudPools được đọc theo mặc định. 

Hình này minh họa quy trình làm việc của CloudPools khi đọc: 1. Máy khách truy cập tệp thông qua tệp SmartLink. 2. OneFS truy xuất CDO từ đám mây đến bộ nhớ đệm cục bộ trên cụm PowerScale. 3. Dữ liệu tệp được gửi đến máy khách từ bộ nhớ đệm cục bộ trên cụm PowerScale. 4. OneFS xóa thông tin bộ nhớ đệm đã hết hạn cho tệp SmartLink.

Hình 3. Quy trình đọc

Bắt đầu từ OneFS 9.1.0.0, bộ đệm đối tượng đám mây được giới thiệu để tăng cường các chức năng của CloudPools để giao tiếp với đám mây. Ở Bước 1, OneFS tìm kiếm dữ liệu trong bộ đệm đối tượng trước và OneFS truy xuất dữ liệu từ bộ đệm đối tượng nếu dữ liệu đã có trong bộ đệm đối tượng. Bộ đệm đối tượng đám mây làm giảm số lượng yêu cầu đến đám mây khi đọc tệp.

Trước OneFS 9.1.0.0, ở Bước 1, OneFS tìm kiếm dữ liệu trong bộ đệm dữ liệu cục bộ trước. Nó chuyển sang Bước 3 nếu dữ liệu đã có trong bộ đệm dữ liệu cục bộ.

Lưu ý : Bộ nhớ đệm đối tượng đám mây là cho mỗi nút. Mỗi nút duy trì bộ nhớ đệm đối tượng riêng của mình trên cụm. 

Cập nhật

Hoạt động cập nhật là quy trình CloudPools xảy ra khi máy khách cập nhật dữ liệu. Khi máy khách thay đổi sang tệp SmartLink, CloudPools trước tiên ghi các thay đổi vào bộ đệm dữ liệu cục bộ và sau đó định kỳ gửi dữ liệu tệp đã cập nhật lên đám mây. Không gian được bộ đệm sử dụng là tạm thời và có thể định cấu hình.

Hình sau đây hiển thị quy trình cập nhật CloudPools. 

Hình này minh họa quy trình làm việc của bản cập nhật CloudPools: 1. Máy khách truy cập tệp thông qua tệp SmartLink. 2. OneFS truy xuất CDO từ đám mây, đưa dữ liệu tệp vào bộ đệm cục bộ. 3. Máy khách cập nhật tệp và những thay đổi đó được lưu trữ trong bộ đệm cục bộ. 4. OneFS gửi dữ liệu tệp đã cập nhật từ bộ đệm cục bộ lên đám mây. 5. OneFS xóa thông tin bộ đệm đã hết hạn cho tệp SmartLink.

Hình 4. Cập nhật quy trình làm việc

Cảm ơn bạn đã dành thời gian đọc blog này và xin chúc mừng vì đã hiểu rõ cách thức hoạt động của OneFS CloudPools!