PowerMax 2500 và 8500 Dynamic Fabric—Kiến trúc cụm hiệu suất cao dành cho lưu trữ doanh nghiệp

Được giới thiệu vào năm 2022, các hệ thống PowerMax 2500 và 8500 đại diện cho thế hệ tiếp theo của dòng sản phẩm PowerMax. Về bản chất, PowerMax 2500 và 8500 có kiến ​​trúc cụm hiệu suất cao chỉ dành riêng cho việc xử lý khối lượng lớn các hoạt động lưu trữ và dữ liệu lưu trữ từ các ứng dụng hiện đại. Bốn thành phần chính của kiến ​​trúc cụm PowerMax là các nút tính toán; Vỏ phương tiện lưu trữ động (DME); Vải động liên kết các thành phần với nhau; và phần mềm hệ thống nội bộ, PowerMaxOS 10. Kiến trúc cụm PowerMax 2500 và 8500 cung cấp các lợi ích sau đây ngay từ đầu mà không cần thêm phần cứng, phần mềm hoặc cấp phép:

  • Độ tin cậy cao và khả năng chịu lỗi : Tất cả các nút trong PowerMax có thể truy cập I/O ứng dụng và cung cấp tài nguyên để xử lý, biến nó thành một hệ thống chia sẻ mọi thứ, chủ động/chủ động thực sự. Trong trường hợp một nút bị lỗi, không cần phải thực hiện hoạt động chuyển đổi dự phòng như với các hệ thống chủ động/thụ động. PowerMaxOS 10 sẽ tự động chuyển hướng I/O của nút bị lỗi sang các nút khác. Vì không cần chuyển đổi dự phòng nên không cần phải cấu hình thiết bị đủ số lượng để bảo vệ chống lại các vấn đề như ” bộ não chia đôi “.
  • Tính đơn giản : Tất cả các nút tính toán và DME trong hệ thống PowerMax đều xuất hiện với người dùng như một thực thể duy nhất. Người dùng không phải đăng nhập vào các nút riêng lẻ để quản lý hoặc cấu hình hệ thống PowerMax. Việc quản lý toàn bộ hệ thống được thực hiện bằng Unisphere dựa trên HTML5 cho PowerMax UI và/hoặc REST API. Các công cụ này cung cấp giao diện dễ sử dụng cho các hành động quản lý và hoạt động giám sát rất quan trọng đối với nhu cầu của tổ chức. 
  • Hoạt động hoàn toàn tự động : PowerMaxOS 10 quản lý tất cả các tài nguyên hệ thống một cách tự động—liên tục chạy chẩn đoán, và xóa và di chuyển dữ liệu trong hệ thống để có hiệu suất và tính khả dụng tối đa 24×7. Không cần phải cấu hình cân bằng tải thủ công giữa các nút vì PowerMaxOS 10 tự động quyết định nút nào sẽ xử lý dữ liệu I/O đến dựa trên vị trí và tính khả dụng của tài nguyên. 
  • Hiệu suất và khả năng mở rộng có thể dự đoán được : Khi các yêu cầu tính toán tăng lên, bạn có thể “mở rộng” hệ thống PowerMax bằng cách thêm các nút mà không gây gián đoạn để cung cấp mức tăng tuyến tính có thể dự đoán được về hiệu suất và sức mạnh tính toán. Khi các yêu cầu về dung lượng tăng lên, bạn có thể “mở rộng” hệ thống theo từng chi tiết, sử dụng các gia số ổ đĩa đơn. Điều này cho phép PowerMax mở rộng dựa trên các yêu cầu của ứng dụng thay vì các yêu cầu về kiến ​​trúc hệ thống. Kiến trúc này cũng cho phép mở rộng phần mềm toàn diện; PowerMax có thể hỗ trợ 64K thiết bị có thể trình bày trên máy chủ, hơn 65 triệu ảnh chụp nhanh và 2.048 nhóm sao chép từ xa với các hệ thống khác.

 Các nút tính toán, DME và phần mềm PowerMaxOS 10 cung cấp nền tảng cho một giải pháp thực sự chủ động/chủ động, chia sẻ mọi thứ cho các yêu cầu khắt khe của các trung tâm dữ liệu doanh nghiệp. Chất keo gắn kết tất cả các thành phần này lại với nhau và cho phép PowerMax cung cấp những lợi ích này cho khách hàng là Dynamic Fabric nội bộ.

Vải năng động PowerMax

Cả PowerMax 2500 và 8500 đều sử dụng cấu trúc Non-Volatile Memory Express over Fabrics (NVMe-oF) nội bộ, toàn diện từ đầu đến cuối giữa các nút tính toán và DME. Các cấu trúc NVMe-oF này được gọi là PowerMax Dynamic Fabric.  

Các yếu tố cốt lõi

Dynamic Fabric biến các thành phần lưu trữ tính toán và lưu trữ phụ trợ thành các điểm cuối độc lập riêng lẻ trên một nền tảng lưu trữ nội bộ lớn. Mỗi điểm cuối trong nền tảng này có cổng kép, với mỗi cổng được kết nối với một nền tảng vật lý bị cô lập—Nền tảng A hoặc Nền tảng B—để dự phòng. Các điểm cuối tính toán và lưu trữ riêng lẻ này có thể được đặt vào các nhóm tài nguyên dùng chung, tách biệt lưu trữ và tính toán trong hệ thống. Trong kiến ​​trúc này, tất cả các điểm cuối của nút tính toán có thể truy cập tất cả bộ nhớ dùng chung trong tất cả các nút tính toán khác bằng giao thức RDMA tốc độ cao của hệ thống. Hơn nữa, tất cả các điểm cuối của nút tính toán có thể truy cập tất cả các điểm cuối lưu trữ và SSD trong DME bằng giao thức NVMe-oF tốc độ cao của hệ thống. Quyền truy cập vào tất cả bộ nhớ dùng chung và tất cả các điểm cuối lưu trữ và SSD DME này tạo ra một kiến ​​trúc hệ thống hoạt động/hoạt động thực sự và chia sẻ mọi thứ. Việc tách biệt hệ thống này tách biệt tính toán và lưu trữ để chúng có thể được mở rộng và cung cấp độc lập với nhau nhằm đáp ứng các yêu cầu của ứng dụng thay vì tuân thủ các yêu cầu nghiêm ngặt về kiến ​​trúc hệ thống. Để cho phép kiến ​​trúc tách biệt mọi thứ được chia sẻ này, Dynamic Fabric cung cấp cho hệ thống các thành phần chính sau:

  • Khả năng chia sẻ quyền truy cập bộ nhớ giữa các nút
  • Kết nối tốc độ cao giữa các thành phần cụm
  • Kiểm tra tính nhất quán của dữ liệu đầu cuối dựa trên Thông tin bảo vệ SCSI T10-DIF bảo vệ chống lại việc truyền dữ liệu sai và hỏng dữ liệu

Bộ nhớ chia sẻ

Hệ thống PowerMax sử dụng kiến ​​trúc chia sẻ mọi thứ chủ động/chủ động. Điều này bao gồm chia sẻ nội dung bộ nhớ, trong đó mỗi nút có thể truy cập dữ liệu trong bộ nhớ của nút khác. Trên PowerMax, điều này được thực hiện bằng cách sử dụng Truy cập bộ nhớ trực tiếp từ xa (RDMA).  RDMA là khả năng đọc và ghi vào bộ nhớ trên một nút tính toán bên ngoài mà không làm gián đoạn quá trình xử lý của CPU trên nút đó. RDMA cho phép truyền dữ liệu thông lượng cao, độ trễ thấp giữa bộ nhớ của hai hệ thống máy tính, điều này rất cần thiết trong các hệ thống máy tính cụm hiệu suất cao như PowerMax. Sử dụng RDMA, tất cả các nút PowerMax có thể truy cập nội dung bộ nhớ của bất kỳ nút nào khác trong hệ thống như thể đó là của chính nó. Khả năng của mỗi nút để truy cập bộ nhớ của các nút khác bằng RDMA biến tổng dung lượng bộ nhớ đệm trong các hệ thống PowerMax thành một nhóm tài nguyên thực sự được chia sẻ có tên là PowerMax Global Cache .

Vải kết nối tốc độ cao

Truyền thông RDMA của PowerMax phải tuân theo độ trễ của fabric, do đó biến PowerMax thành hệ thống Truy cập bộ nhớ không đồng nhất (NUMA). Một yêu cầu chính đối với PowerMax Global Cache (và các hệ thống NUMA nói chung) là fabric vận chuyển truyền thông RDMA giữa các nút phải có độ trễ cực thấp và có băng thông cao. Vì lý do này, PowerMax sử dụng giao thức InfiniBand (IB) làm fabric giữa các nút chính. IB là công nghệ fabric và tập hợp các giao thức thường thấy nhất trong các môi trường điện toán hiệu suất cao (HPC) như các ứng dụng phân tích rủi ro và giao dịch theo thời gian thực của Phố Wall. Nó được sử dụng trong các môi trường này vì nó cung cấp:

  • Một loại vải có hiệu suất năng lượng cao, băng thông cao và độ trễ thấp : Trong PowerMax, vải IB được chạy ở chế độ kết nối, trong đó một làn đơn có thể truyền 100 Gbps với MTU là 2 MB. Truyền dữ liệu một làn lớn hơn hiệu quả hơn so với truyền dữ liệu nhiều làn nhỏ hơn vì nhiều dữ liệu được truyền bằng một chu kỳ xung nhịp duy nhất—tiêu thụ ít tài nguyên tính toán hơn nhiều để truyền dữ liệu. Các nghiên cứu đã chỉ ra rằng khi chạy ở chế độ kết nối, IB hiệu quả năng lượng hơn 70 phần trăm trên mỗi byte được gửi so với các lựa chọn vải RDMA khác như Ethernet:   Đánh giá hiệu quả năng lượng của Gigabit Ethernet và Infiniband Software Stacks trong trung tâm dữ liệu (nghiên cứu IEEE) .
  • Khả năng mở rộng : IB có thể hỗ trợ hàng chục nghìn điểm cuối fabric trong một mạng con phẳng. Do đó, bạn có thể mở rộng kiến ​​trúc phân tách PowerMax bằng cách thêm các điểm cuối lưu trữ và tính toán độc lập vào fabric mà không cần phải thêm nhiều mạng con và không phải chịu thêm các hình phạt về độ trễ.
  • Bảo mật cao : Giao thức được triển khai trong phần cứng và các thuộc tính truyền thông được cấu hình tập trung theo cách không cho phép các ứng dụng phần mềm kiểm soát chúng và cố ý làm giả hoặc thay đổi các thuộc tính đó.
  • Khả năng phục hồi : Truyền dữ liệu RDMA có thể được bảo vệ bằng Thông tin bảo vệ SCSI T10-DIF. Điều này cho phép phát hiện lỗi dữ liệu từ nhiều nguồn và với kiến ​​trúc dự phòng PowerMax, dữ liệu chính xác luôn có thể được tham chiếu.

Thực hiện

Sử dụng RDMA và NVMe-oF với kiến ​​trúc vải IB, PowerMax Dynamic Fabric cung cấp mức hiệu suất, khả năng mở rộng, hiệu quả và bảo mật cao mà khách hàng doanh nghiệp yêu cầu. Việc triển khai Dynamic Fabric để đạt được những kết quả này là khác nhau giữa PowerMax 2500 và PowerMax 8500. 

Công suất tối đa 2500 

PowerMax 2500 có thể mở rộng lên đến hai cặp nút. Mỗi cặp nút đi kèm với DME PCIe gắn trực tiếp của riêng nó. Một phần kiến ​​trúc chính của PowerMax 2500 Dynamic Fabric là sử dụng công nghệ đa máy chủ PCIe. Trong trường hợp của PowerMax 2500, đa máy chủ PCIe cho phép cả hai nút chia sẻ Bộ điều hợp kênh máy chủ PCIe IB 100 Gb nội bộ của nhau (HCA), tạo ra một mạng lưới không cần chuyển mạch, tốc độ cao giữa các nút để giao tiếp RDMA có độ trễ thấp. Truyền dữ liệu giữa các nút và DME PCIe gắn trực tiếp sử dụng mạng lưới NVMe/PCIe x32 làn.

Cấu hình Dynamic Fabric trên PowerMax 2500 cho phép hệ thống cung cấp hiệu suất và khả năng mở rộng trong một gói nhỏ gọn. Nó cho phép đạt được mức hiệu quả cao hơn vì PowerMax 2500 có thể lưu trữ dung lượng lớn hơn tới 7 lần trong một nửa không gian giá đỡ (hơn 4 PBe trong 5U) so với PowerMax 2000 thế hệ trước. Cùng với thiết kế nhỏ gọn, 2500 hỗ trợ đầy đủ các dịch vụ dữ liệu phong phú cho các hệ thống mở, máy chủ lớn, tệp và môi trường ảo.  

PowerMax 8500

PowerMax 8500 Dynamic Fabric là một cấu trúc NVMe/IB 100 Gbps được chuyển mạch hoàn toàn trên mỗi làn, được sử dụng bởi tất cả các giao tiếp RDMA và truyền dữ liệu NVMe. Điều này khác với PowerMax 2500, trong đó dữ liệu NVMe được truyền từ nút đến DME được kết nối PCIe của nó sử dụng NVMe/PCIe. Trên PowerMax 8500, mỗi nút tính toán và DME lưu trữ được coi là các điểm cuối duy nhất trên cấu trúc, cho phép chúng được thêm vào cấu trúc độc lập với nhau trong khi vẫn có thể truy cập vào tất cả các điểm cuối khác. Các nút hệ thống và DME được phân tách hoàn toàn và được kết nối động, cho phép hệ thống mở rộng quy mô tính toán lên các cặp tám nút trong khi mở rộng quy mô lưu trữ lên tám DME—cung cấp hơn 18 PBe trong một hệ thống duy nhất.

Một điểm khác biệt nữa với Dynamic Fabric trên PowerMax 8500 là việc sử dụng DME thông minh. Các DME kết nối vào mạng NVMe/IB bằng cách sử dụng Thẻ điều khiển liên kết (LCC) kép, mỗi thẻ có hai cổng IB 100 Gb. Mỗi bo mạch LCC có bộ xử lý dữ liệu NVIDIA BlueField (DPU) riêng, cho phép thực hiện các chức năng quản lý lưu trữ quan trọng như dỡ tải mạng. Các LCC với DPU của chúng về cơ bản biến mỗi DME PowerMax 8500 thành một hệ thống lưu trữ NVMe bộ điều khiển kép, hoạt động/hoạt động độc đáo trên mạng.

Phần kết luận

Dynamic Fabric là thứ cho phép PowerMax 2500 và 8500 hoạt động như một kiến ​​trúc thực sự hoạt động/hoạt động, chia sẻ mọi thứ cho bộ lưu trữ doanh nghiệp. Với kiến ​​trúc gốc này, khách hàng có thể:

  • Đạt được mức độ chịu lỗi và khả năng phục hồi cao ngay từ đầu mà không cần phần cứng và phần mềm bổ sung tốn kém
  • Đáp ứng yêu cầu khối lượng công việc với ít điện năng và ít tài nguyên hơn
  • Tăng và giảm quy mô mà không cần can thiệp thủ công để cân bằng tải hoặc các hoạt động cụm phụ trợ khác, được PowerMaxOS thực hiện tự động

Dynamic Fabric là thành phần chính cho phép kết nối băng thông cao, độ trễ thấp cần thiết cho giao tiếp RDMA giữa các nút và cho quá trình xử lý dữ liệu NVMe mở rộng và di chuyển giữa các nút và DME trong hệ thống. Dynamic Fabric là xương sống của PowerMax 2500 và 8500. Nó cho phép các hệ thống cung cấp loại hiệu suất, bảo mật, hiệu quả và khả năng mở rộng mà trung tâm dữ liệu hiện đại yêu cầu.