Giải pháp Lưu trữ NFS với bộ lưu trữ Dell EMC mới nhất — Kết quả Hiệu suất

Tổng quan

Phiên bản Giải pháp Dell EMC Ready mới nhất cho Bộ lưu trữ HPC NFS (NSS) với tính khả dụng cao ( giải pháp NSS-HA ) sẽ là NSS7.3-HA, dự kiến ​​phát hành vào cuối tháng này.
Bản phát hành NSS này kết hợp mảng lưu trữ Dell EMC PowerVault ME4084 mới và Red Hat Enterprise Linux 7.5, đồng thời tiếp tục sử dụng CPU dòng bộ xử lý có thể mở rộng Intel Xeon (kiến trúc có tên mã là Skylake) để mang lại hiệu năng hệ thống tổng thể cao hơn so với các giải pháp NSS-HA trước đây. Blog này trình bày kết quả kiểm tra hiệu suất I/O cho phiên bản mới nhất này của giải pháp NSS.
Hình 1 cho thấy thiết kế của cấu hình NSS7.3-HA. Sự khác biệt chính giữa NSS7.3-HA và người tiền nhiệm trực tiếp của nó, NSS7.2-HA là:

  • Mảng lưu trữ Back End:
    • NSS7.2-HA: PowerVault MD3460 + MD3060e tùy chọn (60 hoặc 120 ổ cứng)
    • NSS7.3-HA: PowerVault ME4084 (84 ổ cứng)
  • Hệ điều hành:
    • NSS7.2-HA: RHEL 7.4
    • NSS7.3-HA: Red Hat® Enterprise Linux® 7.5

Ngoại trừ những mục như cập nhật chương trình cơ sở và phần mềm cần thiết, NSS7.2-HA và NSS7.3-HA có chung thiết kế cụm HA và cấu hình lưu trữ cơ bản. (Tham khảo sách trắng NSS7.0-HA để biết thêm thông tin chi tiết về cấu hình.)
Một cải tiến lớn khác từ NSS7.2-HA và NSS7.3-HA là mức tăng lớn về công suất tối đa. Mặc dù NSS7.2-HA bị giới hạn bởi giới hạn hỗ trợ hiện tại của Red Hat XFS là 500 TB, sau khi thử nghiệm và xác thực rộng rãi trong phòng thí nghiệm của chúng tôi, Dell EMC và Red Hat đã đạt được thỏa thuận hợp tác hỗ trợ cấu hình NSS7.3-HA với dung lượng lưu trữ lên tới 768 TB không gian sử dụng được. Đó là Dell EMC PowerVault ME4084 được trang bị đầy đủ ổ cứng 12 TB hoặc 1008 TB dung lượng lưu trữ thô.

Kiến trúc NSS-HA

Hình 1 cho thấy kiến ​​trúc NSS 7.3 bên trong hình chữ nhật chấm, được nhúng trong khu vực thử nghiệm điển hình bao gồm các máy khách và bộ chuyển đổi mạng công cộng.

Hình 1. Kiến trúc và giường thử nghiệm NSS7.3-HA 1008 TB Raw Space (768 TB Usable)

SLN314595_en_US__1hình ảnh(6997)

Bảng tiếp theo tóm tắt các thành phần khác nhau của giải pháp NSS HA 7.3 mới.

Bảng 1. Các thành phần cho NSS7.2-HA và NSS7.3-HA
Bản phát hành NSS7.2-HA (tháng 4 năm 2018)
“máy chủ PowerEdge thế hệ thứ 14 và MD3460 + MD3060e”
Bản phát hành NSS7.3-HA (tháng 10 năm 2018)
“Máy chủ PowerEdge thế hệ thứ 14 và giải pháp dựa trên ME4084”
Phần mềm Red Hat Enterprise Linux 7.4,
Hạt nhân 3.10.0-693.el7.x86_64

Hệ thống tệp có thể mở rộng Red Hat (XFS) v4.5.0-12

Red Hat Enterprise Linux 7.5,
Hạt nhân 3.10.0-862.el7.x86_64

Hệ thống tệp có thể mở rộng Red Hat (XFS) v4.5.0-15

máy chủ NFS Hai máy chủ Dell PowerEdge R740.
CPU: Dual Intel Xeon Gold 6136 @ 3.0 GHz, 12 lõi trên mỗi bộ xử lý.
Bộ nhớ: 12 x 16GiB 2666 MT/s RDIMM.
Kết nối mạng bên ngoài EDR InfiniBand, 10 GbE hoặc Intel Omni-Path.

Đối với blog này, Mellanox ConnectX-4 IB EDR/100 GbE.
Đối với đơn đặt hàng, CX-5 IB EDR/100 GbE.

Kết nối nội bộ Gigabit Ethernet, chuyển mạng Dell S3048-ON
phiên bản OFED Mellanox OFED 4.3-1.0.1.0 Mellanox OFED 4.4-1.0.0
Kết nối lưu trữ trực tiếp Kết nối SAS 12 Gbps.
Hệ thống con lưu trữ Dell EMC MD3460 + MD3060e tùy chọn.

Ổ đĩa 60 – 120 – 3,5″ NL SAS 4 TB.
Hai cấu hình, 240 hoặc 480 TB (không gian thô).
6 hoặc 12 LUN, 8+2 RAID 6, kích thước phân đoạn 512KiB
Không có phụ tùng

Dell EMC PowerVault ME4084.

84 – 3,5″ NL SAS, tối đa 12TB.
Một cấu hình: tối đa 1008TB (không gian thô).
8 LUN, RAID 6 8+2 tuyến tính, kích thước khối 128KiB.
4 Ổ cứng dự phòng toàn cầu.

Bộ lưu trữ PowerVault ME4084 mới tiếp tục sử dụng RAID 6 8+2 tuyến tính làm đơn vị xây dựng cơ bản với kích thước khối mới (kích thước phân đoạn) là 128 KiB và giá trị đọc trước của “kích thước sọc” được chọn để có hiệu suất tối ưu. Ngoài ra, vì hiện tại chúng tôi có 84 ổ đĩa nên chúng tôi có 8 LUN dựa trên RAID 6 và 4 ổ cứng dự phòng toàn cầu được định cấu hình để thay thế ngay lập tức bất kỳ ổ đĩa nào bị lỗi. Điều đó có nghĩa là giải pháp này có thể có tới 768 TB dung lượng khả dụng.

Hiệu suất I/O NSS7.3-HA

Blog này trình bày kết quả kiểm tra hiệu suất I/O cho giải pháp NSS-HA hiện tại, cụ thể là NSS7.3. Tất cả các thử nghiệm hiệu suất đã được tiến hành trong kịch bản không có lỗi HA để đo lường khả năng tối đa của giải pháp. Các thử nghiệm tập trung vào ba loại mẫu I/O: đọc và ghi tuần tự lớn, đọc và ghi ngẫu nhiên nhỏ và ba thao tác siêu dữ liệu (tạo tệp, thống kê và xóa).
Một cụm điện toán 32 nút đã được sử dụng để tạo khối lượng công việc cho các bài kiểm tra điểm chuẩn. Máy khách và cấu hình NSS 1008 TB (kích thước lưu trữ thô) được kết nối bằng InfiniBand EDR và ​​hệ thống tệp được gắn qua IPoIB. Mỗi bài kiểm tra điểm chuẩn I/O được chạy trên một loạt máy khách để kiểm tra khả năng mở rộng của giải pháp. Chi tiết về các khách hàng được sử dụng được liệt kê trong bảng tiếp theo.

Bảng 2. Cấu hình máy khách (thử nghiệm hiệu năng)
Mô hình máy chủ PowerEdge C6420
Số lượng máy chủ 32 cụm máy chủ
CPU CPU Intel(R) Xeon(R) Vàng 6148 @ 2,40 GHz
ĐẬP 192 GIB
Hệ điều hành Red Hat Enterprise Linux Server phát hành 7.4
hạt nhân 3.10.0-693.17.1.el7.x86_64
bộ điều hợp mạng Mellanox ConnectX-4 VPI IB EDR/100 GbE cổng đơn QSFP28
phiên bản OFED MLNX_OFED-4.3.1.0.1.0

Điểm chuẩn IOzone và MDtest đã được sử dụng trong nghiên cứu này. IOzone đã được sử dụng cho các bài kiểm tra tuần tự và ngẫu nhiên. Đối với các thử nghiệm tuần tự, kích thước yêu cầu là 1024 KiB đã được sử dụng. Tổng lượng dữ liệu được truyền là 256 GiB để đảm bảo rằng bộ nhớ cache của máy chủ NFS đã bão hòa. Các thử nghiệm ngẫu nhiên đã sử dụng kích thước yêu cầu 4 KiB và mỗi khách hàng đọc và ghi một tệp 4 GiB. Kiểm tra siêu dữ liệu đã được thực hiện bằng điểm chuẩn MDtest với OpenMPI và bao gồm các thao tác tạo, thống kê và xóa tệp. (Tham khảo Phụ lục A của sách trắng NSS7.0-HA để biết các lệnh hoàn chỉnh được sử dụng trong các thử nghiệm.)

Ghi và đọc tuần tự IPoIB

Hình 2 và 3 cho thấy hiệu suất ghi và đọc tuần tự. Vì cụm thử nghiệm có 32 nút nên điểm dữ liệu 64 luồng thu được bằng cách sử dụng 32 máy khách chạy 2 luồng mỗi máy.
Đối với NSS7.3-HA, hiệu suất đọc cao nhất là 7 GB/giây và hiệu suất ghi cao nhất là gần 5 GB/giây. Từ hai con số, rõ ràng là giải pháp NSS7.3-HA hiện tại có số hiệu suất tuần tự cao hơn so với phiên bản trước. Hiệu suất đọc tốt hơn tới 18,7%, nhưng hiệu suất ghi đặc biệt tốt hơn với hiệu suất của giải pháp trước đó lên tới 2,65 lần (ở 16 luồng). So sánh các giá trị hiệu suất cao nhất, tốc độ ghi trên NSS7.3-HA nhanh hơn 2,13 lần và tốc độ đọc tốt hơn 12,5%.
Điều này một phần là do tốc độ bên trong SAS cao hơn là 12 Gbps cho tất cả các thành phần bên trong PowerVault ME4084 bao gồm cả ổ cứng (PowerVault MD3460 là 6 Gbps) cho phép thông lượng cao hơn trên mỗi LUN, nhưng cũng do bộ điều khiển lưu trữ mới có thể xử lý thông tin nhanh hơn so với PowerVault MD3 thế hệ trước.

Hình 2. Hiệu suất ghi tuần tự lớn IPoIB

SLN314595_en_US__2hình ảnh(6989)

Hình 3. Hiệu suất đọc tuần tự lớn IPoIB

SLN314595_en_US__3hình ảnh(6990)

IPoIB viết và đọc ngẫu nhiên

Hình 4 và Hình 5 cho thấy hiệu suất ghi và đọc ngẫu nhiên.
Từ hình này, ghi ngẫu nhiên đạt được hiệu suất cao nhất ở 32 luồng trong khi phiên bản trước của giải pháp đạt được hiệu suất cao nhất ở 64 luồng. Hiệu suất đọc ngẫu nhiên tăng đều đặn trên NSS7.3 lên tới 32 máy khách và đối với giải pháp trước đó, mức cao nhất là 16 máy khách. Một lần nữa, bộ lưu trữ mới cho thấy hiệu suất vượt trội so với phiên bản tiền nhiệm với khả năng ghi cải thiện tới 3,44 lần (ở 2 luồng) và hiệu suất đọc cao hơn 85% (ở 32 luồng) so với phiên bản tiền nhiệm. So sánh hiệu suất cao nhất, sự khác biệt là khoảng 13% khi ghi ngẫu nhiên và 85% khi đọc ngẫu nhiên. Những cải tiến này chủ yếu là do bộ điều khiển PowerVault ME4084 mới có khả năng xử lý nhanh hơn so với bộ điều khiển PowerVault MD3460.

Hình 4. Hiệu suất ghi ngẫu nhiên IPoIB

SLN314595_en_US__4hình ảnh(6991)

Hình 5. Hiệu suất đọc ngẫu nhiên IPoIB

SLN314595_en_US__5hình ảnh(6992)

Hoạt động siêu dữ liệu IPoIB

Hình 6, Hình 7 và Hình 8 lần lượt hiển thị kết quả của các thao tác tạo, thống kê và xóa tệp. Vì cụm điện toán HPC chỉ có 32 nút điện toán nên trong các biểu đồ bên dưới, mỗi máy khách đã thực thi tối đa một luồng đối với số lượng máy khách lên tới 32 và đối với số lượng luồng là 64, 128, 256 và 512, mỗi máy khách đã thực thi 2, 4, 8 hoặc 16 hoạt động đồng thời (luồng).
Đối với tính năng tạo tệp, so với giải pháp trước đó, giải pháp mới cho thấy sự cải thiện bền vững về hiệu suất gấp đôi với mức chênh lệch cao nhất (208%) ở 32 máy khách, sau đó giảm nhẹ, nhưng thậm chí so sánh hiệu suất cao nhất của cả hai giải pháp ở 256 chủ đề, giải pháp mới nhanh hơn 30%.
Các hoạt động thống kê được cải thiện nhiều nhất nhờ bộ lưu trữ mới, trong đó các cải tiến cao gấp 7,7 lần so với phiên bản tiền nhiệm ở 256 luồng và so sánh hiệu suất cao nhất, NSS7.3 cho thấy số lượng hoạt động thống kê mỗi giây cao hơn gần 6 lần so với phiên bản trước đó. NSS.
Cuối cùng, các thao tác xóa có sự cải thiện tương đối nhỏ với hầu hết các điểm dữ liệu ở mức hiệu suất 33% hoặc tốt hơn so với giải pháp trước đó; ngoại trừ 128 luồng có hiệu suất tốt hơn 2,21 lần. Ở hiệu suất cao nhất, bộ lưu trữ mới đạt được hiệu suất cao hơn gần 55% so với hệ thống NSS trước đó.
Tất cả những cải tiến này là nhờ các ổ cứng HDD nhanh hơn sử dụng tốc độ SAS3 (12 Gbps), cũng như bộ điều khiển PowerVault ME4084 mới, có khả năng mang lại IOP và băng thông cao hơn.

Hình 6. Hiệu suất tạo tệp IPoIB

SLN314595_en_US__6hình ảnh(6993)

Hình 7. Hiệu suất thống kê tệp IPoIB

SLN314595_en_US__7hình ảnh(6994)

Hình 8. Hiệu suất loại bỏ tệp IPoIB

 SLN314595_en_US__8hình ảnh(6995)

Kết luận và công việc tương lai

Qua các thế hệ khác nhau của giải pháp, giải pháp NSS-HA đã trải qua nhiều bản cập nhật phần cứng và phần mềm để liên tục cung cấp tính khả dụng cao, hiệu suất cao hơn và dung lượng lưu trữ lớn hơn. Trong tất cả các phiên bản này, thiết kế kiến ​​trúc cốt lõi của dòng giải pháp NSS-HA vẫn không thay đổi. Để thể hiện sự khác biệt về hiệu suất giữa NSS7.3-HA và bản phát hành trước đó (NSS7.2-HA), số hiệu suất của cả hai giải pháp được đối chiếu, cho thấy hiệu suất vượt trội của phiên bản mới nhất của giải pháp dựa trên PowerVault ME4084: 

  •  Gấp tới 2,65 lần tốc độ ghi tuần tự và hiệu suất đọc nhanh hơn tới 18,7%.
  •  Gấp tới 3,44 lần tốc độ ghi ngẫu nhiên và hiệu suất đọc ngẫu nhiên nhanh hơn tới 85%.
  •  Lên đến 2,1 lần tỷ lệ tạo, 7,7 lần tỷ lệ chỉ số và 2,2 lần tỷ lệ xóa