Giải pháp lưu trữ HPC NFS của Dell EMC – Cấu hình High Availability (NSS7.4 – HA)

Tổng quan về giải pháp

Blog này mô tả Giải pháp lưu trữ HPC NFS của Dell EMC phiên bản 7.4 (NSS7.4-HA), giải pháp này tận dụng Bộ xử lý có thể mở rộng Xeon® thế hệ thứ hai của Intel, có tên mã là “Cascade Lake”. Các bộ xử lý Xeon cải tiến này có tới 28 lõi, bộ nhớ đệm cấp cuối cùng lên tới 38,5 MB và sáu kênh bộ nhớ 2933 MT/s trên mỗi ổ cắm. Các tính năng chính của bộ xử lý Cascade Lake là giảm thiểu phần cứng tích hợp chống lại các cuộc tấn công kênh bên, Intel DL Boost (VNNI) và hỗ trợ tăng tốc độ xung nhịp và tốc độ bộ nhớ.

Cascade Lake và Skylake tiền nhiệm của nó bao gồm một tính năng gọi là  ADDDC ( A daptive D ouble D RAM D evice Cchỉnh). ADDDC được triển khai trong thời gian chạy để tự động vạch ra các thiết bị DRAM bị lỗi trong khi tiếp tục cung cấp S ingle D evice D ata C orrection (SDDC), bộ nhớ mã sửa lỗi (ECC), giúp tăng tuổi thọ của DIMM. Tính năng này chỉ được kích hoạt cho các thiết bị x4 DRAM và không có tác dụng gì khi có các thiết bị x8 DRAM trong hệ thống. Do NSS-HA phiên bản 7.4 mới nhất chỉ sử dụng bộ nhớ 16GB, là tổ chức x8, nên ADDDC có màu xám và không phải là tùy chọn có thể điều chỉnh trong BIOS. Tuy nhiên, nếu bạn đang sử dụng bộ nhớ 32GB x4, thì ADDDC sẽ khả dụng dưới dạng tùy chọn có thể điều chỉnh và bạn nên đặt thành tắt để ưu tiên hiệu suất hơn các tính năng RAS.

Bạn nên định cấu hình máy chủ NFS với cấu hình HPC như được mô tả trong blog ” Đặc tính BIOS cho bộ xử lý Intel Cascade Lake ” Điều này bao gồm điều chỉnh BIOS để bật cụm Sub-NUMA, tắt bộ xử lý logic và cấu hình hệ thống được đặt thành “Hiệu suất “. Nếu nâng cấp hệ thống hiện có, trước tiên hãy đảm bảo BIOS được cập nhật lên phiên bản hỗ trợ CPU Cascade Lake trước khi nâng cấp CPU lên bộ xử lý Cascade Lake. Chương trình cơ sở iDRAC mới nhất cũng được khuyến nghị.

Nhóm Kỹ thuật HPC tại HPC và Phòng thí nghiệm đổi mới trí tuệ nhân tạo , đã thực hiện một loạt thử nghiệm điểm chuẩn với các máy chủ NSS được trang bị bộ xử lý Cascade Lake và so sánh kết quả với các kết quả thu được trước đó từ giải pháp NSS7.3-HA,đã sử dụng phiên bản mới nhất của máy chủ PowerEdge được trang bị bộ xử lý dòng Xeon “Skylake-SP” thế hệ trước. Kết quả điểm chuẩn và so sánh được trình bày trong blog này.

Giải pháp lưu trữ NFS do Dell EMC cung cấp được tối ưu hóa và điều chỉnh để có hiệu suất tốt nhất. Trong khi thiết lập giải pháp NSS7.4-HA, cần lưu ý các điểm nổi bật sau:

  1. Hệ điều hành được hỗ trợ tối thiểu để sử dụng Bộ xử lý Cascade Lake là Red Hat Enterprise Linux 7.6. Tuy nhiên, với phiên bản kernel 3.10.0-957.el7, chia sẻ NFS sẽ bị treo với một tác vụ, chẳng hạn như kworker, tiêu tốn 100% CPU. Nguyên nhân cốt lõi của sự cố là do lớp TCP không đồng bộ với trạng thái vận chuyển của lớp sunrpc. Sự cố này đã được giải quyết với gói kernel-3.10.0-957.5.1.el7 trở lên. Vì vậy, hệ điều hành cơ bản được sử dụng cho giải pháp này là RHEL7.6 và phiên bản nhân được sử dụng là kernel-3.10.0-957.5.1.el7. Vui lòng tham khảo https://access.redhat.com/solutions/3742871 để biết thêm chi tiết.
  2. Đối với giải pháp NSS7.4-HA, trừ khi các gói sau được cài đặt, tài nguyên nfsserver không khởi động được vì nfs-idmapd.service không khởi động được. Vui lòng tham khảo https://access.redhat.com/solutions/3746891 để biết thêm chi tiết.
    • resource-agents-4.1.1-12.el7_6.4
    • resource-agents-aliyun-4.1.1-12.el7_6.4
    • resource-agents-gcp-4.1.1-12.el7_6.4 trở lên.
  3. Ghi chú phát hành của RHEL7.6 thu hút sự chú ý đến thực tế là một lỗi trong lớp I/O của LVM gây ra hỏng dữ liệu trong 128KB đầu tiên của không gian có thể phân bổ của một ổ đĩa vật lý. Sự cố đã được giải quyết với lvm2-2.02.180-10.el7_6.2 trở lên. Vì vậy, hãy đảm bảo rằng gói lvm2 được cập nhật lên phiên bản mới nhất. Nếu cập nhật lvm2 không phải là một tùy chọn, thì giải pháp thay thế là không sử dụng các lệnh LVM thay đổi siêu dữ liệu nhóm âm lượng (VG) chẳng hạn như lvcreate hoặc lvextend , trong khi các ổ đĩa logic trong VG đang được sử dụng.

Kiến trúc NSS7.4-HA

Hình 1 cho thấy thiết kế của NSS7.4-HA. Ngoại trừ các bản cập nhật chương trình cơ sở và phần mềm cần thiết, NSS7.4-HA và NSS7.3-HA chia sẻ cấu hình lưu trữ và cấu hình cụm HA giống nhau. Cặp máy chủ NFS ở cấu hình có tính khả dụng cao chủ động-thụ động được gắn vào PowerVault ME4084. Có thẻ SAS kép trong mỗi máy chủ NFS. Mỗi thẻ có một cáp SAS tới từng bộ điều khiển trong bộ lưu trữ dùng chung, do đó một thẻ SAS đơn lẻ hoặc lỗi cáp SAS không ảnh hưởng đến tính khả dụng của dữ liệu.

Hình 1: Kiến trúc NSS7.4-HA
SLN317325_vi_US__1001


 

So sánh các thành phần trong NSS7.4-HA với NSS7.3-HA

Mặc dù các giải pháp NSS-HA của Dell đã nhận được nhiều bản nâng cấp phần cứng và phần mềm để mang lại tính khả dụng cao hơn, hiệu suất cao hơn và dung lượng lưu trữ lớn hơn kể từ lần phát hành NSS-HA đầu tiên, các hướng dẫn triển khai và thiết kế kiến ​​trúc của dòng giải pháp NSS-HA vẫn không thay đổi. Phiên bản mới nhất này và phiên bản cũ hơn, NSS7.3-HA chia sẻ cùng một phụ trợ lưu trữ là Power Vault ME4084. Bảng sau đây so sánh các thành phần trong giải pháp NSS7.4-HA mới nhất và giải pháp NSS7.3-HA trước đó

Bảng 1: So sánh các thành phần trong NSS7.4-HA với NSS7.3-HA 
Giải pháp Bản phát hành NSS7.4-HA (tháng 6 năm 2019) Bản phát hành NSS7.3-HA (tháng 10 năm 2018)
Mô hình máy chủ NFS 2x Dell EMC PowerEdge R740
Kết nối nội bộ Gigabit Ethernet sử dụng Mạng Dell S3048-ON
Hệ thống con lưu trữ Ổ đĩa Dell EMC PowerVault ME4084
84 – 3,5″ NL SAS, tối đa 12TB.
Hỗ trợ tối đa 1008TB (không gian thô)
8 LUN, RAID 6 8+2 tuyến tính, kích thước khối 128KiB.
4 Ổ cứng dự phòng toàn cầu.
kết nối lưu trữ Kết nối SAS 12 Gbps.
bộ vi xử lý 2x Intel Xeon Gold 6240 @ 2,6 GHz, 18 lõi trên mỗi bộ xử lý 2x Intel Xeon Gold 6136 @ 3.0 GHz, 12 lõi trên mỗi bộ xử lý
Trí nhớ 12 x 16GiB 2933 MT/s RDIMM 12 x 16GiB 2666 MT/s RDIMM
Hệ điều hành Doanh nghiệp mũ đỏ Linux 7.6 Doanh nghiệp mũ đỏ Linux 7.5
Phiên bản hạt nhân 3.10.0-957.5.1.el7.x86_64 3.10.0-862.el7.x86_64
Hệ thống tệp có thể mở rộng Red Hat (XFS) v4.5.0-18 v4.5.0-15
Kết nối mạng bên ngoài Mellanox ConnectX-5 InfiniBand EDR/100 GbE và 10 GbE Mellanox ConnectX-5 InfiniBand EDR và ​​10 GbE.
Đối với blog giải pháp NSS7.3-HA , Mellanox ConnectX-4 IB EDR/100 GbE đã được sử dụng.
Phiên bản OFED Mellanox OFED 4.5-1.0.1.0 Mellanox OFED 4.4-1.0.0

Trong phần còn lại của blog, giường thử nghiệm và thông tin hiệu suất I/O của NSS7.4-HA sẽ được trình bày. Để hiển thị sự khác biệt về hiệu suất giữa NSS7.4-HA và phiên bản trước đó, số hiệu suất tương ứng của NSS7.3-HA cũng được trình bày.


Cấu hình thử nghiệm

Nền tảng thử nghiệm được sử dụng để đánh giá hiệu suất và chức năng của giải pháp NSS7.4-HA được mô tả tại đây. Lưu ý rằng CPU được sử dụng để kiểm tra hiệu suất khác với CPU được chọn cho giải pháp do CPU Xeon Gold 6240 không được nhận đúng hạn cho công việc này. Kế hoạch là lặp lại một số thử nghiệm sau khi có bộ xử lý 6240 và sửa đổi báo cáo này nếu cần.

Bảng 2: Cấu hình phần cứng NSS7.4-HA 
Cấu hình máy chủ
Mô hình máy chủ NFS Dell PowerEdge R740
bộ vi xử lý 2x CPU Intel Xeon Gold 6244 @ 3.60GHz với 8 lõi mỗi lõi
Trí nhớ 12 x 16GiB 2933 MT/s RDIMM
Đĩa cục bộ và Bộ điều khiển RAID PERC H730P với năm ổ cứng 300GB 15K SAS. Hai ổ đĩa được cấu hình trong RAID1 cho HĐH, hai ổ đĩa được cấu hình trong RAID0 cho không gian trao đổi và ổ đĩa thứ năm là dự phòng nóng cho nhóm đĩa RAID1.
Thẻ Mellanox EDR (khe 8) Thẻ Mellanox ConnectX-5 EDR
Thẻ Ethernet 1GbE (Khe cắm thẻ con gái) Thẻ phụ mạng Broadcom 5720 QP 1 Gigabit Ethernet. Hoặc Intel(R) Gigabit 4P I350-t rNDC
Bộ điều khiển lưu trữ bên ngoài (khe 1 và khe 2) Hai HBA Dell 12Gbps SAS
Quản lý hệ thống iDRAC9 doanh nghiệp
Cấu hình lưu trữ
Bao vây lưu trữ 1x Vỏ Dell PowerVault ME4084
bộ điều khiển RAID Bộ điều khiển RAID song công trong Dell ME4084
Ổ đĩa cứng Ổ đĩa 84 – 10TB 7.2K NL SAS trên mỗi mảng, tổng cộng ổ đĩa 84 x 10TB
Các thành phần khác
Bộ chuyển mạch Gigabit Ethernet riêng Mạng Dell S3048-ON
Đơn vị phân phối điện Hai APC switch Rack PDU, model AP7921B

Bảng 3: Phiên bản phần mềm máy chủ NSS7.4-HA 

Thành phần Sự miêu tả
Hệ điều hành Red Hat Enterprise Linux (RHEL) 7.6 x86_64 lỗi
Phiên bản hạt nhân 3.10.0-957.5.1.el7.x86_64
Bộ cụm Red Hat Cluster Suite từ RHEL 7.6
Hệ thống tập tin Hệ thống tệp có thể mở rộng Red Hat (XFS) 4.5.0-18.
Công cụ quản lý hệ thống Quản trị viên máy chủ Dell OpenManage 9.3.0-3407_A00

Bảng 4: Cấu hình máy khách NSS7.4-HA 

Thành phần Sự miêu tả
May chủ 32 nút tính toán Dell EMC PowerEdge C6420
CPU 2x CPU Intel Xeon Gold 6148 @ 2.40GHz với 20 lõi trên mỗi bộ xử lý
Trí nhớ 12 x 16GiB 2666 MT/s RDIMM
Hệ điều hành Red Hat Enterprise Linux Server phát hành 7.6
Phiên bản hạt nhân 3.10.0-957.el7.x86_64
 kết nối Mellanox InfiniBand EDR
phiên bản OFED 4.3-1.0.1.0
Chương trình cơ sở ConnectX-4 17.12.2052

 


Tóm tắt hiệu suất NSS7.4-HA I/O

Phần này trình bày kết quả kiểm tra hiệu suất I/O cho giải pháp NSS7.4 hiện tại. Tất cả các thử nghiệm hiệu suất đã được tiến hành trong một kịch bản không có lỗi để đo lường khả năng tối đa của giải pháp. Các thử nghiệm tập trung vào ba loại mẫu I/O: đọc và ghi tuần tự lớn, đọc và ghi ngẫu nhiên nhỏ và ba thao tác siêu dữ liệu (tạo tệp, thống kê và xóa). Giống như phiên bản trước NSS7.3-HA, giải pháp sử dụng bộ lập lịch I/O thời hạn và 256 daemon NFS.

Cấu hình 840TB (kích thước lưu trữ thô) đã được đo điểm chuẩn với kết nối mạng IPoIB qua EDR. Một cụm điện toán 32 nút đã được sử dụng để tạo khối lượng công việc cho các bài kiểm tra điểm chuẩn. Mỗi thử nghiệm được chạy trên một loạt máy khách để kiểm tra khả năng mở rộng của giải pháp.

Điểm chuẩn IOzone và mdtest đã được sử dụng trong nghiên cứu này. IOzone đã được sử dụng cho các bài kiểm tra tuần tự và ngẫu nhiên. Đối với các thử nghiệm tuần tự, kích thước yêu cầu là 1024KiB đã được sử dụng. Tổng lượng dữ liệu được truyền là 2TB để đảm bảo rằng bộ nhớ cache của máy chủ NFS đã bão hòa. Các thử nghiệm ngẫu nhiên đã sử dụng kích thước yêu cầu 4KiB và mỗi khách hàng đọc và ghi một tệp 4GiB. Kiểm tra siêu dữ liệu đã được thực hiện bằng điểm chuẩn mdtest với OpenMPI và bao gồm các thao tác tạo, thống kê và xóa tệp. (Tham khảo Phụ lục A của sách trắng NSS7.3-HA để biết các lệnh hoàn chỉnh được sử dụng trong các thử nghiệm.)

Trình tự ghi và đọc IPoIB NN

Để đánh giá các lần đọc và ghi tuần tự, điểm chuẩn IOzone, phiên bản 3.487, đã được sử dụng ở chế độ đọc và ghi tuần tự. Các thử nghiệm này được tiến hành trên nhiều số lượng luồng bắt đầu từ 1 luồng và tăng dần theo lũy thừa của 2, tối đa 64 luồng. Tại mỗi luồng, số lượng tệp bằng nhau được tạo, vì thử nghiệm này hoạt động trên một tệp trên mỗi luồng hoặc trường hợp NN. Kích thước tệp tổng hợp là 2TB đã được chọn, được chia đều cho số lượng chuỗi trong bất kỳ thử nghiệm cụ thể nào.

Hình 2 cung cấp sự so sánh về hiệu năng I/O tuần tự của phiên bản NSS7.4-HA với phiên bản NSS7.3-HA. Từ hình này, có thể thấy rằng NSS7.4 mới nhất và NSS7.3 trước đó có hiệu suất cao nhất tương tự nhau, với tốc độ đọc ~ 7 GB/giây và hiệu suất ghi cao nhất ~ 5 GB/giây. Tuy nhiên, ở một số luồng, hiệu suất ghi giảm 15-20% được đo khi so sánh với giải pháp NSS7.3-HA. Chúng tôi đang tiến hành điều tra sự khác biệt về hiệu suất này. Hiệu suất đọc đã tăng gần 45% ở số lượng luồng 1 và 2 và tăng 18% ở số lượng luồng 8. Đối với số lượng luồng cao hơn 8, hiệu suất đọc tương tự như hiệu suất của giải pháp NSS7.3-HA.

Hình 2: Hiệu suất I/O tuần tự lớn IPoIB

SLN317325_en_US__2image002(3)

IPoIB viết và đọc ngẫu nhiên NN

Để đánh giá hiệu suất IO ngẫu nhiên, IOzone phiên bản 3.487 đã được sử dụng ở chế độ ngẫu nhiên. Các thử nghiệm được tiến hành trên số luồng bắt đầu từ 1 đến 64 ở lũy thừa 2. Kích thước bản ghi được chọn là 4KB. Mỗi khách hàng đọc hoặc ghi một tệp 4GiB để mô phỏng các truy cập dữ liệu ngẫu nhiên nhỏ. Vì cụm chỉ có 32 nút nên điểm dữ liệu 64 luồng thu được với 32 máy khách chạy 2 luồng mỗi máy.

Hình 3 cho thấy sự so sánh hiệu suất ghi và đọc I/O ngẫu nhiên của NSS7.4-HA với hiệu suất của NSS7.3-HA. Từ hình này, có thể thấy rằng NSS7.4 có hiệu suất cao nhất ghi ngẫu nhiên tương tự như NSS7.3-HA, ~ 7300 IOPS. Trong giải pháp NSS7.4-HA, đối với số luồng thấp hơn là 1 và 2, hiệu suất ghi thấp hơn khoảng 14% so với phiên bản trước của giải pháp và điều này đang được điều tra. Hiệu suất đọc ngẫu nhiên tăng đều trên NSS7.4 và đạt hiệu suất cao nhất là 16607 IOPS ở 64 luồng. Trong phiên bản trước, (NSS7.3-HA), hiệu suất cao nhất của 28811 IOPS đã đạt được ở 32 luồng, cao hơn 42% so với hiệu suất cao nhất đạt được khi đọc ngẫu nhiên trong giải pháp NSS7.4-HA.

Hình 3: Hiệu suất I/O ngẫu nhiên IPoIB

SLN317325_en_US__303(1)

Hoạt động siêu dữ liệu IPoIB

Để đánh giá hiệu suất siêu dữ liệu của hệ thống, công cụ MDTest phiên bản 1.9.3 đã được sử dụng. Bản phân phối MPI được sử dụng là OpenMPI phiên bản 1.10.7. Các thử nghiệm siêu dữ liệu được thực hiện bằng cách tạo 960000 tệp cho số luồng lên tới 32 và sau đó tăng số lượng tệp để kiểm tra khả năng mở rộng của giải pháp như được lập bảng trong Bảng 5.

Bảng 5: Kiểm tra siêu dữ liệu: Phân phối tệp và thư mục trên các luồng 

Số của chủ đề Số lượng tệp trên mỗi thư mục Số lượng thư mục trên mỗi chủ đề Tổng số tệp
1 3000 320 960000
2 3000 160 960000
4 3000 80 960000
số 8 3000 40 960000
16 3000 20 960000
32 3000 10 960000
64 3000 số 8 1536000
128 3000 4 1436000
256 3000 4 3072000
512 3000 4 6144000

Hình 4, Hình 5 và Hình 6 lần lượt hiển thị kết quả của các thao tác tạo, thống kê và xóa tệp. Vì cụm điện toán HPC có 32 nút điện toán, nên trong biểu đồ bên dưới, mỗi máy khách thực thi tối đa một luồng trên mỗi nút với tổng số lên tới 32. Đối với số lượng máy khách là 64, 128, 256 và 512, mỗi nút thực thi 2, 4 , 8 hoặc 16 hoạt động đồng thời.

Khi tạo tệp, có sự cải thiện 20% về hiệu suất lên tới 16 luồng và từ 32 luồng trở đi, hiệu suất của cả hai phiên bản gần như tương tự nhau.
Hoạt động thống kê trong NSS7.4 đã ghi nhận hiệu suất cải thiện 10% đối với số lượng luồng thấp hơn (1,2, 8 và 16) và hiệu suất giảm >30% ở số lượng luồng cao hơn (từ 64 luồng xuống 512 luồng).
Cuối cùng, thao tác xóa có hiệu suất giảm 14% đối với tối đa 64 máy khách và giảm >20% đối với số lượng luồng cao hơn là 128.256 và 512.

Hình 4: Hiệu suất tạo tệp IPoIB
SLN317325_en_US__404(1)

Hình 5: Hiệu suất chỉ số fiel IPoIB
SLN317325_vi_US__505(1)

Hình 6: Hiệu suất xóa tệp IPoIB
SLN317325_en_US__606(1)


Phần kết luận

Bảng sau đây tóm tắt sự khác biệt về hiệu suất quan sát được giữa các giải pháp NSS7.4 và NSS7.3 gần đây nhất.

Bảng 5: So sánh hiệu năng của phiên bản NSS7.4 và NSS7.3 HA

Lưu trữ Dell EMC HPC NFS NSS7.4-HA NSS7.4 – HÀ NSS7.3-HA
thứ tự Đỉnh ghi 1MB: giảm 1,4% 4.834 MB/giây 4.906 MB/giây
thứ tự Đỉnh đọc 1MB: giảm 0,7% 7.024 MB/giây 7.073 MB/giây
Đỉnh ghi 4KB ngẫu nhiên: giảm 0,7% 7.290 IOp 7.341 IOp
Đỉnh đọc 4KB ngẫu nhiên: Giảm 42% 16.607 IOp 28.811 lượt truy cập
Tạo hoạt động/Đỉnh thứ hai: Giảm 1,1% 54.197 Hoạt động/giây 54.795 Hoạt động/giây
Hoạt động thống kê/Đỉnh thứ hai: Giảm 35% 522.231 Hoạt động/giây 808.317 Hoạt động/giây
Xóa hoạt động/Đỉnh thứ hai: Giảm 35% 47.345 Hoạt động/giây 73.320 Hoạt động/giây

Từ các kết quả trên, chúng tôi có thể kết luận rằng giải pháp NSS7.4-HA hiện tại cung cấp hiệu suất tương đương với giải pháp NSS7.3-HA tiền nhiệm. Chúng tôi dự định chạy các bài kiểm tra điểm chuẩn với CPU Xeon Gold 6240 với 18 lõi trên mỗi bộ xử lý, để hiểu xem liệu hiệu suất giảm đối với các lần đọc ngẫu nhiên và giảm hiệu suất ở số lượng luồng cao hơn trong chỉ số tệp và hoạt động xóa tệp có phải là do nguyên nhân thấp hơn không số lõi được sử dụng trong CPU Xeon Gold 6244 (8 lõi trên mỗi bộ xử lý) được sử dụng để đo điểm chuẩn hiệu năng cho giải pháp NSS7.4-HA.