Khả năng mở rộng của các Giải pháp Sẵn sàng của Dell cho Bộ lưu trữ HPC BeeGFS

Giới thiệu

Blog này thảo luận về khả năng mở rộng của Giải pháp Dell EMC Ready dành cho Bộ lưu trữ HPC BeeGFS mà đã được công bố gần đây. Kiến trúc BeeGFS bao gồm bốn dịch vụ chính, dịch vụ quản lý, dịch vụ siêu dữ liệu, dịch vụ lưu trữ và dịch vụ khách hàng. Có thể chạy bất kỳ sự kết hợp nào của bốn dịch vụ chính này, bao gồm tất cả chúng, trên cùng một máy chủ, vì các vai trò và phần cứng không được tích hợp chặt chẽ trong trường hợp của BeeGFS. Trong “Giải pháp siêu hội tụ”, cả bốn dịch vụ đều chạy trên cùng một máy chủ. Cấu hình này không được khuyến nghị cho các môi trường quan trọng về hiệu suất vì các ứng dụng khách thường tiêu thụ tài nguyên có thể ảnh hưởng đến hiệu suất của các dịch vụ lưu trữ. Giải pháp Dell EMC sử dụng các máy chủ lưu trữ chuyên dụng và máy chủ lưu trữ và siêu dữ liệu mục đích kép để cung cấp giải pháp lưu trữ có thể mở rộng, hiệu suất cao. Có thể mở rộng quy mô hệ thống bằng cách thêm các máy chủ lưu trữ bổ sung vào hệ thống hiện có. Trong blog này, chúng tôi sẽ trình bày các cấu hình với số lượng máy chủ lưu trữ khác nhau và hiệu suất có thể được mong đợi với các cấu hình này.


Cấu hình cơ sở

Giải pháp lưu trữ BeeGFS, được thiết kế để cung cấp hệ thống tệp đầu hiệu suất cao, sử dụng các thành phần phần cứng sau:

  • Máy chủ quản lý
    • R640, Dual Intel Xeon Gold 5218 2.3GHz, 16 lõi, 96GB (12x 8GB 2666 MT/s RDIMM), 6 x 15k RPM 300GB SAS, H740P
  • Siêu dữ liệu và máy chủ lưu trữ
    • R740xd, 2x CPU Intel Xeon Platinum 8268 @ 2,90GHz, 24 lõi, 384GB (12x 32GB 2933 MT/s RDIMM)
    • Thẻ BOSS với 2 ổ SSD M.2 240GB M.2 trong RAID 1 cho HĐH
    • 24x, Intel 1.6TB, NVMe, Flash Express sử dụng hỗn hợp, Ổ đĩa 2.5 SFF, RAID phần mềm

Máy chủ quản lý chạy dịch vụ giám sát BeeGFS. Máy chủ siêu dữ liệu sử dụng 12 ổ đĩa trên vùng NUMA 0 để lưu trữ Mục tiêu siêu dữ liệu (MDT), trong khi 12 ổ đĩa còn lại trên vùng NUMA 1 lưu trữ Mục tiêu lưu trữ (ST). Máy chủ siêu dữ liệu chuyên dụng không được sử dụng vì yêu cầu dung lượng lưu trữ cho siêu dữ liệu BeeGFS là rất nhỏ. Các mục tiêu và dịch vụ siêu dữ liệu và lưu trữ được tách biệt trên các nút NUMA riêng biệt để tạo ra sự tách biệt đáng kể về khối lượng công việc. Các máy chủ lưu trữ được sử dụng trong cấu hình có ba dịch vụ lưu trữ chạy trên mỗi vùng NUMA, tổng cộng sáu dịch vụ trên mỗi máy chủ. Để biết thêm chi tiết, vui lòng tham khảo blog thông báo . Hình 1 cho thấy hai cấu hình cơ bản đã được thử nghiệm và xác nhận tại Dell EMC HPC và Phòng thí nghiệm đổi mới trí tuệ nhân tạo .

SLN319382_en_US__1baseconfigsupload

Hình 1: Cấu hình cơ sở

 

Cấu hình nhỏ bao gồm ba máy chủ R740xd. Nó có tổng cộng 15 mục tiêu lưu trữ. Cấu hình trung bình có máy chủ 6xR740xd và có tổng cộng 33 mục tiêu lưu trữ. Người dùng có thể bắt đầu với cấu hình “Nhỏ” hoặc với cấu hình “Trung bình” và có thể thêm máy chủ lưu trữ hoặc siêu dữ liệu nếu cần để tăng dung lượng lưu trữ và hiệu suất tổng thể hoặc số lượng tệp và hiệu suất siêu dữ liệu tương ứng. Bảng 1 hiển thị dữ liệu hiệu suất cho các cấu hình cơ bản đã được thử nghiệm và xác thực rộng rãi tại Dell EMC HPC và Phòng thí nghiệm đổi mới trí tuệ nhân tạo.

Cấu hình cơ sở Bé nhỏ Trung bình
Tổng U (MDS+SS) 6U 12U
Số máy chủ lưu trữ chuyên dụng 2 5
Số ổ đĩa NVMe để lưu trữ dữ liệu 60 132
Không gian có thể sử dụng ước tính 1,6 TB 86TiB 190 TiB
3,2 TB 173TiB 380 TiB
6,4TB 346TiB 761 tib
Đỉnh tuần tự đọc 60,1 GB/giây 132,4 GB/giây
Ghi tuần tự cao điểm 57,7 GB/giây 120,7 GB/giây
đọc ngẫu nhiên 1,80 triệu IOPS 3,54 triệu IOPS
Viết ngẫu nhiên 1,84 triệu IOPS 3,59 triệu IOPS

Bảng 1 : Chi tiết về công suất và hiệu suất của các cấu hình cơ bản


Tính toán không gian có thể sử dụng BeeGFS

Không gian có thể sử dụng ước tính được tính bằng TiB (vì hầu hết các công cụ hiển thị không gian có thể sử dụng theo đơn vị nhị phân) bằng công thức sau:

Dung lượng có thể sử dụng của BeeGFS tính bằng TiB= (0,99* Số lượng ổ đĩa* kích thước tính bằng TB * (10^12/2^40)

Trong công thức trên, 0,99 là hệ số đạt được bằng cách giả định thận trọng rằng có 1% chi phí hoạt động từ hệ thống tệp. Để đạt được số lượng ổ đĩa để lưu trữ, 12 ổ đĩa từ MDS cũng được bao gồm. Điều này là do, trong MDS, 12 ổ đĩa trong vùng NUMA 0 được sử dụng cho siêu dữ liệu và 12 ổ đĩa trong vùng NUMA 1 được sử dụng để lưu trữ. Yếu tố cuối cùng trong công thức 10^12/2^40 là chuyển đổi dung lượng có thể sử dụng từ TB sang TiB.


Cấu hình có thể mở rộng

Giải pháp lưu trữ hiệu suất cao BeeGFS được thiết kế linh hoạt và người ta có thể dễ dàng và liên tục thay đổi quy mô hiệu suất và/hoặc dung lượng bằng cách thêm các máy chủ bổ sung như minh họa bên dưới:
SLN319382_en_US__2scale4

             Hình 2: Các ví dụ về cấu hình theo tỷ lệ
Phần siêu dữ liệu của ngăn xếp vẫn giữ nguyên đối với tất cả các cấu hình trên được mô tả trong blog này. Điều này là do các yêu cầu về dung lượng lưu trữ cho siêu dữ liệu BeeGFS thường là 0,5% đến 1% tổng dung lượng lưu trữ. Tuy nhiên, nó thực sự phụ thuộc vào số lượng thư mục và tệp trong hệ thống tệp. Theo nguyên tắc chung, người dùng có thể thêm một máy chủ siêu dữ liệu bổ sung khi tỷ lệ phần trăm dung lượng siêu dữ liệu cho bộ lưu trữ giảm xuống dưới 1%. Bảng 2 hiển thị dữ liệu hiệu suất cho các cấu hình linh hoạt khác nhau của Giải pháp lưu trữ BeeGFS.
Cấu hình Bé nhỏ +1 nhỏ Nhỏ +2 Trung bình Trung bình +1
Tổng U (MDS+SS) 6U 8U 10U 12U 14U
Số máy chủ lưu trữ chuyên dụng 2 3 4 5 6
Số ổ đĩa NVMe để lưu trữ dữ liệu 60 84 108 132 156
Không gian có thể sử dụng ước tính 1,6 TB 86TiB 121TiB 156TiB 190 TiB 225 TiB
3,2 TB 173TiB 242TiB 311 tiB 380 TiB 449 TiB
6,4TB 346TiB 484TiB 622TiB 761 tib 898 TiB
Đỉnh tuần tự đọc 60,1 GB/giây 83,3 GB/giây 105,2 GB/giây 132,4 GB/giây 152,9GB/giây
Ghi tuần tự cao điểm 57,7 GB/giây 80,3 GB/giây 99,8GB/giây 120,7 GB/giây 139,9GB/giây

Bảng 2 : Chi tiết về công suất và hiệu suất của các cấu hình theo tỷ lệ

 


Đặc tính hiệu suất

Hiệu suất của các cấu hình khác nhau đã được kiểm tra bằng cách tạo các nhóm lưu trữ. Cấu hình nhỏ có 15 đích lưu trữ và mỗi máy chủ lưu trữ bổ sung sẽ thêm sáu đích lưu trữ bổ sung. Vì vậy, với mục đích kiểm tra hiệu suất của các cấu hình khác nhau, nhóm lưu trữ đã được tạo từ 15 đến 39 mục tiêu lưu trữ (tăng thêm sáu đối với nhỏ, nhỏ+1, nhỏ+2, trung bình, trung bình+1). Đối với mỗi nhóm trong số đó, ba lần lặp lại điểm chuẩn iozone đã được chạy, mỗi lần có một đến 1024 luồng (theo lũy thừa của hai lần tăng). Phương pháp thử nghiệm được áp dụng giống như phương pháp được mô tả trong blog thông báo . Hình 3 và 4 lần lượt hiển thị hiệu suất ghi và đọc của các cấu hình có thể mở rộng, với hiệu suất cao nhất của từng cấu hình được đánh dấu để sẵn sàng tham khảo:

SLN319382_en_US__3image003(2)
Hình 3 : Hiệu suất ghi của cấu hình có thể mở rộng

SLN319382_en_US__4image004
Hình 4:   Hiệu suất đọc của cấu hình có thể mở rộng

 

Nhóm lưu trữ được đề cập chỉ được tạo cho mục đích rõ ràng là mô tả hiệu suất của các cấu hình khác nhau. Trong khi thực hiện đánh giá hiệu suất của cấu hình trung bình được nêu chi tiết trong blog thông báo, tất cả 33 mục tiêu chỉ nằm trong “Nhóm mặc định”. Đầu ra của lệnh beegfs-ctl –liststoragepools được cung cấp dưới đây cho thấy việc gán các mục tiêu lưu trữ:

# beegfs-ctl –liststoragepools
Pool ID Pool Mô tả Mục tiêu Nhóm Buddy
======= ================ =================================================
1 Mặc định 1,2 ,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21
,
22,23,24,25,26,27,28,29,30,
31,32,33


Kết luận và công việc trong tương lai

Blog này đã thảo luận về khả năng mở rộng của Giải pháp Sẵn sàng của Dell EMC cho Bộ lưu trữ HPC BeeGFS và nêu bật hiệu suất cho thông lượng đọc và ghi tuần tự, cho các cấu hình khác nhau. Hãy theo dõi Phần 3 của loạt bài blog này sẽ thảo luận về các tính năng bổ sung của BeeGFS và sẽ nêu bật việc sử dụng “StorageBench”, điểm chuẩn nhắm mục tiêu lưu trữ tích hợp của BeeGFS. Là một phần của các bước tiếp theo, chúng tôi sẽ xuất bản sách trắng sau với hiệu suất siêu dữ liệu, đánh giá hiệu suất IOR N-1 và với các chi tiết bổ sung về cân nhắc thiết kế, điều chỉnh và cấu hình.