Giới thiệu
Blog này thảo luận về khả năng mở rộng của Giải pháp Dell EMC Ready dành cho Bộ lưu trữ HPC BeeGFS mà đã được công bố gần đây. Kiến trúc BeeGFS bao gồm bốn dịch vụ chính, dịch vụ quản lý, dịch vụ siêu dữ liệu, dịch vụ lưu trữ và dịch vụ khách hàng. Có thể chạy bất kỳ sự kết hợp nào của bốn dịch vụ chính này, bao gồm tất cả chúng, trên cùng một máy chủ, vì các vai trò và phần cứng không được tích hợp chặt chẽ trong trường hợp của BeeGFS. Trong “Giải pháp siêu hội tụ”, cả bốn dịch vụ đều chạy trên cùng một máy chủ. Cấu hình này không được khuyến nghị cho các môi trường quan trọng về hiệu suất vì các ứng dụng khách thường tiêu thụ tài nguyên có thể ảnh hưởng đến hiệu suất của các dịch vụ lưu trữ. Giải pháp Dell EMC sử dụng các máy chủ lưu trữ chuyên dụng và máy chủ lưu trữ và siêu dữ liệu mục đích kép để cung cấp giải pháp lưu trữ có thể mở rộng, hiệu suất cao. Có thể mở rộng quy mô hệ thống bằng cách thêm các máy chủ lưu trữ bổ sung vào hệ thống hiện có. Trong blog này, chúng tôi sẽ trình bày các cấu hình với số lượng máy chủ lưu trữ khác nhau và hiệu suất có thể được mong đợi với các cấu hình này.
Cấu hình cơ sở
Giải pháp lưu trữ BeeGFS, được thiết kế để cung cấp hệ thống tệp đầu hiệu suất cao, sử dụng các thành phần phần cứng sau:
- Máy chủ quản lý
- R640, Dual Intel Xeon Gold 5218 2.3GHz, 16 lõi, 96GB (12x 8GB 2666 MT/s RDIMM), 6 x 15k RPM 300GB SAS, H740P
- Siêu dữ liệu và máy chủ lưu trữ
- R740xd, 2x CPU Intel Xeon Platinum 8268 @ 2,90GHz, 24 lõi, 384GB (12x 32GB 2933 MT/s RDIMM)
- Thẻ BOSS với 2 ổ SSD M.2 240GB M.2 trong RAID 1 cho HĐH
- 24x, Intel 1.6TB, NVMe, Flash Express sử dụng hỗn hợp, Ổ đĩa 2.5 SFF, RAID phần mềm
Máy chủ quản lý chạy dịch vụ giám sát BeeGFS. Máy chủ siêu dữ liệu sử dụng 12 ổ đĩa trên vùng NUMA 0 để lưu trữ Mục tiêu siêu dữ liệu (MDT), trong khi 12 ổ đĩa còn lại trên vùng NUMA 1 lưu trữ Mục tiêu lưu trữ (ST). Máy chủ siêu dữ liệu chuyên dụng không được sử dụng vì yêu cầu dung lượng lưu trữ cho siêu dữ liệu BeeGFS là rất nhỏ. Các mục tiêu và dịch vụ siêu dữ liệu và lưu trữ được tách biệt trên các nút NUMA riêng biệt để tạo ra sự tách biệt đáng kể về khối lượng công việc. Các máy chủ lưu trữ được sử dụng trong cấu hình có ba dịch vụ lưu trữ chạy trên mỗi vùng NUMA, tổng cộng sáu dịch vụ trên mỗi máy chủ. Để biết thêm chi tiết, vui lòng tham khảo blog thông báo . Hình 1 cho thấy hai cấu hình cơ bản đã được thử nghiệm và xác nhận tại Dell EMC HPC và Phòng thí nghiệm đổi mới trí tuệ nhân tạo .
Hình 1: Cấu hình cơ sở
Cấu hình nhỏ bao gồm ba máy chủ R740xd. Nó có tổng cộng 15 mục tiêu lưu trữ. Cấu hình trung bình có máy chủ 6xR740xd và có tổng cộng 33 mục tiêu lưu trữ. Người dùng có thể bắt đầu với cấu hình “Nhỏ” hoặc với cấu hình “Trung bình” và có thể thêm máy chủ lưu trữ hoặc siêu dữ liệu nếu cần để tăng dung lượng lưu trữ và hiệu suất tổng thể hoặc số lượng tệp và hiệu suất siêu dữ liệu tương ứng. Bảng 1 hiển thị dữ liệu hiệu suất cho các cấu hình cơ bản đã được thử nghiệm và xác thực rộng rãi tại Dell EMC HPC và Phòng thí nghiệm đổi mới trí tuệ nhân tạo.
Cấu hình cơ sở | Bé nhỏ | Trung bình | |
---|---|---|---|
Tổng U (MDS+SS) | 6U | 12U | |
Số máy chủ lưu trữ chuyên dụng | 2 | 5 | |
Số ổ đĩa NVMe để lưu trữ dữ liệu | 60 | 132 | |
Không gian có thể sử dụng ước tính | 1,6 TB | 86TiB | 190 TiB |
3,2 TB | 173TiB | 380 TiB | |
6,4TB | 346TiB | 761 tib | |
Đỉnh tuần tự đọc | 60,1 GB/giây | 132,4 GB/giây | |
Ghi tuần tự cao điểm | 57,7 GB/giây | 120,7 GB/giây | |
đọc ngẫu nhiên | 1,80 triệu IOPS | 3,54 triệu IOPS | |
Viết ngẫu nhiên | 1,84 triệu IOPS | 3,59 triệu IOPS |
Bảng 1 : Chi tiết về công suất và hiệu suất của các cấu hình cơ bản
Tính toán không gian có thể sử dụng BeeGFS
Không gian có thể sử dụng ước tính được tính bằng TiB (vì hầu hết các công cụ hiển thị không gian có thể sử dụng theo đơn vị nhị phân) bằng công thức sau:
Dung lượng có thể sử dụng của BeeGFS tính bằng TiB= (0,99* Số lượng ổ đĩa* kích thước tính bằng TB * (10^12/2^40)
Trong công thức trên, 0,99 là hệ số đạt được bằng cách giả định thận trọng rằng có 1% chi phí hoạt động từ hệ thống tệp. Để đạt được số lượng ổ đĩa để lưu trữ, 12 ổ đĩa từ MDS cũng được bao gồm. Điều này là do, trong MDS, 12 ổ đĩa trong vùng NUMA 0 được sử dụng cho siêu dữ liệu và 12 ổ đĩa trong vùng NUMA 1 được sử dụng để lưu trữ. Yếu tố cuối cùng trong công thức 10^12/2^40 là chuyển đổi dung lượng có thể sử dụng từ TB sang TiB.
Cấu hình có thể mở rộng
Giải pháp lưu trữ hiệu suất cao BeeGFS được thiết kế linh hoạt và người ta có thể dễ dàng và liên tục thay đổi quy mô hiệu suất và/hoặc dung lượng bằng cách thêm các máy chủ bổ sung như minh họa bên dưới:
Cấu hình | Bé nhỏ | +1 nhỏ | Nhỏ +2 | Trung bình | Trung bình +1 | |
---|---|---|---|---|---|---|
Tổng U (MDS+SS) | 6U | 8U | 10U | 12U | 14U | |
Số máy chủ lưu trữ chuyên dụng | 2 | 3 | 4 | 5 | 6 | |
Số ổ đĩa NVMe để lưu trữ dữ liệu | 60 | 84 | 108 | 132 | 156 | |
Không gian có thể sử dụng ước tính | 1,6 TB | 86TiB | 121TiB | 156TiB | 190 TiB | 225 TiB |
3,2 TB | 173TiB | 242TiB | 311 tiB | 380 TiB | 449 TiB | |
6,4TB | 346TiB | 484TiB | 622TiB | 761 tib | 898 TiB | |
Đỉnh tuần tự đọc | 60,1 GB/giây | 83,3 GB/giây | 105,2 GB/giây | 132,4 GB/giây | 152,9GB/giây | |
Ghi tuần tự cao điểm | 57,7 GB/giây | 80,3 GB/giây | 99,8GB/giây | 120,7 GB/giây | 139,9GB/giây |
Bảng 2 : Chi tiết về công suất và hiệu suất của các cấu hình theo tỷ lệ
Đặc tính hiệu suất
Hiệu suất của các cấu hình khác nhau đã được kiểm tra bằng cách tạo các nhóm lưu trữ. Cấu hình nhỏ có 15 đích lưu trữ và mỗi máy chủ lưu trữ bổ sung sẽ thêm sáu đích lưu trữ bổ sung. Vì vậy, với mục đích kiểm tra hiệu suất của các cấu hình khác nhau, nhóm lưu trữ đã được tạo từ 15 đến 39 mục tiêu lưu trữ (tăng thêm sáu đối với nhỏ, nhỏ+1, nhỏ+2, trung bình, trung bình+1). Đối với mỗi nhóm trong số đó, ba lần lặp lại điểm chuẩn iozone đã được chạy, mỗi lần có một đến 1024 luồng (theo lũy thừa của hai lần tăng). Phương pháp thử nghiệm được áp dụng giống như phương pháp được mô tả trong blog thông báo . Hình 3 và 4 lần lượt hiển thị hiệu suất ghi và đọc của các cấu hình có thể mở rộng, với hiệu suất cao nhất của từng cấu hình được đánh dấu để sẵn sàng tham khảo:
Hình 3 : Hiệu suất ghi của cấu hình có thể mở rộng
Hình 4: Hiệu suất đọc của cấu hình có thể mở rộng
Nhóm lưu trữ được đề cập chỉ được tạo cho mục đích rõ ràng là mô tả hiệu suất của các cấu hình khác nhau. Trong khi thực hiện đánh giá hiệu suất của cấu hình trung bình được nêu chi tiết trong blog thông báo, tất cả 33 mục tiêu chỉ nằm trong “Nhóm mặc định”. Đầu ra của lệnh beegfs-ctl –liststoragepools được cung cấp dưới đây cho thấy việc gán các mục tiêu lưu trữ:
# beegfs-ctl –liststoragepools
Pool ID Pool Mô tả Mục tiêu Nhóm Buddy
======= ================ =================================================
1 Mặc định 1,2 ,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20,21
,
22,23,24,25,26,27,28,29,30,
31,32,33
Kết luận và công việc trong tương lai
Blog này đã thảo luận về khả năng mở rộng của Giải pháp Sẵn sàng của Dell EMC cho Bộ lưu trữ HPC BeeGFS và nêu bật hiệu suất cho thông lượng đọc và ghi tuần tự, cho các cấu hình khác nhau. Hãy theo dõi Phần 3 của loạt bài blog này sẽ thảo luận về các tính năng bổ sung của BeeGFS và sẽ nêu bật việc sử dụng “StorageBench”, điểm chuẩn nhắm mục tiêu lưu trữ tích hợp của BeeGFS. Là một phần của các bước tiếp theo, chúng tôi sẽ xuất bản sách trắng sau với hiệu suất siêu dữ liệu, đánh giá hiệu suất IOR N-1 và với các chi tiết bổ sung về cân nhắc thiết kế, điều chỉnh và cấu hình.
Bài viết mới cập nhật
Dell Precision nào phù hợp cho AI cục bộ?
Trí tuệ nhân tạo (AI) đang định hình lại cách các ...
Chuyển đổi viễn thông với chứng nhận SUSE trên máy chủ Dell Telecom
Khám phá cách chứng nhận chung của SUSE và Dell trao ...
LatentAI: Nâng cao trí thông minh biên với Dell và NVIDIA AI
Giàn khoan dầu, hoạt động quân sự và xe tự hành ...
Tăng tốc lưu trữ máy chủ lớn với các mô hình Dell Disk Library (DLm) mới
Dell công bố các mẫu lưu trữ băng ảo máy chủ ...