Hiệu suất siêu dữ liệu PowerEdge R750 với MDtest bằng các tệp trống
Phần này tương tự như các phần trước đó là sử dụng mô-đun HDMD mới dựa trên một hoặc nhiều cặp máy chủ NVMe dựa trên máy chủ PowerEdge R650 với 10 thiết bị kết nối trực tiếp NVMe. Hiệu suất siêu dữ liệu trên mô-đun HDMD NVMe mới với máy chủ PowerEdge R750 NVMe cho dữ liệu được ghi lại trong phần này. Hiệu suất siêu dữ liệu cho mô-đun HDMD NVMe mới với bộ lưu trữ dữ liệu dựa trên ME sẽ được ghi lại cho bản cập nhật tiếp theo của giải pháp pixstor bằng cách sử dụng mảng PowerVault mới (ME5).
Hiệu suất siêu dữ liệu được đo bằng MDtest phiên bản 3.3.0, với OpenMPI 4.1.4rc1 để chạy điểm chuẩn trên 16 nút tính toán. Các bài kiểm tra mà chúng tôi đã chạy đa dạng từ một luồng cho đến 512 luồng. Điểm chuẩn chỉ được sử dụng cho các tệp (không có siêu dữ liệu thư mục), nhận số lượng hoạt động tạo, thống kê, đọc và xóa mà giải pháp có thể xử lý.
Một số HDMD trên Mô-đun NVMe (cặp NVMe R650) có thể được sử dụng để tăng số lượng tệp được hỗ trợ (các nút) và tăng hiệu suất siêu dữ liệu với mỗi cặp máy chủ bổ sung. Một ngoại lệ đối với sự gia tăng này có thể là các thao tác thống kê (và đọc các tệp trống) vì số lượng của chúng cao và CPU trở thành nút cổ chai và hiệu suất không tiếp tục tăng.
Lệnh sau được sử dụng để chạy điểm chuẩn, trong đó biến Chủ đề là số lượng luồng được sử dụng (1 đến 512 tăng dần theo lũy thừa của hai) và my_hosts.$Threads là tệp tương ứng phân bổ mỗi luồng trên một nút khác nhau, sử dụng phương pháp quay vòng để trải chúng đồng nhất trên 16 nút tính toán. Giống như điểm chuẩn IOR, số lượng luồng tối đa được giới hạn ở 512 vì không có đủ lõi cho hơn 640 luồng và việc chuyển ngữ cảnh có thể ảnh hưởng đến kết quả, báo cáo một con số thấp hơn hiệu suất thực của giải pháp.
mpirun –allow-run-as-root -np $Threads –hostfile my_hosts.$Threads –map-by node –mca btl_openib_allow_ib 1 –oversubscribe –prefix /usr/mpi/gcc/openmpi-4.1.2a1 / usr/local/bin/mdtest -v -d /mmfs1/perf/mdtest -P -i 1 -b $Directories -z 1 -L -I 1024 -u -t -F
Do tổng số IOP, số tệp trên mỗi thư mục và số luồng có thể ảnh hưởng đến kết quả hoạt động nên chúng tôi quyết định giữ cố định tổng số tệp thành 2 tệp Mi (2^21 = 2097152), số tệp trên mỗi thư mục được cố định ở 1024 và số lượng thư mục thay đổi khi số lượng chuỗi thay đổi như trong bảng sau:
Số của chủ đề |
Số lượng thư mục trên mỗi chủ đề |
Tổng số tệp |
1 |
2048 |
2.097.152 |
2 |
1024 |
2.097.152 |
4 |
512 |
2.097.152 |
số 8 |
256 |
2.097.152 |
16 |
128 |
2.097.152 |
32 |
64 |
2.097.152 |
64 |
32 |
2.097.152 |
128 |
16 |
2.097.152 |
256 |
số 8 |
2.097.152 |
512 |
4 |
2.097.152 |
1024 |
2 |
2.097.152 |
Lưu ý rằng thang đo được chọn là logarit với cơ số 10, để cho phép so sánh các hoạt động có sự khác biệt theo một số bậc độ lớn; mặt khác, một số hoạt động xuất hiện giống như một đường phẳng gần bằng 0 trên biểu đồ bình thường. Biểu đồ logarit với cơ số 2 phù hợp hơn vì số luồng tăng theo lũy thừa của 2. Biểu đồ như vậy trông giống nhau, nhưng mọi người có xu hướng nhận thức và ghi nhớ các số dựa trên lũy thừa của 10 tốt hơn.
Hệ thống cho thấy kết quả tốt đối với các hoạt động thống kê đạt giá trị cao nhất ở 64 luồng với 10,5 triệu thao tác/giây. Hoạt động đọc đạt mức cao nhất là 4,3 triệu thao tác/giây ở 64 luồng (lưu ý rằng chúng tôi đang đọc các tệp trống). Thao tác xóa đạt tối đa 419,1K thao tác/giây và tạo thao tác đạt đỉnh với 252,5K thao tác/giây, cả hai đều ở 64 luồng. Hoạt động thống kê và đọc có nhiều biến đổi hơn, nhưng khi chúng đạt đến giá trị cao nhất, hiệu suất không giảm xuống dưới 4,5 triệu thao tác/giây đối với hoạt động thống kê và 2,3 triệu thao tác/giây đối với hoạt động đọc. Thao tác tạo và xóa ít thay đổi hơn. Thao tác tạo tiếp tục tăng khi số lượng luồng tăng lên và thao tác xóa giảm dần sau khi đạt đến giá trị cao nhất.
Vì những con số này dành cho mô-đun siêu dữ liệu với một cặp siêu dữ liệu PowerEdge R650 NVMe, nên hiệu suất sẽ tăng đối với mỗi cặp PowerEdge R650 NVMe bổ sung, tuy nhiên, chúng tôi không thể giả định mức tăng tuyến tính cho tất cả các hoạt động. Trừ khi toàn bộ tệp vừa với inode của tệp đó, các mục tiêu dữ liệu trên các thiết bị khác sẽ được sử dụng để lưu trữ các tệp nhỏ, hạn chế hiệu suất ở một mức độ nào đó.
Bài viết mới cập nhật
Tăng tốc khối lượng công việc của Hệ thống tệp mạng (NFS) của bạn với RDMA
Giao thức NFS hiện nay được sử dụng rộng rãi trong ...
Mẹo nhanh về dữ liệu phi cấu trúc – OneFS Protection Overhead
Gần đây đã có một số câu hỏi từ lĩnh vực ...
Giới thiệu Dell PowerScale OneFS dành cho Quản trị viên NetApp
Để các doanh nghiệp khai thác được lợi thế của công ...
Cơ sở hạ tầng CNTT: Mua hay đăng ký?
Nghiên cứu theo số liệu của IDC về giải pháp đăng ...