Dell Validated Design cho HPC pixstor Storage—Giải pháp chung với Kalray (4)

thành phần giải pháp

  • Giải pháp này được phát hành cùng với CPU Intel Xeon Scalable thế hệ thứ 3 mới nhất, còn được gọi là Ice Lake và RAM nhanh nhất hiện có (3200 MT/s). Bảng sau đây liệt kê các thành phần chính của giải pháp. Một số khác biệt đã được đưa ra giữa BOM mong muốn và phần cứng thử nghiệm thực tế vì phần cứng tiền phát hành (cấp độ sản xuất) cho dự án của chúng tôi, chỉ có một số mẫu CPU được cung cấp, không bao gồm mẫu vòng đời dự kiến.

    Cột  Khi phát hành liệt  kê các thành phần được lên kế hoạch sử dụng vào thời điểm phát hành và có sẵn cho khách hàng cùng với giải pháp. Cột  Giường thử nghiệm  liệt kê các thành phần thực sự được sử dụng để mô tả hiệu suất của giải pháp. Các ổ đĩa được liệt kê cho dữ liệu (12 TB NLS) đã được sử dụng để mô tả đặc tính hiệu suất, nhưng tất cả các ổ cứng HDD và SSD được hỗ trợ trong  Ma trận hỗ trợ PowerVault ME5 có thể được sử dụng cho các giải pháp. Do bộ điều khiển ME5 không còn là nút cổ chai đầu tiên của bộ lưu trữ phụ trợ, nên việc sử dụng ổ đĩa có tốc độ định mức cao hơn (10 K, 15 K và SSD) có thể giúp tăng hiệu suất tuần tự. Ngoài ra, chúng có thể cung cấp IOP ngẫu nhiên tốt hơn và có thể cải thiện hoạt động tạo và xóa siêu dữ liệu cho cấu hình tiêu chuẩn. Để dự phòng đầy đủ mạng tốc độ cao, phải sử dụng hai bộ chuyển mạch tốc độ cao (QM8700 cho IB và SN3700 cho 100 GbE) và mỗi bộ chuyển mạch phải có một bộ điều hợp CX6 được kết nối từ mỗi máy chủ.

    Các thành phần phần mềm được liệt kê mô tả các phiên bản được sử dụng trong quá trình thử nghiệm ban đầu và những phiên bản được sử dụng trên phiên bản đã phát hành. Tuy nhiên, các phiên bản phần mềm này có thể thay đổi giữa các lần phát hành chính thức để bao gồm các bản sửa lỗi quan trọng, hỗ trợ cho các thành phần phần cứng mới hoặc bổ sung các tính năng quan trọng.

    Bảng sau đây liệt kê các ổ cứng và SSD dữ liệu có thể có, dựa trên các ổ đĩa được hỗ trợ trong  ma trận hỗ trợ PowerVault ME5 .

    Bảng 2.       Các thành phần được sử dụng tại thời điểm xuất xưởng và trên giường thử nghiệm

    thành phần giải pháp

    Khi phát hành

    giường thử

    Công tắc quản lý nội bộ

    Dell PowerSwitch N2248X-ON GbE

    PowerSwitch S3048-ON

    Hệ thống con lưu trữ dữ liệu

    1 x đến 4 x mảng PowerVault ME5084

    4 x mảng Dell PowerVault ME5084

    4 phần mở rộng PowerVault ME484 tùy chọn (Một phần cho mỗi mảng ME5084)

    80 – 12 TB Ổ cứng HDD 3.5” NL SAS3

    Các tùy chọn thay thế:  15K  RPM:900GB; 10K  RPM:1,2TB, 2,4TB; SSD : 960 GB, 1,92 TB, 3,84 TB; 7,68 TB; NLS : 4TB, 8TB, 12TB, 16TB, 20TB

    8 LUN, RAID 6 8+2 tuyến tính, kích thước khối 512 KiB.

    4 – 1,92 TB (hoặc 3,84 TB hoặc 7,68 TB) SSD SAS3 trên mỗi dãy ME5084 cho siêu dữ liệu – 2 x RAID 1 (hoặc 4 – Ổ cứng dự phòng toàn cầu, nếu sử dụng HDMD tùy chọn)

    4 SSD cho siêu dữ liệu hoặc 4 ổ dự phòng

    4 phụ tùng toàn cầu

    Hệ thống phụ lưu trữ HDDMD tùy chọn

    Một hoặc nhiều cặp cấp NVMe

    Bộ điều khiển lưu trữ RAID

    Song công 12 Gbps SAS

    Dung lượng không cần mở rộng (với ổ cứng 12 TB)

    Nguyên bản: 4032 TB (3667 TiB hoặc 3,58 PiB)

    Định dạng: khoảng 3072 GB (2794 TiB hoặc 2,73 PiB)

    Công suất mở rộng

    (Ổ cứng 12 TB)

    Nguyên bản: 8064 TB (7334 TiB hoặc 7,16 PiB)

    Định dạng: khoảng 6144 GB (5588 TiB hoặc 5,46 PiB)

    Cổng/ngenea

    2 x Intel Xeon Gold 6326 2,9 GHz, 16C/32T, 11,2GT/s, 24M bộ nhớ đệm, Turbo, HT (185 W) DDR4-3200

    2 x Intel Xeon Bạch kim 8352Y

    2,2 GHz, 32C/64T, 11,2GT/giây,

    Bộ nhớ đệm 48M, Turbo, HT (205 W)

    DDR4-3200

    nút lưu trữ

    nút quản lý

    2 x Intel Xeon Gold 6330 2 GHz, 28C/56T, 11,2GT/s, 42M bộ nhớ đệm, Turbo, HT (185 W) DDR4-2933

    Nút R650 NVMe

    2 x Intel Xeon Gold 6354 3,00 GHz, 18C/36T, 11,2GT/s, 39M bộ nhớ đệm, Turbo, HT (205 W) DDR4-3200

    Siêu dữ liệu nhu cầu cao tùy chọn (R650 NVMe)

    2 x Intel Xeon Gold 6354 3,00 GHz, 18C/36T, 11,2GT/s, 39M bộ nhớ đệm, Turbo, HT (205 W) DDR4-3200

    Nút R750 NVMe

    2 x Intel Xeon Platinum 8352Y, 2,2 GHz, 32C/64T, 11,2GT/s, 48M bộ nhớ đệm, Turbo, HT (205 W) DDR4-3200

    Nút R7525 NVMe

    2 x AMD EPYC 7302 3.0 GHz, 16C/32T, 128M L3 (155 W)

    2 x AMD 7H12 2,6 GHz, 64C/64T 256M L3 (280 W)

    Cổng/ngenea

    16 x 16 GiB 3200 MT/s RDIMM (256 GiB)

    nút lưu trữ

    nút quản lý

    Hệ điều hành

    Doanh nghiệp mũ đỏ Linux 8.5

    Phiên bản hạt nhân

    4.18.0-348.23.1.el8_5.x86_64

    phần mềm pixstor

    6.0.3

    Thang đo phổ (GPFS)

    Thang đo phổ (GPFS) 5.1.3-1

    phiên bản OFED

    Mellanox OFED 5.6-1.0.3.3

    NIC hiệu suất cao

    Tất cả: 2 x Dell OEM ConnectX-6 Cổng đơn HDR VPI InfiniBand, Cấu hình thấp

    Các nút cổng và ngenea: 4 bộ điều hợp CX6 VPI, 2 x FS và 2 x bên ngoài

    Công tắc hiệu suất cao

    Mellanox QM8700 cho InfiniBand HDR (200 Gbps)

    SN3700 cho 100 GbE (hoặc SN4700 cho 200 GbE)

    Đĩa cục bộ (hệ điều hành và phân tích/giám sát)

    Máy chủ NVMe: BOSS-S2 với 2 x M.2 240 GB trong RAID 1

    Các máy chủ khác: 3 x 480 GB SSD SAS3 (RAID 1 + HS) cho hệ điều hành với bộ điều khiển RAID phía trước PERC H345

    quản lý hệ thống

    iDRAC9 Enterprise + Dell OpenManage 10.0.1-4561

    Tốc độ cao, mạng quản lý và kết nối SAS

    Vì Giải pháp Sẵn sàng của Dell cho Bộ lưu trữ HPC pixstor được bán kèm theo các dịch vụ triển khai nên mô tả chi tiết về hệ thống cáp cho SAS hoặc mạng tốc độ cao nằm ngoài phạm vi của tài liệu này. Hệ thống cáp của các thành phần khác nhau đến bộ chuyển mạch quản lý cũng nằm ngoài phạm vi của tài liệu này.

    Máy chủ quản lý

    Sử dụng máy chủ PowerEdge R650 với cấu hình riser 0 có 3 khe cắm x16. Hình dưới đây cho thấy sự phân bổ vị trí cho máy chủ:

    Hình 3.    Máy chủ quản lý PowerEdge R650 – phân bổ khe cắm

    Cổng LAN Trên Bo mạch chủ 1 (LOM 1), được đặt tên là  man0 , được kết nối với mạng quản lý 1 GbE. Cổng LOM 2 (LOM2), được đặt tên là  man2  và cổng dành riêng cho iDRAC được kết nối với mạng quản lý bên ngoài để truy cập giải pháp pixstor. Khe cắm 1 và 2, được sử dụng cho bộ điều hợp CX6, được kết nối với bộ chuyển mạch mạng tốc độ cao. Khe 3 được sử dụng cho thẻ cổng nối tiếp tùy chọn.

    Máy chủ nút lưu trữ (SN)

    Sử dụng máy chủ PowerEdge R750 với cấu hình riser 1 có tám khe cắm, 2 x6 và 6 x8, như minh họa trong hình sau:

    Hình 4.    Nút lưu trữ R750 – phân bổ khe

    Cổng LOM 1 và cổng chuyên dụng iDRAC được kết nối với mạng quản lý 1 GbE. Tất cả các máy chủ PowerEdge R750 đều sử dụng khe cắm 3 và 6 (x16) cho bộ điều hợp CX6 được kết nối với bộ chuyển mạch mạng tốc độ cao. Các máy chủ lưu trữ hoặc HDMD được kết nối với mảng ME5 có hai thẻ SAS HBA355e ở các khe 2 và 5 (x8). Khe 8 được sử dụng cho thẻ cổng nối tiếp tùy chọn.

    Lưu trữ dữ liệu phụ trợ

    Để lưu trữ dữ liệu, giải pháp sử dụng mảng đĩa 5U ME5 mật độ cao. Hình dưới đây cho thấy các bộ điều khiển của mảng ME5084. Một cổng SAS (A0-A3 và B0-B3) từ mỗi bộ điều khiển (A và B) được kết nối với một HBA khác trong các khe 2 và 7 trên mỗi nút lưu trữ.

    Hình 5.    Mảng PowerVault ME5084 – bộ điều khiển và cổng SAS

    Đầu nối SAS I/O 0 (cổng trong hộp màu xanh) của mỗi bộ điều khiển được sử dụng để kết nối Mô-đun I/O (IOM) trong mảng mở rộng ME484 sử dụng cổng I/O 0 của Mô-đun I/O tương ứng (Bộ điều khiển A đến Mô-đun I/O A, Bộ điều khiển B đến Mô-đun I/O B).

    Hình dưới đây cho thấy mặt sau của mảng mở rộng ME484, trong đó cổng I/O 0 là cổng SAS màu xanh ở bên trái của mỗi IOM.

    Hình 6.    Mở rộng ME484 – Mô-đun I/O và các cổng SAS

    Nút NVMe

    Các cặp máy chủ PowerEdge mới nhất trong HA (miền chuyển đổi dự phòng) cung cấp tầng dựa trên flash hiệu suất cao cho giải pháp pixstor. Bậc NVMe bao gồm ba máy chủ PowerEdge thay thế: PowerEdge R650, PowerEdge R750 hoặc PowerEdge R7525. Một điểm khác biệt quan trọng so với các bản phát hành pixstor trước đó là NVMesh không còn là một thành phần của giải pháp. Đối với các mục đích HA, một giải pháp thay thế dựa trên bản sao GPFS của NSD đã được triển khai trên mỗi cặp HA của máy chủ NVMe để có các NSD được nhân đôi về mặt chức năng.

    Đối với máy chủ PowerEdge R650, mỗi máy chủ có 10 thiết bị NVMe được gắn trực tiếp, sáu thiết bị cho CPU trong Ổ cắm số 1 và bốn cho CPU trong ổ cắm số 2 (do đó, cấu hình này không phải là cấu hình cân bằng về miền NUMA) và hai Bộ điều hợp HCAs Mellanox ConnectX-6 Cổng đơn VPI HDR 200 Gbps (một cho mỗi ổ cắm CPU). Bất kỳ thiết bị NVMe nào được hỗ trợ trên máy chủ PowerEdge R650 đều được hỗ trợ cho các nút NVMe này. Cả hai giao diện CX6 đều được sử dụng tích cực để di chuyển dữ liệu, sao chép NSD NVMe và cung cấp kết nối từ hệ thống tệp đến máy khách. Ngoài ra, chúng cung cấp khả năng dự phòng phần cứng ở cấp độ bộ điều hợp, cổng và cáp, nhưng hiệu suất bị ảnh hưởng nếu chỉ có một bộ điều hợp CX6 hoạt động.

    Hình 7.    Phân bổ vị trí nút PowerEdge R650 NVMe

    Đối với máy chủ PowerEdge R750s, mỗi máy chủ có 16 thiết bị NVMe được gắn trực tiếp, tám thiết bị cho mỗi CPU và hai bộ điều hợp HCAs Mellanox ConnectX-6 Cổng đơn VPI HDR 200 Gbps (một cho mỗi ổ cắm CPU). Do đó, cấu hình này là một cấu hình cân bằng về các miền NUMA. Bất kỳ thiết bị NVMe nào được hỗ trợ trên máy chủ PowerEdge R750 đều được hỗ trợ cho các nút NVMe này. Cả hai giao diện CX6 đều được sử dụng tích cực để di chuyển dữ liệu, sao chép NSD NVMe và cung cấp kết nối từ hệ thống tệp đến máy khách. Ngoài ra, chúng cung cấp khả năng dự phòng phần cứng ở cấp độ bộ điều hợp, cổng và cáp, nhưng hiệu suất bị ảnh hưởng nếu chỉ có một bộ điều hợp CX6 hoạt động.

    Hình 8.    Phân bổ vị trí nút PowerEdge R750 NVMe

    Đối với máy chủ PowerEdge R7525, mỗi máy chủ có 24 thiết bị NVMe được gắn trực tiếp, 12 thiết bị cho mỗi CPU và hai bộ điều hợp HCA Mellanox ConnectX-6 Cổng đơn VPI HDR 200 Gbps (một cho mỗi ổ cắm CPU). Do đó, cấu hình này là một cấu hình cân bằng về các miền NUMA. Bất kỳ thiết bị NVMe nào được hỗ trợ trên máy chủ PowerEdge R7525 đều được hỗ trợ cho các nút NVMe này. Cả hai giao diện CX6 đều được sử dụng tích cực để di chuyển dữ liệu, sao chép NSD NVMe và cung cấp kết nối từ hệ thống tệp đến máy khách. Ngoài ra, chúng cung cấp khả năng dự phòng phần cứng ở cấp độ bộ điều hợp, cổng và cáp, nhưng hiệu suất bị ảnh hưởng nếu chỉ có một bộ điều hợp CX6 hoạt động.

    Hình 9.    Phân bổ khe nút R7525 NVMe

    Để duy trì hiệu suất đồng nhất trên các nút NVMe và cho phép phân loại dữ liệu phù hợp giữa các nút trong tầng này, không trộn lẫn các mô hình máy chủ khác nhau trong cùng một tầng NVMe. Tuy nhiên, nhiều tầng NVMe, mỗi tầng có máy chủ khác nhau và được truy cập bằng các bộ tệp khác nhau được hỗ trợ.

    Các máy chủ PowerEdge đã chọn hỗ trợ các thiết bị NVMe PCIe4 và PCIe3. Tuy nhiên, không nên kết hợp các thiết bị NVMe PCIe4 với các thiết bị PCIe3 hiệu suất thấp hơn cho giải pháp và nó không được hỗ trợ cho cùng một bậc NVMe. Các cặp nút NVMe bổ sung có thể mở rộng hiệu suất và dung lượng cho tầng NVMe này. Chọn dung lượng phù hợp cho các thiết bị NVMe được hỗ trợ trên máy chủ hoặc thêm nhiều cặp máy chủ hơn sẽ giúp tăng dung lượng.

    Cổng/ngenea nút

    Sử dụng máy chủ PowerEdge R750 với cấu hình riser 2 có sáu khe cắm, 2 x8 và 4 x16, như minh họa trong hình sau:

    Hình 10.     Các nút cổng R750 hoặc ngenea – phân bổ vị trí

    Công tắc quản lý

    Thế hệ giải pháp này sử dụng PowerSwitch N2248X-ON được sử dụng làm công tắc Lớp 2 đơn giản sử dụng cổng 1 GbE, như thể hiện trong hình sau:

    Hình 11.     Công tắc quản lý – N2248X-ON

    Chuyển đổi mạng tốc độ cao

    Giải pháp sử dụng bộ điều hợp CX6 VPI có thể được định cấu hình thành InfiniBand hoặc Ethernet khi cần.

    Để triển khai InfiniBand, cần có một cặp thiết bị chuyển mạch Mellanox QM8700 IB HDR 200 Gbps (như thể hiện trong hình dưới đây) trừ khi cụm HPC của khách hàng có đủ cổng miễn phí cho tất cả các kết nối dự phòng từ các máy chủ pixstor khác nhau.

    Hình 12.     Công tắc được quản lý InfiniBand HDR – QM8700

    Để triển khai Ethernet, cần có một cặp bộ chuyển mạch Mellanox SN3700 Ethernet 200 Gbps (hiển thị trong hình dưới đây) trừ khi cụm HPC của khách hàng có đủ cổng miễn phí cho tất cả các kết nối dự phòng từ các máy chủ pixstor khác nhau. Ngoài ra còn có phiên bản 100 Gbps của bộ chuyển mạch, SN3700C (không hiển thị).

    Hình 13.     Bộ chuyển mạch được quản lý Ethernet 200 Gbps – SN3700

    Cấu hình lưu trữ trên mảng ME5

    Dell Validated Design cho HPC pixstor Storage có hai biến thể: cấu hình tiêu chuẩn và cấu hình bao gồm mô-đun HDMD.

    Trên cấu hình tiêu chuẩn, cùng một cặp máy chủ PowerEdge R750 sử dụng mảng ME5084 của chúng để lưu trữ dữ liệu trên ổ cứng hoặc SSD NLS SAS3. Hình dưới đây cho thấy cấu hình ME5084 này, cho biết cách các ổ đĩa được gán cho các LUN khác nhau. Lưu ý rằng mỗi mảng ME5084 có tám nhóm đĩa RAID 6 tuyến tính (tám đĩa dữ liệu + hai đĩa chẵn lẻ) được sử dụng cho dữ liệu mà chỉ ổ cứng HDD được chọn, xen kẽ các khe đĩa số chẵn cho một LUN và các khe đĩa số lẻ cho LUN tiếp theo. Mô hình đó lặp lại cho đến khi tất cả 80 đĩa NLS được sử dụng. Bốn khe đĩa cuối cùng có ổ SSD SAS3, được định cấu hình thành hai cặp RAID 1 tuyến tính và chỉ chứa siêu dữ liệu. RAID tuyến tính được chọn thay vì RAID ảo để cung cấp hiệu suất tối đa cho từng nhóm đĩa ảo. Tương tự, RAID 6 được chọn thay vì ADAPT về hiệu năng,

    Hình 14.     Ổ đĩa ME5084 (hoặc MD484) được gán cho LUN cho các cấu hình tiêu chuẩn

    Khi mô-đun lưu trữ có một mảng ME5084, thì GPFS được hướng dẫn sao chép RAID 1 đầu tiên sang RAID 1 thứ hai như một phần của nhóm lỗi. Tuy nhiên, khi mô-đun lưu trữ có hai hoặc bốn mảng ME5084, các mảng này được chia thành các cặp nhóm lỗi và GPFS được hướng dẫn sao chép từng RAID 1 từ mảng này sang mảng khác trong nhóm lỗi của nó. Do đó, mỗi RAID 1 luôn có một bản sao được quản lý bởi nhóm lỗi GPFS.

    Tất cả các ổ đĩa ảo đều có các ổ đĩa được liên kết mở rộng toàn bộ dung lượng của chúng và được ánh xạ tới tất cả các cổng để chúng có thể truy cập được vào bất kỳ cổng HBA nào từ hai máy chủ PowerEdge R750 được kết nối với chúng. Mỗi máy chủ PowerEdge R750 có một cổng HBA được kết nối với từng bộ điều khiển ME5084 từ các mảng lưu trữ. Nếu một máy chủ đang hoạt động và chỉ một cáp SAS duy nhất vẫn được kết nối với từng mảng ME5084, giải pháp vẫn có thể cung cấp quyền truy cập vào tất cả dữ liệu được lưu trữ trong các mảng ME5. Các mảng mở rộng dung lượng ME484 tùy chọn sử dụng cùng cấu hình như các mảng ME5084 mà chúng được kết nối, bao gồm bốn ổ SSD dành cho siêu dữ liệu.

    Khi mô-đun HDMD tùy chọn được sử dụng, tám RAID 6 được chỉ định giống như cấu hình tiêu chuẩn và chỉ được sử dụng để lưu trữ dữ liệu. Tuy nhiên, thay vì ổ SSD, bốn khe ổ đĩa cuối cùng có ổ cứng NLS SAS3 được sử dụng làm ổ dự phòng toàn cầu nóng cho bất kỳ ổ đĩa bị lỗi nào trong mảng, như thể hiện trong hình sau:

    Hình 15.     Các ổ đĩa ME5084 (hoặc ME484) được gán cho LUN để cấu hình với HDMD

    Khi sử dụng Mô-đun siêu dữ liệu nhu cầu cao tùy chọn, mảng mở rộng ME484 dung lượng tùy chọn được sử dụng phải có cùng cấu hình với mảng ME5084 mà chúng được kết nối, bao gồm cả bốn ổ cứng dự phòng.

    Tất cả các nhóm đĩa trên mô-đun lưu trữ được xuất dưới dạng ổ đĩa có thể truy cập vào bất kỳ cổng HBA nào từ hai máy chủ PowerEdge R750 được kết nối với mảng ME5 tương ứng. Mỗi máy chủ PowerEdge R750 có một cổng HBA được kết nối với từng bộ điều khiển ME5 từ các mảng lưu trữ của nó. Nếu một máy chủ đang hoạt động và chỉ một cáp SAS duy nhất vẫn được kết nối với từng mảng ME5, giải pháp vẫn có thể cung cấp quyền truy cập vào tất cả dữ liệu hoặc siêu dữ liệu được lưu trữ trong các mảng đó.

    Cuối cùng, các mạng tốc độ cao được kết nối bằng cách sử dụng bộ điều hợp CX6 để xử lý việc trao đổi thông tin với các máy khách và để xác định xem một nút là một phần của mô-đun có đang hoạt động hay không (cho mục đích HA).

    Quản trị, phân tích nâng cao và tìm kiếm

    Trong số các khả năng của pixstor, việc giám sát hệ thống tệp bằng cách sử dụng phân tích nâng cao có thể là điều cần thiết để đơn giản hóa rất nhiều việc quản trị, giúp tìm ra các sự cố hoặc sự cố tiềm ẩn một cách chủ động hoặc theo phản ứng.

    Giám sát một giải pháp là điều cần thiết để giữ cho nó hoạt động tối ưu, cũng như phát hiện và khắc phục kịp thời mọi sự cố, ngay cả trước khi chúng gây ra lỗi hoặc ảnh hưởng đến chức năng. Hình dưới đây hiển thị bảng điều khiển giải pháp, từ đó quá trình kiểm tra có thể phát hiện các vấn đề ảnh hưởng đến tình trạng của giải pháp cần hành động ngay lập tức (quan trọng ở khu vực giám sát cuối cùng), lập lịch trình hành động (cảnh báo dịch vụ) hoặc xu hướng sử dụng có vấn đề. Biểu đồ thông lượng mạng và ổ đĩa có thể giúp phát hiện các tình huống trong đó hệ thống không được sử dụng tối ưu, sau đó tập trung vào các chi tiết để tìm ra nguyên nhân.

    Hình 16.     Bảng điều khiển giám sát

    Hình dưới đây cho thấy chỉ có hai máy khách đang sử dụng băng thông đọc mạng và máy khách thứ ba đang sử dụng băng thông trong thời gian ngắn. Việc sử dụng đĩa và nhóm đĩa (biểu đồ thứ ba và thứ tư trên hàng đầu tiên) có thể phát hiện sự mất cân bằng có thể làm giảm dung lượng hoặc xu hướng theo thời gian có thể khiến hệ thống tệp đạt đến dung lượng tối đa, cho phép thực hiện các hành động phòng ngừa trước khi quá trình sản xuất bị ảnh hưởng bởi một hệ thống tập tin trở nên đầy đủ. Tải của máy chủ, CPU và mức sử dụng bộ nhớ của giải pháp, có các ngưỡng được xác định trước để cảnh báo khi hệ thống đang đối mặt với tải có thể làm giảm hiệu suất, có thể phát hiện các sự cố nhất thời hơn. Chế độ xem bảng điều khiển duy nhất cho phép bạn điều tra các sự cố và các thành phần liên quan để thực hiện hành động khắc phục, xác định xu hướng dữ liệu để biện minh cho các thay đổi trong chính sách sử dụng,

    Hình 17.     Network Metrics, Read Bandwidth detail

    Việc biết rằng một hệ thống tệp có dung lượng nhất định không giúp phát hiện một số vấn đề ảnh hưởng đến năng suất. Việc truy cập một số lượng lớn các tệp nhỏ có thể gây ra các đỉnh tải hệ thống không mong muốn mà không cho thấy mức tăng đáng kể về dung lượng đã sử dụng. Một số sự kiện nhất định theo chu kỳ có thể ảnh hưởng đến tải và dung lượng của hệ thống, nhưng sau khi hoàn thành, hệ thống sẽ trở lại trạng thái trước đó mà không có đủ thông tin để hiểu tình hình. Trong những trường hợp này, công cụ phân tích của pixstor có thể truy cập lịch sử sử dụng, truy xuất thông tin về dung lượng đã sử dụng và số lượng tệp trên mỗi loại tệp hoặc truy xuất thông tin chi tiết theo bộ tệp hoặc theo dự án để giúp phát hiện các tình huống đã đề cập trước đó.

    Hình dưới đây hiển thị thông tin hữu ích dựa trên dung lượng hệ thống tệp. Phía bên trái hiển thị tổng dung lượng hệ thống tệp được sử dụng và mười người dùng hàng đầu dựa trên dung lượng hệ thống tệp được sử dụng. Phía bên phải cung cấp chế độ xem lịch sử với dung lượng được sử dụng trong nhiều năm, mười loại tệp được sử dụng hàng đầu và mười bộ tệp hàng đầu, cả dựa trên dung lượng được sử dụng và trong biểu đồ Pareto. Với thông tin này, thật dễ dàng để xác định người dùng nào truy cập quá mức vào hệ thống tệp, xác định xu hướng sử dụng dung lượng để quyết định mức tăng dung lượng trong tương lai, xác định tệp nào đang sử dụng nhiều dung lượng nhất hoặc xác định dự án nào đang chiếm phần lớn dung lượng. Công cụ phân tích này không chỉ cung cấp thông tin chi tiết về việc sử dụng dung lượng mà còn về số lượng tệp (nút) và chi tiết về kích thước tệp đang được phổ biến trên hệ thống tệp.

    Hình 18.     phân tích pixel – Chế độ xem dung lượng

    Một công cụ pixstor thiết yếu khác cung cấp khả năng tìm kiếm nâng cao cho quản trị viên và người dùng được phép truy cập máy chủ quản lý. Trên hầu hết các hệ thống tệp song song, tìm kiếm mở rộng có thể ảnh hưởng tiêu cực đến hiệu suất (như tác động của  ls -IR  <mount_point> /*  trên hệ thống tệp song song thông thường có nhiều tệp). Tuy nhiên, phần mềm tìm kiếm pixstor hoạt động độc lập với siêu dữ liệu PFS, tránh các tác động tiêu cực đến hiệu suất, giúp tìm kiếm hiệu quả và cho phép tìm kiếm phức tạp thường khó thực hiện trên PFS.

    Hình dưới đây hiển thị kết quả tìm kiếm trên các thư mục khác nhau với lớp phủ cửa sổ phân tích:

    Hình 19.     Tìm kiếm hiển thị kết quả theo thư mục với lớp phủ phân tích

    Kết quả tìm kiếm có thể tận dụng các bản xem trước (ví dụ: đối với hình ảnh), cho phép sàng lọc kết quả hiệu quả hơn so với danh sách tên tệp. Ngoài ra, pixstor có thể tận dụng lợi thế của một giải pháp nhiều tầng với một không gian tên duy nhất, bao gồm các giải pháp lưu trữ khác được kết nối với các nút ngenea. Đặc điểm này cho phép tệp dữ liệu nằm trong bộ nhớ ngoài, trong khi sơ khai siêu dữ liệu được lưu trên pixstor, cho phép thực hiện tìm kiếm như thể nó hiện diện cục bộ. Nếu một tệp là cần thiết nhưng không phải là tệp cục bộ của hệ thống tệp pixstor, tệp đó có thể dễ dàng được di chuyển trở lại.

    Hình dưới đây cho thấy một ví dụ về tìm kiếm trên pixstor bằng cách sử dụng các bản xem trước của hình ảnh y tế và thông báo kết quả nào được tìm thấy nhưng không có sẵn ngay lập tức để sử dụng:

    Hình 20.     Kết quả tìm kiếm bằng xem trước

    nút cổng

    Các nút cổng sử dụng máy chủ PowerEdge R750 nhưng với cấu hình RAID khác có sẵn bốn khe x16 và hai khe x8 cho bất kỳ bộ điều hợp nào khác. Bốn khe cắm x16 có bộ điều hợp VPI một cổng Mellanox ConnectX-6 có thể được định cấu hình cho kết nối IB HDR hoặc Ethernet 200 Gbps hoặc bất kỳ tốc độ nào được các bộ điều hợp đó hỗ trợ. Ít nhất một trong số các bộ điều hợp đó phải được kết nối với giải pháp pixstor để truy cập vào hệ thống tệp hoặc hai kết nối nếu yêu cầu dự phòng trên bất kỳ cổng nào. Ngoài ra, các cổng có thể được kết nối với các mạng khác có thêm NIC được hỗ trợ bởi máy chủ PowerEdge R750 trên hai khe cắm x8 có sẵn (một khe cắm x8 bên trong được sử dụng bởi bộ điều hợp PERC đặc biệt để quản lý SSD cục bộ cho hệ điều hành).

    Samba’s  Clustered Trivial DataBase (CTDB)  là một cơ sở dữ liệu nhóm được sử dụng để quản lý các dịch vụ NFS và SMB trên các nút cổng, cung cấp tính sẵn sàng cao, cân bằng tải và giám sát các nút trong cụm CTDB. Đối với mỗi cổng trong cụm CTDB, một mục nhập Hệ thống tên miền (DNS) có bản ghi A cho địa chỉ IP được thêm vào, sao cho tất cả các cổng có cùng tên máy chủ, một loại “tên cổng công khai”. Sau đó, các máy khách sử dụng tên cổng đó để gắn kết các dịch vụ đó sao cho daemon máy chủ định danh (được đặt tên) có thể chỉ định tất cả các cổng trong cụm CTDB cho các máy khách bằng phương pháp vòng tròn. Khi cần, NFS-Ganesha (một máy chủ tệp NFS mã nguồn mở, không gian người dùng) có thể được sử dụng thay thế cho các dịch vụ máy chủ NFS thông thường; nó cũng được quản lý bởi cụm CTDB.

    Đằng sau các cổng, hệ thống pixstor phải được truy cập và xuất cho khách hàng. Để mô tả đặc điểm của các cổng trong tài liệu này, một giải pháp pixstor với siêu dữ liệu có nhu cầu cao và các mô-đun mở rộng dung lượng đã được sử dụng.

    Hiệu suất nút cổng dự kiến ​​sẽ tương tự như hiệu suất GFPS được báo cáo trong tài liệu này. Đặc tính hiệu suất cổng sẽ được thực hiện và báo cáo trong một blog trong tương lai.

    nút ngenea

    Phần cứng cho các nút ngenea giống như được sử dụng cho các nút cổng, nhưng được cài đặt phần mềm khác và yêu cầu giấy phép khác. Các nút này đã được xác thực bằng một số giải pháp như PowerScale F200 (OneFS), giải pháp băng từ và chúng tôi dự định xác thực trên các hệ thống lưu trữ khác của Dell. Hình dưới đây cho thấy một ví dụ về các công việc ngenea sử dụng bộ nhớ ngoài. Một blog trong tương lai sẽ mô tả phần mềm này chi tiết hơn và có thể trình bày một số trường hợp sử dụng/đặc tính hiệu suất có liên quan đến Bộ lưu trữ pixstor.

    Hình 21.     Ví dụ về Ngenea Hub hiển thị các công việc liên quan