Lưu trữ do HPC xác định bằng phần mềm với PixStor (2)

Giới thiệu

Môi trường HPC ngày nay đã tăng nhu cầu lưu trữ tốc độ cao. Với các CPU có số lượng lõi cao hơn, bộ nhớ lớn hơn và nhanh hơn, bus PCIe nhanh hơn và mạng ngày càng nhanh hơn, bộ nhớ có thể trở thành nút cổ chai trong nhiều khối lượng công việc. Các yêu cầu HPC có nhu cầu cao đó thường được bao phủ bởi các hệ thống tệp song song cung cấp quyền truy cập đồng thời vào một tệp hoặc một tập hợp các tệp từ nhiều nút, phân phối dữ liệu rất hiệu quả và an toàn tới nhiều số đơn vị logic (LUN) trên một số máy chủ lưu trữ.

Các hệ thống tệp đó có truyền thống tận dụng phương tiện quay để cung cấp dung lượng cao nhất với chi phí thấp nhất. Tuy nhiên, tốc độ và độ trễ của phương tiện kéo sợi ngày càng thường xuyên không thể theo kịp nhu cầu của nhiều khối lượng công việc HPC hiện đại, đòi hỏi phải sử dụng công nghệ flash dưới dạng bộ đệm liên tục, tầng nhanh hơn hoặc thậm chí là cào, cục bộ hoặc được phân phối. Thiết kế đã được xác thực của Dell Technologies dành cho Bộ lưu trữ HPC PixStor tận dụng các mảng Dell EMC PowerVault ME4 để có tầng dung lượng cao hiệu quả về chi phí và các nút NVMe có thể đáp ứng nhu cầu băng thông cao mới, bên cạnh tính linh hoạt, khả năng mở rộng, hiệu quả và đáng tin cậy.

Thông thường, không thể truy cập dữ liệu bằng hệ thống tệp gốc và phải sử dụng các giao thức khác như NFS hoặc SMB. Ví dụ: khi yêu cầu dữ liệu truy cập từ máy trạm hoặc máy tính xách tay chạy MS-Windows hoặc Apple macOS hoặc các hệ thống nghiên cứu/sản xuất chỉ cung cấp kết nối thông qua các giao thức tiêu chuẩn, Thiết kế được xác thực cho Bộ lưu trữ HPC PixStor sử dụng các nút Cổng để cho phép kết nối đó với hiệu suất có thể mở rộng, một cách hiệu quả và đáng tin cậy.

Ngoài ra, các giải pháp lưu trữ thường yêu cầu quyền truy cập vào các thiết bị lưu trữ khác — cục bộ hoặc từ xa — để di chuyển dữ liệu đến và từ các thiết bị đó mà Cổng PixStor không phải là lựa chọn thích hợp nhất. Khi tích hợp các thiết bị đó dưới dạng một tầng khác vào hệ thống lưu trữ HPC PixStor (ví dụ: lưu trữ đối tượng, lưu trữ đám mây, thư viện băng từ, v.v.). Trong những trường hợp đó, giải pháp lưu trữ PixStor có thể cung cấp quyền truy cập theo tầng cho các thi

ết bị lưu trữ khác bằng cách sử dụng các giao thức doanh nghiệp khác, bao gồm giao thức đám mây thông qua các nút Ngenea với phần mềm ArcaStream cho phép tích hợp mà vẫn tiết kiệm chi phí.

Thiết kế hệ thống

Hình 2  trình bày thiết kế cho thế hệ mới của Thiết kế được xác thực cho Bộ lưu trữ HPC PixStor, tận dụng các máy chủ Dell EMC PowerEdge R650, R750 và R7525 cũng như mảng lưu trữ PowerVault ME4084 và ME4024, với phần mềm PixStor 6.0 từ ArcaStream. Ngoài ra, các mảng PowerVault ME484 EBOD tùy chọn có thể được sử dụng để tăng dung lượng của giải pháp. Hình 2 trình bày thiết kế giải pháp mô tả việc mở rộng dung lượng như SAS bổ sung cho mảng lưu trữ PowerVault ME4084 hiện có.

Phần mềm PixStor bao gồm hệ thống tệp song song chung phổ biến (GPFS) còn được gọi là Spectrum Scale là thành phần PFS được coi là bộ lưu trữ do phần mềm xác định do tính linh hoạt và khả năng mở rộng của nó. Ngoài ra, phần mềm PixStor bao gồm nhiều thành phần phần mềm ArcaStream khác như phân tích nâng cao, quản trị và giám sát đơn giản hóa, tìm kiếm tệp hiệu quả, khả năng cổng nâng cao và nhiều tính năng khác.

Hình 2. Thiết kế giải pháp         

Các thành phần chính của giải pháp lưu trữ PixStor là:

Máy chủ quản lý

Máy chủ Dell EMC PowerEdge R650 cung cấp quyền truy cập giao diện người dùng đồ họa (GUI) và giao diện dòng lệnh (CLI) để quản lý và giám sát giải pháp lưu trữ PixStor, cũng như thực hiện các khả năng tìm kiếm nâng cao biên dịch một số thông tin siêu dữ liệu trong cơ sở dữ liệu để tăng tốc độ tìm kiếm và tránh tải đĩa chia sẻ mạng siêu dữ liệu (NSD). 

mô-đun lưu trữ

Hiện tại- khối xây dựng chính cho giải pháp lưu trữ PixStor, mỗi mô-đun bao gồm một cặp  máy chủ lưu trữ,  1, 2 hoặc 4 mảng  lưu trữ phụ trợ  (ME4084) với  khả năng mở rộng dung lượng tùy chọn  (ME484) và  các ổ đĩa dùng chung mạng  có trong các mảng đó .

Máy chủ lưu trữ (SS)

Một phần thiết yếu của  mô-đun lưu trữ , HA p air của  máy chủ Dell EMC PowerEdge R750  (miền chuyển đổi dự phòng)  được kết nối với mảng ME4084 thông qua cáp SAS 12 Gbps, quản lý NSD dữ liệu và cung cấp quyền truy cập vào NSD thông qua  giao diện mạng tốc độ cao dự phòng . Đối với cấu hình PixStor tiêu chuẩn, các máy chủ này có vai trò kép là máy chủ siêu dữ liệu và quản lý NSD siêu dữ liệu (sử dụng SSD thay thế tất cả các ổ cứng dự phòng).

Lưu trữ phụ trợ

Lưu trữ dữ liệu hệ thống tệp (MD4084) hoặc siêu dữ liệu (ME4024). PowerVault ME4084 là một phần của  mô-đun lưu trữ  và PowerVault ME4024 là một phần của  mô-đun siêu dữ liệu Nhu cầu cao tùy chọn  trong  Hình 2 .

Lưu trữ mở rộng dung lượng

Mở rộng dung lượng tùy chọn  là PowerVault ME484 ( bên trong hình vuông chấm màu cam trong  Hình 2 ) được kết nối phía sau ME4084 qua cáp SAS 12 Gbps để mở rộng dung lượng của  mô-đun lưu trữ . Đối với cấu hình bộ lưu trữ PixStor, mỗi ME4084 chỉ có thể sử dụng một bản mở rộng ME484 để đạt được hiệu suất và độ tin cậy (ngay cả ME4084 đó cũng hỗ trợ tối đa ba ME484).

Đĩa chia sẻ mạng (NSDS) 

NSDS là các thiết bị khối phụ trợ (ví dụ: RAID LUN từ mảng ME4 hoặc thiết bị RAID 10 NVMeoF) lưu trữ thông tin, dữ liệu và siêu dữ liệu. Trong giải pháp lưu trữ PixStor, dữ liệu hệ thống tệp và siêu dữ liệu được lưu trữ trong các NSD khác nhau, NSD dữ liệu thường sử dụng phương tiện quay (ổ cứng NLS SAS3), trong khi NSD siêu dữ liệu sử dụng SSD SAS3 (siêu dữ liệu bao gồm thư mục, tên tệp, quyền, dấu thời gian và vị trí của dữ liệu trong các NSD khác).

NSD dựa trên NVMeoF hiện chỉ được sử dụng cho dữ liệu, tuy nhiên, chúng tôi hiện đang thử nghiệm chúng để tìm siêu dữ liệu và chúng tôi dự định thử nghiệm chúng cho dữ liệu + siêu dữ liệu.

Máy chủ siêu dữ liệu có nhu cầu cao (HDMDS) 

Chia  mô-đun siêu dữ liệu có nhu cầu cao tùy chọn  bên trong hình vuông chấm màu vàng trong  Hình 2 ). Các cặp máy chủ Dell EMC PowerEdge R750 trong HA (miền chuyển đổi dự phòng) được kết nối với mảng PowerVault ME4024 qua cáp SAS, quản lý NSD siêu dữ liệu và cung cấp quyền truy cập vào phần phụ trợ siêu dữ liệu thông qua giao diện mạng tốc độ cao dự phòng.

nút NVMe

Phần chính của  các mô-đun Bậc NVMe tùy chọn  bên trong hình vuông chấm màu lục trong  Hình 2 ). Các cặp máy chủ PowerEdge R650 trong HA (miền chuyển đổi dự phòng) cung cấp tầng dựa trên flash hiệu suất cao cho giải pháp lưu trữ PixStor. Hiệu suất và dung lượng cho tầng NVMe này có thể được mở rộng bằng cặp nút NVMe bổ sung. Dung lượng tăng lên được cung cấp bằng cách chọn dung lượng thích hợp cho các thiết bị NVMe được hỗ trợ trong PowerEdge R650.

Mỗi PowerEdge R650 có mười thiết bị NVMe được chia thành các lát/phân vùng. Sau đó, các lát từ tất cả các ổ đĩa trong cả hai máy chủ được kết hợp thành các thiết bị RAID10 để có thông lượng cao. Các nút NVMe này tận dụng NVMesh làm thành phần NVMe over Fabric (NVMeoF) để có mỗi bản sao nhân bản từ RAID10 trên một máy chủ khác (cho mục đích HA) và cung cấp các thiết bị khối cho hệ thống tệp để sử dụng làm NSD.

Phần mềm máy khách gốc

Phần mềm được cài đặt trên máy khách cho phép truy cập vào hệ thống tệp. Hệ thống tệp phải được gắn kết để truy cập và xuất hiện dưới dạng một không gian tên duy nhất.

nút cổng

Các  nút cổng tùy chọn  bên trong hình vuông chấm màu đỏ trong  Hình 2 ) là các máy chủ PowerEdge R750 (cùng phần cứng với  các nút Ngenea  nhưng phần mềm khác) trong  cụm Cơ sở dữ liệu tầm thường theo cụm (CTDB) của Samba  cung cấp quyền truy cập NFS hoặc SMB cho các máy khách không có, hoặc không thể cài đặt phần mềm máy khách gốc mà thay vào đó sử dụng các giao thức NFS hoặc SMB để truy cập thông tin.

nút ngenea

Các  nút Ngenea tùy chọn  bên trong hình vuông chấm màu đỏ trong  Hình 2 ) là các máy chủ PowerEdge R750 (cùng phần cứng với  các nút  cổng nhưng phần mềm khác) sử dụng phần mềm PixStor để truy cập vào các thiết bị lưu trữ bên ngoài có thể được sử dụng như một tầng khác trong cùng một không gian tên ( ví dụ: Lưu trữ đối tượng, lưu trữ đám mây, thư viện băng từ, v.v.) sử dụng các giao thức doanh nghiệp, bao gồm các giao thức đám mây.

Công tắc quản lý

Bộ chuyển đổi ethernet gigabit Dell EMC PowerSwitch N2248X-ON được sử dụng để kết nối các máy chủ và mảng lưu trữ khác nhau. Nó được sử dụng để quản lý giải pháp, kết nối tất cả các thành phần với nhau.

Công tắc hiệu suất cao

Bộ chuyển mạch NVIDIA ®  QM8700 cung cấp khả năng truy cập tốc độ cao qua InfiniBand (IB) HDR và ​​HDR100. Đối với các giải pháp Ethernet, có thể sử dụng NVIDIA Mellanox SN3700.