Thiết kế được Dell xác thực cho Bộ lưu trữ HPC pixstor ( 4 )

Giải pháp xây dựng

Thành phần giải pháp (2)

Chuyển đổi mạng tốc độ cao

Giải pháp sử dụng bộ điều hợp CX6 VPI có thể được định cấu hình thành InfiniBand hoặc Ethernet khi cần.

Để triển khai InfiniBand, cần có một cặp thiết bị chuyển mạch Mellanox QM8700 IB HDR 200 Gbps (như thể hiện trong hình dưới đây) trừ khi cụm HPC của khách hàng có đủ cổng miễn phí cho tất cả các kết nối dự phòng từ các máy chủ pixstor khác nhau.

Hình 9.    Công tắc quản lý InfiniBand HDR – QM8700

Để triển khai Ethernet, cần có một cặp bộ chuyển mạch Mellanox SN3700 Ethernet 200 Gbps (hiển thị trong hình dưới đây) trừ khi cụm HPC của khách hàng có đủ cổng miễn phí cho tất cả các kết nối dự phòng từ các máy chủ pixstor khác nhau. Ngoài ra còn có phiên bản 100 Gbps của bộ chuyển mạch, SN3700C (không hiển thị).

Hình 10.     Bộ chuyển mạch được quản lý Ethernet 200 Gbps – SN3700

Cấu hình lưu trữ trên mảng ME4

Dell Validated Design cho HPC pixstor Storage có hai biến thể: cấu hình tiêu chuẩn và cấu hình bao gồm mô-đun HDMD. 

Trên cấu hình tiêu chuẩn, cùng một cặp máy chủ PowerEdge R750 sử dụng mảng ME4084 của chúng để lưu trữ dữ liệu trên ổ cứng hoặc SSD NLS SAS3. Hình dưới đây cho thấy cấu hình ME4084 này, cho biết cách các ổ đĩa được gán cho các LUN khác nhau. Lưu ý rằng mỗi mảng ME4084 có tám nhóm đĩa RAID 6 tuyến tính (tám đĩa dữ liệu + hai đĩa chẵn lẻ) được sử dụng cho dữ liệu mà chỉ ổ cứng HDD được chọn, xen kẽ các khe đĩa số chẵn cho một LUN và các khe đĩa số lẻ cho LUN tiếp theo. Mô hình đó lặp lại cho đến khi tất cả 80 đĩa NLS được sử dụng. Bốn khe đĩa cuối cùng có ổ SSD SAS3, được định cấu hình thành hai cặp RAID 1 tuyến tính và chỉ chứa siêu dữ liệu. RAID tuyến tính được chọn thay vì RAID ảo để cung cấp hiệu suất tối đa cho mỗi đĩa ảo. Tương tự, RAID 6 được chọn thay vì ADAPT về hiệu năng,

Hình 11.     Ổ đĩa ME4084 được gán cho LUN cho các cấu hình tiêu chuẩn

Khi mô-đun lưu trữ có một mảng ME4084, thì GPFS được hướng dẫn sao chép RAID 1 đầu tiên sang RAID 1 thứ hai như một phần của nhóm lỗi. Tuy nhiên, khi mô-đun lưu trữ có hai hoặc bốn mảng ME4084, các mảng này được chia thành các cặp nhóm lỗi và GPFS được hướng dẫn sao chép từng RAID 1 từ mảng này sang mảng khác trong nhóm lỗi của nó. Do đó, mỗi RAID 1 luôn có một bản sao được quản lý bởi nhóm lỗi GPFS.

Tất cả các nhóm đĩa có các ổ đĩa được liên kết mở rộng toàn bộ dung lượng của chúng và được ánh xạ tới tất cả các cổng để chúng có thể truy cập được vào bất kỳ cổng HBA nào từ hai máy chủ PowerEdge R750 được kết nối với chúng. Mỗi máy chủ PowerEdge R750 có một cổng HBA được kết nối với từng bộ điều khiển ME4084 từ các mảng lưu trữ. Nếu một máy chủ đang hoạt động và chỉ một cáp SAS duy nhất vẫn được kết nối với từng mảng ME4084, giải pháp vẫn có thể cung cấp quyền truy cập vào tất cả dữ liệu được lưu trữ trong các mảng ME4. Xem phần tiếp theo để biết thông tin về mảng mở rộng công suất ME484 tùy chọn.

Khi mô-đun HDMD tùy chọn được sử dụng, tám RAID 6 được chỉ định giống như cấu hình tiêu chuẩn và chỉ được sử dụng để lưu trữ dữ liệu. Tuy nhiên, thay vì ổ SSD, bốn khe ổ đĩa cuối cùng có ổ cứng NLS SAS3 được sử dụng làm dự phòng nóng cho bất kỳ ổ đĩa nào bị lỗi trong mảng, như minh họa trong hình sau:

Hình 12.     Ổ đĩa ME4084 được gán cho LUN để cấu hình với HDMD hoặc mảng ME484

Mảng mở rộng dung lượng ME484 tùy chọn có cùng cấu hình với mảng ME4084 như trong hình, bao gồm bốn ổ cứng dự phòng, cho dù sử dụng cấu hình tiêu chuẩn hay cấu hình với mô-đun HDMD. 

Tất cả các ổ đĩa ảo trên mô-đun lưu trữ được xuất dưới dạng ổ đĩa có thể truy cập vào bất kỳ cổng HBA nào từ hai máy chủ PowerEdge R750 được kết nối với mảng ME4 tương ứng. Mỗi máy chủ PowerEdge R750 có một cổng HBA được kết nối với từng bộ điều khiển ME4 từ các mảng lưu trữ của nó. Nếu một máy chủ đang hoạt động và chỉ một cáp SAS duy nhất vẫn được kết nối với từng mảng ME4, giải pháp vẫn có thể cung cấp quyền truy cập vào tất cả dữ liệu hoặc siêu dữ liệu được lưu trữ trong các mảng đó.

Cuối cùng, các mạng tốc độ cao được kết nối bằng cách sử dụng bộ điều hợp CX6 để xử lý việc trao đổi thông tin với các máy khách và để xác định xem một nút là một phần của mô-đun có đang hoạt động hay không.

Quản trị, phân tích nâng cao và tìm kiếm

Trong số các khả năng của pixstor, việc giám sát hệ thống tệp bằng cách sử dụng phân tích nâng cao có thể là điều cần thiết để đơn giản hóa rất nhiều việc quản trị, giúp tìm ra các sự cố hoặc sự cố tiềm ẩn một cách chủ động hoặc theo phản ứng. 

Giám sát một giải pháp là điều cần thiết để giữ cho nó hoạt động tối ưu, cũng như phát hiện và khắc phục kịp thời mọi sự cố, ngay cả trước khi chúng gây ra lỗi hoặc ảnh hưởng đến chức năng. Hình dưới đây hiển thị bảng điều khiển giải pháp, từ đó quá trình kiểm tra có thể phát hiện các sự cố ảnh hưởng đến tình trạng của giải pháp cần hành động ngay lập tức (ngừng lưu trữ), lên lịch cho một hành động (cảnh báo dịch vụ) hoặc xu hướng sử dụng có vấn đề. Biểu đồ thông lượng mạng và ổ đĩa có thể giúp phát hiện các tình huống trong đó hệ thống không được sử dụng tối ưu, sau đó tập trung vào các chi tiết để tìm ra nguyên nhân. Việc sử dụng đĩa và nhóm đĩa có thể phát hiện sự mất cân bằng có thể làm giảm dung lượng hoặc xu hướng theo thời gian có thể khiến hệ thống tệp đạt đến dung lượng tối đa, cho phép thực hiện các hành động phòng ngừa trước khi sản xuất bị ảnh hưởng bởi hệ thống tệp đầy. Tải máy chủ của giải pháp, CPU và việc sử dụng bộ nhớ, có các ngưỡng được xác định trước để cảnh báo khi hệ thống đang đối mặt với tải có thể làm giảm hiệu suất, có thể phát hiện nhiều sự cố nhất thời hơn. Chế độ xem bảng điều khiển duy nhất cho phép bạn điều tra các vấn đề và các thành phần liên quan để thực hiện các hành động khắc phục, xác định xu hướng dữ liệu để biện minh cho các thay đổi trong chính sách sử dụng hoặc giúp lập kế hoạch phát triển trong tương lai của một số hoặc tất cả các thành phần giải pháp để đáp ứng nhu cầu ngày càng tăng.

Hình 13.     Bảng điều khiển giám sát

Việc biết rằng một hệ thống tệp có dung lượng nhất định không giúp phát hiện một số vấn đề ảnh hưởng đến năng suất. Việc truy cập một số lượng lớn các tệp nhỏ có thể gây ra các đỉnh tải hệ thống không mong muốn mà không cho thấy mức tăng đáng kể về dung lượng đã sử dụng. Một số sự kiện nhất định theo chu kỳ có thể ảnh hưởng đến tải và dung lượng của hệ thống, nhưng sau khi hoàn thành, hệ thống sẽ trở lại trạng thái trước đó mà không có đủ thông tin để hiểu tình hình. Trong những trường hợp này, công cụ phân tích của pixstor có thể truy cập lịch sử sử dụng, truy xuất thông tin về dung lượng đã sử dụng và số lượng tệp trên mỗi loại tệp hoặc truy xuất thông tin chi tiết theo bộ tệp hoặc theo dự án để giúp phát hiện các tình huống đã đề cập trước đó.

Hình dưới đây hiển thị thông tin hữu ích dựa trên dung lượng hệ thống tệp. Phía bên trái hiển thị tổng dung lượng hệ thống tệp được sử dụng và mười người dùng hàng đầu dựa trên dung lượng hệ thống tệp được sử dụng. Phía bên phải cung cấp chế độ xem lịch sử với dung lượng được sử dụng trong nhiều năm, mười loại tệp được sử dụng hàng đầu và mười bộ tệp hàng đầu, cả dựa trên dung lượng được sử dụng và trong biểu đồ Pareto. Với thông tin này, thật dễ dàng để xác định người dùng nào truy cập hệ thống tệp quá mức, xác định xu hướng sử dụng dung lượng để quyết định tăng trưởng dung lượng trong tương lai, xác định tệp nào đang sử dụng hầu hết dung lượng hoặc xác định dự án nào đang chiếm phần lớn dung lượng. Công cụ phân tích này không chỉ cung cấp thông tin chi tiết về việc sử dụng dung lượng mà còn về số lượng tệp (nút) và chi tiết về kích thước tệp đang được phổ biến trên hệ thống tệp.

Hình 14.      phân tích pixel – Chế độ xem dung lượng

Một công cụ pixstor thiết yếu khác cung cấp khả năng tìm kiếm nâng cao cho quản trị viên và người dùng được phép truy cập máy chủ quản lý. Trên hầu hết các hệ thống tệp song song, tìm kiếm mở rộng có thể ảnh hưởng tiêu cực đến hiệu suất (như tác động của  ls -R  <mount_point> /*  trên hệ thống tệp song song thông thường có nhiều tệp). Tuy nhiên, phần mềm tìm kiếm pixstor hoạt động độc lập với siêu dữ liệu PFS, tránh các tác động tiêu cực đến hiệu suất, giúp tìm kiếm hiệu quả và cho phép tìm kiếm phức tạp thường khó thực hiện trên PFS.

Hình dưới đây hiển thị kết quả tìm kiếm trên các thư mục khác nhau với lớp phủ cửa sổ phân tích:

Hình 15.     Tìm kiếm hiển thị kết quả theo thư mục với lớp phủ phân tích

Kết quả tìm kiếm có thể tận dụng các bản xem trước (ví dụ: đối với hình ảnh), cho phép sàng lọc kết quả hiệu quả hơn so với danh sách tên tệp. Ngoài ra, pixstor có thể tận dụng lợi thế là một giải pháp nhiều tầng với một không gian tên duy nhất, cho phép tích hợp các giải pháp lưu trữ khác được kết nối với các nút ngenea như một tầng khác. Đặc điểm này cho phép tệp dữ liệu nằm trong bộ nhớ ngoài, trong khi sơ khai siêu dữ liệu được lưu trên pixstor, cho phép thực hiện tìm kiếm như thể nó hiện diện cục bộ. Nếu một tệp là cần thiết nhưng không phải là tệp cục bộ của hệ thống tệp pixstor, tệp đó có thể dễ dàng được di chuyển trở lại.

Hình dưới đây cho thấy một ví dụ về tìm kiếm trên pixstor bằng cách sử dụng các bản xem trước của hình ảnh y tế và thông báo kết quả nào được tìm thấy nhưng không có sẵn ngay lập tức để sử dụng:

Hình 16.     Kết quả tìm kiếm bằng xem trước

nút cổng

Các nút cổng sử dụng máy chủ PowerEdge R750 nhưng với cấu hình RAID khác có sẵn bốn khe x16 và hai khe x8 cho bất kỳ bộ điều hợp nào khác. Bốn khe cắm x16 có bộ điều hợp VPI một cổng Mellanox ConnectX-6 có thể được định cấu hình cho kết nối IB HDR hoặc Ethernet 200 Gbps hoặc bất kỳ tốc độ nào được các bộ điều hợp đó hỗ trợ. Ít nhất một trong số các bộ điều hợp đó phải được kết nối với giải pháp pixstor để truy cập vào hệ thống tệp hoặc hai kết nối nếu yêu cầu dự phòng trên bất kỳ cổng đơn nào. Ngoài ra, các cổng có thể được kết nối với các mạng khác có thêm NIC được hỗ trợ bởi máy chủ PowerEdge R750 trên hai khe cắm x8 có sẵn (một khe cắm x8 bên trong được sử dụng bởi bộ điều hợp PERC đặc biệt để quản lý SSD cục bộ cho hệ điều hành).

Samba’s  Clustered Trivial DataBase (CTDB)  là một cơ sở dữ liệu nhóm được sử dụng để quản lý các dịch vụ NFS và SMB trên các nút cổng, cung cấp tính sẵn sàng cao, cân bằng tải và giám sát các nút trong cụm CTDB. Đối với mỗi cổng trong cụm CTDB, một mục nhập Hệ thống tên miền (DNS) có bản ghi A cho địa chỉ IP được thêm vào, sao cho tất cả các cổng có cùng tên máy chủ, một loại “tên cổng công cộng”. Sau đó, tên cổng đó được các máy khách sử dụng để gắn kết các dịch vụ đó sao cho daemon máy chủ định danh (được đặt tên) có thể chỉ định tất cả các cổng trong cụm CTDB cho các máy khách bằng phương pháp quay vòng. Khi cần, NFS-Ganesha (một máy chủ tệp NFS mã nguồn mở, không gian người dùng) có thể được sử dụng thay thế cho các dịch vụ máy chủ NFS thông thường; nó cũng được quản lý bởi cụm CTDB.

Đằng sau các cổng, hệ thống pixstor phải được truy cập và xuất cho khách hàng. Để mô tả đặc điểm của các cổng trong tài liệu này, một giải pháp pixstor với siêu dữ liệu có nhu cầu cao và các mô-đun mở rộng dung lượng đã được sử dụng.

Bởi vì bộ lưu trữ phụ trợ vẫn giữ nguyên, nên hiệu suất của nút cổng dự kiến ​​sẽ không thay đổi đáng kể. Do đó, không có đặc tính hiệu suất cổng cho phiên bản này.

nút ngenea

Phần cứng cho các nút ngenea giống như được sử dụng cho các nút cổng, nhưng được cài đặt phần mềm khác và yêu cầu giấy phép khác. Bởi vì các nút này chưa được kiểm tra tại thời điểm xuất bản, một blog trong tương lai sẽ mô tả chúng chi tiết hơn và trình bày một số đặc tính hiệu suất/trường hợp sử dụng có liên quan đến bộ lưu trữ pixstor.