Lưu trữ tệp APEX cho các cân nhắc về hiệu suất của Microsoft Azure

Để hiểu các đặc điểm hiệu suất của APEX File Storage cho Microsoft Azure, Nhóm hiệu suất PowerScale của Dell Technical Marketing Engineering đã sử dụng một công cụ chuẩn. Công cụ này được sử dụng để tiến hành các thử nghiệm đọc tuần tự với kích thước yêu cầu là 128 KiB và các thử nghiệm ghi tuần tự với kích thước yêu cầu là 512 KiB, với NFS phiên bản 3.

Liên quan đến các bài kiểm tra đọc/ghi tuần tự, sau đây là một số thông tin cụ thể:

  • Trong các thử nghiệm, chúng tôi đã áp dụng mẫu truy cập OneFS “streaming” vào thư mục thử nghiệm cấp cao nhất và bất kỳ đối tượng con nào của thư mục đó. Để biết thêm thông tin về mẫu truy cập dữ liệu OneFS, hãy xem sách trắng PowerScale OneFS Best Practices .
  • Ghi tuần tự (100% ghi) được thực hiện vào các tệp thử nghiệm lớn. Mỗi luồng ghi ghi vào một tệp thử nghiệm lớn duy nhất. Chúng tôi đã sử dụng các tệp 80 GiB cho các lần ghi tuần tự.
  • Đọc tuần tự (đọc 100%) được thực hiện từ các tệp thử nghiệm lớn hiện có. Mỗi luồng đọc đọc từ một tệp thử nghiệm lớn duy nhất. Chúng tôi đã sử dụng các tệp 80 GiB cho các lần đọc tuần tự.

Các tính năng nén nội tuyến và loại bỏ trùng lặp nội tuyến của OneFS được giữ nguyên ở mặc định (được bật) trong tất cả các thử nghiệm. Khối lượng công việc chuẩn chỉ định 0% khối dữ liệu có thể nén hoặc loại bỏ trùng lặp. Tỷ lệ giảm dữ liệu cho tập dữ liệu là 1,0 trong các thử nghiệm.

Lưu ý : Có một sự cố đã biết là tính năng khử trùng lặp nội tuyến và nén nội tuyến không được bật theo mặc định ở cấp độ nhóm đĩa. Bản MR (Bản phát hành chính) đầu tiên sẽ khắc phục sự cố này sau GA (Khả dụng chung). Bạn cũng có thể liên hệ với đại diện bán hàng của mình nếu bạn cần sửa lỗi ngay lập tức.

Trong các thử nghiệm, chúng tôi đã sử dụng máy khách Standard_D48s_v5 để tạo I/O cho các cụm OneFS. Tỷ lệ máy khách so với nút là 2:1. Mỗi phiên bản máy khách chứa 48 lõi vCPU và bộ nhớ 192 GiB, và băng thông mạng là 24 Gbps. Đối với mỗi thử nghiệm, chúng tôi tuân theo quy tắc đảm bảo rằng băng thông tổng hợp của đĩa dữ liệu là đủ ở cấp VM. Xem Phụ lục C: thông tin chi tiết về cấu hình đĩa dữ liệu được khuyến nghị để có hiệu suất tối ưu trong sách trắng Giới thiệu về Lưu trữ tệp APEX cho Microsoft Azure .

Tất cả các bài kiểm tra hiệu suất trong tài liệu này đều được thực hiện tại địa điểm Nam Trung Bộ Hoa Kỳ.

Những cân nhắc

Nhìn chung, thử nghiệm hiệu suất của chúng tôi đã xác định một số cân nhắc chính cần giải quyết trước khi triển khai APEX File Storage cho cụm Microsoft Azure. Những cân nhắc này rất quan trọng để đảm bảo rằng các cụm có thể đáp ứng hiệu quả nhu cầu hiệu suất của tổ chức bạn.

Phần này mô tả hai yếu tố chính ảnh hưởng đến hiệu suất khi thiết kế cụm OneFS của APEX File Storage cho Microsoft Azure. Các yếu tố chính là:

  • Các loại nút
  • Mở rộng quy mô nút

Lưu ý: Kiểm tra hiệu suất được thực hiện với các cấu hình mức bảo vệ +2d:1n được hỗ trợ. Xem  Phụ lục A: chi tiết cấu hình cụm được hỗ trợ cho tất cả các kết hợp được hỗ trợ trong sách trắng  Giới thiệu về Lưu trữ tệp APEX cho Microsoft Azure .

Bắt đầu từ OneFS 9.8.0.0, APEX File Storage for Microsoft Azure hỗ trợ:

  • Máy ảo dòng Ddv5
  • Máy ảo dòng Ddsv5
  • Máy ảo Edv5-series
  • Máy ảo Edsv5-series

Bảng 1 hiển thị hai giới hạn thông lượng lưu trữ Azure và giới hạn băng thông mạng ở cấp độ nút để thử nghiệm. Ba giới hạn này sẽ ảnh hưởng trực tiếp đến hiệu suất thông lượng đọc tuần tự tối đa. 

Bảng 1. Giới hạn thông lượng lưu trữ Azure và giới hạn băng thông mạng cho các loại nút được thử nghiệm

Loại nút/Kích thước VM vCPU Bộ nhớ (GiB) Thông lượng đĩa không lưu trữ tối đa (MBps) Thông lượng đĩa không lưu trữ đệm tối đa (MBps) Băng thông mạng tối đa (Mbps)
Tiêu chuẩn_D32ds_v5 32 128 865 2.000 16.000
Tiêu chuẩn_D48ds_v5 48 192 1.315 3.000 24.000
Tiêu chuẩn_D64ds_v5 64 256 1.735 3.000 30.000
Tiêu chuẩn_E104ids_v5 104 672 4.000 4.000 100.000

Khi tối ưu hóa hiệu suất của cụm, hãy xem Phụ lục C: thông tin chi tiết về cấu hình đĩa dữ liệu được đề xuất để có hiệu suất tối ưu trong sách trắng Giới thiệu về Lưu trữ tệp APEX cho Microsoft Azure .

Các loại nút

Phần này mô tả hiệu suất đọc tuần tự và ghi tuần tự cho các loại nút khác nhau.

Thông lượng đọc tuần tự

Hình 1 biểu diễn khối lượng công việc đọc tuần tự 128KB cho các loại nút khác nhau. Nó chỉ ra rằng hiệu suất đọc tuần tự tăng lên với các nút mạnh hơn (kích thước VM lớn hơn) trong cụm.

Thông lượng đĩa không lưu trữ đệm tối đa và băng thông mạng tối đa ảnh hưởng trực tiếp đến hiệu suất thông lượng đọc tuần tự tối đa.

  • Thông lượng đĩa không lưu trữ đệm tối đa : Đối với nút E104ids_v5, hiệu suất đọc tuần tự của nút này bị giới hạn bởi thông lượng lưu trữ cấp nút, đó là thông lượng đĩa không lưu trữ đệm tối đa hoặc thông lượng đĩa không lưu trữ đệm tối đa như thể hiện trong Bảng 1.
  • Băng thông mạng tối đa : Đối với hầu hết các loại nút (trừ E104ids_v5), hiệu suất đọc tuần tự của chúng bị hạn chế bởi giới hạn băng thông mạng cấp nút của chúng như được hiển thị trong Bảng 1. Băng thông mạng của một nút được đo dựa trên lưu lượng ra trên tất cả các giao diện mạng. Băng thông mạng này được chia sẻ bởi cả giao diện bên ngoài (giao diện đầu cuối) và giao diện bên trong (giao diện cuối cùng) của nút.

Biểu đồ về thông lượng đọc tuần tự cho các loại nút khác nhau, D32ds_v5, D48ds_v5, D64ds_v5, E104ids_v5. 1. Thông lượng đọc D48ds_v5 tăng 49% so với D32ds_v5. 2. Thông lượng đọc D64ds_v5 tăng 25% so với D48ds_v5. 3. Thông lượng đọc E104ids_v5 tăng 96% so với D64ds_v5.

Hình 1. Thông lượng đọc tuần tự cho các loại nút khác nhau

Lưu ý : Mỗi thử nghiệm sử dụng cụm 4 nút với 12 đĩa dữ liệu trên mỗi nút.

Thông lượng ghi tuần tự

Hình 2 biểu diễn khối lượng công việc ghi tuần tự 512KB cho các loại nút khác nhau. Nó chỉ ra rằng hiệu suất ghi tuần tự tăng lên với các nút mạnh hơn (kích thước VM lớn hơn) trong cụm.

Biểu đồ thông lượng ghi tuần tự cho các loại nút khác nhau, D32ds_v5, D48ds_v5, D64ds_v5, E104ids_v5. 1. Thông lượng ghi D48ds_v5 tăng 56% so với D32ds_v5. 2. Thông lượng ghi D64ds_v5 tăng 24% so với D48ds_v5. 3. Thông lượng ghi E104ids_v5 tăng 16% so với D64ds_v5.

Hình 2. Thông lượng ghi tuần tự cho các loại nút khác nhau

Lưu ý : Mỗi bài kiểm tra sử dụng cụm 4 nút với 12 đĩa dữ liệu trên mỗi nút.

Mở rộng quy mô nút

Phần này mô tả hiệu suất đọc tuần tự và ghi tuần tự cho việc mở rộng quy mô nút.

Bảng 2 hiển thị cấu hình cụm cho các thử nghiệm mở rộng quy mô nút.

Bảng 2. Cấu hình cụm cho các thử nghiệm mở rộng nút

Loại nút Số lượng nút Loại đĩa dữ liệu Số lượng đĩa dữ liệu
Tiêu chuẩn_D48ds_v5 10 P40 12
Tiêu chuẩn_D48ds_v5 14 P40 12
Tiêu chuẩn_D48ds_v5 18 P40 12

Lưu ý: Kiểm tra hiệu suất được thực hiện với các cấu hình mức bảo vệ +2d:1n được hỗ trợ. Đối với tất cả các kết hợp được hỗ trợ, hãy xem Phụ lục A: chi tiết cấu hình cụm được hỗ trợ trong sách trắng Giới thiệu về Lưu trữ tệp APEX cho Microsoft Azure .

Thông lượng đọc tuần tự

Hình 3 biểu diễn khối lượng công việc đọc tuần tự 128KB cho node scale-out. Nó chỉ ra rằng hiệu suất đọc tuần tự tăng lên với nhiều node hơn trong cụm. 

Biểu đồ hiệu suất đọc tuần tự cho node Scale-out, 10 node, 14 node và 18 node. 1. Thông lượng đọc của cụm 14 node (D48ds_v5) tăng 36% so với cụm 10 node (D32ds_v5). 2. Thông lượng đọc của cụm 18 node (D48ds_v5) tăng 30% so với cụm 14 node (D32ds_v5).

Hình 3. Hiệu suất đọc tuần tự cho nút Scale-out

Thông lượng ghi tuần tự

Hình 4 biểu diễn khối lượng công việc ghi tuần tự 512KB cho việc mở rộng quy mô nút. Nó chỉ ra rằng hiệu suất ghi tuần tự tăng lên với nhiều nút hơn trong cụm.   Biểu đồ hiệu suất ghi tuần tự cho node scale-out, 10 node, 14 node và 18 node. 1. Thông lượng ghi của cụm 14 node (D48ds_v5) tăng 12% so với cụm 10 node (D32ds_v5). 2. Thông lượng ghi của cụm 18 node (D48ds_v5) tăng 24% so với cụm 14 node (D32ds_v5).

Hình 4. Hiệu suất ghi tuần tự cho nút Scale-out

Chúng tôi cũng đã xác thực khối lượng công việc AI phổ biến và đạt được hiệu suất vững chắc trên các cụm OneFS trong Azure. Về mặt hiệu suất, nó rất phù hợp để chạy khối lượng công việc AI thông thường trên các cụm OneFS trong Azure.

Tuyên bố miễn trừ trách nhiệm : Kết quả chuẩn phụ thuộc vào khối lượng công việc, yêu cầu ứng dụng cụ thể và thiết kế và triển khai hệ thống. Hiệu suất hệ thống tương đối thay đổi dựa trên các yếu tố này và các yếu tố khác. Không nên sử dụng các kết quả chuẩn này để thay thế cho hồ sơ ứng dụng khách hàng cụ thể khi đưa ra quyết định lập kế hoạch năng lực quan trọng hoặc đánh giá sản phẩm. Tất cả các kết quả hiệu suất được trình bày trong báo cáo này đều thu được trong môi trường được kiểm soát chặt chẽ. Kết quả thu được trong các môi trường hoạt động khác có thể thay đổi đáng kể. Dell Technologies không bảo đảm hoặc tuyên bố rằng người dùng có thể hoặc sẽ đạt được kết quả hiệu suất tương tự.

Cảm ơn bạn đã dành thời gian đọc blog này và xin chúc mừng vì đã hiểu rõ về đặc điểm hiệu suất của APEX File Storage cho Microsoft Azure!