Giá trị tối ưu hóa AX-6515 cho các trường hợp sử dụng ROBO

Giới thiệu

Các trường hợp sử dụng văn phòng nhỏ và chi nhánh từ xa (ROBO) đặt ra những thách thức đặc biệt cho các tổ chức CNTT. Các vấn đề thường xoay quanh cách triển khai một nền tảng có khả năng mở rộng, phục hồi, an toàn và hiệu suất cao với TCO phải chăng. Cơ sở hạ tầng phải đủ khả năng để chạy hiệu quả danh mục ứng dụng và dịch vụ đa dạng cao nhưng vẫn dễ triển khai, cập nhật và hỗ trợ bởi một chuyên gia CNTT tại địa phương. Dell Technologies và Microsoft giúp bạn đẩy nhanh kết quả kinh doanh trong các môi trường ROBO độc đáo này với Giải pháp Dell EMC cho Microsoft Azure Stack HCI của chúng tôi .

Trong bài đăng trên blog này, chúng tôi chia sẻ kết quả VMFleet được quan sát trong phòng thí nghiệm Dell Technologies cho cấu hình hai nút AX-6515 mới nhất của chúng tôi – lý tưởng cho môi trường ROBO. Được tối ưu hóa về giá trị, nút AX-6515 nhỏ nhưng mạnh mẽ này chứa bộ xử lý AMD EPYC thế hệ thứ 2, một ổ cắm dày đặc trong khung máy 1RU mang lại hiệu suất cao nhất và TCO tuyệt vời. Chúng tôi cũng đã đưa Dell EMC PowerSwitch S5212F-ON vào thử nghiệm của mình để cung cấp kết nối mạng 25GbE cho lưu trữ, quản lý và lưu lượng VM trong một hệ số dạng nhỏ. Hướng dẫn triển khai Dell EMC Solutions for Azure Stack HCI đã được tuân theo để xây dựng phòng thí nghiệm thử nghiệm và chỉ áp dụng cho cơ sở hạ tầng được xây dựng bằng các nút AX đã được xác thực và chứng nhận chạy Microsoft Windows Server 2019 Datacenter từ Dell Technologies.

Chúng tôi khá ấn tượng với kết quả VMFleet. Đầu tiên, chúng tôi nhấn mạnh hệ thống lưu trữ của cụm đến giới hạn của nó bằng các kịch bản nhằm xác định IOPS, độ trễ và thông lượng tối đa. Sau đó, chúng tôi điều chỉnh các thông số thử nghiệm để đại diện hơn cho khối lượng công việc trong thế giới thực. Tóm tắt sau đây về các phát hiện cho chúng tôi biết rằng cụm hai nút, dựa trên AMD, toàn bộ flash này có thể đáp ứng hoặc vượt quá các yêu cầu về hiệu suất của các cấu hình khối lượng công việc thường thấy trong môi trường ROBO:

  • Đạt được hơn 1 triệu IOPS ở độ trễ micro giây bằng cách sử dụng kích thước khối 4k và mẫu IO đọc ngẫu nhiên 100%.
  • Đạt được hơn 400.000 IOPS với độ trễ 4 mili giây bằng cách sử dụng kích thước khối 4k và kiểu IO ghi ngẫu nhiên 100%.
  • Sử dụng kích thước khối 512k, thúc đẩy thông lượng 6 GB/giây và 12 GB/giây cho các mẫu IO ghi tuần tự 100% và đọc tuần tự 100%.
  • Sử dụng nhiều tình huống thực tế, cụm này đã đạt được hàng trăm nghìn IOPS với độ trễ dưới 7 mili giây và đạt thông lượng liên tục từ 5 – 12 GB/giây .

Thiết lập phòng thí nghiệm

Sơ đồ sau minh họa môi trường được tạo trong phòng thí nghiệm Dell Technologies để thử nghiệm VMFleet. Các dịch vụ phụ trợ cần thiết cho hoạt động cụm như DNS, Active Directory và máy chủ tệp cho cụm quorum không được mô tả.

Hình 1 Cấu trúc mạng

 

Bảng 1 Cấu hình cụm

Các yếu tố thiết kế cụm Sự miêu tả
Số lượng nút cụm 2
Mô hình nút cụm Các nút AX-6515
Số lượng bộ chuyển mạch mạng cho lưu lượng RDMA và TCP/IP 2
Mô hình chuyển mạch mạng Bộ chuyển mạch nguồn Dell EMC S5212F-ON
Cấu trúc mạng Cấu hình mạng hội tụ hoàn toàn . Lưu lượng RDMA và TCP/IP đi qua 2 kết nối mạng 25GbE từ mỗi máy chủ.
Chuyển mạch mạng để quản lý OOB Bộ chuyển mạch nguồn Dell EMC S3048-ON
Tùy chọn phục hồi Gương hai chiều
Dung lượng lưu trữ có thể sử dụng Khoảng 12 TB

 

Bảng 2 Tài nguyên nút cụm

Tài nguyên cho mỗi nút cụm Sự miêu tả
Bộ vi xử lý Bộ xử lý AMD EPYC 7702P 64 lõi ổ cắm đơn
Ký ức Bộ nhớ RAM DDR4 256GB
Bộ điều khiển lưu trữ cho hệ điều hành Thẻ chuyển đổi BOSS-S1
Ổ đĩa vật lý cho hệ điều hành 2 ổ đĩa Intel 240 GB M.2 SATA được cấu hình thành RAID 1
Bộ điều khiển lưu trữ cho Storage Spaces Direct (S2D) HBA330 Nhỏ
Ổ đĩa vật lý 8 x 1,92 TB SSD KIOXIA SAS sử dụng hỗn hợp
Bộ điều hợp mạng Bộ chuyển đổi Mellanox ConnectX-5 Dual Port 10/25GbE SFP28
Hệ điều hành Trung tâm dữ liệu Windows Server 2019

Kiến trúc của các giải pháp Azure Stack HCI có tính chủ quan và mang tính quy định cao. Mỗi thiết kế đều được Dell Technologies Engineering kiểm tra và xác thực rộng rãi. Sau đây là tóm tắt các thuộc tính chất lượng chính xác định các kiến ​​trúc này, tiếp theo là phần dành riêng cho các phát hiện về hiệu suất của chúng tôi.

  • Hiệu quả – Nhiều khách hàng quan tâm đến việc cải thiện hiệu suất và đạt được hiệu quả bằng cách hiện đại hóa nền tảng ảo hóa cũ của họ bằng HCI. Sử dụng Azure Stack HCI giúp tránh cách tiếp cận DIY đối với cơ sở hạ tầng CNTT, dễ xảy ra lỗi của con người và đòi hỏi nhiều nhân công hơn.
  • Khả năng bảo trì –  Giải pháp của chúng tôi giúp dễ dàng kết hợp các khả năng lai để giảm gánh nặng vận hành bằng cách sử dụng Microsoft Windows Admin Center (WAC). Các dịch vụ trong Azure cũng có thể được tận dụng để tránh các khoản đầu tư tại chỗ bổ sung cho quản lý, giám sát, BCDR, bảo mật, v.v. Chúng tôi cũng đã phát triển Dell EMC OpenManage Integration với Microsoft Windows Admin Center để hỗ trợ giám sát phần cứng và đơn giản hóa các bản cập nhật bằng Cluster Aware Updates (CAU).
  • Tính khả dụng  – Sử dụng bản sao hai chiều, chúng ta luôn có hai bản sao dữ liệu của mình. Cấu hình này có thể tồn tại sau một lỗi ổ đĩa đơn trong một nút hoặc tồn tại sau lỗi toàn bộ nút. Tuy nhiên, cụm không thể tồn tại sau hai lỗi đồng thời trên cả hai nút. Trong trường hợp muốn có khả năng phục hồi cao hơn, có thể tạo các khối lượng bằng khả năng phục hồi lồng nhau. Khả năng phục hồi lồng nhau được thảo luận chi tiết hơn trong phần “Các sửa đổi tùy chọn cho kiến ​​trúc” sau trong bài đăng trên blog này.
  • Khả năng hỗ trợ – Hỗ trợ được cung cấp bởi các kỹ thuật viên chuyên dụng Dell Technologies ProSupport Plus và ProSupport for Software, những người có chuyên môn được thiết kế riêng cho các giải pháp Azure Stack HCI.

 

Kết quả thử nghiệm

Chúng tôi đã tận dụng VMFleet để đánh giá chuẩn hệ thống lưu trữ của cụm 2 nút của chúng tôi. Nhiều khách hàng và đối tác của Microsoft dựa vào công cụ này để giúp họ kiểm tra ứng suất các cụm Azure Stack HCI của họ. VMFleet bao gồm một tập lệnh PowerShell triển khai máy ảo vào cụm Hyper-V và thực thi DiskSpd của Microsoft trong các VM đó để tạo IO. Bảng sau đây trình bày phạm vi các tham số VMFleet và DiskSpd được sử dụng trong quá trình thử nghiệm của chúng tôi tại phòng thí nghiệm Dell Technologies.

Bảng 3 Các thông số thử nghiệm

Tham số VMFleet và DiskSpd Giá trị
Số lượng VM đang chạy trên mỗi nút 20
vCPU trên mỗi VM 2
Bộ nhớ trên mỗi VM 8GB
Kích thước VHDX trên mỗi VM 40GB
Hệ điều hành VM Máy chủ Windows 2019
Kích thước bộ đệm đọc trong bộ nhớ của Cluster Shared Volume (CSV) 0
Kích thước khối (B) 4k – 512k
Số lượng sợi (T) 2
IOs nổi bật (O) 32
Viết phần trăm (W) 0, 20, 50, 100
Mẫu IO (P) Ngẫu nhiên, Tuần tự

Đầu tiên, chúng tôi đã chọn các kịch bản DiskSpd nhằm xác định ngưỡng IOPS, độ trễ và thông lượng tối đa của cụm. Bằng cách đẩy giới hạn của hệ thống lưu trữ, chúng tôi đã xác nhận rằng lớp mạng, tính toán, hệ điều hành và ảo hóa được cấu hình đúng theo Hướng dẫn triển khai và hướng dẫn Tùy chọn cấu hình mạng và mạng máy chủ của chúng tôi . Điều này cũng đảm bảo rằng không có cấu hình sai nào xảy ra trong quá trình triển khai ban đầu có thể làm sai lệch kết quả hiệu suất lưu trữ trong thế giới thực. Kết quả của chúng tôi được mô tả trong Bảng 4.

Bảng 4 Kết quả thử nghiệm tối đa

Kịch bản Giải thích các giá trị tham số Đo lường hiệu suất
B4-T2-O32-W0-PR Kích thước khối: 4k

Số lượng sợi: 2

IO nổi bật: 32

Mẫu IO: đọc ngẫu nhiên 100%

IOPS: 1.146.948

Độ trễ đọc: 245 micro giây

Sử dụng CPU: 48%

B4-T2-O32-W100-PR Kích thước khối: 4k

Số lượng sợi: 2

IO nổi bật: 32

Mẫu IO: ghi ngẫu nhiên 100%

IOPS: 417.591

Độ trễ ghi: 4 mili giây

Sử dụng CPU: 25%

B512-T2-O2-W0-PSI Kích thước khối: 512k

Số lượng sợi: 2

IO nổi bật: 8

Mẫu IO: đọc tuần tự 100%

Thông lượng: 12 GB/giây
B512-T2-O2-W100-PSI Kích thước khối: 512k

Số lượng sợi: 2

IO nổi bật: 8

Mẫu IO: ghi tuần tự 100%

Thông lượng: 6 GB/giây

Sau đó, chúng tôi nhấn mạnh hệ thống lưu trữ con bằng cách sử dụng các mẫu IO phản ánh nhiều hơn các loại khối lượng công việc được tìm thấy trong trường hợp sử dụng ROBO. Các ứng dụng này thường được đặc trưng bởi kích thước khối nhỏ hơn, các mẫu I/O ngẫu nhiên và nhiều tỷ lệ đọc/ghi khác nhau. Các ví dụ bao gồm các ứng dụng LOB chung của doanh nghiệp và văn phòng nhỏ và khối lượng công việc OLTP. Kết quả thử nghiệm trong Hình 2 bên dưới chỉ ra rằng cụm có tiềm năng tăng tốc khối lượng công việc OLTP và khiến các ứng dụng doanh nghiệp phản hồi cao với người dùng cuối.

Hình 2 Kết quả hiệu suất với kích thước khối nhỏ hơn

Các dịch vụ khác như sao lưu, phát trực tuyến video và quét tập dữ liệu lớn có kích thước khối lớn hơn và các mẫu IO tuần tự. Với các khối lượng công việc này, thông lượng trở thành chỉ số hiệu suất chính để phân tích. Các kết quả hiển thị trong biểu đồ sau đây cho thấy thông lượng duy trì ấn tượng có thể mang lại lợi ích lớn cho loại dịch vụ và ứng dụng CNTT này.

Hình 3 Kết quả hiệu suất với kích thước khối lớn hơn

 

Các sửa đổi tùy chọn cho kiến ​​trúc

Khách hàng có thể thực hiện các sửa đổi đối với cấu hình phòng thí nghiệm để đáp ứng các yêu cầu khác nhau trong trường hợp sử dụng ROBO. Ví dụ, Dell Technologies hỗ trợ hoàn toàn cấu trúc liên kết lưới đầy đủ liên kết kép cho Azure Stack HCI . Cấu trúc lưu trữ không hội tụ không cần chuyển mạch này loại bỏ nhu cầu về các bộ chuyển mạch mạng để truyền thông lưu trữ và cho phép bạn sử dụng cơ sở hạ tầng hiện có để quản lý và lưu lượng VM. Cách tiếp cận này sẽ mang lại các số liệu hiệu suất tương tự hoặc được cải thiện so với các số liệu được đề cập trong blog này do có 2 x 25 GB kết nối trực tiếp giữa các nút và việc cô lập lưu lượng lưu trữ trên các kết nối chuyên dụng này.  

Hình 4 Tùy chọn kiến ​​trúc back-to-back hai nút

Có thể có những tình huống trong các kịch bản ROBO mà không có chuyên gia CNTT nào gần địa điểm để giải quyết lỗi phần cứng. Khi một ổ đĩa hoặc toàn bộ nút bị lỗi, có thể mất nhiều ngày hoặc nhiều tuần trước khi ai đó có thể bảo dưỡng các nút và đưa cụm trở lại hoạt động đầy đủ. Hãy cân nhắc khả năng phục hồi lồng nhau thay vì phản chiếu hai chiều để xử lý nhiều lỗi trên cụm hai nút. Được lấy cảm hứng từ công nghệ RAID 5 + 1, khối lượng công việc vẫn trực tuyến và có thể truy cập được ngay cả trong các trường hợp sau:

Hình 5 Tùy chọn khả năng phục hồi lồng nhau

Lưu ý rằng có chi phí hiệu quả về dung lượng khi sử dụng khả năng phục hồi lồng nhau. Phản chiếu hai chiều có hiệu quả 50%, nghĩa là 1 TB dữ liệu chiếm 2 TB dung lượng lưu trữ vật lý. Tùy thuộc vào loại khả năng phục hồi lồng nhau mà bạn chọn để cấu hình, hiệu quả về dung lượng có thể dao động từ 25% – 40%. Do đó, hãy đảm bảo bạn có đủ dung lượng lưu trữ thô nếu bạn định sử dụng công nghệ này. Hiệu suất cũng sẽ bị ảnh hưởng khi sử dụng khả năng phục hồi lồng nhau – đặc biệt là trên các khối lượng công việc có tỷ lệ IO ghi cao hơn vì cần phải duy trì nhiều bản sao dữ liệu hơn trên cụm.

Nếu bạn cần tính linh hoạt cao hơn trong các tài nguyên cụm, Dell Technologies cung cấp các cấu hình Azure Stack HCI để đáp ứng mọi hồ sơ khối lượng công việc và yêu cầu kinh doanh. Bảng bên dưới hiển thị các tùy chọn tài nguyên khác nhau có sẵn cho mỗi nút AX. Để tìm thông số kỹ thuật chi tiết hơn về các cấu hình này, vui lòng xem thông số kỹ thuật chi tiết của sản phẩm trên trang sản phẩm của chúng tôi .

Bảng 5 Tùy chọn cấu hình Azure Stack HCI

Truy cập trang web của chúng tôi để biết thêm thông tin chi tiết về Giải pháp Dell EMC cho Azure Stack HCI.