Giá trị được tối ưu hóa AX-6515 cho các trường hợp sử dụng ROBO

Giới thiệu

Các trường hợp sử dụng văn phòng nhỏ và văn phòng chi nhánh từ xa (ROBO) đặt ra những thách thức đặc biệt cho các tổ chức CNTT. Các vấn đề có xu hướng xoay quanh cách triển khai nền tảng có thể mở rộng, linh hoạt, an toàn và hiệu suất cao với mức TCO phải chăng. Cơ sở hạ tầng phải có đủ khả năng để vận hành hiệu quả danh mục ứng dụng và dịch vụ rất đa dạng, đồng thời phải đơn giản để triển khai, cập nhật và hỗ trợ bởi một chuyên gia CNTT địa phương. Dell Technologies và Microsoft giúp bạn tăng tốc kết quả kinh doanh trong các môi trường ROBO độc đáo này với Giải pháp Dell EMC dành cho Microsoft Azure Stack HCI của chúng tôi .

Trong bài đăng trên blog này, chúng tôi chia sẻ kết quả VMFleet được quan sát trong phòng thí nghiệm của Dell Technologies cho cấu hình hai nút AX-6515 mới nhất của chúng tôi – lý tưởng cho môi trường ROBO. Được tối ưu hóa về mặt giá trị, nút AX-6515 nhỏ nhưng mạnh mẽ chứa bộ xử lý AMD EPYC thế hệ 2 một socket dày đặc trong khung máy 1RU mang lại hiệu suất cao nhất và TCO tuyệt vời. Chúng tôi cũng đã đưa Dell EMC PowerSwitch S5212F-ON vào thử nghiệm để cung cấp kết nối mạng 25GbE cho việc lưu trữ, quản lý và lưu lượng VM ở dạng nhỏ. Hướng dẫn triển khai Giải pháp Dell EMC cho Azure Stack HCI đã được tuân theo để xây dựng phòng thí nghiệm thử nghiệm và chỉ áp dụng cho cơ sở hạ tầng được xây dựng bằng các nút AX đã được xác thực và chứng nhận chạy Trung tâm dữ liệu Microsoft Windows Server 2019 của Dell Technologies.

Chúng tôi khá ấn tượng với kết quả của VMFleet. Đầu tiên, chúng tôi nhấn mạnh đến giới hạn của hệ thống con lưu trữ của cụm bằng cách sử dụng các kịch bản nhằm xác định IOPS, độ trễ và thông lượng tối đa. Sau đó, chúng tôi đã điều chỉnh các tham số thử nghiệm để mang tính đại diện hơn cho khối lượng công việc trong thế giới thực. Bản tóm tắt các phát hiện sau đây cho chúng tôi biết rằng cụm toàn flash, dựa trên AMD, hai nút này có thể đáp ứng hoặc vượt quá các yêu cầu về hiệu suất của cấu hình khối lượng công việc thường thấy trong môi trường ROBO:

  • Đạt được hơn 1 triệu IOPS ở độ trễ micro giây bằng cách sử dụng kích thước khối 4k và mẫu IO đọc ngẫu nhiên 100%.
  • Đạt được hơn 400.000 IOPS ở độ trễ 4 mili giây bằng cách sử dụng kích thước khối 4k và mẫu IO ghi ngẫu nhiên 100%.
  • Sử dụng kích thước khối 512k, đã tăng thông lượng 6 GB/s và 12 GB/s cho các mẫu IO ghi tuần tự 100% và đọc tuần tự 100%.
  • Bằng cách sử dụng nhiều tình huống trong thế giới thực, cụm này đã đạt được hàng trăm nghìn IOPS với độ trễ dưới 7 mili giây và thúc đẩy thông lượng được duy trì từ 5 – 12 GB/s .

Thiết lập phòng thí nghiệm

Sơ đồ sau minh họa môi trường được tạo trong phòng thí nghiệm của Dell Technologies để thử nghiệm VMFleet. Các dịch vụ phụ trợ cần thiết cho hoạt động của cụm như DNS, Active Directory và máy chủ tệp cho số đại biểu của cụm không được mô tả.

Hình 1 Cấu trúc liên kết mạng

 

Bảng 1 Cấu hình cụm

Các yếu tố thiết kế cụm Sự miêu tả
Số lượng nút cụm 2
Mô hình nút cụm Nút AX-6515
Số lượng thiết bị chuyển mạch mạng cho lưu lượng RDMA và TCP/IP 2
Mô hình chuyển mạch mạng Dell EMC PowerSwitch S5212F-ON
Cấu trúc mạng Cấu hình mạng hội tụ đầy đủ . Lưu lượng RDMA và TCP/IP truyền qua 2 kết nối mạng 25GbE từ mỗi máy chủ.
Chuyển đổi mạng để quản lý OOB Dell EMC PowerSwitch S3048-ON
Tùy chọn khả năng phục hồi Gương hai chiều
Dung lượng lưu trữ có thể sử dụng Khoảng 12 TB

 

Bảng 2 Tài nguyên nút cụm

Tài nguyên trên mỗi nút cụm Sự miêu tả
CPU Bộ xử lý AMD EPYC 7702P 64 lõi một socket
Ký ức RAM 256GB DDR4
Bộ điều khiển lưu trữ cho hệ điều hành Thẻ chuyển đổi BOSS-S1
Ổ đĩa vật lý cho hệ điều hành 2 x ổ Intel 240 GB M.2 SATA được định cấu hình là RAID 1
Bộ điều khiển lưu trữ cho Storage Spaces Direct (S2D) HBA330 Mini
Ổ đĩa vật lý 8 x 1,92 TB SSD KIOXIA SAS sử dụng hỗn hợp
Bộ điều hợp mạng Bộ chuyển đổi Mellanox ConnectX-5 Cổng kép 10/25GbE SFP28
Hệ điều hành Trung tâm dữ liệu Windows Server 2019

Kiến trúc của các giải pháp Azure Stack HCI rất được quan tâm và mang tính quy định. Mỗi thiết kế đều được Dell Technologies Engineering thử nghiệm và xác nhận rộng rãi. Dưới đây là bản tóm tắt các thuộc tính chất lượng chính xác định các kiến ​​trúc này, sau đó là phần dành cho các phát hiện về hiệu suất của chúng tôi.

  • Hiệu quả – Nhiều khách hàng quan tâm đến việc cải thiện hiệu suất và đạt được hiệu quả bằng cách hiện đại hóa nền tảng ảo hóa cũ kỹ của họ bằng HCI. Việc sử dụng Azure Stack HCI giúp tránh cách tiếp cận tự làm đối với cơ sở hạ tầng CNTT vốn dễ xảy ra lỗi của con người và tốn nhiều công sức hơn.
  • Khả năng bảo trì –  Giải pháp của chúng tôi giúp việc kết hợp các khả năng kết hợp để giảm bớt gánh nặng vận hành bằng Trung tâm quản trị Microsoft Windows (WAC) trở nên đơn giản. Các dịch vụ trong Azure cũng có thể được tận dụng để tránh phải đầu tư thêm tại chỗ cho hoạt động quản lý, giám sát, BCDR, bảo mật, v.v. Chúng tôi cũng đã phát triển Tích hợp Dell EMC OpenManager với Trung tâm quản trị Microsoft Windows để hỗ trợ giám sát phần cứng và đơn giản hóa các bản cập nhật bằng Cập nhật nhận biết cụm (CAU).
  • Tính sẵn có  – Sử dụng máy nhân bản hai chiều, chúng tôi luôn có hai bản sao dữ liệu của mình. Cấu hình này có thể tồn tại sau một lỗi ổ đĩa ở một nút hoặc tồn tại sau lỗi toàn bộ nút. Tuy nhiên, cụm không thể tồn tại hai lỗi đồng thời trên cả hai nút. Trong trường hợp mong muốn có khả năng phục hồi cao hơn, khối lượng có thể được tạo bằng cách sử dụng khả năng phục hồi lồng nhau. Khả năng phục hồi lồng nhau được thảo luận chi tiết hơn trong phần “Các sửa đổi tùy chọn đối với kiến ​​trúc” ở phần sau của bài đăng blog này.
  • Khả năng hỗ trợ – Hỗ trợ được cung cấp bởi Dell Technologies ProSupport Plus và ProSupport dành riêng cho các kỹ thuật viên Phần mềm có kiến ​​thức chuyên môn được thiết kế riêng cho các giải pháp Azure Stack HCI.

 

Kết quả kiểm tra

Chúng tôi đã tận dụng VMFleet để đánh giá hệ thống con lưu trữ của cụm 2 nút của chúng tôi. Nhiều khách hàng và đối tác của Microsoft dựa vào công cụ này để giúp họ kiểm tra hiệu quả cụm Azure Stack HCI của mình. VMFleet bao gồm một tập lệnh PowerShell triển khai các máy ảo vào cụm Hyper-V và thực thi DiskSpd của Microsoft trong các máy ảo đó để tạo IO. Bảng sau đây trình bày phạm vi tham số VMFleet và DiskSpd được sử dụng trong quá trình thử nghiệm của chúng tôi trong phòng thí nghiệm của Dell Technologies.

Bảng 3 Thông số thử nghiệm

Tham số VMFleet và DiskSpd Giá trị
Số lượng máy ảo chạy trên mỗi nút 20
vCPU trên mỗi VM 2
Bộ nhớ trên mỗi VM 8 GB
Kích thước VHDX trên mỗi VM 40GB
Hệ điều hành VM Máy chủ Windows 2019
Kích thước bộ nhớ đệm đọc trong bộ nhớ chia sẻ cụm (CSV) 0
Kích thước khối (B) 4k – 512k
Số lượng chủ đề (T) 2
IO nổi bật (O) 32
Viết phần trăm (W) 0, 20, 50, 100
Mẫu IO (P) Ngẫu nhiên, tuần tự

Trước tiên, chúng tôi đã chọn các kịch bản DiskSpd nhằm xác định ngưỡng IOPS, độ trễ và thông lượng tối đa của cụm. Bằng cách vượt qua các giới hạn của hệ thống con lưu trữ, chúng tôi đã xác nhận rằng lớp mạng, điện toán, hệ điều hành và ảo hóa đã được định cấu hình chính xác theo Hướng dẫn triển khai , Tích hợp mạng và Tùy chọn cấu hình mạng máy chủ của chúng tôi . Điều này cũng đảm bảo rằng không có cấu hình sai nào xảy ra trong quá trình triển khai ban đầu có thể làm sai lệch kết quả hiệu suất lưu trữ trong thế giới thực. Kết quả của chúng tôi được mô tả trong Bảng 4.

Bảng 4 Kết quả thử nghiệm tối đa

Kịch bản Giá trị tham số được giải thích Chỉ số hiệu suất
B4-T2-O32-W0-PR Kích thước khối: 4k

Số chủ đề: 2

IO nổi bật: 32

Mẫu IO: đọc ngẫu nhiên 100%

IOPS: 1.146.948

Độ trễ đọc: 245 micro giây

Mức sử dụng CPU: 48%

B4-T2-O32-W100-PR Kích thước khối: 4k

Số chủ đề: 2

IO nổi bật: 32

Mẫu IO: ghi ngẫu nhiên 100%

IOPS: 417.591

Độ trễ ghi: 4 mili giây

Mức sử dụng CPU: 25%

B512-T2-O2-W0-PSI Kích thước khối: 512k

Số chủ đề: 2

IO nổi bật: 8

Mẫu IO: đọc tuần tự 100%

Thông lượng: 12 GB/giây
B512-T2-O2-W100-PSI Kích thước khối: 512k

Số chủ đề: 2

IO nổi bật: 8

Mẫu IO: ghi tuần tự 100%

Thông lượng: 6 GB/giây

Sau đó, chúng tôi nhấn mạnh hệ thống con lưu trữ sử dụng mẫu IO phản ánh rõ hơn các loại khối lượng công việc được tìm thấy trong trường hợp sử dụng ROBO. Các ứng dụng này thường có đặc điểm là kích thước khối nhỏ hơn, kiểu I/O ngẫu nhiên và nhiều tỷ lệ đọc/ghi khác nhau. Các ví dụ bao gồm các ứng dụng LOB văn phòng nhỏ và doanh nghiệp nói chung cũng như khối lượng công việc OLTP. Kết quả thử nghiệm trong Hình 2 bên dưới cho thấy cụm này có khả năng tăng tốc khối lượng công việc OLTP và làm cho các ứng dụng doanh nghiệp có khả năng phản hồi cao với người dùng cuối.

Hình 2 Kết quả hiệu suất với kích thước khối nhỏ hơn

Các dịch vụ khác như sao lưu, truyền phát video và quét tập dữ liệu lớn có kích thước khối lớn hơn và mẫu IO tuần tự. Với những khối lượng công việc này, thông lượng trở thành chỉ số hiệu suất chính để phân tích. Các kết quả được hiển thị trong biểu đồ sau đây cho thấy thông lượng được duy trì ấn tượng có thể mang lại lợi ích to lớn cho danh mục dịch vụ và ứng dụng CNTT này.

Hình 3 Kết quả hiệu suất với kích thước khối lớn hơn

 

Tùy chọn sửa đổi kiến ​​trúc

Khách hàng có thể sửa đổi cấu hình phòng thí nghiệm để đáp ứng các yêu cầu khác nhau trong trường hợp sử dụng ROBO. Ví dụ: Dell Technologies hỗ trợ hoàn toàn cấu trúc liên kết toàn lưới liên kết kép cho Azure Stack HCI . Cấu trúc liên kết không chuyển mạch lưu trữ không hội tụ này giúp loại bỏ nhu cầu chuyển mạch mạng để liên lạc lưu trữ và cho phép bạn sử dụng cơ sở hạ tầng hiện có để quản lý và lưu lượng VM. Cách tiếp cận này sẽ mang lại các số liệu hiệu suất tương tự hoặc được cải thiện so với các số liệu được đề cập trong blog này do kết nối trực tiếp 2 x 25 GB giữa các nút và sự cô lập lưu lượng lưu trữ trên các kết nối chuyên dụng này.  

Hình 4 Tùy chọn kiến ​​trúc back-to-back hai nút

Có thể có những tình huống trong các tình huống ROBO trong đó không có chuyên gia CNTT tổng quát nào ở gần địa điểm để giải quyết các lỗi phần cứng. Khi một ổ đĩa hoặc toàn bộ nút bị lỗi, có thể mất vài ngày hoặc vài tuần trước khi ai đó có thể bảo trì các nút và đưa cụm trở lại đầy đủ chức năng. Hãy xem xét khả năng phục hồi lồng nhau thay vì phản chiếu hai chiều để xử lý nhiều lỗi trên cụm hai nút. Lấy cảm hứng từ công nghệ RAID 5 + 1, khối lượng công việc vẫn trực tuyến và có thể truy cập được ngay cả trong các trường hợp sau:

Hình 5 Tùy chọn khả năng phục hồi lồng nhau

Xin lưu ý rằng sẽ tốn chi phí hiệu quả năng lực khi sử dụng khả năng phục hồi lồng nhau. Phản chiếu hai chiều có hiệu suất 50%, nghĩa là 1 TB dữ liệu chiếm 2 TB dung lượng lưu trữ vật lý. Tùy thuộc vào loại khả năng phục hồi lồng nhau mà bạn chọn để định cấu hình, hiệu suất công suất có thể dao động trong khoảng 25% – 40%. Do đó, hãy đảm bảo bạn có đủ dung lượng lưu trữ thô nếu bạn có ý định sử dụng công nghệ này. Hiệu suất cũng sẽ bị ảnh hưởng khi sử dụng khả năng phục hồi lồng nhau – đặc biệt là đối với khối lượng công việc có tỷ lệ ghi IO cao hơn vì cần phải duy trì nhiều bản sao dữ liệu hơn trên cụm.

Nếu bạn cần sự linh hoạt hơn về tài nguyên cụm, Dell Technologies sẽ cung cấp cấu hình Azure Stack HCI để đáp ứng mọi yêu cầu kinh doanh và hồ sơ khối lượng công việc. Bảng bên dưới hiển thị các tùy chọn tài nguyên khác nhau có sẵn cho mỗi nút AX. Để tìm thêm thông số kỹ thuật chi tiết về các cấu hình này, vui lòng xem lại thông số kỹ thuật chi tiết của sản phẩm trên trang sản phẩm của chúng tôi .

Bảng 5 Tùy chọn cấu hình Azure Stack HCI