Tăng tốc đồ họa thế hệ tiếp theo cho nơi làm việc kỹ thuật số từ Dell EMC và NVIDIA

Được xuất bản lần đầu vào tháng 6 năm 2019

Đối với hầu hết các tổ chức đang trải qua quá trình chuyển đổi kỹ thuật số, việc duy trì trải nghiệm người dùng tốt trên máy tính để bàn ảo—một thành phần thiết yếu của nơi làm việc kỹ thuật số—là một thách thức. Người dùng tự nhiên so sánh trải nghiệm máy tính để bàn ảo mới của họ với trải nghiệm điểm cuối vật lý trước đây của họ. Khi trải nghiệm người dùng tiếp tục trở nên quan trọng tại nơi làm việc kỹ thuật số, điều cần thiết là môi trường ảo hóa phải bắt kịp nhu cầu ngày càng tăng về cải thiện trải nghiệm người dùng.

Việc tập trung vào trải nghiệm người dùng mới này đang được các nhà phát triển hệ điều hành và ứng dụng hiện đại giải quyết, những người cố gắng đáp ứng kỳ vọng cao của người tiêu dùng. Ví dụ: hệ điều hành Windows 10, đóng một vai trò quan trọng trong các sáng kiến ​​chuyển đổi kỹ thuật số ngày nay, lại thiên về đồ họa hơn các phiên bản tiền nhiệm. Một nghiên cứu của Cộng đồng SysTrack của Lakeside Software cho thấy yêu cầu về đồ họa tăng 32% khi bạn chuyển từ Windows 7 sang Windows 10. Các ứng dụng Microsoft Office (PowerPoint, Outlook, Excel, v.v.), phần mềm cộng tác Skype for Business và tất cả các ứng dụng hiện đại- Các trình duyệt web hàng ngày được thiết kế để sử dụng nhiều khả năng tăng tốc đồ họa hơn trong các phiên bản mới nhất của chúng.

Giải pháp sẵn sàng của Dell EMC cho VDI với GPU NVIDIA Tesla T4

Các giải pháp sẵn sàng của Dell EMC cho VDI, kết hợp với phần mềm NVIDIA GRID Virtual PC (GRID vPC) và Ứng dụng ảo (GRID vApps) , cung cấp các giải pháp tăng tốc đồ họa toàn diện cho khối lượng công việc ảo hóa máy tính để bàn của bạn. Cốt lõi của phần mềm NVIDIA GRID là công nghệ NVIDIA vGPU . Công nghệ này tạo ra các GPU ảo, cho phép chia sẻ phần cứng GPU cơ bản giữa nhiều người dùng hoặc máy tính để bàn ảo chạy đồng thời trên một máy chủ. Video này so sánh chất lượng của máy tính để bàn VDI “chỉ có CPU” với máy tính để bàn VDI được hỗ trợ bởi công nghệ NVIDIA vGPU.

GPU NVIDIA mới nhất hỗ trợ ảo hóa là NVIDIA Tesla T4 , đây là GPU phổ thông có thể đáp ứng nhiều khối lượng công việc khác nhau. Tesla T4 đi kèm bộ nhớ DDR6 16 GB. Nó hoạt động ở công suất 70 W, mang lại hiệu suất năng lượng cao hơn và chi phí vận hành thấp hơn so với các phiên bản tiền nhiệm và có hệ số dạng PCIe một khe cắm. Bạn có thể định cấu hình tối đa sáu Tesla T4 trong một máy chủ Dell EMC PowerEdge R740xd duy nhất, cung cấp mật độ cao nhất cho các máy ảo tăng tốc GPU trong máy chủ Dell EMC. Để biết thêm chi tiết về GPU NVIDIA Tesla T4, hãy xem Tóm tắt công nghệ ảo hóa Tesla T4 .

thiết kế-trực quan hóa-ảo-gpu-công nghệ-cách thức hoạt động-625-ud.jpg

Hình ảnh lịch sự của Tập đoàn NVIDIA

Hình 1. Ngăn xếp công nghệ NVIDIA vGPU

 

Tesla T4 so với thẻ GPU Tesla trước đó

Hãy so sánh NVIDIA Tesla T4 với các card được sử dụng rộng rãi khác—NVIDIA Tesla P40 và NVIDIA Tesla M10.

Tesla T4 so với Tesla P40 :

  • Tesla T4  đi  kèm với bộ đệm khung tối đa 16 GB. Trong máy chủ PowerEdge R740xd, thẻ T4 có thể cung cấp bộ nhớ lên tới 96 GB (GPU 16 GB x 6), so với mức tối đa 72 GB do thẻ P40 (GPU 24 GB x 3) cung cấp. Vì vậy, để có mật độ người dùng cao hơn và tiết kiệm chi phí hơn, Tesla T4 là lựa chọn tốt hơn trong khối lượng công việc VDI.
  • Bạn có thể phải hy sinh cấu hình 3, 6, 12 và 24 GB khi sử dụng T4, nhưng cấu hình 2 GB và 4 GB, là những cấu hình được kiểm tra và định cấu hình nhiều nhất trong khối lượng công việc VDI, hoạt động tốt với Tesla T4. Tuy nhiên, các trường hợp sử dụng NVIDIA Quadro vDWS yêu cầu bộ nhớ cao hơn cho mỗi cấu hình được khuyến khích sử dụng Tesla P40.

Tesla T4 so với Tesla M10:

  • Trong máy chủ PowerEdge R740xd, ba thẻ Tesla M10 có thể cung cấp cho bạn bộ nhớ 96 GB giống như sáu thẻ Tesla T4 trong máy chủ PowerEdge R740xd. Tuy nhiên, khi nói đến mức tiêu thụ điện năng, sáu thẻ Tesla T4 chỉ tiêu thụ 420 W (70 W x 6 GPU), trong khi ba GPU Tesla M10 tiêu thụ 675 W (225 W x 3 GPU), chênh lệch đáng kể là 255 W mỗi thẻ. máy chủ. Khi so sánh với Tesla M10, Tesla T4 giúp tiết kiệm điện năng, giảm chi phí vận hành trung tâm dữ liệu của bạn.
  • Thẻ Tesla M10 hỗ trợ cấu hình 512 MB, Tesla T4 không hỗ trợ. Tuy nhiên, cấu hình 512 MB không phải là một lựa chọn khả thi ở nơi làm việc hiện đại ngày nay, nơi phổ biến các hệ điều hành Windows 10, nhiều màn hình và màn hình 4k chuyên sâu về đồ họa.

Bảng sau đây cung cấp thông tin tóm tắt về thẻ Tesla T4, P40 và M10.

Bảng 1. So sánh NVIDIA Tesla T4, P40 & M10

GPU  Yếu tố hình thức GPU/board Kích thước bộ nhớ  hồ sơ vGPU  Quyền lực
T4 Khe cắm đơn PCIe 3.0 1 16GB GDDR6 1GB, 2GB, 4GB, 8GB, 16GB 70 W
P40 Khe cắm kép PCIe 3.0 1 24GB GDDR5 1GB, 2GB, 3GB, 4GB, 6GB, 8GB, 12GB, 24GB 250W
M10 Khe cắm kép PCIe 3.0 4 32GB GDDR5 0,5 GB, 1 GB, 2 GB, 4 GB, 8 GB 225W
(8 mỗi GPU)

Kích thước GPU và hỗ trợ cho khối lượng công việc hỗn hợp

Với việc nhiều màn hình và màn hình 4K đang trở thành tiêu chuẩn ở nơi làm việc hiện đại, việc truyền phát video có độ phân giải cao có thể làm bão hòa công cụ mã hóa trên GPU và tăng tải cho CPU, ảnh hưởng đến hiệu suất và khả năng mở rộng của hệ thống VDI. Vì vậy, điều quan trọng là phải xác định kích thước GPU dựa trên số luồng mã hóa và số khung hình cần thiết trên giây (khung hình / giây). Tesla T4 đi kèm với bộ mã hóa NVIDIA NVENC nâng cao có thể cung cấp khả năng nén cao hơn và chất lượng hình ảnh tốt hơn ở các codec video H.264 và H.265 (HEVC). Tesla T4 có thể mã hóa 22 luồng ở độ phân giải quét lũy tiến (p) 720, hiển thị đồng thời ở chế độ chất lượng cao. Trung bình, Tesla T4 cũng có thể xử lý 10 luồng ở độ phân giải 1080p và 2–3 luồng ở độ phân giải Ultra HD (2160p). Chạy ở chế độ có độ trễ thấp, nó có thể mã hóa 37 luồng ở độ phân giải 720p, 17–18 luồng ở độ phân giải 1080p và 4–5 luồng ở Ultra HD.

Các giao thức từ xa VDI như VMware Blast Extreme có thể sử dụng phần mềm NVIDIA GRID và Tesla T4 để mã hóa luồng video ở định dạng H.265 và H.264, có thể giảm độ trễ mã hóa và cải thiện khung hình/giây, mang lại trải nghiệm tốt hơn cho người dùng ở nơi làm việc kỹ thuật số. Bộ mã hóa Tesla T4 NVENC mới giúp tiết kiệm tốc độ bit lên tới 25% cho H.265 và tiết kiệm tới 15% tốc độ bit cho H.264. Tham khảo blog NVIDIA này để tìm hiểu thêm về các cải tiến mã hóa Tesla T4 NVENC.

Tesla T4 rất phù hợp để sử dụng trong trung tâm dữ liệu có khối lượng công việc hỗn hợp. Ví dụ: nó có thể chạy khối lượng công việc VDI ​​vào ban ngày và tính toán khối lượng công việc vào ban đêm. Khái niệm này, được gọi là VDI ban ngày, HPC ban đêm , giúp tăng năng suất và sử dụng tài nguyên của trung tâm dữ liệu, đồng thời giảm chi phí vận hành trung tâm dữ liệu.

Thử nghiệm Tesla T4 trên Giải pháp sẵn sàng của Dell EMC VDI

Tại Dell EMC, nhóm kỹ thuật của chúng tôi đã thử nghiệm NVIDIA Tesla T4 trên ngăn xếp VDI Giải pháp sẵn sàng của chúng tôi dựa trên cơ sở hạ tầng siêu hội tụ Dell EMC VxRail . Môi trường thử nghiệm là cụm thiết bị VxRail V570F 3 nút được tối ưu hóa cho khối lượng công việc VDI. Cụm này được định cấu hình với bộ xử lý Intel Xeon có thể mở rộng thế hệ thứ 2 ( Cascade Lake) và với thẻ NVIDIA Tesla T4 ở một trong các máy chủ điện toán. Môi trường bao gồm các thành phần sau:

  • Máy chủ PowerEdge R740xd
  • Intel Xeon Gold 6248, bộ xử lý 2 x 20 nhân, 2,5 GHz (Cascade Lake)
  • GPU NVIDIA Tesla T4 với bộ nhớ 768 GB (12 x 64 GB @ 2.933 MHz)
  • Kho dữ liệu lai VMware vSAN sử dụng tầng bộ nhớ đệm SSD
  • Trình ảo hóa VMware ESXi 6.7
  • Lớp phần mềm VMware Horizon 7.7 VDI

Dell EMC Engineering đã sử dụng khối lượng công việc Power Worker từ Đăng nhập VSI để thử nghiệm. Bạn có thể tìm thấy thông tin cơ bản về phân tích Đăng nhập VSI tại Kết quả phân tích VSI đăng nhập .

Máy chủ điện toán PowerEdge hỗ trợ GPU đã lưu trữ 96 máy ảo có cấu hình GRID vPC vGPU (T4-1B) có bộ nhớ 1 GB mỗi máy. Máy chủ được cấu hình với sáu thẻ NVIDIA Tesla T4, cấu hình tối đa có thể có cho NVIDIA Tesla T4 trong máy chủ Dell PowerEdge R740xd.

Khi tất cả các máy ảo được bật, máy chủ lưu trữ đã ghi lại mức sử dụng CPU trung bình ở trạng thái ổn định là khoảng 95% và mức sử dụng GPU trung bình ở trạng thái ổn định là khoảng 34%. Đăng nhập VSImax—không đạt được số phiên hoạt động ở điểm bão hòa của hệ thống—có nghĩa là hiệu suất của hệ thống rất tốt. Ngưỡng tiêu chuẩn 85% của chúng tôi đối với mức sử dụng CPU trung bình đã được nới lỏng trong thử nghiệm này để chứng minh hiệu suất khi tài nguyên đồ họa được sử dụng hết (96 cấu hình trên mỗi máy chủ). Bạn có thể có được trải nghiệm người dùng tốt hơn khi quản lý CPU ở ngưỡng 85 phần trăm bằng cách giảm mật độ người dùng hoặc bằng cách sử dụng CPU có dung lượng cao hơn. Tuy nhiên, nếu CPU của bạn là bộ xử lý Intel Xeon Scalable (Skylake) thế hệ trước thì khuyến nghị là chỉ sử dụng tối đa bốn thẻ NVIDIA Tesla cho mỗi máy chủ PowerEdge R740xd. Với sáu thẻ T4 trên mỗi máy chủ PowerEdge R740xd, GPU được kết nối với cả hai làn x8 và x16. Chúng tôi không tìm thấy vấn đề gì khi sử dụng cả làn x8 và x16 và như được chỉ ra trong kết quả kiểm tra Đăng nhập VSI, hiệu suất hệ thống rất tốt.

Dell EMC Engineering đã thực hiện các thử nghiệm tương tự với Khối lượng công việc đa phương tiện đăng nhập VSI bằng cách sử dụng 48 máy ảo hỗ trợ vGPU trên máy chủ điện toán hỗ trợ GPU, mỗi máy ảo có cấu hình Quadro vDWS-vGPU (T4-2Q) với bộ đệm khung 2 GB. Khi tất cả các máy ảo được bật, mức sử dụng CPU ở trạng thái ổn định trung bình là khoảng 48% và mức sử dụng GPU ở trạng thái ổn định trung bình là khoảng 35%. Hệ thống hoạt động tốt và trải nghiệm người dùng rất tốt.

Để biết thêm thông tin về cấu hình môi trường thử nghiệm và các số liệu sử dụng tài nguyên bổ sung, hãy xem hướng dẫn thiết kế và xác thực cho VMware Horizon trên VxRail và vSAN trên Trung tâm thông tin VDI của chúng tôi .

Bản tóm tắt

Cũng giống như Windows 10 và các ứng dụng hiện đại đang kết hợp nhiều đồ họa hơn để đáp ứng mong đợi của người dùng, môi trường ảo hóa phải bắt kịp nhu cầu cải thiện trải nghiệm người dùng. Các giải pháp sẵn sàng của Dell EMC cho VDI, kết hợp với NVIDIA Tesla T4 vGPU, là các giải pháp đã được thử nghiệm và xác nhận nhằm cung cấp trải nghiệm người dùng chất lượng cao mà lực lượng lao động ngày nay yêu cầu. Dell EMC Engineering đã sử dụng Khối lượng công việc Power Worker và Khối lượng công việc đa phương tiện đăng nhập của VSI để thử nghiệm các Giải pháp sẵn sàng cho VDI với Tesla T4 và nhận thấy kết quả rất tốt về cả hiệu suất hệ thống và trải nghiệm người dùng.