Tổng quan
Dell Technologies đã gửi kết quả cho bộ đo điểm chuẩn MLPerf Training cho vòng thứ năm. Blog này cung cấp tổng quan về các bản đệ trình của chúng tôi cho phiên bản mới nhất, v1.1. Kết quả gửi cho thấy rằng các máy chủ Dell EMC khác nhau (máy chủ Dell EMC DSS8440, PowerEdge R750xa và PowerEdge XE8545) mang lại hiệu suất đầy hứa hẹn cho khối lượng công việc học sâu. Các khối lượng công việc này thuộc nhiều loại vấn đề khác nhau như phân loại hình ảnh, phân đoạn hình ảnh y tế, phát hiện đối tượng nhẹ, phát hiện đối tượng nặng, nhận dạng giọng nói, xử lý ngôn ngữ tự nhiên, đề xuất và học tăng cường.
Blog trước về MLPerf v1.0 có phần giới thiệu về MLCommons™ và các điểm chuẩn trong bộ đo điểm chuẩn đào tạo MLPerf. Chúng tôi khuyên bạn nên đọc blog này để biết tổng quan về điểm chuẩn. Tất cả các điểm chuẩn và quy tắc vẫn giống như đối với v1.0.
Biểu đồ sau với trục y được chia tỷ lệ theo cấp số nhân cho biết thời gian hội tụ của các máy chủ và điểm chuẩn được đề cập:
Hình 1: Tất cả các kết quả đệ trình của Dell Technologies cho MLPerf Training v1.1
Hình 1 cho thấy vòng đệ trình này của Dell Technologies bao gồm nhiều kết quả. Chúng tôi cung cấp 51 kết quả. Những kết quả này bao gồm các máy chủ Dell Technologies khác nhau bao gồm máy chủ Dell EMC DSS8440, PowerEdge R750xa và PowerEdge XE8545 với các cấu hình bộ tăng tốc NVIDIA A100 khác nhau với các hệ số dạng khác nhau: PCIe, SXM4 và các biến thể VRAM khác nhau bao gồm các phiên bản 40 GB và 80 GB. Các biến thể này cũng bao gồm các biến thể TDP 300 W, 400 W và 500 W.
Lưu ý : Để biết thông số kỹ thuật phần cứng và phần mềm của các hệ thống trong biểu đồ, hãy xem https://github.com/mlcommons/training_results_v1.1/tree/master/Dell/systems .
Các điểm chuẩn khác nhau đã được gửi trải rộng trên các lĩnh vực phân loại hình ảnh, phân đoạn hình ảnh y tế, phát hiện đối tượng nhẹ, phát hiện đối tượng nặng, nhận dạng giọng nói, xử lý ngôn ngữ tự nhiên, đề xuất và học tăng cường. Trong tất cả các lĩnh vực này, hiệu suất của máy chủ Dell EMC DSS8440, PowerEdge R750xa và PowerEdge XE8545 đều vượt trội.
Điểm nổi bật
bảo hiểm đầy đủ
Dell Technologies không chỉ gửi nhiều kết quả nhất mà còn cả các kết quả toàn diện từ một hệ thống duy nhất. Kết quả máy chủ PowerEdge XE8545 x 4 A100-SXM-80GB bao gồm các lần gửi trên toàn bộ các mô hình được đo điểm chuẩn trong bộ đào tạo MLPerf v1.1 như BERT, DLRM, MaskR-CNN, Minigo, ResNet, SSD, RNNT và 3D U- Mạng lưới.
Kết quả đa điểm
Tỷ lệ hiệu suất của các kết quả đa nút gần như tuyến tính hoặc tuyến tính và kết quả có tỷ lệ tốt. Việc mở rộng quy mô này làm cho hiệu suất của máy chủ Dell EMC trong môi trường đa nút thuận lợi hơn với thời gian định giá nhanh hơn. Hơn nữa, trong số những người gửi khác bao gồm các lần gửi dựa trên trình tăng tốc NVIDIA, chúng tôi là một trong ba người gửi bao gồm các kết quả đa nút.
Cải tiến từ v1.0 lên v1.1
Các bản cập nhật cho bản đệ trình Dell Technologies v1.1 bao gồm:
- Việc gửi v1.1 bao gồm các kết quả từ máy chủ PowerEdge R750xa. Máy chủ PowerEdge R750xa mang lại hiệu suất hấp dẫn, rất phù hợp cho khối lượng công việc suy luận và đào tạo trí tuệ nhân tạo, học máy cũng như học sâu.
- Kết quả của chúng tôi bao gồm các con số cho 10 GPU với các biến thể A100 80 GB trên máy chủ Dell EMC DSS8440. Kết quả cho 10 GPU rất hữu ích vì nhiều GPU hơn trong máy chủ giúp đào tạo mô hình nhanh hơn, nếu bị hạn chế trong một môi trường nút duy nhất để đào tạo.
Hình 2: So sánh hiệu suất của BERT giữa v1.0 và v1.1 giữa các máy chủ Dell EMC DSS8440 và PowerEdge XE8545
Chúng tôi nhận thấy sự cải thiện hiệu suất của v1.1 so với v1.0 với mô hình BERT, đặc biệt là với máy chủ PowerEdge XE8545. Mặc dù nhiều khối lượng công việc học sâu có hiệu suất tương tự nhau giữa phiên bản 1.0 và v1.1, nhiều kết quả mà chúng tôi đã gửi giúp khách hàng hiểu được sự khác biệt về hiệu suất giữa các phiên bản.
Sự kết luận
- Số lượng bài nộp của chúng tôi rất đáng kể (51 bài nộp). Chúng giúp khách hàng quan sát hiệu suất với các máy chủ Dell EMC khác nhau trên các cấu hình khác nhau. Số lượng kết quả cao hơn giúp khách hàng hiểu hiệu suất máy chủ, cho phép thời gian giải quyết nhanh hơn trên các loại cấu hình, điểm chuẩn và cài đặt đa nút khác nhau.
- Trong số các lần gửi khác bao gồm các lần gửi dựa trên trình tăng tốc NVIDIA, chúng tôi là một trong ba bên gửi bao gồm các kết quả đa nút. Điều bắt buộc là phải hiểu hiệu suất mở rộng trên nhiều máy chủ vì nhu cầu điện toán học sâu tiếp tục tăng với các loại mô hình học sâu và kỹ thuật xử lý song song khác nhau.
- Kết quả máy chủ PowerEdge XE8545 x 4A100-SXM-80GB bao gồm tất cả các kiểu máy trong điểm chuẩn MLPerf v1.1.
- Kết quả máy chủ PowerEdge R750xa đã được công bố cho vòng này; họ cung cấp hiệu suất tuyệt vời.
Bài viết mới cập nhật
Tăng tốc đổi mới và tính bền vững của AI: Dell PowerScale F910 mật độ cao, hiệu suất cao
Tăng tốc đổi mới và tính bền vững của AI: Dell ...
Khả năng hiển thị là điều bắt buộc tuyệt đối đối với an ninh
Tìm hiểu cách Dell và Absolute sử dụng dữ liệu từ ...
Dell Reconnect kỷ niệm 20 năm tái chế
Hãy kỷ niệm 20 năm Dell Reconnect và tái chế các ...
Nhật ký của một Kỹ sư Hệ thống VFX—Phần 1: Thống kê isi
Chào mừng bạn đến với bài đăng đầu tiên trong loạt ...