Công nghệ Dell: Hiệu suất OpenFOAM® với Bộ xử lý sê-ri AMD EPYC™ 7002

Giới thiệu

Blog này thảo luận về hiệu suất của OpenFOAM®, một ứng dụng Computational Fluid Dynamics (CFD) phổ biến trên Giải pháp Sẵn sàng của Dell EMC dành cho Sản xuất Kỹ thuật số HPC với bộ xử lý sê-ri AMD EPYC™ 7002. Giải pháp Sẵn sàng cho EMC của Dell dành cho HPC này được thiết kế và định cấu hình dành riêng cho khối lượng công việc Sản xuất Kỹ thuật số, trong đó các ứng dụng Kỹ thuật Hỗ trợ Máy tính (CAE) rất quan trọng để phát triển sản phẩm ảo. Các Giải pháp Sẵn sàng của Dell EMC dành cho Sản xuất Kỹ thuật số HPC sử dụng phương pháp tiếp cận khối xây dựng linh hoạt để thiết kế hệ thống HPC, trong đó các khối xây dựng riêng lẻ có thể được kết hợp để xây dựng các hệ thống HPC được tối ưu hóa cho các trường hợp sử dụng và khối lượng công việc cụ thể của khách hàng.

Các Giải pháp Sẵn sàng của Dell EMC dành cho Sản xuất Kỹ thuật số HPC là một trong nhiều giải pháp trong danh mục giải pháp HPC của Dell EMC. Vui lòng truy cập www.dellemc.com/hpc để biết tổng quan toàn diện về các giải pháp HPC do Dell EMC cung cấp.


Cấu hình hệ thống điểm chuẩn

Điểm chuẩn hiệu suất được thực hiện bằng cả bộ xử lý AMD EPYC sê-ri 7001 và 7002. Các cấu hình hệ thống được sử dụng để đo điểm chuẩn hiệu suất được trình bày trong Bảng 1 và Bảng 2. Tất cả các máy chủ đều được trang bị hai bộ xử lý. Cấu hình BIOS được sử dụng cho các hệ thống đo điểm chuẩn được trình bày trong Bảng 3.

Bảng 1: Cấu hình hệ thống AMD EPYC sê-ri 7001
Người phục vụ Dell EMC PowerEdge R7425
bộ vi xử lý Bộ xử lý 24 nhân AMD EPYC 7451 (x2)

Bộ xử lý 32 nhân AMD EPYC 7601 (x2)

Kỉ niệm RDIMM 16x16GB 2400 MTps
Phiên bản sinh học 1.10.6
Hệ điều hành     Red Hat Enterprise Linux Server phát hành 7.5
Phiên bản hạt nhân 3.10.0-862.el7.x86_64
Bảng 2: Cấu hình hệ thống AMD EPYC dòng 7002
Người phục vụ Dell EMC PowerEdge C6525
bộ vi xử lý Bộ xử lý 64 nhân AMD EPYC 7702 (x2)

Bộ xử lý 32 nhân AMD EPYC 7502 (x2)

Bộ xử lý 24 nhân AMD EPYC 7402 (x2)

Kỉ niệm RDIMM 16x16GB 3200 MTps
Phiên bản sinh học 1.0.1
Hệ điều hành Red Hat Enterprise Linux Server phát hành 7.6
Phiên bản hạt nhân 3.10.0-957.27.2.el7.x86_64

 

Bảng 3: Cấu hình BIOS
Hồ sơ hệ thống Hiệu suất được tối ưu hóa
Bộ xử lý logic Vô hiệu hóa
Công nghệ ảo hóa Vô hiệu hóa
NUMA nút trên mỗi ổ cắm 4 (C6525)

Phiên bản phần mềm

Các phiên bản phần mềm ứng dụng được mô tả trong Bảng 4.

Bảng 4: Phiên bản phần mềm
OpenFOAM     Phiên bản 7 với OpenMPI 3.1.4

 


Hiệu suất OpenFOAM

OpenFOAM là một hộp công cụ C++ được sử dụng chủ yếu cho phân tích Tính toán Động lực học Chất lưu (CFD). Đối với bài báo này, chúng tôi đã sử dụng phiên bản 7 từ OpenFOAM Foundation ( www.openfoam.org ). Chúng tôi đã xây dựng OpenFOAM bằng trình biên dịch GCC phiên bản 4.8.5 với các tùy chọn biên dịch mặc định được cung cấp cùng với phiên bản 7. Ngoài ra, chúng tôi đã xây dựng và sử dụng OpenMPI phiên bản 3.1.4. Đối với các điểm chuẩn này, chúng tôi đã xây dựng cả hai phiên bản độ chính xác đơn (SP) và độ chính xác kép (DP).

Chúng tôi đã chạy điểm chuẩn bằng cách sử dụng bộ dữ liệu được cung cấp cùng với phân phối mã trong thư mục con ‘hướng dẫn’. Các trường hợp điểm chuẩn này được mô tả trong Bảng 5.

Bảng 5: Các trường hợp chuẩn
Trường hợp Vị trí tập tin Kích thước mắt lưới thời gian giải quyết
lốc xoáy $FOAM_TUTORIALS/lagrange/MPPICBọt/lốc xoáy 5M 0,01
chân vịt $FOAM_TUTORIALS/multiphase/interPhaseChangeFoam/cánh quạt 6M 0,001
đập $FOAM_TUTORIALS/multiphase/multiphaseEulerFoam/damBreak4phaseFine     15M 0,1
xe máy $FOAM_TUTORIALS/không nén được/đơn giảnFoam/xe máy 34M 2500
nêm $FOAM_TUTORIALS/discreteMethods/dsmcFoam/wedge15Ma5 50M 0,003
góc $FOAM_TUTORIALS/discreteMethods/dsmcFoam/supersonicCorner 80M 0,001

Hình 1 cho thấy hiệu suất đo được cho OpenFOAM có độ chính xác kép trên các hệ thống máy chủ đơn lẻ được mô tả trong Bảng 1 và 2 với các trường hợp điểm chuẩn được mô tả trong Bảng 5.
SLN319369_vi_US__1hình ảnh(12843)
Hình 1: Hiệu suất máy chủ đơn OpenFOAM 7 DP

Đối với các điểm chuẩn này, hiệu suất được đo theo thời gian đồng hồ treo tường cần thiết cho phần bộ giải chính trong mô phỏng (cao hơn thì tốt hơn). Các kết quả trong được vẽ tương ứng với hiệu suất của máy chủ dựa trên AMD 7451. 

Những kết quả này cho thấy lợi thế về hiệu suất khả dụng với bộ xử lý AMD EPYC dòng 7002 là đáng chú ý nhưng thay đổi tùy theo điểm chuẩn riêng lẻ. Nói chung, lợi ích tổng thể của các hệ thống dựa trên Rome giảm đi khi kích thước của trường hợp chuẩn tăng lên, đặc biệt là đối với lợi thế về hiệu suất của hệ thống dựa trên hai bộ xử lý AMD Rome 64 nhân 7702. Điều này có thể là do khả năng của máy chủ phù hợp hiệu quả hơn với dữ liệu của các điểm chuẩn nhỏ hơn trong bộ đệm của bộ xử lý làm giảm sự phụ thuộc của bộ nhớ chính để truy cập dữ liệu. “Hiệu ứng bộ đệm” này ưu tiên mang lại lợi ích cho các bộ xử lý có nhiều lõi hơn, chẳng hạn như bộ xử lý 64 lõi 7702. Ngoài ra, hiệu ứng bộ đệm này thường dễ nhận thấy hơn do sự cố được trải rộng trên nhiều nút để mô phỏng.

Hình 2 tương tự như Hình 1 nhưng hiển thị hiệu suất với phiên bản OpenFOAM độ chính xác đơn.

SLN319369_en_US__3hình ảnh(12844)
Hình 2: Hiệu suất máy chủ đơn OpenFoam 7 SP

Điểm chuẩn ‘nêm’ và ‘góc’ không tương thích với phiên bản có độ chính xác đơn. Điểm chuẩn chính xác đơn cho thấy lợi ích hiệu suất lớn hơn đáng kể đối với bộ xử lý Rome so với Napoli so với điểm chuẩn chính xác kép. Những kết quả này tương tự như những gì chúng ta đã thấy từ các ứng dụng CFD khác. Các máy chủ 24 lõi và 32 lõi dựa trên Rome đã thể hiện những cải tiến đáng chú ý so với các đối tác ở Napoli và bộ xử lý 7702 Rome dựa trên 64 lõi mang lại hiệu suất hệ thống tuyệt vời.


Phần kết luận

Các kết quả được trình bày trong blog này cho thấy rằng các bộ xử lý AMD EPYC sê-ri 7002 mang lại sự cải thiện hiệu suất đáng kể cho OpenFOAM so với các bộ xử lý AMD EPYC sê-ri 7001.