Giới thiệu
Blog này thảo luận về hiệu suất của OpenFOAM®, một ứng dụng Computational Fluid Dynamics (CFD) phổ biến trên Giải pháp Sẵn sàng của Dell EMC dành cho Sản xuất Kỹ thuật số HPC với bộ xử lý sê-ri AMD EPYC™ 7002. Giải pháp Sẵn sàng cho EMC của Dell dành cho HPC này được thiết kế và định cấu hình dành riêng cho khối lượng công việc Sản xuất Kỹ thuật số, trong đó các ứng dụng Kỹ thuật Hỗ trợ Máy tính (CAE) rất quan trọng để phát triển sản phẩm ảo. Các Giải pháp Sẵn sàng của Dell EMC dành cho Sản xuất Kỹ thuật số HPC sử dụng phương pháp tiếp cận khối xây dựng linh hoạt để thiết kế hệ thống HPC, trong đó các khối xây dựng riêng lẻ có thể được kết hợp để xây dựng các hệ thống HPC được tối ưu hóa cho các trường hợp sử dụng và khối lượng công việc cụ thể của khách hàng.
Các Giải pháp Sẵn sàng của Dell EMC dành cho Sản xuất Kỹ thuật số HPC là một trong nhiều giải pháp trong danh mục giải pháp HPC của Dell EMC. Vui lòng truy cập www.dellemc.com/hpc để biết tổng quan toàn diện về các giải pháp HPC do Dell EMC cung cấp.
Cấu hình hệ thống điểm chuẩn
Điểm chuẩn hiệu suất được thực hiện bằng cả bộ xử lý AMD EPYC sê-ri 7001 và 7002. Các cấu hình hệ thống được sử dụng để đo điểm chuẩn hiệu suất được trình bày trong Bảng 1 và Bảng 2. Tất cả các máy chủ đều được trang bị hai bộ xử lý. Cấu hình BIOS được sử dụng cho các hệ thống đo điểm chuẩn được trình bày trong Bảng 3.
Bảng 1: Cấu hình hệ thống AMD EPYC sê-ri 7001 | |
---|---|
Người phục vụ | Dell EMC PowerEdge R7425 |
bộ vi xử lý | Bộ xử lý 24 nhân AMD EPYC 7451 (x2)
Bộ xử lý 32 nhân AMD EPYC 7601 (x2) |
Kỉ niệm | RDIMM 16x16GB 2400 MTps |
Phiên bản sinh học | 1.10.6 |
Hệ điều hành | Red Hat Enterprise Linux Server phát hành 7.5 |
Phiên bản hạt nhân | 3.10.0-862.el7.x86_64 |
Bảng 2: Cấu hình hệ thống AMD EPYC dòng 7002 | |
---|---|
Người phục vụ | Dell EMC PowerEdge C6525 |
bộ vi xử lý | Bộ xử lý 64 nhân AMD EPYC 7702 (x2)
Bộ xử lý 32 nhân AMD EPYC 7502 (x2) Bộ xử lý 24 nhân AMD EPYC 7402 (x2) |
Kỉ niệm | RDIMM 16x16GB 3200 MTps |
Phiên bản sinh học | 1.0.1 |
Hệ điều hành | Red Hat Enterprise Linux Server phát hành 7.6 |
Phiên bản hạt nhân | 3.10.0-957.27.2.el7.x86_64 |
Bảng 3: Cấu hình BIOS | |
---|---|
Hồ sơ hệ thống | Hiệu suất được tối ưu hóa |
Bộ xử lý logic | Vô hiệu hóa |
Công nghệ ảo hóa | Vô hiệu hóa |
NUMA nút trên mỗi ổ cắm | 4 (C6525) |
Phiên bản phần mềm
Các phiên bản phần mềm ứng dụng được mô tả trong Bảng 4.
Bảng 4: Phiên bản phần mềm | |
---|---|
OpenFOAM | Phiên bản 7 với OpenMPI 3.1.4 |
Hiệu suất OpenFOAM
OpenFOAM là một hộp công cụ C++ được sử dụng chủ yếu cho phân tích Tính toán Động lực học Chất lưu (CFD). Đối với bài báo này, chúng tôi đã sử dụng phiên bản 7 từ OpenFOAM Foundation ( www.openfoam.org ). Chúng tôi đã xây dựng OpenFOAM bằng trình biên dịch GCC phiên bản 4.8.5 với các tùy chọn biên dịch mặc định được cung cấp cùng với phiên bản 7. Ngoài ra, chúng tôi đã xây dựng và sử dụng OpenMPI phiên bản 3.1.4. Đối với các điểm chuẩn này, chúng tôi đã xây dựng cả hai phiên bản độ chính xác đơn (SP) và độ chính xác kép (DP).
Chúng tôi đã chạy điểm chuẩn bằng cách sử dụng bộ dữ liệu được cung cấp cùng với phân phối mã trong thư mục con ‘hướng dẫn’. Các trường hợp điểm chuẩn này được mô tả trong Bảng 5.
Bảng 5: Các trường hợp chuẩn | |||
---|---|---|---|
Trường hợp | Vị trí tập tin | Kích thước mắt lưới | thời gian giải quyết |
lốc xoáy | $FOAM_TUTORIALS/lagrange/MPPICBọt/lốc xoáy | 5M | 0,01 |
chân vịt | $FOAM_TUTORIALS/multiphase/interPhaseChangeFoam/cánh quạt | 6M | 0,001 |
đập | $FOAM_TUTORIALS/multiphase/multiphaseEulerFoam/damBreak4phaseFine | 15M | 0,1 |
xe máy | $FOAM_TUTORIALS/không nén được/đơn giảnFoam/xe máy | 34M | 2500 |
nêm | $FOAM_TUTORIALS/discreteMethods/dsmcFoam/wedge15Ma5 | 50M | 0,003 |
góc | $FOAM_TUTORIALS/discreteMethods/dsmcFoam/supersonicCorner | 80M | 0,001 |
Hình 1 cho thấy hiệu suất đo được cho OpenFOAM có độ chính xác kép trên các hệ thống máy chủ đơn lẻ được mô tả trong Bảng 1 và 2 với các trường hợp điểm chuẩn được mô tả trong Bảng 5.
Hình 1: Hiệu suất máy chủ đơn OpenFOAM 7 DP
Đối với các điểm chuẩn này, hiệu suất được đo theo thời gian đồng hồ treo tường cần thiết cho phần bộ giải chính trong mô phỏng (cao hơn thì tốt hơn). Các kết quả trong được vẽ tương ứng với hiệu suất của máy chủ dựa trên AMD 7451.
Những kết quả này cho thấy lợi thế về hiệu suất khả dụng với bộ xử lý AMD EPYC dòng 7002 là đáng chú ý nhưng thay đổi tùy theo điểm chuẩn riêng lẻ. Nói chung, lợi ích tổng thể của các hệ thống dựa trên Rome giảm đi khi kích thước của trường hợp chuẩn tăng lên, đặc biệt là đối với lợi thế về hiệu suất của hệ thống dựa trên hai bộ xử lý AMD Rome 64 nhân 7702. Điều này có thể là do khả năng của máy chủ phù hợp hiệu quả hơn với dữ liệu của các điểm chuẩn nhỏ hơn trong bộ đệm của bộ xử lý làm giảm sự phụ thuộc của bộ nhớ chính để truy cập dữ liệu. “Hiệu ứng bộ đệm” này ưu tiên mang lại lợi ích cho các bộ xử lý có nhiều lõi hơn, chẳng hạn như bộ xử lý 64 lõi 7702. Ngoài ra, hiệu ứng bộ đệm này thường dễ nhận thấy hơn do sự cố được trải rộng trên nhiều nút để mô phỏng.
Hình 2 tương tự như Hình 1 nhưng hiển thị hiệu suất với phiên bản OpenFOAM độ chính xác đơn.
Hình 2: Hiệu suất máy chủ đơn OpenFoam 7 SP
Điểm chuẩn ‘nêm’ và ‘góc’ không tương thích với phiên bản có độ chính xác đơn. Điểm chuẩn chính xác đơn cho thấy lợi ích hiệu suất lớn hơn đáng kể đối với bộ xử lý Rome so với Napoli so với điểm chuẩn chính xác kép. Những kết quả này tương tự như những gì chúng ta đã thấy từ các ứng dụng CFD khác. Các máy chủ 24 lõi và 32 lõi dựa trên Rome đã thể hiện những cải tiến đáng chú ý so với các đối tác ở Napoli và bộ xử lý 7702 Rome dựa trên 64 lõi mang lại hiệu suất hệ thống tuyệt vời.
Phần kết luận
Các kết quả được trình bày trong blog này cho thấy rằng các bộ xử lý AMD EPYC sê-ri 7002 mang lại sự cải thiện hiệu suất đáng kể cho OpenFOAM so với các bộ xử lý AMD EPYC sê-ri 7001.
Bài viết mới cập nhật
Tăng tốc đổi mới và tính bền vững của AI: Dell PowerScale F910 mật độ cao, hiệu suất cao
Tăng tốc đổi mới và tính bền vững của AI: Dell ...
Khả năng hiển thị là điều bắt buộc tuyệt đối đối với an ninh
Tìm hiểu cách Dell và Absolute sử dụng dữ liệu từ ...
Dell Reconnect kỷ niệm 20 năm tái chế
Hãy kỷ niệm 20 năm Dell Reconnect và tái chế các ...
Nhật ký của một Kỹ sư Hệ thống VFX—Phần 1: Thống kê isi
Chào mừng bạn đến với bài đăng đầu tiên trong loạt ...