Thiết kế đã được xác thực của Dell Technologies cho SIMULIA Abaqus® FEA với Bộ xử lý Intel Xeon có khả năng mở rộng thế hệ thứ 3 (4)

Hiệu suất SIMULIA Abaqus

Abaqus là phần mềm Phân tích phần tử hữu hạn (FEA) đa vật lý được phát triển bởi thương hiệu SIMULIA của Dassault Systèmes. Nó thường được sử dụng trong các ngành nghiên cứu, phát triển và sản xuất, trong nhiều ngành kỹ thuật. Tùy thuộc vào các loại sự cố cụ thể, mã FEA có thể hoặc không thể mở rộng tốt trên nhiều lõi bộ xử lý và máy chủ. Các vấn đề FEA tiềm ẩn thường đặt ra yêu cầu lớn đối với các hệ thống con I/O bộ nhớ và đĩa. Abaqus chứa một số tùy chọn bộ giải, cả ngầm định và rõ ràng. Do đó, rất khó để tóm tắt tiềm năng hiệu suất tổng thể của Abaqus với một vài điểm chuẩn. Mỗi bản phân phối bản phát hành Abaqus bao gồm một tập hợp các điểm chuẩn, cho cả bộ giải ẩn (Sxx hoặc Abaqus/Standard) và bộ giải rõ ràng (Ví dụ cho Abqaus/Explicit). Các điểm chuẩn này rất hữu ích để chỉ ra tiềm năng hiệu suất tương đối cho các hệ thống khác nhau; xem chúng một cách định tính hơn là định lượng.

Hiệu suất máy chủ đơn

Hình dưới đây cho thấy hiệu suất đo được của các điểm chuẩn Abaqus/Standard đã chọn trên một máy chủ có phiên bản 2021hf6. Hiệu suất cho từng điểm chuẩn được đo bằng cách sử dụng thời gian đã trôi qua của bộ giải dựa trên đầu ra ở cuối tệp .msg .

Hình 3. Abaqus/ Hiệu suất tiêu chuẩn  

Các kết quả được biểu thị tương ứng với hiệu suất của một máy chủ được định cấu hình bằng bộ xử lý Intel Xeon Gold 6242. Giá trị lớn hơn cho thấy hiệu suất tổng thể tốt hơn. Ngoại trừ mô hình “S3D”, tất cả các mô hình khác đều chạy với “mp_mode=MPI” và “mp_host_split=8”. Điểm chuẩn “S3D” là một phân tích phương thức chỉ hoạt động ở chế độ “mp_mode=threads”.

Những kết quả này cho thấy lợi thế về hiệu suất khả dụng với Bộ xử lý có khả năng thay đổi Intel Xeon thế hệ thứ 3 (tên mã Ice Lake). Những kết quả này cũng cho thấy điểm chuẩn Abaqus/Standard có thể sử dụng bộ xử lý có số lượng lõi cao hơn, chẳng hạn như Intel Xeon Platinum 8358 32 lõi. Ngoại lệ đáng chú ý là kết quả cho trường hợp “S3D”, là phân tích phương thức. Bộ giải này chỉ song song dựa trên luồng và do đó, không thể khai thác số lượng lõi lớn hơn có sẵn trong các hệ thống dựa trên Ice Lake so với các hệ thống dựa trên Lake trước đó. Đối với những phân tích này, tần số xung nhịp của bộ xử lý lõi là rất quan trọng. Bộ xử lý dựa trên Ice Lake thường có thể so sánh với bộ xử lý Cascade Lake tiền nhiệm của chúng trong lĩnh vực này. Đối với các trường hợp điểm chuẩn S4E và S9,

Hình dưới đây cho thấy tác động của việc sửa đổi số lượng miền MPI cho điểm chuẩn Abaqus/Standard trên một máy chủ với bộ xử lý Intel Gold 6252 24 nhân kép thế hệ trước của Intel với Abaqus 2019:

Hình 4. Hiệu suất “mp_host_split”

Đối với tất cả các mô hình được thử nghiệm, hiệu suất tăng đáng kể đã được thực hiện bằng cách sử dụng nhiều miền trên mỗi nút. Việc sử dụng tám miền (sáu luồng trên mỗi miền) mang lại hiệu suất tối ưu. Chúng tôi khuyến khích bạn kiểm tra tùy chọn này với các mô hình của mình để xác định giá trị tối ưu. Một số chẵn được ưa thích hơn vì nó cho phép kích hoạt liên kết bộ xử lý MPI để cải thiện hơn nữa hiệu suất. Có thể tăng dung lượng bộ nhớ cần thiết để giảm thiểu I/O khi có nhiều hơn một miền được đặt trên một nút. Đảm bảo rằng bạn tránh các giải pháp “lỗi thời”, gây ra hoạt động I/O đáng kể tiềm ẩn và làm giảm hiệu suất tổng thể. Bạn có thể kiểm tra các yêu cầu bộ nhớ miền để giảm thiểu I/O trong tệp .dat để đảm bảo rằng sự cố này không xảy ra.

Hình dưới đây cho thấy hiệu suất đo được của nhiều điểm chuẩn Abaqus/Explicit khác nhau trên một máy chủ sử dụng phiên bản 2021hf6. Hiệu suất cho từng điểm chuẩn được đo bằng cách sử dụng thời gian đã trôi qua của bộ giải thu được từ đầu ra ở cuối tệp nhật ký.

Hình 5. Hiệu suất Abaqus/Explicit

Các kết quả được vẽ biểu đồ tương ứng với hiệu suất của một máy chủ được định cấu hình bằng bộ xử lý Intel Xeon Gold 6242 để chỉ rõ hơn các cải tiến hiệu suất thế hệ. Giá trị lớn hơn cho thấy hiệu suất tổng thể tốt hơn. Những kết quả này tương tự như điểm chuẩn tiêu chuẩn của một máy chủ được hiển thị trong Hình 3, cho thấy sự cải thiện đáng kể về hiệu suất của các máy chủ dựa trên Ice Lake so với các máy chủ dựa trên Cascade Lake thế hệ trước. Đối với tất cả các điểm chuẩn này, có một mối tương quan chặt chẽ giữa hiệu suất của bộ xử lý và số lượng lõi của bộ xử lý.

Khả năng mở rộng đa máy chủ

Hình dưới đây thể hiện khả năng mở rộng song song khi chạy Abaqus bằng cách sử dụng tối đa bốn nút được định cấu hình với bộ xử lý Intel Xeon Platinum 8358 cho các điểm chuẩn Abaqus/Standard và Abaqus/Explicit khác nhau với phiên bản 2021hf6 (được mô tả trong các phần trước). Giá trị lớn hơn cho thấy hiệu suất tổng thể tốt hơn. Hiệu suất được trình bày liên quan đến hiệu suất của một hệ thống dựa trên nút 8358.

Hình 6. Hiệu suất song song của nhiều máy chủ

Việc tăng tốc song song khi chạy các công việc trên nhiều hơn một nút được trộn lẫn. Các bộ dữ liệu này nhỏ theo tiêu chuẩn sản xuất hiện tại và không đại diện cho các mô phỏng quy mô sản xuất điển hình. Mặc dù tốc độ tăng tốc song song có xu hướng tương quan với kích thước mô hình, nhưng có một số yếu tố ảnh hưởng đến tốc độ tăng tốc song song. Hầu hết các mô hình được thử nghiệm đều cho thấy tốc độ tăng đáng kể từ một đến hai nút. Ngoại lệ đáng chú ý là trường hợp E10, hiển thị tốc độ siêu tuyến tính. Hành vi này được giải thích bằng “hiệu ứng bộ đệm”, trong đó tập dữ liệu được phân phối giữa một số lượng lớn hơn các nút. Có thể có một điểm mà toàn bộ vấn đề có thể phù hợp với bộ đệm và tốc độ của bộ giải có thể tăng lên đáng kể. Các hiệu ứng bộ đệm như vậy rất cụ thể về vấn đề. Nói chung, có một sự đánh đổi trong tính song song của bộ nhớ phân tán trong đó hiệu suất bộ đệm thường cải thiện khi sự cố được phân phối cho nhiều nút hơn. Tuy nhiên, chi phí liên lạc cũng tăng lên, cản trở hiệu suất tăng lên từ lợi ích của bộ nhớ đệm. Chúng tôi khuyến khích bạn thực hiện một số thử nghiệm với các mô hình mới để xác định số lượng nút tối ưu để có thông lượng công việc tốt nhất với các tài nguyên có sẵn.

Phần kết luận

Sách trắng kỹ thuật này trình bày Thiết kế được Dell Technologies xác thực cho SIMULIA Abaqus FEA với Bộ xử lý Intel Xeon có khả năng mở rộng thế hệ thứ 3 . Phân tích chi tiết về cấu hình máy chủ chứng minh rằng hệ thống được kiến ​​trúc cho một mục đích cụ thể—để cung cấp giải pháp HPC toàn diện cho phần mềm CAE. Việc sử dụng phương pháp khối xây dựng cho phép khách hàng dễ dàng triển khai hệ thống HPC được tối ưu hóa cho các yêu cầu khối lượng công việc cụ thể. Thiết kế giải quyết các yêu cầu về tính toán, lưu trữ, kết nối mạng và phần mềm. Nó cung cấp một giải pháp dễ cài đặt, định cấu hình và quản lý, với các dịch vụ và hỗ trợ cài đặt sẵn có. Điểm chuẩn hiệu suất xác nhận thiết kế giải pháp, thể hiện hiệu suất của giải pháp với phần mềm SIMULIA.