Dell Technologies đã xác thực thiết kế cho bộ gen với NVIDIA Clara Parabricks trên Dell PowerEdge do AMD cung cấp (4)

Đánh giá hiệu suất phần mềm

  • Trường hợp thử nghiệm 1: Tác động của NVLink

    Các quy trình dòng mầm của Clara Parabricks 3.7.0-1 và 3.6.1-1 được thử nghiệm bằng cách sử dụng PowerEdge XE8545 với bốn GPU A100 (phiên bản SMX4, NVLink). Kết quả với hai GPU A100 được so sánh từ phiên bản 3.6.1-1 với PowerEdge R7525 để so sánh công bằng. Sự khác biệt chính giữa hai cấu hình máy chủ là số lượng GPU và NVLink như trongbàn số 3.hinh 4hiển thị sự khác biệt về thời gian chạy với hai A100 giữa hai máy chủ khác nhau có và không có hỗ trợ NVLink. Việc giảm thời gian chạy giữa hai máy chủ với Clara Parabricks phiên bản 3.6.1-1 là:

    • 16% cho dữ liệu WGS 10x
    • 32% cho dữ liệu 30x WGS
    • 13% cho dữ liệu 50x WGS

    Không có sự gia tăng hiệu suất đáng chú ý nào từ phiên bản 3.6.1-1 lên phiên bản 3.7.0-1 trên cùng một hệ thống. Nhóm Clara Parabricks đã xác nhận rằng phiên bản 3.7.0-1 tập trung vào việc bổ sung chức năng mới và không tập trung vào các khả năng tăng tốc bổ sung.

    Biểu đồ, biểu đồ thác nướcMô tả được tạo tự động

    Hình 4. Hiệu suất của đường dẫn dòng mầm Parabricks với hai GPU A100

    Trường hợp thử nghiệm 2: Cải thiện hiệu suất liên tục thông qua phát triển phần mềm

    NVIDIA tiếp tục giới thiệu những cải tiến phần mềm cho Clara Parabricks. Phiên bản mới nhất, 3.7.0-1, tập trung vào việc bổ sung nhiều công cụ hơn là cải thiện hiệu suất như trongHình 5. Dell Technologies đã quan sát thấy sự cải thiện hiệu suất liên tục từ phiên bản cũ hơn sang phiên bản mới hơn.

    Phiên bản 3.6.1 bao gồm năm trình gọi soma để phân tích bộ gen ung thư tăng tốc toàn diện: MuSE, LoFreq, Strelka2, Mutect2 và SomaticSnipter. Ngoài ra, các công cụ đã được thêm vào để tận dụng dữ liệu lưu trữ trong các tình huống khi các tệp FASTQ gốc bị xóa để tiết kiệm dung lượng lưu trữ. BAM2FASTQ là phiên bản tăng tốc của GATK Sam2fastq, giúp chuyển đổi tệp BAM hoặc CRAM hiện có thành tệp FASTQ trong phiên bản 3.7.0.

    Biểu đồ, biểu đồ thanh, biểu đồ thác nước Mô tả được tạo tự động

    Hình 5. Hiệu suất của đường dẫn dòng mầm Parabricks với bốn GPU A100

    Trường hợp thử nghiệm 3: Khả năng mở rộng dữ liệu và GPU

    Số lượng GPU tối thiểu cần thiết cho Clara Parabricks là hai. Như được hiển thị trong Hình 6, thời gian chạy mở rộng tốt cho hai và bốn GPU với các kích cỡ dữ liệu WGS khác nhau. Các kết quả thử nghiệm trước đây với GPU NVIDIA T4 cho thấy khả năng mở rộng tuyến tính lên tới 12 GPU với dữ liệu WGS 50x.

    Biểu đồ, biểu đồ thanh, biểu đồ thác nước Mô tả được tạo tự động

    Hình 6. Khả năng mở rộng của GPU A100

     

Tóm lược

  • Cả Dell PowerEdge XE8545 và PowerEdge R7525 đều có thể xử lý hơn 20 50x WGS mỗi ngày bằng cách sử dụng NVIDIA Clara Parabricks. Thông lượng phân tích hàng ngày tương tự bằng cách sử dụng kiến ​​trúc CPU x86 truyền thống yêu cầu tám nút điện toán PowerEdge C6420. Kiến trúc hoàn chỉnh dự kiến ​​sẽ sớm được xuất bản.

    Ngoài tốc độ, khả năng tương thích với các công cụ phân tích khác là điều cần thiết để so sánh kết quả. Các kết quả phân tích dòng mầm Clara Parabricks gần giống với phân tích BWA-Mem GATK HaplotypeCaller nổi tiếng từ thử nghiệm trước đó. Dell Technologies cũng muốn so sánh kết quả gọi biến thể Clara Parabricks với các bộ công cụ khác như samtools-mpileup. Hai công cụ khác nhau này đạt được ~90% thỏa thuận chung cho các biến thể đã xác định. Các biến thể ở nhiều vùng gen nổi tiếng có chứa các gen quan trọng phù hợp hơn 99%.