Đánh giá hiệu suất phần mềm
-
Trường hợp thử nghiệm 1: Tác động của NVLink
Các quy trình dòng mầm của Clara Parabricks 3.7.0-1 và 3.6.1-1 được thử nghiệm bằng cách sử dụng PowerEdge XE8545 với bốn GPU A100 (phiên bản SMX4, NVLink). Kết quả với hai GPU A100 được so sánh từ phiên bản 3.6.1-1 với PowerEdge R7525 để so sánh công bằng. Sự khác biệt chính giữa hai cấu hình máy chủ là số lượng GPU và NVLink như trongbàn số 3.hinh 4hiển thị sự khác biệt về thời gian chạy với hai A100 giữa hai máy chủ khác nhau có và không có hỗ trợ NVLink. Việc giảm thời gian chạy giữa hai máy chủ với Clara Parabricks phiên bản 3.6.1-1 là:
- 16% cho dữ liệu WGS 10x
- 32% cho dữ liệu 30x WGS
- 13% cho dữ liệu 50x WGS
Không có sự gia tăng hiệu suất đáng chú ý nào từ phiên bản 3.6.1-1 lên phiên bản 3.7.0-1 trên cùng một hệ thống. Nhóm Clara Parabricks đã xác nhận rằng phiên bản 3.7.0-1 tập trung vào việc bổ sung chức năng mới và không tập trung vào các khả năng tăng tốc bổ sung.
Trường hợp thử nghiệm 2: Cải thiện hiệu suất liên tục thông qua phát triển phần mềm
NVIDIA tiếp tục giới thiệu những cải tiến phần mềm cho Clara Parabricks. Phiên bản mới nhất, 3.7.0-1, tập trung vào việc bổ sung nhiều công cụ hơn là cải thiện hiệu suất như trongHình 5. Dell Technologies đã quan sát thấy sự cải thiện hiệu suất liên tục từ phiên bản cũ hơn sang phiên bản mới hơn.
Phiên bản 3.6.1 bao gồm năm trình gọi soma để phân tích bộ gen ung thư tăng tốc toàn diện: MuSE, LoFreq, Strelka2, Mutect2 và SomaticSnipter. Ngoài ra, các công cụ đã được thêm vào để tận dụng dữ liệu lưu trữ trong các tình huống khi các tệp FASTQ gốc bị xóa để tiết kiệm dung lượng lưu trữ. BAM2FASTQ là phiên bản tăng tốc của GATK Sam2fastq, giúp chuyển đổi tệp BAM hoặc CRAM hiện có thành tệp FASTQ trong phiên bản 3.7.0.
Trường hợp thử nghiệm 3: Khả năng mở rộng dữ liệu và GPU
Số lượng GPU tối thiểu cần thiết cho Clara Parabricks là hai. Như được hiển thị trong Hình 6, thời gian chạy mở rộng tốt cho hai và bốn GPU với các kích cỡ dữ liệu WGS khác nhau. Các kết quả thử nghiệm trước đây với GPU NVIDIA T4 cho thấy khả năng mở rộng tuyến tính lên tới 12 GPU với dữ liệu WGS 50x.
Tóm lược
-
Cả Dell PowerEdge XE8545 và PowerEdge R7525 đều có thể xử lý hơn 20 50x WGS mỗi ngày bằng cách sử dụng NVIDIA Clara Parabricks. Thông lượng phân tích hàng ngày tương tự bằng cách sử dụng kiến trúc CPU x86 truyền thống yêu cầu tám nút điện toán PowerEdge C6420. Kiến trúc hoàn chỉnh dự kiến sẽ sớm được xuất bản.
Ngoài tốc độ, khả năng tương thích với các công cụ phân tích khác là điều cần thiết để so sánh kết quả. Các kết quả phân tích dòng mầm Clara Parabricks gần giống với phân tích BWA-Mem GATK HaplotypeCaller nổi tiếng từ thử nghiệm trước đó. Dell Technologies cũng muốn so sánh kết quả gọi biến thể Clara Parabricks với các bộ công cụ khác như samtools-mpileup. Hai công cụ khác nhau này đạt được ~90% thỏa thuận chung cho các biến thể đã xác định. Các biến thể ở nhiều vùng gen nổi tiếng có chứa các gen quan trọng phù hợp hơn 99%.
Bài viết mới cập nhật
Dell PowerScale và Marvel hợp tác để tạo ra quy trình làm việc truyền thông tối ưu
Hiện đang ở thế hệ thứ 9, giải pháp lưu trữ Dell ...
Bảo mật PowerScale OneFS SyncIQ
Trong thế giới sao chép dữ liệu, việc đảm bảo tính ...
Danh sách kiểm tra cơ sở bảo mật PowerScale
Là một biện pháp bảo mật tốt nhất, chúng tôi khuyến ...
Bảo vệ dữ liệu của bạn trong tương lai: Airgap Bộ dữ liệu về tính liên tục của doanh nghiệp của bạn
Trong thời đại kỹ thuật số ngày nay, mối đe dọa ...