Thiết kế được xác thực của Dell cho lĩnh vực chăm sóc sức khỏe và khoa học đời sống với Dell PowerEdge C6520 và XE8545 (6)

Đánh giá hiệu suất của đường ống BWA-GATK

  • Trường hợp thử nghiệm 1: BWA-GATK v3.6

    Đường ống này được thiết kế để thực hiện gọi biến thể dòng mầm. Hiệu suất của quy trình được đo bằng thời gian chạy (giờ) và bộ gen mỗi ngày.

    Hiệu suất mẫu đơn

    Một mẫu đơn (50x WGS) được xử lý với 6248, 8352Y và 8358 và kết quả được hiển thị trong Hình 6. Thời gian chạy với 8352Y giảm 10% so với 6348 trong khi 8358 chạy nhanh hơn 11%.

    Biểu đồ, biểu đồ thanh Mô tả được tạo tự động

    Hình 6.    Hiệu suất BWA-GATK v3.6 với một mẫu và một nút

    Lưu ý : Các vòng tròn biểu thị mức tăng tốc của 8352Y và 8358 so với 6248 trong khi các viên kim cương biểu thị mức tăng tốc của 8358 so với 8352Y.

    Thông lượng của một nút: hiệu suất của nhiều mẫu và một nút

    Khi số lượng mẫu được xử lý đồng thời tăng lên (trục x trong Hình 7), thời gian chạy để hoàn thành nhiều đường ống tăng lên (trục y bên trái trong Hình 7). Với 14 mẫu được xử lý trên một nút điện toán duy nhất trong 49,86 giờ, bộ gen mỗi ngày được tính là 6,74 (trục y bên phải trong Hình 7). Dung lượng này là mức tối đa cho một chiếc C6520 với CPU Intel 8358.

    Mô tả biểu đồ được tạo tự động

    Hình 7.    Hiệu suất BWA-GATK v3.6 với nhiều mẫu và một nút

    Thông lượng của nhiều nút: hiệu suất đa mẫu và đa nút

    Từ nghiên cứu hiệu suất nhiều mẫu và một nút, 14 mẫu trên mỗi C6520 là số lượng mẫu tối đa có thể được xử lý cùng nhau. Tuy nhiên, số lượng mẫu trên mỗi C6520 được đặt thành 12 để tránh bất kỳ lỗi nào.

    Hình 8 hiển thị thời gian chạy và số liệu bộ gen/ngày cho hiệu suất của quy trình. Có một số biến thể thời gian chạy cùng với hai, bốn và tám thử nghiệm nút tính toán do môi trường thử nghiệm không được tách biệt cho nghiên cứu này. Tắc nghẽn mạng và lưu trữ có thể ảnh hưởng đến các bài kiểm tra tại bất kỳ thời điểm nào. Càng sử dụng nhiều C6520, số lượng bộ gen mỗi ngày càng tăng theo cấp số nhân và không có dấu hiệu của sự cố lưu trữ và mạng với 32 mẫu C6520 và 384 mẫu 50x WGS. Có thể kiểm chứng rằng hệ thống có thể xử lý 384 50x WGS trong 46,84 giờ (196,75 bộ gen/ngày).

    Hình 8.    Hiệu suất BWA-GATK v3.6 với hiệu suất đa mẫu và đa nút

    Trường hợp thử nghiệm 2: BWA-GATK v4.2 không song song hóa dữ liệu

    Thời gian chạy của từng bước trong quy trình BWA-GATK v4.2 được hiển thị trong Bảng 9.

    Vì các bước GATK bị giới hạn trong việc sử dụng một lõi, đặc biệt là thời gian chạy cho bước gọi biến thể tăng lên khoảng 29 giờ từ khoảng 7 giờ. Ngay cả khi số liệu bộ gen mỗi ngày có thể được tăng lên bằng cách xử lý nhiều mẫu hơn cùng nhau, thì thông lượng từ phiên bản quy trình này sẽ không cải thiện một cách có ý nghĩa.

    Bảng 9.       Hiệu suất BWA-GATK v4.2 không song song hóa dữ liệu

    Bước chân

    Hoạt động

    lõi

    Thời gian chạy (giờ)

    1

    Căn chỉnh và sắp xếp

    64

    2,73

    2

    Đánh dấu và loại bỏ trùng lặp

    64

    4,92

    3

    Hiệu chỉnh lại cơ sở và tạo BQSR

    1

    6,56

    4

    Áp dụng BQSR

    1

    4,32

    5

    Biến thể cuộc gọi

    1

    29.22

    6

    Hợp nhất GVCF

    1

    0,31

    Tổng thời gian chạy

    48.06

    Bộ gen/ngày

    0,50

    Trường hợp thử nghiệm 3: BWA-GATK v4.2 với song song hóa dữ liệu

    Đầu tiên, 50x WGS được chia thành 64 phần ở bước DP 1. Mỗi đoạn đọc trình tự đầu vào được căn chỉnh và loại bỏ các phần trùng lặp trong Bước 1 và 2 với một lõi duy nhất. Kết quả từ Bước 2 là 64 tệp BAM. Các tệp BAM này được hợp nhất thành một tệp BAM duy nhất theo thứ tự vị trí nhiễm sắc thể. Hai bước bổ sung này đã thêm 1,73 giờ nhưng thời gian chạy giảm ở Bước 1 và 2 là khoảng 10 giờ. Ngoài ra, dữ liệu có thể được song song hóa dễ dàng sau bước DP2 mà không làm giảm sức mạnh thống kê, nếu dữ liệu được chia thành nhiều phần theo thứ tự vị trí nhiễm sắc thể.

    Thay vì chia nhỏ tệp BAM đã hợp nhất về mặt vật lý, một loạt tệp chỉ mục được tạo ở bước DP 4. Tổng cộng có 64 tệp khoảng thời gian đã được tạo và mỗi tệp khoảng thời gian chứa một vùng nhiễm sắc thể liên tiếp trỏ đến số lần đọc trình tự bằng nhau để giảm thiểu các biến thể thời gian chạy.

    DP 5 là một bước bổ sung khác kết hợp tất cả các kết quả (khối VCF) từ Bước 6 thành một VCF duy nhất. Bước này có thể là một tùy chọn vì mỗi VCF đều có đầy đủ chức năng.

    Tổng thời gian chạy với quy trình mới này là 5,50 giờ và nó có thể xử lý 4,36 bộ gen mỗi ngày.

    Điều đáng chú ý là mức độ song song hóa dữ liệu trong đường ống phụ thuộc vào mạng và băng thông lưu trữ. Đường ống đọc từ một tập hợp hai tệp đầu vào và tạo ra 64 khối cho mỗi tệp. Kích thước của tệp đầu vào được sử dụng cho thử nghiệm là khoảng 110 GB ở định dạng nén gzip. Và kích thước của mỗi đoạn nhỏ hơn 1 GB một chút ở định dạng gzip. Do đó, hệ thống lưu trữ cần ghi đồng thời 128 tệp 1GB. Nếu bộ lưu trữ không có đủ băng thông để xử lý nhiều tệp đồng thời, bộ lưu trữ sẽ xử lý từng khối một. Tình trạng này sẽ làm tăng thời gian chạy nhiều hơn so với khi không có song song hóa dữ liệu.

    Bạn nên nghiên cứu sơ bộ để tìm ra số lượng phân tách tối ưu (mức độ song song hóa dữ liệu) trước khi áp dụng loại song song hóa dữ liệu này.

    Bảng 10.  Hiệu suất BWA-GATK v4.2 với song song hóa dữ liệu

    Bước chân

    Hoạt động

    Số lần chia tách

    lõi

    Thời gian chạy (giờ)

    ĐP 1

    Tách tệp FASTQ

    64

    64

    1,38

    1

    Căn chỉnh và sắp xếp

    64

    1

    1,28

    2

    Đánh dấu và loại bỏ trùng lặp

    64

    1

    0,19

    ĐP 2

    Hợp nhất các tệp BAM

    1

    1

    0,35

    ĐP 3

    Đếm số lần đọc được căn chỉnh

    1

    1

    0,04

    ĐP 4

    Tạo các tệp Khoảng thời gian

    64

    1

    0,45

    3

    Hiệu chỉnh lại cơ sở và tạo BQSR

    64

    1

    0,12

    4

    Áp dụng BQSR

    64

    1

    0,16

    5

    Biến thể cuộc gọi

    64

    1

    1.04

    6

    Hợp nhất GVCF

    64

    1

    0,01

    ĐP 5

    Hợp nhất các tệp VCF

    1

    1

    0,49

    Tổng thời gian chạy

    5,50

    Bộ gen/ngày

    4,36