Tăng tốc khối lượng công việc của Hệ thống tệp mạng (NFS) của bạn với RDMA

Giao thức NFS hiện nay được sử dụng rộng rãi trong các trung tâm dữ liệu của NAS. Ban đầu, nó được thiết kế để lưu trữ và quản lý dữ liệu tập trung, sau đó chia sẻ dữ liệu trên các mạng. Khi công nghệ phát triển, NFS đã được nhiều tổ chức sử dụng cho khối lượng công việc sản xuất quan trọng.

NFS thường được triển khai qua TCP để truyền dữ liệu. Với sự xuất hiện của Ethernet tốc độ cao hơn và khối lượng công việc ứng dụng nặng hơn chạy trong các trung tâm dữ liệu, tốc độ truyền khối lượng dữ liệu ngày càng tăng là rất quan trọng đối với các tổ chức. Ngành công nghiệp đã theo đuổi những cách mới để cải thiện hiệu suất giao thức NFS và thích ứng với khối lượng công việc ứng dụng mới nổi. Điều này đã giúp việc sử dụng NFS qua Truy cập bộ nhớ trực tiếp từ xa (RDMA) trở nên khả thi.

RDMA cho phép truy cập dữ liệu bộ nhớ trên máy từ xa mà không cần truyền dữ liệu qua CPU trên hệ thống. Do đó, RDMA cho phép dữ liệu được truyền giữa bộ lưu trữ và máy khách với thông lượng cao hơn và sử dụng CPU thấp hơn. NFS qua RDMA, như được định nghĩa trong RFC8267 , sử dụng các ưu điểm của RDMA. Bắt đầu từ OneFS 9.2.0, OneFS hỗ trợ NFSv3 qua RDMA dựa trên giao thức mạng ROCEv2 (còn được gọi là Routable RoCE hoặc RRoCE).

Để đánh giá những cải tiến và lợi thế của NFSv3 so với RDMA, so với NFSv3 so với TCP, chúng tôi đã chạy một số thử nghiệm đọc tuần tự FIO và quan sát thông lượng và mức sử dụng CPU theo số lượng luồng khác nhau. Hình sau đây cho thấy cấu hình tài nguyên và cấu trúc môi trường thử nghiệm.

  Các nút cụm Khách hàng
Số lượng  Cụm 48 nút 10
Phiên bản hệ điều hành OneFS 9.2.1.0 Phiên bản CentOS Linux 8.3.2011
Người mẫu F600 Máy khách Dell PowerEdge C4140
Thiết bị mạng 2 * Gia đình MT28800 [ConnectX-5 Ex] * 100GE 2 * Họ MT28908 [ConnectX-6] * 100GE

Biểu đồ sau đây cho thấy sự so sánh thông lượng giữa RDMA và TCP. Chúng tôi thấy rằng NFSv3 qua RDMA mang lại thông lượng cao hơn NFSv3 qua TCP. (Lưu ý: Vì 10 máy khách thử nghiệm không thể quá tải cụm F600 48 nút nên số thông lượng chỉ được sử dụng để so sánh RDMA và TCP và không biểu thị hiệu suất cụm tối đa.)

Biểu đồ sau đây cho thấy sự so sánh mức sử dụng CPU của khách hàng đối với RDMA so với TCP. Chúng tôi thấy rằng khách hàng tiêu thụ ít tài nguyên CPU hơn khi sử dụng NFSv3 qua RDMA.

Phần kết luận

Cải thiện hiệu suất NFSv3 qua RDMA thay đổi khi số luồng máy khách tăng lên, so với NFSv3 qua TCP. Nhìn chung, NFSv3 qua RDMA cung cấp thông lượng cao hơn trong khi giảm đáng kể chi phí CPU của máy khách. Do đó, khối lượng công việc tuần tự và khối lượng công việc sử dụng nhiều CPU có thể được hưởng lợi khi sử dụng NFSv3 qua RDMA trên OneFS.

Tác giả: Lieven Lin , LinkedIn