Tôi cảm thấy cần thiết – cần tốc độ (và sức bền): Phiên bản Intel Optane

Chỉ mới ba tháng ngắn ngủi kể từ khi chúng tôi ra mắt VxRail trên PowerEdge thế hệ thứ 15, nhưng chúng tôi đã mở rộng danh mục cấu hình. Cho đến nay, chúng tôi đã bổ sung thêm 18 bộ xử lý để tăng cường sức mạnh cho khối lượng công việc của bạn, bao gồm một số tùy chọn xung nhịp cao và số lượng lõi thấp. Đây là tin vui cho những ai đang sử dụng ứng dụng được cấp phép theo lõi, một GPU NVIDIA bổ sung – A30, một loạt ổ đĩa bổ sung và dung lượng RAM tăng gấp đôi lên 8TB. Có lẽ tôi đã bỏ lỡ điều gì đó, vì thật khó để theo dõi tất cả những đổi mới đang diễn ra bên trong chiếc xe đua VxRail này!

Trong bài viết trước, tôi đã hé lộ một trong những bổ sung ổ đĩa đó, ổ đĩa đệm nhanh hơn. Hôm nay, tôi rất vui mừng thông báo rằng giờ đây bạn có thể đặt hàng và tăng tốc VxRail của mình với Intel P5800X 400GB hoặc 800GB – ổ đĩa Optane NVMe thế hệ thứ hai của Intel. Trước khi đi sâu vào một số thông số hiệu năng, hãy cùng thảo luận về điều gì khiến ổ đĩa Optane trở nên đặc biệt. Cụ thể hơn, điều gì giúp chúng mang lại hiệu năng cao hơn đáng kể, bên cạnh độ bền bỉ đáng kể.

Nói một cách đơn giản, và tôi xin lỗi trước các kỹ sư Intel đã dành tâm huyết cho việc này, khi ghi vào bộ nhớ flash NAND, cần phải thực hiện một chu kỳ xóa trước khi có thể thực hiện một thao tác ghi. Các chu kỳ xóa này rất tốn thời gian và là lý do chính tại sao khả năng ghi ngẫu nhiên vào bộ nhớ flash NAND thường chỉ bằng một phần nhỏ khả năng đọc. Ngoài ra, bộ thu gom rác liên tục chạy ở chế độ nền để đảm bảo có đủ dung lượng cho các thao tác ghi đến. Mặt khác, Optane thực hiện các thao tác ghi tại chỗ ở cấp độ bit, do đó không yêu cầu chu kỳ xóa, bộ thu gom rác hay các thao tác ghi gây giảm hiệu suất. Do đó, khả năng ghi ngẫu nhiên vào gần như tương đương với khả năng đọc ngẫu nhiên vào. Vậy độ bền của ổ đĩa Optane mới này tốt hơn bao nhiêu? Độ bền có thể được đo bằng Số lần ghi ổ đĩa mỗi ngày (DWPD), đo lường số lần toàn bộ kích thước ổ đĩa có thể bị ghi đè mỗi ngày trong thời hạn bảo hành. Với ổ NVMe P5600 1,6TB, tốc độ này là 3 DWPD, hay 55 MB/giây, mỗi giây trong năm năm – gần bằng 9PB dữ liệu ghi, không tệ. Tuy nhiên, ổ Optane P5800X 800GB sẽ chịu được 146PB trong suốt thời hạn bảo hành năm năm, hay gần 1 GB/giây (926 MB/giây) mỗi giây trong suốt thời hạn bảo hành 100 DWPD năm năm. Không hoàn toàn bất khả xâm phạm, nhưng đó là một lượng ghi lớn, nên bạn không cần thêm dung lượng để cân bằng hao mòn và một ổ đĩa dung lượng nhỏ hơn là đủ.

Bạn có thể tự hỏi tại sao bạn phải quan tâm đến độ bền, vì Dell EMC sẽ thay thế ổ đĩa theo chế độ bảo hành dù sao đi nữa – có ba lý do. Khi ổ đĩa đệm bị hỏng, nhóm đĩa của nó sẽ ngoại tuyến, do đó, bạn không chỉ mất hiệu suất và dung lượng mà môi trường của bạn còn phải gánh thêm gánh nặng của hoạt động xây dựng lại để bảo vệ lại dữ liệu của mình. Thứ hai, ngày càng có nhiều hệ thống được triển khai bên ngoài trung tâm dữ liệu cốt lõi. Việc thay thế ổ đĩa trong trung tâm dữ liệu của bạn rất đơn giản và bạn thậm chí có thể có ổ đĩa dự phòng tại chỗ, nhưng bên ngoài trung tâm dữ liệu cốt lõi của bạn thì sao? Kế hoạch của bạn để thay thế ổ đĩa tại một văn phòng từ xa hoặc cách xa hàng nghìn dặm là gì? Điều gì sẽ xảy ra nếu địa điểm từ xa đó không phải là văn phòng mà là một giàn khoan dầu cách bờ biển một trăm dặm hoặc một con tàu du lịch cách nửa vòng trái đất, nơi chi phí để có được ổ đĩa thay thế không hề nhỏ? Ở những địa điểm xa xôi này, việc thay thế tại chỗ là phổ biến, nhưng có những trường hợp ngoại lệ dẫn tôi đến lý do thứ ba, Định luật Murphy. CNTT và nhân viên CNTT có thể là một suy nghĩ muộn màng tại những địa điểm xa xôi này. Việc thay thế ổ đĩa bị lỗi tại một địa điểm xa xôi, thiếu nhân viên CNTT thực sự có thể không được ưu tiên đúng mức, và sau đó luôn có nguy cơ xảy ra lỗi của người dùng… “Ồ, ý anh là ổ đĩa kia?!? Xin lỗi…”

Bộ nhớ đệm dưới nhiều hình thức đóng vai trò quan trọng trong trung tâm dữ liệu. Bộ nhớ đệm cho phép các thiết bị chuyển mạch và lưu trữ cung cấp mức hiệu suất cao hơn. Trên VxRail, ổ đĩa đệm của chúng tôi được chia thành hai loại, SAS và NVMe, trong đó NVMe cung cấp IOPS cao hơn tới 35% và độ trễ thấp hơn 14%. Trong số các ổ đĩa đệm NVMe của chúng tôi, chúng tôi có hai loại từ Intel, P5600 1,6TB và Optane P5800X , với dung lượng 400GB và 800GB. Các liên kết cho từng loại sẽ đưa bạn đến thông số kỹ thuật của ổ đĩa bao gồm chi tiết về hiệu suất. Nhưng hiệu suất ở cấp độ ổ đĩa ảnh hưởng đến hiệu suất ở cấp độ giải pháp như thế nào? Bởi vì, vào cuối ngày, đó là những gì ứng dụng của bạn tiêu thụ ở cấp độ giải pháp, sau khi phản chiếu bộ nhớ đệm, các bước nhảy mạng và ngăn xếp vSAN. Intel là một đối tác tuyệt vời để hợp tác, khi chúng tôi kiểm tra với họ về việc xuất bản dữ liệu hiệu suất cấp độ giải pháp so sánh hai ổ đĩa cạnh nhau, tất cả đều đồng ý.

Trong phần giải thích quá đơn giản ở trên, tôi đã mô tả chu kỳ ghi của ổ đĩa Optane khác biệt đáng kể như một thao tác xóa và không cần phải được thực hiện trước. Vậy điều này diễn ra như thế nào trong một giải pháp đầy đủ? Hình 1 so sánh một cụm VxRail P670F bốn nút, chạy khối lượng công việc ghi tuần tự 100% 64KB. Đây không phải là một bài kiểm tra phản ánh bất kỳ khối lượng công việc thực tế nào, nhưng thực sự nhấn mạnh vào lớp bộ nhớ đệm vSAN, làm nổi bật hiệu suất ghi ổn định mà công nghệ 3D XPoint mang lại, và cho thấy Optane có thể giải phóng bộ nhớ đệm khi nó đầy mà không ảnh hưởng đến hiệu suất.

Hình 1: Ổ đĩa đệm Optane mang lại hiệu suất ghi ổn định và có thể dự đoán được

Khi xem xét hiệu suất, có hai con số cần lưu ý: IOPS và độ trễ. Mục tiêu là đạt được IOPS cao với độ trễ thấp  có thể dự đoán được, ở kích thước IO thực tế và tỷ lệ đọc/ghi. Để đạt được mục tiêu này, hãy cùng xem hiệu suất VxRail khác biệt như thế nào so với P5600 và P5800X trong bài kiểm tra khối lượng công việc chuẩn OLTP32K (70R30W) và RDBMS (60R40W), như thể hiện trong Hình 2.

Hình 2: Ổ đĩa đệm Optane mang lại hiệu suất cao hơn và độ trễ thấp hơn trên nhiều loại khối lượng công việc khác nhau.

Không cần phải là chuyên gia để nhận ra rằng với P5800X, hiệu suất đỉnh của cụm VxRail P670F bốn nút này cao hơn đáng kể so với khi được trang bị P5600 làm ổ đĩa đệm. Đối với khối lượng công việc RDBMS, IOPS cao hơn tới 44% với độ trễ giảm 37%. Nhưng hiệu suất đỉnh không phải là tất cả. Nhiều khối lượng công việc, đặc biệt là cơ sở dữ liệu, coi trọng yêu cầu về độ trễ hơn. Điều gì sẽ xảy ra nếu khối lượng công việc của chúng ta, cơ sở dữ liệu hoặc các khối khác, yêu cầu thời gian phản hồi 1ms? Có thể đây là Thỏa thuận mức dịch vụ (SLA) mà nhóm cơ sở hạ tầng có với nhóm ứng dụng. Trong tình huống như vậy, dựa trên dữ liệu được hiển thị và đối với khối lượng công việc OLTP 70:30 với kích thước khối 32K, cụm VxRail sẽ mang lại hiệu suất gấp đôi ở cùng SLA độ trễ, tăng từ 147.746 lên 314.300 IOPS.

Trong trung tâm dữ liệu, cũng như trong cuộc sống, chúng ta thường phải đối mặt với câu hỏi “Tốt, nhanh, hay rẻ. Hãy chọn một”. Khi so sánh giá của P5600 và P5800X, ổ đĩa Optane có mức giá cao hơn đáng kể so với chất lượng và tốc độ của nó. Tuy nhiên, hãy nhớ rằng bạn không mua một ổ đĩa riêng lẻ, mà là mua một giải pháp tích hợp đầy đủ các phần cứng và phần mềm, trong đó chi phí cao cấp không đáng kể so với độ bền và hiệu năng được cải thiện. Cho dù bạn muốn tăng tốc VxRail như một chiếc xe đua, hay mạnh mẽ như một chiếc xe tăng, ổ đĩa SSD Intel Optane sẽ đáp ứng cả hai.