Hiểu về ‘Tổng lượng dữ liệu tiết kiệm được khi nhúng’ khi sử dụng ‘isi_cstats’

Gần đây, một khách hàng đã liên hệ với chúng tôi để cho chúng tôi biết rằng anh ấy nghĩ rằng có lỗi trong đầu ra của lệnh OneFS CLI ‘isi_cstats’. Bắt đầu từ OneFS 9.3, lệnh ‘isi_cstats’ bao gồm số lượng tệp được ghi chép trong /ifs. Nó cũng chứa một số liệu thống kê có tên là “Tổng số dữ liệu được ghi chép tiết kiệm”.

Khách hàng này mong đợi rằng con số ‘Tổng tiết kiệm dữ liệu nội tuyến’ chỉ đơn giản là ‘Tổng số tệp nội tuyến’ nhân với 8KB. Lý do anh ta nghĩ rằng con số này sai là vì con số này không tính đến mức độ bảo vệ. 

Trong OneFS, đối với mức bảo vệ 2d:1n, mỗi tệp nhỏ hơn 128KB được lưu trữ dưới dạng bản sao 3X. Lấy ảnh chụp màn hình bên dưới làm ví dụ.

Nếu chúng ta thực hiện một số tính toán ở đây,

379.948.336 * 8KB = 3.039.586.688KiB = 2898,78GiB

chúng ta có thể thấy rằng 2.899GiB từ đầu ra lệnh được tính là một khối cho mỗi tệp nội tuyến. Vì vậy, trong ví dụ của chúng tôi, khách hàng sẽ nghĩ rằng ‘Tổng tiết kiệm dữ liệu nội tuyến’ sẽ báo cáo 2898,78 GiB * 3, vì mức bảo vệ 2d:1n. 

Vâng, số liệu thống kê này không phải là khoản tiết kiệm thực tế, mà thực ra là chi phí hợp lý trên đĩa cho tất cả các tệp được nhúng. Chúng tôi không thể báo cáo chính xác khoản tiết kiệm vật lý vì nó phụ thuộc vào chi phí bảo vệ không được nhúng, có thể thay đổi. Ví dụ:

  • Nếu mức độ bảo vệ là 2d:1n, nếu không có tính năng nhúng dữ liệu trong inode 8KB, thì mỗi tệp được nhúng sẽ có giá là 8KB * 3.
  • Nếu mức độ bảo vệ là 3d:1n1d, nó sẽ trở thành 8KB * 4.

Một điều nữa cần cân nhắc, nếu một tệp nhỏ hơn 8KB sau khi nén, tệp đó cũng sẽ được nhúng vào inode. Do đó, số liệu thống kê này cũng không biểu thị mức tiết kiệm logic, vì nó không tính đến việc nén. Để báo cáo mức tiết kiệm logic, cần theo dõi tổng kích thước logic cho tất cả các tệp nhúng.

Để tránh nhầm lẫn, chúng tôi dự định đổi tên thống kê này thành “Total inline data” trong phiên bản tiếp theo của OneFS. Chúng tôi cũng dự định hiển thị thêm thông tin hữu ích về tổng dữ liệu logic của các tệp được nhúng, ngoài “Total inline data”.

Để biết thêm thông tin về báo cáo các tính năng giảm dữ liệu, hãy xem sách trắng   PowerScale OneFS: Giảm dữ liệu và Hiệu quả lưu trữ trên Info Hub.

Tác giả : Yunlong Zhang, Kỹ sư công nghệ kỹ thuật chính