Tổng quan về Bảo vệ dữ liệu và Đường dẫn dữ liệu ECS Phần III

Dell ECS đại diện cho bước tiến mạnh mẽ trong các giải pháp lưu trữ dữ liệu doanh nghiệp. Khi các doanh nghiệp ngày càng tạo ra lượng lớn dữ liệu phi cấu trúc, từ các tệp đa phương tiện đến luồng dữ liệu IoT, nhu cầu về lưu trữ có khả năng mở rộng, an toàn và tiết kiệm chi phí chưa bao giờ lớn đến vậy. Dell ECS được thiết kế để đáp ứng nhu cầu này bằng cách cung cấp một nền tảng lưu trữ đối tượng cực kỳ linh hoạt và hiệu quả, có thể xử lý các nhu cầu đa dạng và năng động của các doanh nghiệp hiện đại.

Blog này sẽ giới thiệu cách ECS chịu đựng các tình huống lỗi. Bạn nên đọc phần II của Tổng quan về bảo vệ dữ liệu và đường dẫn dữ liệu của Dell ECS trước để có một số kiến ​​thức cơ bản về bảo vệ dữ liệu của ECS. Bạn cũng có thể tham khảo bài viết Kiến trúc và tổng quan về ECS nếu muốn biết thêm về ECS.

ECS được thiết kế để chịu được nhiều tình huống hỏng hóc thiết bị. Phạm vi các điều kiện hỏng hóc trải dài trong phạm vi khác nhau bao gồm:

  • Lỗi ổ cứng đơn trong một nút đơn
  • Nhiều ổ cứng bị lỗi trong một nút duy nhất
  • Nhiều nút có một ổ cứng bị lỗi
  • Nhiều nút có nhiều ổ cứng bị lỗi
  • Lỗi nút đơn
  • Lỗi nhiều nút
  • Mất kết nối tới một VDC được sao chép
  • Mất một VDC được sao chép toàn bộ 

Trong cấu hình một site, hai site hoặc geo-replicated, tác động của lỗi phụ thuộc vào số lượng và loại thành phần bị ảnh hưởng. Tuy nhiên, ở mỗi cấp độ, ECS cung cấp các cơ chế để bảo vệ chống lại tác động của lỗi thành phần. Một số cơ chế này đã được thảo luận trong blog Dell ECS Data protection and data path overview part II .  Chúng sẽ được xem xét lại ở đây và trong hình sau để cho thấy cách chúng được áp dụng vào giải pháp. Bao gồm: 

  • Lỗi đĩa
    1. Các phân đoạn EC hoặc bản sao từ cùng một khối không được lưu trữ trên cùng một đĩa
    2. Tính toán tổng kiểm tra trên các hoạt động ghi và đọc
    3. Trình kiểm tra tính nhất quán nền tảng xác minh lại tổng kiểm tra
  • Lỗi nút
    1. Phân phối các phân đoạn hoặc bản sao của một khối một cách đồng đều trên các nút trong VDC
    2. ECS Fabric duy trì các dịch vụ chạy và quản lý các tài nguyên như đĩa và mạng.
    3. Bản ghi phân vùng và bảng được bảo vệ bằng cách chuyển đổi quyền sở hữu phân vùng từ nút này sang nút khác.
  • Lỗi giá đỡ trong VDC    
    1. Phân phối các phân đoạn bản sao của một khối một cách đồng đều trên các giá đỡ trong VDC. [WD1] [ZJ2]

Hình 1: Cơ chế bảo vệ ở cấp độ đĩa, nút và giá đỡ

Lưu ý: Nhận biết giá đỡ có thể không bảo vệ được 12+4 EC trên ít hơn 4 giá đỡ và 10+2 EC trên ít hơn 6 giá đỡ.

Lưu ý: Đối với rack aware, khi thêm rack mới vào cụm hiện có, một số dữ liệu sẽ được chuyển đến rack mới để cân bằng dữ liệu trên tất cả các rack một cách đồng đều. Tuy nhiên, quá trình này có thể mất nhiều thời gian để tránh ảnh hưởng đến hiệu suất của hệ thống. Nếu khách hàng tiếp tục ghi dữ liệu một cách tích cực và lấp đầy rack đầu tiên, thì tất cả các lần ghi mới sẽ chỉ xảy ra trên rack mới.