Cụm dữ liệu lớn của Microsoft SQL Server 2019: Giải pháp dữ liệu lớn sử dụng cơ sở hạ tầng Dell EMC (4)

Dell EMC PowerFlex

Giới thiệu

Hệ thống PowerFlex kết hợp máy chủ Dell EMC PowerEdge với nền tảng phần mềm PowerFlex để tạo SAN được xác định bằng phần mềm. Dòng PowerFlex, bao gồm thiết bị PowerFlex và giá PowerFlex, được hỗ trợ đầy đủ và được cấu hình theo thông số kỹ thuật của khách hàng. Các nút giá PowerFlex là các khối xây dựng máy chủ được xác thực được cấu hình để sử dụng với các hệ thống PowerFlex. Được thiết kế dành cho những khách hàng muốn xây dựng môi trường của riêng mình, các nút giá có sẵn với hàng nghìn tùy chọn cấu hình.

Khách hàng có một số tùy chọn cấu hình—từ ổ cứng dung lượng cao hoặc ổ đĩa thể rắn (SSD) đến các công nghệ lưu trữ mới hơn như bộ nhớ flash Non-Volatile Memory Express (NVMe) hoặc flash Peripheral Component Interconnect Express (PCIe). Với các tùy chọn này, khách hàng có thể tạo các tầng lưu trữ phù hợp với yêu cầu về dung lượng và hiệu suất của mình. Bổ sung cho việc phân tầng lưu trữ là khả năng sử dụng cài đặt Chất lượng dịch vụ (QoS). Với QoS, khách hàng có thể xác định IOPS tối đa, IOPS tối đa trên mỗi GB, băng thông tối đa và băng thông tối đa trên mỗi GB.

Phần mềm ảo hóa PowerFlex hỗ trợ nén dữ liệu, giúp tiết kiệm không gian lưu trữ quý giá trên ổ SSD. Tính năng nén không được bật theo mặc định; đúng hơn, nó phải được chỉ định khi một tập đĩa được tạo ra. Nếu một ổ đĩa không hỗ trợ nén thì việc cung cấp mỏng sẽ được sử dụng theo mặc định. Cung cấp mỏng là công nghệ dự trữ không gian lưu trữ bằng cách chỉ phân bổ không gian được sử dụng, cho phép sử dụng lưu trữ hiệu quả hơn.

Phần mềm PowerFlex Manager điều khiển các hệ thống PowerFlex, quản lý phần cứng nút và chuyển mạch, bao gồm chương trình cơ sở, BIOS và tình trạng. Nó duy trì sự tuân thủ Ma trận chứng nhận phát hành để đảm bảo cấu hình vận hành phù hợp. PowerFlex Manager tự động hóa và đơn giản hóa việc quản lý bộ lưu trữ PowerFlex. Bảng điều khiển cung cấp bản tóm tắt về tình trạng và lịch sử của hệ thống PowerFlex. Từ bảng điều khiển, quản trị viên có thể dễ dàng giám sát việc sử dụng máy chủ, bộ lưu trữ và dịch vụ. Màn hình tài nguyên cung cấp chế độ xem vào hệ thống PowerFlex, cổng PowerFlex và cụm bộ ảo hóa. Để biết tổng quan nhanh về video, hãy xem Trình quản lý PowerFlex (trước đây gọi là Trình quản lý VxFlex) trên YouTube.

Dữ liệu lớn được định vị tốt nhất trên nền tảng lưu trữ có khả năng mở rộng. Với hệ thống PowerFlex, kiến ​​trúc có thể mở rộng từ bốn nút lên đến hàng nghìn nút. Khả năng mở rộng này cung cấp quy mô chi tiết hơn để tổ chức CNTT có thể bắt đầu với quy mô nhỏ, với mức đầu tư tối thiểu và thêm các nút và giá đỡ theo thời gian. Mỗi nút bổ sung sẽ tăng thêm dung lượng và hiệu suất cho hệ thống PowerFlex.

 

Giá đỡ PowerFlex

Đối với trường hợp sử dụng của mình, chúng tôi đã triển khai giá đỡ PowerFlex, bao gồm thiết bị PowerFlex trong tủ có bộ cấp nguồn thông minh và cảm biến nhiệt. Giá đỡ PowerFlex cũng đi kèm với dịch vụ triển khai găng tay trắng đảm bảo trải nghiệm chìa khóa trao tay.

Giá đỡ PowerFlex hỗ trợ triển khai bằng kim loại trần, mặc dù việc triển khai bằng kim loại trần cần có sự phê duyệt trước về hỗ trợ.

Trong giá PowerFlex của chúng tôi, chúng tôi đã sử dụng máy chủ Dell EMC PowerEdge R840 cho nhóm lưu trữ. Máy chủ dữ liệu lưu trữ (SDS) là một dịch vụ chạy trên mỗi máy chủ và là nhà môi giới cho các dịch vụ lưu trữ, như minh họa trong hình sau:

Hình 6. Giao tiếp dịch vụ PowerFlex

Đối với thử nghiệm này, giá PowerFlex có bốn nút lưu trữ, mỗi nút chạy dịch vụ SDS. Chúng tôi đã xem xét hai tùy chọn triển khai PowerFlex linh hoạt cho dự án này. Đầu tiên là kiến ​​trúc SAN hai lớp truyền thống trong đó các ứng dụng sử dụng tài nguyên điện toán tách biệt với tài nguyên SAN, như minh họa trong hình sau. Tùy chọn triển khai này hoạt động tốt cho các ứng dụng yêu cầu CPU và bộ nhớ chuyên dụng hoàn toàn để có hiệu suất tối ưu hoặc chỉ hoạt động trong kiến ​​trúc hai lớp truyền thống .

Hình 7. Kiến trúc hai lớp PowerFlex

Tùy chọn triển khai một lớp, còn được gọi là cơ sở hạ tầng siêu hội tụ (HCI), là một mô hình trong đó tính toán và lưu trữ nằm trên cùng một lớp, như minh họa trong hình sau. Chúng tôi đã sử dụng mô hình này trong thử nghiệm của mình vì mục tiêu là tối đa hóa sự hợp nhất. Ví dụ: các bộ chứa Cụm dữ liệu lớn của chúng tôi đang chia sẻ tài nguyên điện toán trên hệ thống PowerFlex. Tùy chọn triển khai HCI tối đa hóa khoản đầu tư của khách hàng thông qua hợp nhất.

Hình 8. Kiến trúc một lớp (HCI)

Trong giá PowerFlex của chúng tôi, chúng tôi đã sử dụng bốn máy chủ R840, mỗi máy chủ chạy dịch vụ SDS. Do đó, cả bốn máy chủ đều đóng góp vào kho lưu trữ cho Cụm dữ liệu lớn. Chúng tôi đã cấu hình mỗi R840 với bốn CPU Intel Xeon Gold 6140M và mỗi CPU có 18 lõi, nâng tổng số lên 72 lõi. Khi siêu phân luồng được kích hoạt, 144 lõi logic có sẵn trên mỗi máy chủ.

Mỗi máy chủ có tám ổ SSD 3,84 TB, với tổng dung lượng thô là 30,72 TB, cung cấp cấu hình lưu trữ trong đó hiệu suất và dung lượng được cân bằng tốt. Vì trọng tâm của chúng tôi là cách tận dụng Cụm dữ liệu lớn chứ không phải hiệu suất nên chúng tôi không báo cáo về hiệu suất trong sách trắng này.

Một phần của giá PowerFlex bao gồm các nút điều khiển chạy dịch vụ Trình quản lý dữ liệu Meta (MDM). Các nút điều khiển phối hợp hoạt động giữa máy khách (SDC) và nút lưu trữ (SDS). Ví dụ: các nút điều khiển liên lạc với khách hàng nếu bố cục dữ liệu thay đổi và với các nút lưu trữ để thực hiện các hoạt động tái cân bằng. Các dịch vụ MDM chạy trên ba máy chủ PowerEdge R640, như minh họa trong hình sau:

Hình 9. Các nút điều khiển

Giá PowerFlex mà chúng tôi sử dụng để thử nghiệm được thiết kế để có tính sẵn sàng cao (HA). Thiết kế HA bắt đầu với bố cục phản chiếu dạng lưới RAID 1, được minh họa trong hình sau:

Hình 10. Ví dụ về lưới PowerFlex RAID 1

Với tính năng bảo vệ nhân đôi dạng lưới RAID 1, mỗi khối dữ liệu được lưu trữ trên hai đơn vị SDS khác nhau. Việc đảm bảo rằng nhiều bản sao dữ liệu nằm trên bộ lưu trữ vật lý riêng biệt sẽ bảo vệ khỏi lỗi ổ đĩa đơn lẻ, và nói rộng ra, việc có các bản sao dữ liệu trên các nút sẽ bảo vệ khỏi lỗi nút.

Dịch vụ cụm dữ liệu lớn

Trong giá đỡ Cụm dữ liệu lớn đến PowerFlex, các dịch vụ được cân bằng trên bốn nút. Hình sau đây trình bày trực quan về cách phân phối các dịch vụ Cụm dữ liệu lớn:

Hình 11. Phân phối dịch vụ Cụm dữ liệu lớn

Các nhóm đã sử dụng các nút sau:

  • Nhóm chính SQL Server đã sử dụng các nút 1, 2 và 4.
  • Nhóm điện toán đã sử dụng các nút 1, 3 và 4.
  • Nhóm dữ liệu đã sử dụng các nút 1, 3 và 4.
  • Nhóm lưu trữ đã sử dụng các nút 2, 3 và 4.

Nút thứ tư hỗ trợ bộ cân bằng tải bên ngoài. Ba máy ảo SQL chính đã được sử dụng trong nhóm khả dụng Luôn bật. SQL Server tự động xây dựng nhóm sẵn sàng Luôn bật khi tùy chọn HA được chọn trong quá trình triển khai. Nhóm khả dụng bao gồm cơ sở dữ liệu hệ thống và được tích hợp vào công cụ SQL Server để mọi cơ sở dữ liệu mới được tạo sẽ tự động được thêm vào nhóm khả dụng. Nhóm sẵn sàng Luôn bật cung cấp cho kiến ​​trúc cơ sở dữ liệu chính SQL một số lợi ích:

  • Bảo vệ cơ sở dữ liệu chính SQL bằng cách cung cấp các tùy chọn chuyển đổi dự phòng tự động và theo kế hoạch
  • Phân phối các truy vấn cần đọc nhiều cho một hoặc nhiều bản sao phụ
  • Cho phép chuyển các hoạt động sao lưu sang bản sao phụ
  • Cung cấp sửa chữa trang tự động để bảo vệ chống hỏng trang

Cụm Luôn bật cung cấp các tính năng quan trọng để triển khai sản xuất Cụm dữ liệu lớn, chẳng hạn như tính sẵn sàng cao, hỗ trợ giảm tải và khả năng tự phục hồi.

Kiến trúc hợp nhất cao này cho phép khách hàng bắt đầu với quy mô nhỏ và phát triển sau này nếu cần. Kiến trúc này cung cấp nhiều lợi ích:

  • vSphere vMotion cho phép di chuyển không phân phối các dịch vụ Cụm dữ liệu lớn được ảo hóa từ nút giá PowerFlex này sang nút giá PowerFlex khác. Trong trường hợp này, việc phân phối lại các dịch vụ Cụm dữ liệu lớn trên nhiều nút hơn có thể tăng hiệu suất mà không cần thêm các dịch vụ Cụm dữ liệu lớn mới.
  • Việc tự động hóa việc cung cấp VM bằng cách triển khai bộ chứa Kubernetes cho phép khách hàng nhanh chóng bổ sung thêm nhiều dịch vụ Cụm dữ liệu lớn hơn . Ví dụ: nếu một phần của kiến ​​trúc Cụm dữ liệu lớn được sử dụng nhiều thì việc thêm các dịch vụ sẽ phân phối tải nhiều hơn. Việc thêm dịch vụ có thể trùng hoặc không trùng với việc bổ sung một nút khác.
  • Việc bổ sung các nút giá PowerFlex cho phép mở rộng các dịch vụ Cụm dữ liệu lớn sang các khu vực khác của tổ chức trong khi vẫn giữ mức độ phức tạp trong quản lý ở mức thấp.

Khi triển khai và chạy Cụm dữ liệu lớn trên giá PowerFlex, cấu hình đã hoạt động như mong đợi mà không gặp khó khăn hay trở ngại nào. Sự dễ dàng triển khai và tích hợp của giá đỡ PowerFlex, Kubernetes thông qua plug-in CSI và VMware đã xác nhận rằng hệ thống PowerFlex là nền tảng lý tưởng cho môi trường Cụm dữ liệu lớn.