Giải pháp lớn trên Dell EMC VxRail với cụm dữ liệu lớn SQL 2019

Lượng dữ liệu và các định dạng khác nhau mà các tổ chức phải quản lý, thu thập và phân tích chính là động lực thúc đẩy Microsoft SQL 2019 Big Data Clusters (BDC). SQL Server 2019 BDC minh họa việc triển khai các cụm có khả năng mở rộng của SQL Server, Spark và HDFS (Hệ thống Tệp Phân tán Hadoop) được chứa trong container chạy trên Kubernetes.

Gần đây, chúng tôi đã triển khai và thử nghiệm SQL Server 2019 BDC trên cơ sở hạ tầng siêu hội tụ Dell EMC VxRail để chứng minh cách VxRail mang lại hiệu suất, khả năng mở rộng và tính linh hoạt cần thiết để kết hợp nhiều khối lượng công việc này lại với nhau.    

Nền tảng Dell EMC VxRail được lựa chọn nhờ khả năng tích hợp tính toán, lưu trữ, ảo hóa và quản lý trong một nền tảng duy nhất. Tính năng chính của VxRail HCI là tích hợp vSphere, vSAN và Phần mềm Hệ thống VxRail HCI, mang lại trải nghiệm triển khai và vận hành hiệu quả và đáng tin cậy. Việc sử dụng VxRail với SQL Server 2019 BDC giúp dễ dàng kết hợp dữ liệu quan hệ với dữ liệu lớn.  

Bài kiểm tra này chứng minh những lợi ích của việc sử dụng VxRail với SQL Server 2019 BDC cho việc phát triển ứng dụng phân tích. Điều này cũng chứng minh cách Docker, Kubernetes và trình điều khiển Giao diện Lưu trữ Container (CSI) vSphere đẩy nhanh vòng đời phát triển ứng dụng khi chúng được sử dụng với VxRail. Môi trường phòng thí nghiệm để phát triển và kiểm tra đã sử dụng bốn nút VxRail E560F được hỗ trợ bởi trình điều khiển vSphere CSI. Với giải pháp này, các nhà phát triển có thể cung cấp SQL Server BDC trong môi trường container mà không cần phải trải qua những phức tạp của các phương pháp truyền thống để cài đặt cơ sở dữ liệu và cung cấp lưu trữ.

Sách trắng của chúng tôi, Microsoft SQL Server 2019 Big Data Cluster trên Dell EMC VxRail, cho thấy sức mạnh của việc triển khai các công nghệ SQL Server 2019 BDC trên VxRail. Việc tích hợp SQL Server 2019 RDBMS, SQL Server BDC, MongoDB và Oracle RDBMS giúp tạo ra một ứng dụng phân tích dữ liệu thống nhất. Việc sử dụng VxRail giúp tăng cường khả năng mở rộng cụm lưu trữ và tính toán của SQL Server 2019, đồng thời tận dụng các kỹ thuật ảo hóa từ VMware. Giải pháp SQL Server 2019 BDC này cũng được hưởng lợi từ sự đơn giản của Dell EMC VxRail hoàn chỉnh nhưng linh hoạt, đã được xác thực với khả năng tích hợp quản lý và lưu trữ Kubernetes.

Giải pháp này chứng minh giá trị kết hợp của các công nghệ sau: 

  • VxRail E560F – Hiệu suất toàn flash
  • Các bảng lớn được lưu trữ trên cụm lưu trữ HDFS mở rộng được lưu trữ bởi BDC 
  • Các bảng dữ liệu liên quan nhỏ hơn được lưu trữ trên cơ sở dữ liệu SQL Server, MongoDB và Oracle 
  • Các truy vấn phân tán được hỗ trợ bởi khả năng PolyBase trong SQL Server 2019 để xử lý các truy vấn Transact-SQL truy cập dữ liệu bên ngoài trong SQL Server, Oracle, Teradata và MongoDB. 
  • Red Hat Enterprise Linux

 

Dịch vụ cụm dữ liệu lớn


Sơ đồ này cho thấy cách các nhóm được xây dựng. Sơ đồ cung cấp chi tiết về lợi ích của các tính năng Kubernetes cho việc điều phối container ở quy mô lớn, bao gồm:

  • Tự động mở rộng, sao chép và phục hồi các vùng chứa 
  • Giao tiếp nội bộ, chẳng hạn như chia sẻ IP 
  • Một thực thể duy nhất—một nhóm—để tạo và quản lý nhiều vùng chứa 
  • Một tác nhân phân tích hiệu suất và sử dụng tài nguyên container, cAdvisor 
  • Kiến trúc cắm mạng 
  • Cân bằng tải 
  • Dịch vụ kiểm tra sức khỏe

Sách trắng này, Microsoft SQL Server 2019 Big Data Cluster trên Dell EMC VxRail,  đề cập đến lưu trữ dữ liệu lớn, các công cụ xử lý dữ liệu lớn và chi tiết về thử nghiệm với TPC-H. Khi chúng tôi thử nghiệm ảo hóa dữ liệu với PolyBase, các truy vấn đã thành công, chạy không lỗi và trả về kết quả đã kết nối cả bốn nguồn dữ liệu.

Vì ảo hóa dữ liệu không liên quan đến việc sao chép và di chuyển dữ liệu vật lý (để dữ liệu có sẵn cho người dùng doanh nghiệp theo thời gian thực), BDC đơn giản hóa và tập trung hóa việc truy cập và phân tích phạm vi dữ liệu của tổ chức. Nó cho phép bộ phận CNTT quản lý giải pháp bằng cách hợp nhất dữ liệu lớn và ảo hóa dữ liệu trên một nền tảng với một bộ công cụ đã được chứng minh.

Thành công bắt đầu từ nền tảng đúng đắn:

SQL Server 2019 BDC là một giải pháp mới đầy hấp dẫn để tận dụng SQL Server nhằm kết hợp dữ liệu quan hệ giá trị cao và dữ liệu lớn dung lượng lớn trên một nền tảng dữ liệu thống nhất, có khả năng mở rộng. Tất cả những điều này có thể được triển khai với VxRail, cho phép doanh nghiệp trải nghiệm sức mạnh của PolyBase để ảo hóa kho dữ liệu, tạo hồ dữ liệu và tạo các kho dữ liệu nhỏ có khả năng mở rộng trong một môi trường thống nhất, an toàn mà không cần triển khai các quy trình Trích xuất, Chuyển đổi và Tải (ETL) chậm chạp và tốn kém. Điều này giúp các ứng dụng và phân tích dựa trên dữ liệu phản hồi nhanh hơn và hiệu quả hơn. SQL Server 2019 BDC và Dell EMC VxRail cung cấp một nền tảng dữ liệu thống nhất hoàn chỉnh để cung cấp các ứng dụng thông minh, giúp mọi tổ chức thành công hơn.

Đọc toàn bộ bài báo để tìm hiểu thêm về cách Dell EMC VxRail với SQL 2019 Big Data Clusters có thể:

  • Kết hợp dữ liệu quan hệ có giá trị cao và dữ liệu lớn có khối lượng lớn trên một nền tảng duy nhất, có khả năng mở rộng.
  • Kết hợp các tính năng thông minh và có được thông tin chi tiết từ nhiều dữ liệu hơn—bao gồm dữ liệu được lưu trữ ngoài SQL Server trong Hadoop, Oracle, Teradata và MongoDB.
  • Hỗ trợ và nâng cao khả năng quản lý cơ sở dữ liệu và ứng dụng dựa trên dữ liệu của bạn bằng công nghệ phân tích nâng cao sử dụng Hadoop và Spark.