Thiết kế được xác thực của Dell cho phân tích—Data Lakehouse (2)

Giải pháp xây dựng

Tổng quan về kiến ​​trúc

Thiết kế được xác thực của Dell dành cho phân tích – Data Lakehouse đã được phát triển để giải quyết nhu cầu của các tổ chức triển khai phân tích nâng cao. Nó kết hợp các khái niệm về kiến ​​trúc nhà hồ cùng với nền tảng container sử dụng tính toán và lưu trữ tách rời.

Tổng quan thiết kế

Kiến trúc được thiết kế để hỗ trợ các yêu cầu phân tích dữ liệu hiện đại. Nó cung cấp một nền tảng linh hoạt, có thể mở rộng cho nhiều khối lượng công việc phân tích và hỗ trợ việc sử dụng kiến ​​trúc Lakehouse. Hình dưới đây minh họa kiến ​​trúc nền tảng tổng thể của Lakehouse.

Hình 1. Kiến trúc nền tảng Lakehouse
Sơ đồ kiến ​​trúc data lakehouse
Cơ sở hạ tầng Dell
Lớp cơ sở hạ tầng cung cấp tài nguyên mạng, lưu trữ và điện toán cốt lõi cho nền tảng. Để biết chi tiết về cơ sở hạ tầng được đề xuất, hãy xem Cơ sở hạ tầng của Dell. Để biết thêm hướng dẫn định cỡ và chia tỷ lệ, hãy xem Giải pháp định cỡ.
Mặt phẳng điều khiển
Mặt phẳng điều khiển là tập hợp các thành phần cung cấp khả năng quản trị nền tảng, quản lý vận hành và điều phối ứng dụng. Nền tảng Symcloud cung cấp mặt phẳng điều khiển.
Thời gian chạy nền tảng

Được quản lý bởi mặt phẳng điều khiển, các thành phần thời gian chạy nền tảng trừu tượng hóa các chi tiết cơ sở hạ tầng, hiển thị chúng dưới dạng một nhóm tài nguyên điện toán, lưu trữ và truyền thông. Để biết chi tiết về cả mặt phẳng điều khiển và các thành phần thời gian chạy nền tảng, hãy xem phần Triển khai nền tảng Container.

Ứng dụng và khối lượng công việc
Ứng dụng và khối lượng công việc là các thành phần cung cấp chức năng phân tích dữ liệu do khách hàng chỉ định. Các ứng dụng này chủ yếu được đóng gói trong vùng chứa và sử dụng định dạng hình ảnh Sáng kiến ​​Vùng chứa Mở (OCI) tiêu chuẩn ngành . Các ứng dụng có thể được đóng gói thành các gói ứng dụng bao gồm thông tin triển khai và điều phối thời gian chạy. Để biết chi tiết về các ứng dụng cốt lõi được sử dụng cho kiến ​​trúc nhà hồ, hãy xem Thiết kế khối lượng công việc. Bạn có thể tìm thấy hướng dẫn thiết kế cho các giải pháp khác chạy trên nền tảng này trên Dell Info Hub dành cho phân tích dữ liệu .

Tính năng nền tảng

Kiến trúc cung cấp khả năng mở rộng tính toán, lưu trữ và kết nối mạng ở lớp cơ sở hạ tầng, khả năng mở rộng của mặt phẳng điều khiển và các lớp thời gian chạy cũng như khả năng mở rộng của khối lượng công việc ứng dụng. Bộ lưu trữ và điện toán được tách rời để hỗ trợ mở rộng quy mô độc lập tùy thuộc vào yêu cầu ứng dụng và quy mô lớp mạng theo sự phát triển của cơ sở hạ tầng.

Kiến trúc cung cấp sự linh hoạt để chạy nhiều khối lượng công việc trên một nền tảng duy nhất với khả năng quản lý tài nguyên và quản lý vận hành. Khối lượng công việc có thể là các ứng dụng gốc trên đám mây được đóng gói hoặc có thể chạy trên máy ảo. Người dùng có thể được tổ chức thành đối tượng thuê và quyền cũng như phân bổ tài nguyên có thể được kiểm soát ở cấp độ người dùng và đối tượng thuê.

Kiến trúc cũng triển khai các tính năng có tính sẵn sàng cao ở mọi cấp độ. Mạng dự phòng được sử dụng cho nền tảng cốt lõi, Bộ lưu trữ đám mây đàn hồi ( ECS ) và bộ lưu trữ PowerScale . Nền tảng container triển khai Tính sẵn sàng cao (HA) thông qua tính năng dự phòng cho các thành phần cốt lõi. Nó hỗ trợ sao chép tự động cho khối lượng công việc gốc trên đám mây và cung cấp khả năng sao lưu, chụp nhanh và khôi phục ứng dụng.

Nhìn chung, kiến ​​trúc cho phép phân tích dữ liệu trên dữ liệu có cấu trúc, bán cấu trúc và không cấu trúc trên một nền tảng duy nhất. Nó cung cấp cho các nhà phát triển, nhà khoa học dữ liệu và kỹ sư dữ liệu một giao diện duy nhất để triển khai các quy trình phân tích nâng cao. Nó cung cấp cho quản trị viên một nền tảng cấp sản xuất dựa trên hệ sinh thái Kubernetes tiêu chuẩn trên thực tế .

Cơ sở hạ tầng Dell

Tổng quan về cơ sở hạ tầng

Cơ sở hạ tầng của Dell cung cấp tài nguyên điện toán, bộ nhớ, lưu trữ và mạng cho nền tảng. Nền tảng Lakehouse trên cơ sở hạ tầng của Dell minh họa các thành phần cơ sở hạ tầng cần thiết và vai trò của chúng trong cụm.

Hình 2. Nền tảng Lakehouse trên cơ sở hạ tầng của Dell
Nền tảng Lakehouse trên đồ họa cơ sở hạ tầng Dell
Nút điều khiển
Các nút điều khiển hỗ trợ các dịch vụ nền tảng cốt lõi được xác định trong vai trò Trình quản lý nền tảng Symcloud .
Nút công nhân
Các nút công nhân hỗ trợ các dịch vụ thời gian chạy nền tảng và khối lượng công việc của khách hàng. Các dịch vụ thời gian chạy được xác định trong vai trò Lưu trữ và Điện toán của Nền tảng Symcloud , trong khi việc triển khai của người dùng xác định khối lượng công việc. Các nút được hỗ trợ bao gồm các nút tăng tốc tiêu chuẩn và điện toán.
Cơ sở hạ tầng lưu trữ
Cơ sở hạ tầng lưu trữ cung cấp lớp lưu trữ Lakehouse. Cấu hình PowerScale và ECS được cung cấp. Bạn có thể sử dụng một hoặc cả hai.
Cơ sở hạ tầng mạng
Cơ sở hạ tầng mạng cung cấp kết nối cần thiết giữa máy chủ, cơ sở hạ tầng lưu trữ và mạng tại chỗ.

Kiến trúc linh hoạt và hỗ trợ nhiều cấu hình cơ sở hạ tầng. Dell Technologies khuyến nghị các cấu hình sau cho môi trường Lakehouse đa năng chạy khối lượng công việc phân tích. Cấu hình nút riêng lẻ bao gồm hướng dẫn dành riêng cho nút. Hướng dẫn thêm về định cỡ và chia tỷ lệ ở cấp độ cụm được cung cấp trong Giải pháp định cỡ. Hướng dẫn thiết kế cho các giải pháp riêng lẻ trên nền tảng có thể bao gồm các đề xuất cụ thể hơn cho các giải pháp đó.

Cơ sở hạ tầng máy chủ

Cơ sở hạ tầng máy chủ cung cấp khả năng tính toán, bộ nhớ và một số tài nguyên lưu trữ cần thiết để chạy khối lượng công việc của khách hàng. Có thể có nhiều cấu hình máy chủ PowerEdge . Các đề xuất ở đây hỗ trợ nhiều loại khối lượng công việc điển hình khi triển khai kiến ​​trúc nhà hồ.

Nút mặt phẳng điều khiển Lakehouse

Các nút mặt phẳng điều khiển Lakehouse hỗ trợ các dịch vụ nền tảng cốt lõi được xác định trong vai trò Trình quản lý nền tảng Symcloud . Dell khuyến nghị cấu hình trong cấu hình nút mặt phẳng điều khiển Lakehouse làm điểm khởi đầu cho các nút này.

Bảng 2. Cấu hình nút mặt phẳng điều khiển Lakehouse
Chức năng máy Thành phần
Nền tảng Máy chủ PowerEdge R660
khung gầm Khung máy 2,5 inch với tối đa 10 ổ cứng (SAS hoặc SATA), hai khe cắm CPU và PERC 12
Cấu hình khung gầm Cấu hình Riser 2, ba khe cắm 16 kênh, cấu hình thấp (hai Gen5 và một Gen4)
Nguồn cấp Ổ cắm nóng kép, khả năng chịu lỗi (1+1), chế độ hỗn hợp 1100 W (100-240 Vac), Titanium, bộ nguồn luồng khí thông thường (NAF)
Bộ xử lý Intel Xeon Gold 6426Y 2,5 G, 16 C/32 T, 16 GT/s, bộ đệm 38 M, turbo, HT (185 W) DDR5-4800
Dung lượng bộ nhớ 128 GB (tám RDIMM 16 GB, 3200 MT/s, xếp hạng kép)
Bộ điều khiển lưu trữ RAID nội bộ Dell PERC H965i có khung tải phía sau
Đĩa—SSD Hai ổ cắm nóng 1,6 TB 2,5 in, SAS, sử dụng hỗn hợp, lên đến 24 Gbps 512e Tiêu chuẩn xử lý thông tin liên bang (FIPS), ba ổ SSD ghi mỗi ngày ( DWPD )
Bộ điều khiển giao diện mạng Bộ chuyển đổi NVIDIA ConnectX-6 Lx cổng kép 10/25 GbE SFP28, cấu hình thấp PCIe

Dell Technologies đề xuất bố cục ổ đĩa và phân vùng cho bộ máy này được liệt kê trong các khối nút mặt phẳng điều khiển Lakehouse và các phân vùng nút mặt phẳng điều khiển Lakehouse .

Bảng 3. Khối lượng nút mặt phẳng điều khiển Lakehouse
Cách sử dụng Loại âm lượng Đĩa vật lý ID tập
Hệ điều hành và nền tảng Symcloud đột kích 1 Hai ổ SSD SAS 1,6 TB 0
Bảng 4. Phân vùng nút mặt phẳng điều khiển Lakehouse
Điểm gắn kết Kích cỡ Loại hệ thống tập tin ID tập Loại phân vùng Sự miêu tả
/khởi động 1024 MB XFS 0 Sơ đẳng Phân vùng này chứa các tệp khởi động BIOS phải nằm trong phạm vi 2 GB đầu tiên của đĩa.
/khởi động/efi 650 MB VFAT 0 Mở rộng Phân vùng này chứa các tệp khởi động EFI.
/ 200GB XFS 0 LVM Phân vùng này chứa hệ thống tập tin gốc.
/var 60 GB XFS 0 LVM Phân vùng này chứa dữ liệu có thể thay đổi như tệp nhật ký hệ thống, cơ sở dữ liệu, thư mục bộ đệm thư và máy in, tệp tạm thời và tệp tạm thời.
/var/lib/docker 400GB XFS 0 LVM Phân vùng này chứa các hình ảnh chứa.
/trang chủ 300GB XFS 0 LVM Phân vùng này chứa các thư mục chính của người dùng.
/home/robinds 40GB XFS 0 LVM Phân vùng này chứa thư mục chính của Symworld .
/home/robinds/var/lib/pgsql 80GB XFS 0 LVM Phân vùng này chứa cơ sở dữ liệu PostgreSQL mà Symworld sử dụng.
/home/robinds/var/log 60 GB XFS 0 LVM Phân vùng này chứa các tệp nhật ký Symworld .
/home/robinds/var/crash 100GB XFS 0 LVM Phân vùng này chứa các tập tin lỗi Symworld .

Cần có ba nút mặt phẳng điều khiển cho các cụm sản xuất để cung cấp tính sẵn sàng cao cho mặt phẳng điều khiển. Để thử nghiệm thí điểm, các dịch vụ mặt phẳng điều khiển được xác định trong vai trò Trình quản lý nền tảng Symcloud có thể được chỉ định cho các nút công nhân thay vì sử dụng các nút mặt phẳng điều khiển chuyên dụng .

Bộ nhớ, bộ lưu trữ và bộ xử lý đã được điều chỉnh kích thước để hỗ trợ tất cả các dịch vụ cần thiết trong quá trình triển khai sản xuất.

Cấu hình bao gồm hai cổng mạng để hỗ trợ kết nối mạng có tính sẵn sàng cao (HA). Các cổng này có thể từ một card mạng đơn, hoặc một cặp card mạng dành cho adapter cấp HA bổ sung.

Hai SDD trong cấu hình RAID 1 được sử dụng cho ổ đĩa hệ điều hành. Các thư mục chính được phân bổ trong một phân vùng nhỏ riêng biệt vì các tệp người dùng không được lưu trữ trên các nút cơ sở hạ tầng. Hầu hết dung lượng lưu trữ được phân bổ cho phân vùng /var cho các tệp thời gian chạy.

Bạn có thể sử dụng LVM để điều chỉnh việc phân bổ bộ nhớ giữa //homevà /varcho các nhu cầu cụ thể.

Nút công nhân Lakehouse đa năng

Các nút công nhân Lakehouse hỗ trợ các dịch vụ thời gian chạy nền tảng và khối lượng công việc của khách hàng. Các dịch vụ thời gian chạy được xác định trong vai trò Lưu trữ và Điện toán của Nền tảng Symcloud . Việc triển khai của người dùng xác định khối lượng công việc. Dell Technologies khuyến nghị cấu hình trong cấu hình nút công nhân Lakehouse đa năng làm điểm khởi đầu cho khối lượng công việc đa năng.

Bảng 5. Cấu hình nút công nhân Lakehouse đa năng
Chức năng máy Thành phần
Nền tảng Máy chủ PowerEdge R660
khung gầm Khung máy 2,5 inch với tối đa tám ổ cứng SAS hoặc SATA, ba khe cắm PCIe và hai CPU
Cấu hình khung gầm Cấu hình Riser 2, ba khe cắm 16 kênh cấu hình thấp, (hai Gen5 và một (Gen4)
Nguồn cấp Ổ cắm nóng kép, dự phòng hoàn toàn (1+1), 2400 W, nguồn điện chế độ hỗn hợp
Bộ xử lý Intel Xeon Gold kép 6438Y 2 G, 32 C/64 T, 16 GT/s, 60 M Cache, turbo, HT (205 W) DDR5-4800
Dung lượng bộ nhớ 512 GB (mười sáu RDIMM 32 GB, 4800 MT/s, xếp hạng kép)
Bộ điều khiển lưu trữ RAID nội bộ Dell PERC HBA355i có khung tải phía sau
Đĩa—SSD Sáu ổ cắm nóng 3,84 TB, SAS, sử dụng hỗn hợp, lên đến 24 Gbps, 512 2,5 in, Ổ đĩa tự mã hóa (SED) Tiêu chuẩn xử lý thông tin liên bang (FIPS)
Khởi động thẻ lưu trữ được tối ưu hóa Card điều khiển BOSS-N1 + kèm 2 ổ SSD M.2 960 GB (RAID 1)
Bộ điều khiển giao diện mạng Bộ chuyển đổi NVIDIA ConnectX-6 Lx cổng kép 10/25 GbE SFP28, cấu hình thấp PCIe

Dell Technologies đề xuất bố cục ổ đĩa và phân vùng cho bộ máy này được liệt kê trong các khối lượng nút công nhân hồ đa năng và phân vùng nút công nhân hồ đa năng .

Bảng 6. Khối lượng nút công nhân Lakehouse đa năng
Cách sử dụng Loại âm lượng Đĩa vật lý ID tập
Hệ điều hành đột kích 1 Hai ổ SSD M.2 960 GB 0
Lưu trữ Symcloud Không có cuộc đột kích Sáu ổ SSD SAS 3,84 TB 1-6
Bảng 7. Phân vùng nút công nhân Lakehouse đa năng
Điểm gắn kết Kích cỡ Loại hệ thống tập tin ID tập Loại phân vùng Sự miêu tả
/khởi động 1024 MB XFS 0 Sơ đẳng Phân vùng này chứa các tệp khởi động BIOS phải nằm trong phạm vi 2 GB đầu tiên của đĩa.
/khởi động/efi 650 MB VFAT 0 Mở rộng Phân vùng chứa các tệp khởi động EFI.
/ Khoảng 100 GB XFS 0 LVM Phân vùng này chứa hệ thống tập tin gốc.
/trang chủ 400GB XFS 0 LVM Phân vùng này chứa các thư mục chính của người dùng.
/var 400GB XFS 0 LVM Phân vùng này chứa dữ liệu có thể thay đổi như tệp nhật ký hệ thống, cơ sở dữ liệu, thư mục bộ đệm thư và máy in, tệp tạm thời và tệp tạm thời.
Không có Sáu 3,84 TB Lưu trữ Symcloud 1-6 Phân vùng thô Symcloud Storage quản lý các phân vùng này.

Dell Technologies đề xuất bốn nút công nhân để triển khai ở mức tối thiểu.

Cấu hình bao gồm hai cổng mạng để hỗ trợ kết nối mạng có tính sẵn sàng cao (HA). Các cổng này có thể từ một card mạng đơn, hoặc một cặp card mạng dành cho adapter cấp HA bổ sung.

Hai ổ SSD M.2 960 GB ở cấu hình RAID 1 được sử dụng cho ổ đĩa hệ điều hành. Các thư mục chính được phân bổ trong một phân vùng nhỏ riêng biệt do các tệp người dùng không được lưu trữ ở cấp hệ điều hành trên các nút sản xuất. Hầu hết dung lượng lưu trữ được phân bổ cho phân vùng /var cho các tệp thời gian chạy. Bạn có thể sử dụng LVM để điều chỉnh việc phân bổ bộ nhớ giữa //homevà /varcho các nhu cầu cụ thể.

Sáu ổ SSD được Symcloud Storage phân bổ để sử dụng . Các dịch vụ hỗ trợ lưu trữ này được triển khai với vai trò Lưu trữ Symcloud . Bộ lưu trữ này tiếp xúc với khối lượng công việc chạy trên cụm thông qua giao diện Kubernetes CSI. Cấu hình được đề xuất cung cấp khoảng 23 TB dung lượng lưu trữ cho mỗi nút. Dung lượng này đủ để lưu trữ thời gian chạy thông thường trong môi trường Lakehouse, nơi phần lớn dữ liệu được lưu trữ trên bộ nhớ ngoài. Bộ lưu trữ bên ngoài có thể là HDFS do PowerScale cung cấp hoặc bộ lưu trữ đối tượng do ECS cung cấp . Nếu cần thêm bộ nhớ cục bộ, có thể thêm tối đa hai ổ SSD nữa và có thể tăng kích thước ổ đĩa.

Bộ nhớ đã được điều chỉnh kích thước để hỗ trợ tất cả các dịch vụ cần thiết khi triển khai sản xuất với đủ khoảng trống cho khối lượng công việc của người dùng. Thay đổi phổ biến nhất là tăng kích thước bộ nhớ để hỗ trợ nhiều bộ chứa hơn hoặc khối lượng công việc cần nhiều bộ nhớ hơn.

Các bộ xử lý đã được chọn để hỗ trợ tính toán khối lượng công việc AI và ML chuyên sâu, đồng thời bao gồm các đơn vị Phần mở rộng Vector nâng cao (AVX) kép của Intel để có tốc độ tính toán tối đa. Có thể lựa chọn bộ xử lý khác nhưng phải lưu ý đến yêu cầu về bộ nhớ và mức tiêu thụ điện năng tổng thể.

Nút công nhân Lakehouse được tăng tốc GPU

Các nút công nhân Lakehouse được tăng tốc GPU hỗ trợ các dịch vụ thời gian chạy nền tảng và khối lượng công việc của khách hàng được hưởng lợi từ khả năng tăng tốc GPU. Vai trò Điện toán và Lưu trữ của Nền tảng Symcloud xác định các dịch vụ thời gian chạy, trong khi việc triển khai của người dùng xác định khối lượng công việc. Dell Technologies khuyến nghị cấu hình trong cấu hình nút nhân viên Lakehouse được tăng tốc GPU làm điểm khởi đầu cho khối lượng công việc được GPU tăng tốc.

Bảng 8. Cấu hình nút nhân viên Lakehouse được tăng tốc GPU
Chức năng máy Thành phần
Nền tảng Máy chủ PowerEdge R760
khung gầm Khung máy 2,5 inch với tối đa 16 ổ đĩa SAS hoặc SATA, Smart Flow, PERC 12 phía trước, hai CPU
Cấu hình khung gầm Cấu hình Riser 5, chiều dài đầy đủ, với hai khe 16 kênh có chiều cao đầy đủ (Gen4), hai khe 16 kênh cấu hình thấp (Gen4), một khe 16 kênh có chiều cao đầy đủ (Gen5) và một khe chiều cao đầy đủ , khe cắm rộng gấp đôi, 16 kênh, hỗ trợ GPU (Gen5)
Nguồn cấp Bộ nguồn kép, cắm nóng, dự phòng 2400 W, cấu hình D, bộ nguồn chế độ hỗn hợp
Bộ xử lý Intel Xeon Gold 6438Y 2 G, 32 C/64 T, 16 GT/s, bộ đệm 60 M, turbo, HT (205 W) DDR5-4800
Dung lượng bộ nhớ 512 GB (mười sáu RDIMM 32 GB, 3200 MT/s, xếp hạng kép)
Bộ điều khiển lưu trữ RAID nội bộ Dell PERC H965i có khung tải phía sau
Đĩa—SSD Sáu ổ cắm nóng 3,84 TB, SAS, sử dụng hỗn hợp, lên đến 24 Gbps, 512e 2,5 in, Ổ đĩa tự mã hóa (SED) Tiêu chuẩn xử lý thông tin liên bang (FIPS)
Khởi động thẻ lưu trữ được tối ưu hóa Card điều khiển BOSS-N1 + kèm 2 ổ SSD M.2 960 GB (RAID 1)
Bộ điều khiển giao diện mạng Bộ chuyển đổi NVIDIA ConnectX-6 Lx cổng kép 10/25 GbE SFP28, cấu hình thấp PCIe
GPU, FPGA hoặc thẻ tăng tốc NVIDIA Ampere A30 , PCIe, 165 W, 24 GB thụ động, GPU có chiều cao tối đa, rộng gấp đôi và có cáp

Dell Technologies đề xuất bố cục ổ đĩa và phân vùng cho nhóm máy này được liệt kê trong các khối nút công nhân Lakehouse được tăng tốc GPU và các phân vùng nút Lakehouse Worker được tăng tốc GPU .

Bảng 9. Khối lượng nút công nhân Lakehouse được tăng tốc GPU
Cách sử dụng Loại âm lượng Đĩa vật lý ID tập
Hệ điều hành đột kích 1 Hai ổ SSD 960 GB 0
Lưu trữ Symcloud Không có cuộc đột kích Sáu ổ SSD SAS 3,84 TB 1-6
Bảng 10. Phân vùng nút nhân viên Lakehouse được tăng tốc GPU
Điểm gắn kết Kích cỡ Loại hệ thống tập tin ID tập Loại phân vùng Sự miêu tả
/khởi động 1024 MB XFS 0 Sơ đẳng Phân vùng này chứa các tệp khởi động BIOS phải nằm trong phạm vi 2 GB đầu tiên của đĩa.
/khởi động/efi 650 MB VFAT 0 Mở rộng Phân vùng chứa các tệp khởi động EFI.
/ Khoảng 100 GB XFS 0 LVM Phân vùng này chứa hệ thống tập tin gốc.
/trang chủ 300GB XFS 0 LVM Phân vùng này chứa các thư mục chính của người dùng.
/var 400GB XFS 0 LVM Phân vùng này chứa dữ liệu có thể thay đổi như tệp nhật ký hệ thống, cơ sở dữ liệu, thư mục bộ đệm thư và máy in, tệp tạm thời và tệp tạm thời.
Không có Sáu 3,84 TB Lưu trữ Symcloud 1-6 Phân vùng thô Symcloud Storage quản lý các phân vùng này.

Các nút công việc được tăng tốc GPU có các khả năng tương tự như các nút công việc có mục đích chung , đồng thời bổ sung khả năng tăng tốc GPU. Dell Technologies đề xuất bốn nút công nhân để triển khai ở mức tối thiểu. Bạn có thể sử dụng bất kỳ sự kết hợp nào giữa các nút mục đích chung và các nút được tăng tốc GPU.

Cấu hình bao gồm hai cổng mạng để hỗ trợ kết nối mạng có tính sẵn sàng cao (HA). Các cổng này có thể từ một card mạng đơn, hoặc một cặp card mạng dành cho adapter cấp HA bổ sung.

Hai ổ SSD M.2 960 GB ở cấu hình RAID 1 được sử dụng cho ổ đĩa hệ điều hành. Các thư mục chính được phân bổ trong một phân vùng nhỏ riêng biệt do các tệp người dùng không được lưu trữ ở cấp hệ điều hành trên các nút sản xuất. Hầu hết dung lượng lưu trữ được phân bổ vào /varphân vùng dành cho các tệp thời gian chạy. Bạn có thể sử dụng LVM để điều chỉnh việc phân bổ bộ nhớ giữa //homevà /varcho các nhu cầu cụ thể.

Sáu ổ SSD được Symcloud Storage phân bổ để sử dụng . Các dịch vụ hỗ trợ lưu trữ này được triển khai với vai trò Lưu trữ Symcloud . Bộ lưu trữ này tiếp xúc với khối lượng công việc chạy trên cụm thông qua giao diện Kubernetes CSI. Cấu hình được đề xuất cung cấp khoảng 23 TB dung lượng lưu trữ cho mỗi nút. Dung lượng này đủ để lưu trữ thời gian chạy thông thường trong môi trường Lakehouse, nơi phần lớn dữ liệu được lưu trữ trên bộ nhớ ngoài. Bộ lưu trữ bên ngoài có thể là HDFS do PowerScale cung cấp hoặc bộ lưu trữ đối tượng do ECS cung cấp . Nếu cần thêm bộ nhớ cục bộ, có thể thêm tối đa 10 ổ SSD nữa và có thể tăng kích thước ổ đĩa.

Bộ nhớ đã được điều chỉnh kích thước để hỗ trợ tất cả các dịch vụ cần thiết khi triển khai sản xuất với đủ khoảng trống cho khối lượng công việc của người dùng. Thay đổi phổ biến nhất là tăng kích thước bộ nhớ để hỗ trợ nhiều bộ chứa hơn hoặc khối lượng công việc cần nhiều bộ nhớ hơn.

Các bộ xử lý đã được chọn để hỗ trợ tính toán khối lượng công việc AI và ML chuyên sâu, đồng thời bao gồm các đơn vị Phần mở rộng Vector nâng cao (AVX) kép của Intel để có tốc độ tính toán tối đa. Có thể lựa chọn bộ xử lý khác nhưng phải lưu ý đến yêu cầu về bộ nhớ và mức tiêu thụ điện năng tổng thể.

GPU đã được chọn để hỗ trợ tăng tốc Spark cho các hoạt động SQL và khung dữ liệu bằng cách sử dụng Bộ tăng tốc NVIDIA RAPIDS cho Apache Spark . Những hoạt động khối lượng công việc này là điển hình trong môi trường nhà hồ. Một hoặc hai GPU có thể được sử dụng trong cấu hình này. Khối lượng công việc AI và ML có thể được hưởng lợi từ các mô hình GPU thay thế.

Cơ sở hạ tầng lưu trữ

Bộ lưu trữ Lakehouse có thể sử dụng PowerScale với giao thức HDFS hoặc ECS để lưu trữ đối tượng. Bạn có thể sử dụng một hoặc cả hai hệ thống tùy thuộc vào yêu cầu khối lượng công việc. Bộ nhớ trong của máy chủ cung cấp bộ nhớ trong thời gian chạy mà các ứng dụng yêu cầu. Phần mềm Symcloud Storage quản lý bộ nhớ thời gian chạy.

ECS và PowerScale được triển khai dưới dạng hệ thống cấp cụm. Các đề xuất về nút ở đây có thể được sử dụng làm hướng dẫn cho các cụm mới, xác minh tính tương thích với các cụm hiện có hoặc mở rộng các cụm hiện có.

Cơ sở hạ tầng PowerScale

Dell Technologies khuyến nghị cấu hình trong cấu hình PowerScale để lưu trữ theo cụm sử dụng PowerScale cho bộ lưu trữ hồ chính của họ bằng HDFS.

Bảng 11. Cấu hình PowerScale
Chức năng máy Thành phần
Người mẫu PowerScale H7000 (hỗn hợp)
khung gầm Nút 4U
Các nút trên mỗi khung bốn
Lưu trữ nút Hai mươi ổ cứng SATA 12 TB 3,5 inch 4 kn
Bộ đệm nút Hai ổ SSD 3,2 TB
Công suất sử dụng trên mỗi khung 600 TB
Mạng mặt trước Hai 25 GbE (SFP28)
Mạng cơ sở hạ tầng (back-end) Hai InfiniBand QDR hoặc hai 40 GbE (QSFP+)
Hệ điều hành OneFS 9.4.0.12

Cấu hình được đề xuất có kích thước phù hợp cho mục đích sử dụng thông thường làm bộ lưu trữ HDFS ở hồ.

Hai cổng mạng Ethernet trên mỗi nút được bao gồm để kết nối với mạng dữ liệu Cụm hoặc mạng lưu trữ PowerScale . Hai cổng mạng bổ sung được bao gồm để kết nối với mạng phụ trợ PowerScale . Các cổng bổ sung này có thể là InfiniBand QDR hoặc 40 GbE, tùy thuộc vào tùy chọn tại chỗ.

Một khung PowerScale H7000 hỗ trợ bốn nút PowerScale H7000 . Cấu hình này cung cấp khoảng 720 TB dung lượng lưu trữ có thể sử dụng. Với mức sử dụng 85%, dung lượng lưu trữ HDFS 600 TB là tiêu chuẩn phù hợp cho dung lượng lưu trữ sẵn có trên mỗi khung máy.

Cấu hình này giả định rằng các nút PowerScale chủ yếu được sử dụng để lưu trữ HDFS. Nếu các nút PowerScale được sử dụng cho các ứng dụng hoặc cụm lưu trữ khác, bạn phải tính đến nó trong kích thước cụm tổng thể. Bạn cũng có thể sử dụng các cấu hình ổ PowerScale H7000 khác .

Nút ECS

Dell Technologies khuyến nghị các cấu hình trong cấu hình nút ECS EX500 hoặc cấu hình nút ECS EXF900 để lưu trữ trong các cụm sử dụng ECS ​​cho bộ lưu trữ hồ chính của họ bằng s3a://giao thức.

Bảng 12. Cấu hình nút ECS EX500
Chức năng máy Thành phần
Người mẫu ECS EX500
khung gầm Nút 2U
Nút trên mỗi giá 16
Lưu trữ nút SSD 960GB
Bộ đệm nút không áp dụng
Công suất sử dụng trên mỗi khung Ít hơn 384 TB một chút
Mạng mặt trước Hai 25 GbE (SFP28)
Mạng cơ sở hạ tầng (back-end) Hai 25 GbE (SFP28)

Cấu hình ECS EX500 mang lại sự cân bằng tốt về mật độ lưu trữ và hiệu suất cho việc sử dụng nhà hồ.

Hai cổng mạng Ethernet trên mỗi nút được bao gồm để kết nối với mạng dữ liệu Cụm hoặc mạng lưu trữ ECS . Hai cổng mạng bổ sung được bao gồm để kết nối với mạng phụ trợ ECS .

Bảng 13. Cấu hình nút ECS EXF900
Chức năng máy Thành phần
Người mẫu ECS EXF900
khung gầm Nút 2U
Nút trên mỗi giá 16
Lưu trữ nút 184 TB (hai mươi bốn ổ NVMe 7,68 TB)
Bộ đệm nút không áp dụng
Công suất sử dụng trên mỗi khung Ít hơn 184 TB một chút
Mạng mặt trước Hai 25 GbE (SFP28)
Mạng cơ sở hạ tầng (back-end) Hai 25 GbE (SFP28)

Cấu hình ECS EXF900 là cấu hình hoàn toàn flash và mang lại hiệu suất cao nhất cho việc sử dụng nhà hồ.

Hai cổng mạng Ethernet trên mỗi nút được bao gồm để kết nối với mạng dữ liệu Cụm hoặc mạng lưu trữ ECS . Hai cổng mạng bổ sung được bao gồm để kết nối với mạng phụ trợ ECS .

Lưu trữ máy chủ

Các nút công nhân bao gồm bộ lưu trữ SSD cục bộ để sử dụng làm bộ lưu trữ thời gian chạy cho khối lượng công việc. Bộ lưu trữ này được hiển thị cho các nhóm chạy trên cụm thông qua giao diện Kubernetes CSI. Khối lượng liên tục và phù du được hỗ trợ. Symcloud Storage quản lý các thiết bị lưu trữ này thông qua vai trò Symcloud Storage .

Bộ lưu trữ Symcloud và trình điều khiển CSI liên quan hỗ trợ các tính năng nâng cao bao gồm:

  • Sao chép để đảm bảo tính sẵn có của dữ liệu
  • Mã hóa để bảo mật dữ liệu
  • Nén và cung cấp mỏng để lưu trữ hiệu quả
  • Ảnh chụp nhanh
  • Sao lưu và phục hồi

Lớp lưu trữ Kubernetes xác định một số tính năng này, trong khi những tính năng khác có thể truy cập được thông qua giao diện quản lý Symcloud . Bạn có thể tìm thêm thông tin chi tiết về các khả năng của Bộ lưu trữ Symcloud trong tài liệu Symcloud , Tổng quan về bộ nhớ gốc của Robin Cloud .

Cấu hình được đề xuất cung cấp khoảng 23 TB dung lượng lưu trữ cho mỗi nút. Dung lượng này đủ để lưu trữ thời gian chạy thông thường trong môi trường Lakehouse, nơi phần lớn dữ liệu nằm trên bộ nhớ ngoài. Có thể có các cấu hình thay thế, bao gồm các nút lưu trữ chuyên dụng. Một số khối lượng công việc phân tích, như cơ sở dữ liệu, có thể yêu cầu bộ nhớ bổ sung cho dữ liệu liên tục bên ngoài bộ lưu trữ hồ.

Cơ sở hạ tầng mạng

Mạng được thiết kế để đáp ứng nhu cầu về một cụm có hiệu suất cao và có thể mở rộng, đồng thời cung cấp khả năng dự phòng và quyền truy cập vào các khả năng quản lý. Kiến trúc là mô hình lá và cột sống dựa trên công nghệ mạng Ethernet. Nó sử dụng công tắc PowerSwitch S5248F-ON cho các lá và công tắc PowerSwitch Z9432F-ON cho cột sống.

Mạng vật lý trong kiến ​​trúc này rất đơn giản vì hầu hết các khả năng nâng cao của hệ thống đều được triển khai bằng cách sử dụng mạng được xác định bằng phần mềm. Mạng logic được mô tả trong phần triển khai nền tảng Container. Kiến trúc này có ba mạng vật lý, như được hiển thị trong Cơ sở hạ tầng mạng vật lý .

Mạng iDRAC (hoặc BMC)
Mạng iDRAC (hoặc BMC) là mạng được bảo mật và cách ly để quản lý phần cứng máy chủ và chuyển mạch, bao gồm quyền truy cập vào mô- đun iDRAC9 và Serial-over-LAN. Mạng này tùy chọn kết nối với quản lý mạng công ty cho phép truy cập trực tiếp hơn vào cơ sở hạ tầng phần cứng. Mỗi nút trên mạng này được gán một địa chỉ IP riêng từ không gian địa chỉ quản lý.
Mạng dữ liệu cụm
Mạng dữ liệu Cụm là mạng chính để liên lạc nội bộ giữa tất cả các nút máy chủ và lưu trữ. Mỗi nút máy chủ trên mạng này được gán một địa chỉ IP duy nhất trên mạng này.
Mạng trung tâm dữ liệu lõi
Mạng trung tâm dữ liệu lõi là mạng doanh nghiệp hiện có. Mạng dữ liệu Cụm được giao tiếp với mạng này thông qua chuyển mạch và định tuyến cho phép các dịch vụ cụm được hiển thị cho người dùng hệ thống.
Hình 3. Cơ sở hạ tầng mạng vật lý
Đồ họa cơ sở hạ tầng mạng vật lý Lakehouse

Cấu trúc mạng quản lý

Mạng quản lý sử dụng bộ chuyển đổi PowerSwitch S3148 1 GbE để kết nối iDRAC và quản lý khung gầm.

Cấu trúc mạng dữ liệu cụm

Mạng dữ liệu Cụm sử dụng kết cấu không chặn, đàn hồi, có thể mở rộng với thiết kế hình lá như được minh họa trong Kết nối mạng dữ liệu Cụm . Mỗi nút trên mạng này được kết nối với hai thiết bị chuyển mạch lá S5248F-ON với giao diện mạng 25 GbE. Các switch chạy Dell SmartFabric OS10 . SmartFabric OS10 cho phép phân chia nhiều lớp các chức năng mạng được phân lớp trên hệ điều hành dựa trên Linux nguồn mở.

Về phía máy chủ, hai kết nối mạng được liên kết và được gán một địa chỉ IP duy nhất.

Về phía switch, thiết kế mạng sử dụng kết nối Virtual Link Trunking (VLT) giữa hai switch lá.

Công nghệ VLT cho phép máy chủ liên kết nhiều đường trục vật lý vào nhiều bộ chuyển mạch S5248F-ON bằng cách xử lý các đường lên như một đường trục logic. Trong môi trường VLT, cặp switch được kết nối hoạt động như một switch duy nhất đến máy chủ kết nối trong khi tất cả các đường dẫn đều hoạt động. Có thể đạt được thông lượng cao trong khi vẫn cung cấp khả năng phục hồi trước các lỗi phần cứng. VLT thay thế các mạng dựa trên Giao thức cây kéo dài (STP), cung cấp cả khả năng dự phòng và sử dụng toàn bộ băng thông bằng nhiều đường dẫn hoạt động.

Cấu hình VLT trong thiết kế này sử dụng bốn cổng 100 GbE giữa mỗi bộ chuyển mạch Top of Rack (ToR). 100 cổng GbE còn lại có thể được sử dụng để kết nối tốc độ cao với các thiết bị chuyển mạch cột sống hoặc trực tiếp tới cơ sở hạ tầng mạng lõi của trung tâm dữ liệu.

Hình 4. Kết nối mạng dữ liệu cụm
Đồ họa kết nối mạng dữ liệu cụm