Hỗ trợ khối lượng công việc phân tích bảo trì dự đoán với Dell AI Starter Kit

Bản tóm tắt

Các kỹ thuật Học sâu (DL) đã mang lại những thành công to lớn trong nhiều lĩnh vực, chẳng hạn như thị giác máy tính, xử lý ngôn ngữ tự nhiên (NLP), lái xe tự động và bảo trì dự đoán (PdM), bằng cách cho phép mô hình học từ dữ liệu hiện có và sau đó đưa ra các dự đoán tương ứng. Đây là cốt lõi của PdM, một kỹ thuật được thiết kế để giúp xác định tình trạng của thiết bị đang hoạt động nhằm ước tính thời điểm cần thực hiện bảo trì để tránh tình trạng mất điện ngoài ý muốn, tăng cường an toàn cho người lao động và giảm thời gian chết.

Sự thành công của DL trong PdM là do sự kết hợp của các thuật toán được cải thiện, khả năng truy cập vào các tập dữ liệu lớn hơn và sức mạnh tính toán tăng lên. Việc lựa chọn và thiết kế các thành phần hệ thống, được lựa chọn và điều chỉnh cẩn thận cho các trường hợp sử dụng DL, có thể có tác động lớn đến tốc độ, độ chính xác và giá trị kinh doanh của việc triển khai các kỹ thuật AI cho PdM.

Trong một môi trường phức tạp như vậy, điều quan trọng là các tổ chức có thể dựa vào các nhà cung cấp mà họ tin tưởng. Trong vài năm qua, Dell và NVIDIA đã thiết lập quan hệ đối tác chặt chẽ để giúp các tổ chức đẩy nhanh các sáng kiến ​​AI của họ. Tài liệu này chứng minh cách Dell PowerScale All-Flash Scale-out NAS, máy chủ Dell PowerEdge với GPU NVIDIA và Dell PowerSwitches có thể được sử dụng để cung cấp một môi trường tuyệt vời cho các nhóm nhỏ thực hiện khoa học dữ liệu, AI và học sâu cho PdM. Bộ công cụ được mô tả ở đây có mục đích là một kiến ​​trúc khởi động nhanh để thử nghiệm và điều chỉnh các mô hình cho các môi trường sản xuất nhỏ hoặc các giải pháp đơn lẻ trong các trung tâm dữ liệu sản xuất lớn hơn.

Dell PowerScale

Một nhóm khoa học dữ liệu hiệu quả thường đòi hỏi khả năng chia sẻ lượng dữ liệu lớn trong khi vẫn cung cấp hiệu suất cao, độ tin cậy và khả năng truy cập liền mạch từ nhiều hệ điều hành. NAS mở rộng (network attached storage) của Dell PowerScale cung cấp khả năng quan trọng này. Với khả năng mở rộng dung lượng và hiệu suất dễ dàng, PowerScale cho phép các nhóm khoa học dữ liệu cộng tác hiệu quả và chia sẻ dữ liệu trên nhiều ứng dụng và hệ thống khác nhau. Các tùy chọn triển khai linh hoạt của nó, bao gồm tại chỗ, đám mây lai và đa đám mây, cung cấp sự linh hoạt cần thiết để thích ứng với nhu cầu kinh doanh thay đổi và để triển khai trong tương lai.

PowerScale cũng cung cấp các tính năng bảo mật nâng cao, chẳng hạn như hệ thống tệp và mã hóa cấp độ khối lượng và vùng truy cập an toàn, để đảm bảo tính bảo mật và toàn vẹn của dữ liệu nhạy cảm. Các tính năng này khiến PowerScale trở thành thành phần thiết yếu trong bộ công cụ của bất kỳ nhóm khoa học dữ liệu nào, cho phép họ quản lý, phân tích và rút ra thông tin chi tiết hiệu quả từ lượng lớn dữ liệu.

Nền tảng lưu trữ toàn flash PowerScale, được hỗ trợ bởi hệ điều hành OneFS, cung cấp kiến ​​trúc lưu trữ mở rộng mạnh mẽ nhưng đơn giản để tăng tốc độ truy cập vào lượng lớn dữ liệu phi cấu trúc trong khi giảm đáng kể chi phí và độ phức tạp. Chúng mang lại hiệu suất và hiệu quả cực cao cho các ứng dụng và khối lượng công việc dữ liệu phi cấu trúc đòi hỏi khắt khe nhất của bạn.

 

Hỗ trợ mọi khối lượng công việc

Chọn từ các nút all-flash, hybrid và archive để phù hợp nhất với dữ liệu của bạn. Chạy nhiều giao thức dữ liệu với quyền truy cập đồng thời để tránh các silo lưu trữ. Triển khai dưới dạng thiết bị NAS tại chỗ, trong APEX hoặc trên Đám mây.

Quản lý dữ liệu có thể mở rộng

Tăng, giảm hoặc mở rộng mà không gây gián đoạn đến hàng chục petabyte. Quản lý cơ sở hạ tầng lưu trữ của bạn bằng một giao diện người dùng duy nhất với CloudIQ. Quản lý các tập dữ liệu của bạn trên toàn doanh nghiệp.

Bảo vệ dữ liệu của bạn

PowerScale cung cấp tính khả dụng, dự phòng, bảo mật, bảo vệ dữ liệu và sao chép tích hợp với OneFS. Nó cung cấp khả năng bảo vệ khỏi các cuộc tấn công mạng với khả năng phòng thủ ransomware tích hợp và AirGap thông minh, và được thiết kế để có tính khả dụng 6×9.

Dell PowerEdge

Thế hệ máy chủ PowerEdge mới nhất nâng cao cả tính linh hoạt của doanh nghiệp và thời gian đưa ra thị trường, đồng thời có thể hỗ trợ khối lượng công việc chuyển đổi như cơ sở dữ liệu và phân tích, ảo hóa, lưu trữ được xác định bằng phần mềm, cơ sở hạ tầng máy tính để bàn ảo (VDI), container hóa, HPC, AI và ML. Hệ thống Dell PowerEdge có thể sử dụng toàn bộ ngăn xếp AI của NVIDIA — bao gồm GPU, DPU và bộ phần mềm NVIDIA AI Enterprise — cung cấp cho các doanh nghiệp nền tảng cần thiết cho nhiều ứng dụng AI, bao gồm nhận dạng giọng nói, an ninh mạng, hệ thống đề xuất và ngày càng nhiều dịch vụ dựa trên ngôn ngữ mang tính đột phá.

Hiệu suất và quy mô

Máy chủ PowerEdge thế hệ tiếp theo cung cấp hiệu suất được cải thiện, mang lại khả năng suy luận AI tốt hơn. Bạn có thể đặt hàng các hệ thống PowerEdge với các đơn vị xử lý dữ liệu NVIDIA Bluefield để cung cấp thêm khả năng giảm tải, tăng tốc và cô lập khối lượng công việc lý tưởng cho hiệu quả năng lượng cho các triển khai riêng tư, lai và đa đám mây.

Được thiết kế cho sự bền vững

Thiết kế Dell Smart Flow là một tính năng mới trong bộ Dell Smart Cooling giúp tăng luồng khí và giảm công suất quạt tới 52% so với các máy chủ thế hệ trước. Thiết kế Smart Flow hỗ trợ hiệu suất máy chủ cao hơn và yêu cầu ít điện năng hơn để làm mát hệ thống cho các trung tâm dữ liệu hiệu quả hơn. Một loạt các bộ di chuyển không khí có sẵn từ chìa khóa trao tay đến cao cấp để đáp ứng tốt nhất nhu cầu làm mát máy chủ.

Độ tin cậy và bảo mật

Kiến trúc chống chịu mạng của Dell là một phương pháp tiếp cận bảo mật nhiều lớp, bao gồm một mạng lưới các thành phần giải pháp bảo mật được thiết kế để bảo vệ, phát hiện và phục hồi sau các mối đe dọa. Chúng tôi tăng cường bảo mật chuỗi cung ứng với dịch vụ Xác minh thành phần bảo mật (SCV). SCV cho phép khách hàng xác minh bằng mật mã rằng các thành phần được đặt tại nhà máy khớp với những gì đã được giao cho họ.

Máy chủ PowerEdge giúp đẩy nhanh việc áp dụng Zero Trust trong môi trường CNTT của tổ chức. Các thiết bị liên tục xác minh quyền truy cập, bằng cách cho rằng mọi người dùng và thiết bị đều là mối đe dọa tiềm ẩn. Ở cấp độ phần cứng, gốc tin cậy phần cứng dựa trên silicon, với các thành phần bao gồm Dell Secured Component Verification (SCV), giúp xác minh bảo mật chuỗi cung ứng từ thiết kế đến giao hàng.

Bộ chuyển đổi nguồn Dell

Dell Technologies nhận thức sâu sắc về những thách thức tồn tại trong không gian mạng và những gì cần phải làm để giải quyết những hạn chế do mạng độc quyền, chậm phát triển và tác động của chúng đến các sáng kiến ​​AI. Với Dell Technologies Open Networking , chúng tôi cung cấp một chiến lược hoàn chỉnh kết hợp khả năng mở rộng và tính linh hoạt của mạng với phần cứng dựa trên tiêu chuẩn và các giải pháp phần mềm sáng tạo, tốt nhất trong phân khúc — và các công cụ tự động hóa để hợp lý hóa một lượng lớn can thiệp thủ công. Bạn sẽ ở vị thế tốt hơn để đáp ứng nhu cầu về quy trình làm việc và ứng dụng với khả năng kiểm soát và tính linh hoạt của mạng lớn hơn.

Mạng được xác định bằng phần mềm

Hệ điều hành mạng Dell cung cấp chức năng mạng được xác định bằng phần mềm đầy đủ tính năng với khả năng kết nối Lớp 2 và Lớp 3 đáp ứng nhu cầu của bạn với phần mềm từ Dell và các đối tác hệ sinh thái Open Networking.

Phần mềm cho Mạng mở trong Đám mây (SONiC)

Dell Technologies cung cấp dịch vụ phân phối SONiC được tinh chỉnh, phù hợp với doanh nghiệp và được hỗ trợ trên toàn cầu – được gọi là Phân phối SONiC Doanh nghiệp của Dell Technologies – nhằm giúp mang lại lợi ích của các đóng góp SONiC tập trung vào quy mô lớn cho các thị trường Doanh nghiệp và Viễn thông cũng như các trường hợp sử dụng còn lại.

Ngành kiến ​​​​trúc

Hình 1. Các thành phần ngăn xếp phân tích dự đoán

Thành phần kiến ​​trúc

Kiến trúc Predictive Analytics kết hợp nhiều thành phần phần cứng và phần mềm. Dell Technologies cung cấp nhiều lựa chọn phần cứng để xây dựng kiến ​​trúc như vậy, bắt đầu từ máy chủ tính toán với PowerEdge Family, PowerSwitch cho mạng và PowerScale cho lưu trữ phân tán. Trong giải pháp này, chúng tôi sử dụng máy chủ Dell PowerEdge được trang bị GPU NVIDIA, chạy bản phát hành Ubuntu 20.04 LTS.

Để tận dụng GPU NVIDIA, chúng tôi đã sử dụng NVIDIA Container Toolkit, cho phép người dùng xây dựng và chạy các container được tăng tốc bằng GPU. Để biết thêm chi tiết về bộ công cụ này, hãy xem trang web NVIDIA . Cuối cùng, chúng tôi đã sử dụng một container docker tùy chỉnh dựa trên hình ảnh Docker TensorFlow của NVIDIA. Hình ảnh này cung cấp một hệ sinh thái lớn các công cụ cho phép các kỹ sư và nhà khoa học dữ liệu phát triển các ứng dụng ML bằng các thư viện cuDF JupyterLab, TensorFlow, Keras, RAPIDS và nhiều thư viện khác. Điểm hấp dẫn nhất trong phương pháp này là tính linh hoạt mà Docker cung cấp. Người dùng có thể xây dựng và tùy chỉnh hình ảnh của riêng mình và triển khai các container Docker cụ thể dựa trên nhu cầu của họ.

Bảng 1. Các thành phần phần cứng và phần mềm cốt lõi

Thành phần Sự miêu tả
Máy đo công suất PowerScale F200 PowerScale F200 cung cấp hiệu suất lưu trữ flash trong một hệ số hình thức tiết kiệm chi phí để đáp ứng nhu cầu của nhiều loại khối lượng công việc khác nhau. Mỗi nút cho phép bạn mở rộng dung lượng lưu trữ thô từ 3,84 TB lên 30,72 TB và lên đến 7,7 PB dung lượng thô cho mỗi cụm. F200 bao gồm nén nội tuyến và loại bỏ trùng lặp. Số lượng tối thiểu các nút PowerScale cho mỗi cụm là ba trong khi kích thước cụm tối đa là 252 nút.
Công tắc nguồn S5224-ON S5200-ON là một họ sản phẩm chuyển mạch hoàn chỉnh: chuyển mạch ToR 12 cổng, 24 cổng và 48 cổng 25GbE/100GbE, chuyển mạch Giữa hàng (MoR)/Cuối hàng (EoR) 96 cổng 25GbE/100GbE và chuyển mạch Spine/Leaf đa tốc độ 100GbE 32 cổng.
PowerEdge R7525 Dell PowerEdge R7525 là máy chủ dạng rack 2U, hai ổ cắm được thiết kế để chạy các khối lượng công việc phức tạp bằng bộ nhớ có khả năng mở rộng cao, dung lượng I/O và các tùy chọn mạng. Hệ thống này dựa trên bộ xử lý AMD EPYC thế hệ thứ 2 (tối đa 64 lõi), có tối đa 32 DIMM, khe cắm mở rộng hỗ trợ PCI Express (PCIe) 4.0 và hỗ trợ tối đa ba bộ tăng tốc 300W rộng gấp đôi hoặc sáu bộ tăng tốc 75W rộng đơn.
Bộ công cụ NVIDIA Container NVIDIA Container Toolkit cho phép người dùng xây dựng và chạy các container được tăng tốc bằng GPU. Bộ công cụ này bao gồm thư viện thời gian chạy container và các tiện ích để tự động cấu hình container để tận dụng GPU NVIDIA.
Phòng thí nghiệm Jupyter JupyterLab là môi trường phát triển tương tác dựa trên web mới nhất dành cho sổ tay, mã và dữ liệu. Giao diện linh hoạt của nó cho phép người dùng định cấu hình và sắp xếp quy trình công việc trong khoa học dữ liệu, điện toán khoa học, báo chí tính toán và học máy.