Ảo hóa GPU cho AI với VMware và NVIDIA dựa trên cơ sở hạ tầng của Dell

Tóm tắt điều hành

Dell Technologies, VMware và NVIDIA đang hợp tác để phát triển các giải pháp nhằm cải thiện các phương pháp tiên tiến nhất để triển khai AI trong doanh nghiệp. Tính linh hoạt và dễ sử dụng tiếp tục là những nguyên lý chính và đặc điểm mong muốn của các nền tảng trí tuệ nhân tạo (AI) được sử dụng để đào tạo và lưu trữ các mô hình cho AI. Sách trắng này mô tả Thiết kế được xác thực của Dell để ảo hóa GPU cho AI với VMware và NVIDIA, một giải phápmà ba công ty cùng thiết kế và xác nhận. Chúng tôi cung cấp thông tin cơ bản và đề xuất về cách triển khai nhiều loại sản phẩm tăng tốc bộ xử lý đồ họa (GPU) NVIDIA bằng cách sử dụng một số loại máy chủ của Dell Technologies cùng với công nghệ VMware vSphere và Tanzu. Giải pháp này có thể đáp ứng nhu cầu của hầu hết mọi yêu cầu ứng dụng AI dành cho khách hàng doanh nghiệp muốn chuẩn hóa trên VMware để triển khai và vận hành hệ thống. Thiết kế đã được xác thực cũng cho thấy cách kết hợp NVIDIA AI Enterprise, một bộ phần mềm toàn diện gồm các công cụ và khung AI, cho phép các tổ chức chạy VMware vSphere ảo hóa và chứa khối lượng công việc AI trên Hệ thống được NVIDIA chứng nhận.

Một bài học rút ra trong thập kỷ qua là các nền tảng AI với kiến ​​trúc tùy chỉnh—dù là tại chỗ hay trong nhà cung cấp dịch vụ đám mây—gây ra những thách thức về tích hợp và vận hành, từ đó dẫn đến chi phí cao hơn. Với thiết kế đã được xác thực này, các chuyên gia VMware có thể sử dụng bộ kỹ năng hiện có của họ để triển khai và vận hành nền tảng AI ảo hóa này. Khả năng một tổ chức duy trì và phát triển các trung tâm hoạt động xuất sắc hiện có của mình cho phép tổng chi phí sở hữu thấp hơn và tính liên tục trong kinh doanh tổng thể tốt hơn.

Các doanh nghiệp đang tận dụng AI trong mọi khía cạnh kinh doanh của họ. Nguồn nhân lực đang sử dụng AI để thu hút nhân tài, bộ phận tiếp thị đang sử dụng AI để dự báo giá và nhu cầu, CNTT đang sử dụng AI cho an ninh mạng và dịch vụ khách hàng đang sử dụng AI cho chatbot. Việc áp dụng AI rộng rãi như vậy trên toàn doanh nghiệp đòi hỏi phải tích hợp liền mạch các khả năng AI vào hoạt động của trung tâm dữ liệu. Thông qua NVIDIA AI Enterprise trên VMware vSphere, thiết kế đã được xác thực này cho phép các doanh nghiệp triển khai, hiện đại hóa, quản lý và vận hành khối lượng công việc AI cùng với các ứng dụng hiện có của họ bằng cách sử dụng cùng các công cụ quen thuộc.

Mục đích của tài liệu

Bằng cách sử dụng thông tin trong sách trắng này, các chuyên gia của VMware có thể nhanh chóng triển khai và vận hành một nền tảng đầy đủ tính năng để hỗ trợ các trường hợp sử dụng AI nâng cao tận dụng GPU được tăng tốc của NVIDIA và phần mềm AI được quản lý dành cho các nhà nghiên cứu AI, nhà khoa học dữ liệu và nhà phát triển trên Dell Technologies cơ sở hạ tầng .

Sách trắng này là tài liệu đồng hành với Ảo hóa GPU cho AI với VMware và NVIDIA Hướng dẫn thiết kế và Hướng dẫn thực hiện . Xem hướng dẫn thiết kế để biết thêm thông tin về kiến ​​trúc tham chiếu, cấu hình và đặc tính hiệu suất. Xem hướng dẫn triển khai để được hướng dẫn triển khai giải pháp.

Sách trắng cập nhật này phản ánh các máy chủ Dell PowerEdge mới nhất, VMware vSphere 8 và NVIDIA AI Enterprise 3.

Khán giả

Sách trắng này dành cho các kiến ​​trúc sư giải pháp, quản trị viên hệ thống và những người quan tâm đến nền tảng ảo hóa để phát triển ứng dụng AI.

Bảng sửa đổi

Bảng 1.     Lịch sử sửa đổi

Ngày

Phiên bản

Thay đổi tóm tắt

tháng 5 năm 2021

1.0

phát hành lần đầu

Tháng 10 năm 2021

1.1

Đã cập nhật để thêm hỗ trợ cho NVIDIA AI Enterprise

tháng 3 năm 2022

2.0

Đã cập nhật để thêm hỗ trợ cho VMware Tanzu

tháng 5 năm 2023

3.0

Đã cập nhật để thêm hỗ trợ cho VMware vSphere 8, NVIDIA AI Enterprise 3.1 và máy chủ PowerEdge mới nhất

Thử thách AI bóng tối

Việc phát triển các kỹ năng để thành công trong việc tích hợp AI, phát triển phần mềm và vận hành CNTT đã thách thức tất cả mọi người. Yêu cầu đặt ra đối với CNTT là cung cấp các hệ thống sản xuất mạnh mẽ cho khối lượng công việc AI quan trọng trong kinh doanh đồng thời quản lý các môi trường bổ sung để phát triển các sáng kiến ​​mới đã gây áp lực nặng nề lên các nguồn lực vốn đã hạn chế. Áp lực phải phát triển từ ý tưởng, thông qua thử nghiệm và sản xuất thường xuyên khiến các nhà khoa học và nhà phát triển dữ liệu phải từ bỏ việc hợp tác với CNTT. Thay vào đó, họ cố gắng tiến hành nhanh hơn một mình. Tình trạng này xuất hiện trong những năm có sự thay đổi nhanh chóng trong thời đại phát triển ứng dụng định hướng dịch vụ vi mô và trí tuệ kinh doanh, càng làm căng thẳng thêm mối quan hệ vốn đã đầy thách thức giữa CNTT, cộng đồng nhà phát triển và cộng đồng quản lý doanh nghiệp.

Bản chất thử nghiệm của công việc khoa học dữ liệu khiến việc cộng tác và lập kế hoạch trở nên khó khăn. Việc phân bổ nguồn lực CNTT trong môi trường cần có nguồn lực cho “phòng thí nghiệm phát triển” là điều khó dự đoán. Sự không chắc chắn về thời gian để định giá khiến việc quản lý ngân sách và khối lượng công việc gần như không thể thực hiện được. Bộ phận CNTT có thể cảm thấy rằng họ thiếu thông tin đầy đủ để phân bổ nguồn lực một cách hiệu quả và các nhà phát triển thường cảm thấy thiếu sự ưu tiên để đáp ứng những thay đổi trong kế hoạch đã thống nhất trước đó.

Những yếu tố này đã tạo ra động lực cho các nhóm tham gia vào việc gấp rút triển khai khối lượng công việc AI để hành xử theo những cách không hiệu quả về mặt chi phí cho tổ chức của họ. Những cách phổ biến nhất mà các nhóm cố gắng “đi nhanh hơn” là sử dụng việc sử dụng đám mây công cộng không được giám sát, tái sử dụng thiết bị cho một nỗ lực ngoài ý muốn hoặc mua lại nguồn tài trợ của đơn vị kinh doanh cho các sáng kiến ​​phát triển riêng biệt nằm ngoài quy trình lập ngân sách vốn CNTT chính thức. Những loại hệ thống thông tin này, tồn tại phần lớn ẩn giấu đối với các nhà quản lý và các đơn vị CNTT chính thức, tạo ra vấn đề ”CNTT ngầm” mà tất cả các tổ chức lớn hơn phải giải quyết. Các tình huống thúc đẩy các nhóm lựa chọn con đường CNTT bóng tối đặc biệt gay gắt trong lĩnh vực nghiên cứu ứng dụng AI và trí tuệ máy móc.

Sự tập trung vào AI, trước đây chỉ là mối quan tâm của một cộng đồng nhỏ các nhà nghiên cứu và nhà khoa học máy tính, giờ đây trở nên mãnh liệt đến mức nhiều tổ chức cảm thấy rằng mặc dù đã đầu tư đáng kể nhưng họ đang ngày càng tụt hậu so với các đối thủ cạnh tranh. Tốc độ quản lý dữ liệu mới và AI được đưa ra thị trường làm tăng chi phí lập kế hoạch hệ thống và tăng nguy cơ phải thay đổi quy trình thường xuyên hơn.