Làm cho AI, HPC và GPU trở nên dễ dàng hơn cho các nhà khoa học dữ liệu

Với cơ sở hạ tầng máy chủ và vùng chứa sẵn sàng cho GPU mới, các tổ chức đang đơn giản hóa việc triển khai các ứng dụng trí tuệ nhân tạo và các cụm mà chúng chạy trên đó.

Bất kể họ làm việc trong lĩnh vực nào, các nhà nghiên cứu, nhà khoa học dữ liệu và nhà phát triển đều muốn tập trung vào công việc họ làm, chứ không phải hệ thống và công cụ họ sử dụng để chạy khối lượng công việc của mình. Mặc dù đó là một đề xuất đơn giản, nhưng thực tế trên mặt đất thường khác xa với thế giới lý tưởng này.

Những người đã xây dựng trí tuệ nhân tạo và các ứng dụng điện toán hiệu năng cao khác từ đầu — bắt đầu với các máy chủ kim loại thô, khung máy tính, thư viện phần mềm, v.v. — hiểu rằng có rất nhiều công việc nặng nhọc cần phải làm trước mắt. Công việc này luôn được ưu tiên trước, trước khi bạn có thể tập trung vào công việc bạn thực sự muốn làm, chẳng hạn như huấn luyện mô hình, chạy khối lượng công việc suy luận và xem kết quả.

Cùng với các đối tác của mình, NVIDIA đang nỗ lực viết lại câu chuyện này. Việc triển khai các hệ thống tăng tốc GPU trở nên thực sự dễ dàng với NVIDIA GPU Cloud, hay NGC.

Sổ đăng ký bộ chứa NGC

Thông qua sổ đăng ký bộ chứa NGC , NVIDIA cung cấp danh mục các bộ chứa tăng tốc GPU cung cấp phần mềm tăng tốc GPU dễ triển khai cho AI, máy học và HPC . Các thùng chứa này, có sẵn để tải xuống miễn phí, giúp giảm bớt nhiều vấn đề đau đầu khi thiết lập phần mềm. Chúng giúp bạn thiết lập và chạy nhanh chóng với các khung và ứng dụng đã được thử nghiệm, tối ưu hóa và cập nhật. Các bộ chứa được thiết kế để tận dụng tối đa GPU NVIDIA, tại chỗ hoặc trên đám mây và để hoạt động trên nhiều nền tảng GPU NVIDIA.

Sổ đăng ký vùng chứa NGC rất dễ sử dụng. Khi bạn truy cập trang web, bạn sẽ được nhắc trả lời một câu hỏi đơn giản: “Bạn quan tâm đến công việc gì?” Để tiếp tục, bạn chỉ cần chọn một trong sáu tùy chọn từ danh mục: Điện toán hiệu năng cao, Học sâu, Học máy, Suy luận, Trực quan hóa hoặc Cơ sở hạ tầng. Sau khi lựa chọn được thực hiện, bạn có thể bắt đầu làm việc với khung học sâu Caffee2 hoặc ứng dụng phần mềm LAMMPS để mô phỏng động lực học phân tử. Sau đó, bạn có thể tiếp tục với sự tự tin khi biết phần mềm của mình được định cấu hình chính xác.

Phần cứng NGC-Ready

Tất nhiên, phần mềm chỉ là một phần của vấn đề khi triển khai các ứng dụng AI và HPC quy mô lớn. Bạn cũng phải tìm cơ sở hạ tầng phần cứng phù hợp để chạy khối lượng công việc của mình. NVIDIA làm cho quá trình này trở nên dễ dàng hơn với chương trình NGC-Ready. Thông qua chương trình này, các nhà cung cấp phần cứng xác thực rằng các bộ chứa NGC chạy chính xác trên máy chủ và máy trạm của họ.

Dell EMC là một người tham gia tích cực trong chương trình này. Cơ sở hạ tầng NGC-Ready của chúng tôi, bao gồm cả máy chủ Dell EMC PowerEdge C4140, đã được thử nghiệm và xác thực để chạy các bộ chứa từ Đám mây GPU NVIDIA. Công việc phụ trợ này cho phép các tổ chức triển khai các hệ thống Dell EMC được GPU tăng tốc với sự tự tin khi biết rằng họ đã sẵn sàng chạy các bộ chứa NGC.

Và đó chỉ là một phần công việc mà Dell EMC làm với NVIDIA. Nhóm của tôi hợp tác chặt chẽ với các kỹ sư tại NVIDIA để tối ưu hóa hệ thống, thực hiện kiểm tra điểm chuẩn và thực hiện các bước khác nhằm giúp đảm bảo rằng bạn và những người khác có thể nhận được toàn bộ giá trị của khả năng tăng tốc GPU khi triển khai bộ chứa NGC trên phần cứng Dell EMC.

Ví dụ: một số người dùng lo lắng rằng việc chứa một ứng dụng sẽ ảnh hưởng đến hiệu suất. Thông qua phòng thí nghiệm và kiểm tra điểm chuẩn, chúng tôi có thể chỉ ra rằng hiệu suất bị mất đi rất ít, nếu có, khi bạn chứa phần mềm của mình, trái ngược với việc bắt đầu với phần mềm mà bạn triển khai trên các máy chủ kim loại thô. Chúng tôi đặc biệt tập trung vào việc chứng minh tiềm năng của việc sử dụng các vùng chứa trong các mô phỏng quy mô lớn và các ứng dụng học sâu. Trong phòng thí nghiệm của mình, chúng tôi nhận thấy các thùng chứa có thể di động và hiệu quả khi chúng tôi mở rộng quy mô khối lượng công việc học sâu.

Tốt hơn nữa, chúng tôi đang chứng minh cách tiếp cận vùng chứa giúp cuộc sống của các nhà khoa học dữ liệu và những người dùng khác dễ dàng hơn, những người đang mạo hiểm bước vào thế giới mới đầy dũng cảm của AI và máy học . Với các khung phù hợp được tích hợp vào bộ chứa NGC và được triển khai trên phần cứng NGC-Ready của chúng tôi, bạn có thể tận dụng GPU để học sâu bằng cách chỉ thêm một vài dòng mã — theo đúng nghĩa đen. Bạn thêm các dòng mã và bạn nhận được lợi ích của việc tăng tốc GPU mà không cần chuyển mã ứng dụng của mình sang một nền tảng mới.

Giải pháp sẵn sàng cho AI

Trong một sáng kiến ​​khác đang diễn ra, các kỹ sư của chúng tôi tại Dell EMC hợp tác chặt chẽ với các đối tác của họ tại NVIDIA để đưa các hệ thống được tối ưu hóa cho các ứng dụng học sâu hỗ trợ GPU ra thị trường. Đó là trường hợp của Giải pháp Sẵn sàng cho AI của Dell EMC của chúng tôi , được tối ưu hóa cho deep learning với GPU NVIDIA.

Các Giải pháp sẵn sàng này cung cấp một ngăn xếp được tối ưu hóa cho GPU có thể tiết kiệm thời gian quý báu cho các dự án học sâu. Nếu đó là mục tiêu của bạn, các kỹ sư của Dell EMC có thể giúp bạn định cấu hình, kiểm tra và điều chỉnh phần cứng và phần mềm hỗ trợ GPU của bạn, để bạn có thể thiết lập và chạy nhanh chóng với nền tảng học sâu hàng đầu dựa trên một khung có thể sử dụng cả CPU và GPU. Các giải pháp này thậm chí còn bao gồm các dịch vụ giúp các nhà khoa học dữ liệu của bạn khám phá thông tin chuyên sâu về dữ liệu trong thời gian ngắn hơn.

điểm chính

Nếu bạn lùi lại một bước và nhìn vào bức tranh toàn cảnh, bạn sẽ thấy rằng có rất nhiều tài nguyên sẵn có để giúp tổ chức của bạn triển khai các ứng dụng do AI và HPC điều khiển để tận dụng sức mạnh của khả năng tăng tốc GPU và để làm như vậy với sự tự tin đi kèm với các giải pháp phần cứng và phần mềm đã được xác thực và tối ưu hóa.

Tôi nghĩ bạn cũng sẽ thấy rằng việc tham gia trò chơi này trở nên dễ dàng hơn nhiều so với chỉ một vài năm trước. Ngày nay, người dùng cuối không còn cần phải trở thành chuyên gia về công nghệ cơ bản để tận dụng các hệ thống tăng tốc GPU và sức mạnh của AI cũng như các ứng dụng sử dụng HPC khác. Thay vào đó, họ có thể để mắt đến phần thưởng thực sự – công việc họ làm.

Để tìm hiểu thêm

Để có cái nhìn sâu hơn về các công nghệ làm nên tất cả, hãy khám phá các giải pháp Dell EMC dành cho máy tính hiệu năng cao và trí tuệ nhân tạo