Những ý tưởng tuyệt vời không còn đủ nữa. Sự phát triển nhanh chóng của công nghệ trí tuệ nhân tạo (AI) và học máy (ML) đã giải phóng trí óc của các nhà nghiên cứu để phát triển các sáng kiến AI ngày càng tinh vi hơn. Về mặt lý thuyết. Việc đưa các mô hình AI vào sản xuất rất chậm và hầu hết các sáng kiến AI thậm chí không bao giờ đạt đến giai đoạn này. Các doanh nghiệp cần nhiều hơn là những ý tưởng tuyệt vời; họ cần công nghệ để hiện thực hóa chúng.
Biến một ý tưởng tuyệt vời thành sáng kiến AI sẵn sàng đưa ra thị trường liên quan đến việc xây dựng, đào tạo và suy luận. Các nhà nghiên cứu phải có quyền truy cập vào cơ sở hạ tầng để chạy thử nghiệm, mở rộng và đào tạo khối lượng công việc bằng các kỹ thuật khác nhau và chạy dữ liệu thông qua các mô hình AI để tính toán đầu ra và giải quyết các nhiệm vụ. Tất cả những điều này đòi hỏi khối lượng dữ liệu, sức mạnh tính toán và nguồn lực tài chính khổng lồ. Nó cũng đòi hỏi các nhóm chuyên dụng không bị cản trở bởi dữ liệu, phần mềm và quản lý cơ sở hạ tầng.
GPU có vấn đề
Sự phát triển về công nghệ và chiến lược đã giúp tạo ra những sáng kiến AI tuyệt vời từ những ý tưởng tuyệt vời. Cải thiện hiệu suất—và cho phép các doanh nghiệp có được thông tin chi tiết từ dữ liệu nhanh hơn—có thể đạt được bằng cách chuyển tải khối lượng công việc AI sang các đơn vị xử lý đồ họa (GPU). Các nhà nghiên cứu đang dựa vào chiến lược này và các GPU này để xây dựng và đào tạo các thuật toán ML và học sâu (DL) cần thiết để đưa các sáng kiến AI vào sản xuất.
Tuy nhiên, chiến lược này cũng đang kìm hãm việc triển khai các sáng kiến AI— và tất cả những ý tưởng tuyệt vời đó! Cách GPU phân bổ tài nguyên có nghĩa là quá trình này tốn kém quá mức đối với một số tổ chức và không mang lại đủ ROI cho nhiều tổ chức khác. Do cách phân bổ tài nguyên cố định, sức mạnh tính toán đắt tiền thường bị một nhà nghiên cứu để không sử dụng trong khi một nhà nghiên cứu khác chờ truy cập.
Phương pháp tĩnh này làm chậm quá trình triển khai các mô hình và cản trở quá trình thử nghiệm của các nhà nghiên cứu: lãng phí cả sức mạnh tính toán và trí tuệ. Tính không linh hoạt của nó cũng khiến các nhóm phụ thuộc vào CNTT, với các nhà nghiên cứu được cấp ít khả năng hiển thị và kiểm soát hơn đối với các nguồn lực và khối lượng công việc của họ. Khi cố gắng hiện thực hóa các sáng kiến AI và xây dựng các ứng dụng ở quy mô lớn, những điều này rất quan trọng vì chúng giúp đảm bảo tuân thủ, bảo mật và kiểm soát.
Kiến trúc máy chủ loại này có thể cung cấp hiệu suất cần thiết để khám phá thông tin chi tiết về doanh nghiệp ở giai đoạn chứng minh khái niệm. Tuy nhiên, ngay cả những tổ chức có đủ nguồn lực để triển khai phương pháp này cũng sẽ gặp phải vấn đề thứ hai. Phân bổ tài nguyên tĩnh không cho phép sản xuất ở quy mô lớn. Các tác vụ khối lượng công việc được xếp hàng và hoàn thành từng cái một, gây ra tình trạng kém hiệu quả và có nghĩa là chỉ một tỷ lệ nhỏ tài nguyên GPU được sử dụng tại bất kỳ thời điểm nào.
Những ý tưởng tuyệt vời chỉ đưa doanh nghiệp đi xa đến vậy. Để hiện thực hóa những ý tưởng này, họ cần công nghệ cho phép họ tận dụng tối đa GPU đắt tiền, khai thác tối đa GPU đắt tiền—và tận dụng tối đa nhóm nghiên cứu của họ—trong khi tránh các vấn đề lâu nay liên quan đến việc sử dụng cơ sở hạ tầng này. Bất kỳ giải pháp nào cũng phải tạo điều kiện thuận lợi cho việc xây dựng, đào tạo và suy luận, mà không có sự trì hoãn và thiếu linh hoạt trong việc phân bổ tài nguyên, đặc điểm của mô hình GPU cũ. Vậy, ý tưởng tuyệt vời là gì?
Chúng tôi cho rằng đó là sự hợp tác giữa Run:ai và Dell, và sự tích hợp của Run:ai Atlas với nền tảng Data Lakehouse của Dell. Phần mềm Run:ai hợp lý hóa quá trình phát triển và quản lý các ứng dụng AI trên mọi cơ sở hạ tầng: tại chỗ, biên hoặc đám mây. Nền tảng Data Lakehouse của Dell cung cấp cơ sở hạ tầng cho Run:ai và cho phép môi trường đám mây lai cung cấp khả năng mở rộng và tính linh hoạt tại chỗ. Việc tích hợp cả hai có nghĩa là các nhóm nghiên cứu có thể vượt qua những thách thức liên quan đến kiến trúc GPU và có thể xây dựng, đào tạo và thực hiện suy luận với tốc độ, sự dễ dàng và ở quy mô lớn. Để làm được điều này, các nhóm này cần bộ lưu trữ hiệu suất cao để lưu trữ dữ liệu lakehouse. Các nút toàn flash Dell PowerScale và ECS/ObjectScale cung cấp nền tảng dữ liệu để biến điều này thành hiện thực.
Vượt qua thách thức, tối ưu hóa nguồn lực
Sử dụng Run:ai Atlas, các nhóm nghiên cứu có thể tập hợp tài nguyên tính toán và GPU trong một nhóm tập trung và sau đó phân bổ tài nguyên cho nhiều khối lượng công việc. Các thành viên nhóm riêng lẻ (có quyền truy cập cần thiết và thông qua các phương tiện an toàn) có thể xem cách sử dụng tài nguyên, với khả năng hiển thị các khối lượng công việc, người dùng, dự án và phòng ban khác được cấp và kiểm soát dễ dàng.
Tài nguyên có thể được phân bổ và quản lý tự động, giảm bớt gánh nặng mà các thành viên trong nhóm phải gánh vác. Thay vì phải thuê nhân tài mới hoặc buộc các nhà nghiên cứu phải đảm nhiệm nhiều vai trò, sự hợp tác giữa Dell và Run:ai giới thiệu một thành viên nhóm mới, vô hình: một chuyên gia AI hoạt động đằng sau hậu trường để tối ưu hóa việc phân bổ tài nguyên. Một công ty—chuyên gia về công nghệ nhận dạng khuôn mặt— đã tăng từ mức sử dụng GPU 28% lên mức tối ưu hóa hơn 70% . Bằng cách hợp lý hóa việc sử dụng GPU, nhóm có thể xây dựng nhanh hơn và có thể lập ngân sách tốt hơn với khả năng hiển thị cao hơn.
Data Lakehouse của Dell cũng giúp các doanh nghiệp vượt qua những thách thức vốn có trong việc quản lý dữ liệu và khai thác dữ liệu để có được những thông tin chi tiết có giá trị. Môi trường đám mây lai cung cấp cho các nhóm quyền truy cập tự phục vụ để cân bằng khối lượng công việc giữa các vị trí CNTT và quản lý dữ liệu nhạy cảm một cách an toàn, mà không cần phải gửi dữ liệu lên đám mây. Bao gồm các thành phần tính toán, lưu trữ và phần mềm trong một nền tảng an toàn duy nhất có nghĩa là các nhóm có thể tập trung vào việc hiện thực hóa những ý tưởng tuyệt vời mà không lãng phí thời gian quản lý cơ sở hạ tầng và lo lắng về quản trị và an toàn dữ liệu.
Đẩy nhanh hành trình đến sự vĩ đại của AI
Quan hệ đối tác và tích hợp công nghệ đang giúp nhiều doanh nghiệp khắc phục các vấn đề phổ biến trong việc lập lịch GPU. Nó đang giảm bớt—và loại bỏ—sự cản trở và thách thức trong mọi giai đoạn phát triển AI: từ thử nghiệm và chứng minh khái niệm đến triển khai. Những ý tưởng tuyệt vời đang được biến thành các sáng kiến AI tuyệt vời, nhanh chóng đưa ra thị trường, cho phép hiểu biết sâu sắc hơn về doanh nghiệp và mang lại ROI cực kỳ quan trọng. Thúc đẩy sự hợp tác lớn hơn và giảm khối lượng công việc, các nhà nghiên cứu được giải phóng để tập trung vào việc phát triển ý tưởng của họ và giúp đẩy nhanh hành trình AI của nhóm họ.
Để tìm hiểu sâu hơn về cách Run:ai Atlas và nền tảng data lakehouse của Dell có thể tối ưu hóa các dự án AI của bạn, hãy xem báo cáo này .
Bài viết mới cập nhật
Tăng tốc khối lượng công việc của Hệ thống tệp mạng (NFS) của bạn với RDMA
Giao thức NFS hiện nay được sử dụng rộng rãi trong ...
Mẹo nhanh về dữ liệu phi cấu trúc – OneFS Protection Overhead
Gần đây đã có một số câu hỏi từ lĩnh vực ...
Giới thiệu Dell PowerScale OneFS dành cho Quản trị viên NetApp
Để các doanh nghiệp khai thác được lợi thế của công ...
Cơ sở hạ tầng CNTT: Mua hay đăng ký?
Nghiên cứu theo số liệu của IDC về giải pháp đăng ...