Tăng tốc GenAI với Dell, Databricks và Hugging Face

Khi GenAI phát triển, hãy đầu tư vào bối cảnh phù hợp với tương lai để có quy mô và tính linh hoạt nhằm đổi mới với tốc độ ổn định.

Dữ liệu ngày nay được phân phối nhiều hơn bao giờ hết. Các doanh nghiệp liên tục di chuyển và hợp nhất dữ liệu cũng như tài sản điện toán trên các tài sản tại chỗ, đám mây và biên, cố gắng đạt được sự cân bằng giữa trọng lượng dữ liệu, chi phí và tính khả dụng của SLA điện toán, bảo mật, kinh doanh và quy mô sử dụng, cùng một số vấn đề khác. Với các trường hợp sử dụng và khối lượng công việc mới nổi như GenAI, người dùng không ngừng khám phá các nhóm phần mềm và phần cứng phù hợp có thể đáp ứng yêu cầu của họ. Điều này thường có nghĩa là nhóm giải pháp toàn diện cần được tối ưu hóa cho quy mô, kiểu sử dụng và yêu cầu tuân thủ của tổ chức.

Theo Gartner , hơn 80% doanh nghiệp sẽ sử dụng GenAI vào năm 2026, tăng từ mức chỉ 5% vào năm 2023. Làn sóng áp dụng rộng rãi này ngụ ý rằng người dùng sẽ tìm kiếm những cách nhanh chóng và dễ dàng để khám phá các khả năng cũng như học cách triển khai những kết quả này trong tổ chức của họ. Điều này đặc biệt đúng khi các giải pháp dựa trên đám mây có rào cản gia nhập thấp để bắt đầu. Dell gần đây đã ra mắt Bộ lưu trữ tệp Dell APEX cho Đám mây công cộng – một giải pháp lưu trữ tệp được xác định bằng phần mềm hiệu suất cao, cấp doanh nghiệp, mang phần mềm PowerScale OneFS đến với đám mây công cộng mà bạn lựa chọn. Với các dịch vụ lưu trữ phổ biến trên khắp các vị trí của bạn, tạo ra một lớp lưu trữ chung, nó cho phép bạn di chuyển dữ liệu một cách liền mạch giữa tại chỗ và đám mây. Với tư cách là tại chỗ, bạn sẽ được trải nghiệm hiệu suất lưu trữ, tính nhất quán trong hoạt động và các dịch vụ dữ liệu cấp doanh nghiệp, do đó, bạn có thể tập trung vào đổi mới với dịch vụ lưu trữ tệp mở rộng quy mô linh hoạt,¹ an toàn² và hiệu quả³ nhất thế giới. Bộ lưu trữ tệp Dell APEX hiện có sẵn trên AWS và Azure.

Dell đã hợp tác với Databricks và Hugging Face để đơn giản hóa cách khách hàng có thể bắt đầu hành trình GenAI của mình. Trong sách trắng này , chúng tôi trình bày cách người dùng có thể sử dụng dữ liệu có cấu trúc và không cấu trúc được lưu trữ trong Bộ lưu trữ tệp Dell APEX dành cho Azure, cùng với các thư viện ML phong phú từ Databricks Khảm AI và Ôm mặt và LLM tùy chọn, để mang lại kết quả do AI điều khiển cho doanh nghiệp của họ. Chúng bao gồm các khả năng đào tạo một mô hình mới, tinh chỉnh LLM hiện có hoặc tùy chỉnh các phản hồi LLM thông qua RAG (thế hệ tăng cường truy xuất). Trải nghiệm quản lý được đơn giản hóa trên đám mây cho phép dễ dàng mở rộng và tương tác với nhiều công cụ và công nghệ nhất trong hệ sinh thái dữ liệu và AI.

Sách trắng giới thiệu hai trường hợp sử dụng chính:

    • Sử dụng thư viện biến áp Ôm Mặt để tinh chỉnh LLM từ đầu đến cuối . Chúng tôi sử dụng các loại LLM khác nhau như OpenAI GPT, Google BERT và Falcon. Chúng tôi mã hóa dữ liệu văn bản, đào tạo và tối ưu hóa mô hình, đồng thời lưu mô hình và mã thông báo đã tinh chỉnh trở lại Bộ lưu trữ tệp Dell APEX. Suy luận mẫu được thực hiện bằng cách đọc dữ liệu và tinh chỉnh mô hình từ bộ lưu trữ tệp để tạo ra đầu ra văn bản phù hợp.
    • Sử dụng thư viện soạn thảo AI của Databricks khảm để nhận dạng và phân loại hình ảnh bằng kiến ​​trúc Rest Net với TesNet-56 . Chúng tôi sử dụng thư viện tập dữ liệu của TorchVision để tạo tập dữ liệu tổng hợp cho mục đích đào tạo và thử nghiệm. Các bộ dữ liệu này được lưu trữ trong Bộ lưu trữ tệp Dell APEX và được truy cập bằng S3A.

Trong cả hai trường hợp sử dụng ở trên, cụm Spark đọc dữ liệu đã tinh chỉnh và tất cả các hoạt động đầu vào/đầu ra của cụm điện toán và lưu trữ đều được hỗ trợ thông qua khung tính toán phân tán Spark, sử dụng giao thức S3A.

Khi các khả năng và trường hợp sử dụng của GenAI phát triển theo nhu cầu kinh doanh ngày càng tăng, điều quan trọng là phải đầu tư vào bối cảnh dữ liệu phù hợp với tương lai để mang lại quy mô và tính linh hoạt cho các doanh nghiệp đổi mới với tốc độ ổn định. Tìm hiểu thêm về các giải pháp quản lý dữ liệu và AI của Dell.

1 Dựa trên phân tích của Dell, tháng 2 năm 2023
2 Dựa trên phân tích của Dell so sánh khả năng của phần mềm bảo mật mạng được cung cấp cho Dell PowerScale với các sản phẩm cạnh tranh, tháng 9 năm 2022.
3 Dựa trên phân tích của Dell so sánh các tính năng liên quan đến hiệu quả: giảm dữ liệu, dung lượng lưu trữ, bảo vệ dữ liệu , phần cứng, không gian, hiệu quả quản lý vòng đời và cấu hình được chứng nhận ENERGY STAR, tháng 6 năm 2023.