Sự phổ biến rộng rãi và đột ngột của GenAI đang thu hút sự chú ý của mọi người, khi các tổ chức đang cố gắng tìm hiểu ý nghĩa của điều này đối với hoạt động kinh doanh của họ – và cách họ có thể xây dựng giá trị và doanh thu.
Với thông báo ngày 31 tháng 7 của chúng tôi – dựa trên thông báo Project Helix của tháng 5 – chúng tôi hiện đang đơn giản hóa việc triển khai và áp dụng giải pháp toàn bộ ngăn xếp cho các dự án suy luận GenAI. Phối hợp với NVIDIA, kiến trúc chung này mang đến một thiết kế mô-đun và linh hoạt hỗ trợ nhiều trường hợp sử dụng và yêu cầu tính toán.
Trước hết, suy luận là gì?
Suy luận trong AI đề cập đến quá trình sử dụng một mô hình được đào tạo để tạo dự đoán, đưa ra quyết định hoặc tạo kết quả đầu ra dựa trên dữ liệu đầu vào. Đó là áp dụng kiến thức và mẫu đã học trong giai đoạn huấn luyện mô hình cho dữ liệu hoàn toàn mới. Trong quá trình suy luận, mô hình được đào tạo xử lý dữ liệu đầu vào thông qua các thuật toán tính toán hoặc kiến trúc mạng thần kinh để tạo ra đầu ra hoặc dự đoán (nghĩa là thông tin hoặc hành động có ý nghĩa).
Vậy điều đó có ý nghĩa gì đối với GenAI?
Suy luận là giai đoạn cuối cùng trong vòng đời của một hệ thống AI, cho phép mô hình khái quát hóa kiến thức của nó và đưa ra dự đoán hoặc tạo phản hồi trên dữ liệu mới. Về cơ bản, bạn đã hoàn thành quá trình đào tạo và điều chỉnh (hoặc sử dụng mô hình được đào tạo trước), giờ là lúc triển khai vào sản xuất và bắt đầu mang lại kết quả cũng như giá trị.
Một số ví dụ thú vị về các trường hợp sử dụng suy luận bao gồm:
-
- Tạo ngôn ngữ tự nhiên . Các mô hình có thể được sử dụng cho các tác vụ tạo văn bản như viết tài liệu, tạo đối thoại, tóm tắt hoặc tạo nội dung.
- Chatbots và trợ lý ảo . Tăng sức mạnh cho các tác nhân đàm thoại, chatbot và trợ lý ảo bằng cách tạo phản hồi bằng ngôn ngữ tự nhiên dựa trên các truy vấn hoặc hướng dẫn của người dùng.
- Phát triển mã . Nhận hỗ trợ phát triển phần mềm với các tính năng như hoàn thành mã, khả năng tạo bài kiểm tra đơn vị hoặc chức năng trò chuyện để giải thích mã.
Tăng năng suất và thông tin chi tiết
Thông qua Dell Validated Designs, bạn có thể đoán được việc triển khai GenAI với kiến trúc tham chiếu đã được chứng minh nhằm đơn giản hóa việc áp dụng. Tăng sức mạnh cho nỗ lực suy luận của bạn trên cơ sở hạ tầng Dell, chẳng hạn như Dell PowerEdge XE9680 hoặc PowerEdge R760xa, một lựa chọn GPU NVIDIA® Tensor Core, với phần mềm Dell và nền tảng phần mềm NVIDIA AI Enterprise bao gồm Triton Inference Server và khung NeMo. Lưu trữ kho dữ liệu nhanh, phong phú cho AI Sáng tạo và các mô hình ngôn ngữ lớn được cung cấp bởi mảng lưu trữ kết hợp hoặc flash toàn bộ của Dell PowerScale
Với kiến trúc tham chiếu dành cho Suy luận, chúng tôi đang cung cấp một lộ trình về cách tận dụng các mô hình được đào tạo trước một cách tiết kiệm chi phí thông qua khung NVIDIA NeMo – thay vì xây dựng và đào tạo mô hình của riêng bạn từ đầu. Bằng cách tận dụng các mô hình suy luận được đào tạo trước, bạn có thể mang lại kết quả nhanh hơn và tiết kiệm chi phí hơn. Các mô hình được đào tạo trước cũng có thể được tinh chỉnh thêm với lượng dữ liệu cụ thể theo nhiệm vụ nhỏ hơn, đồng thời cấp quyền truy cập vào một loạt chức năng sẵn sàng sử dụng, chẳng hạn như dịch ngôn ngữ chẳng hạn.
Cung cấp môi trường phát triển hiệu suất cao tại địa phương
Một phần của việc triển khai suy luận LLM trên quy mô lớn trong trung tâm dữ liệu của riêng bạn là cho phép các nhà phát triển AI và nhà khoa học dữ liệu của bạn phát triển và tinh chỉnh cục bộ các mô hình GenAI trước khi đưa vào sản xuất. Với máy trạm Dell Precision và phần mềm AI tích hợp (Dell Optimizer), bạn sẽ có được hiệu suất và độ tin cậy mà Dell đã quen thuộc – được hỗ trợ bởi tối đa bốn GPU NVIDIA RTX 6000 thế hệ Ada trong một máy trạm.
Mở khóa các ưu tiên của bạn nhanh hơn với Dịch vụ chuyên nghiệp của Dell
Ngoài ra, chúng tôi sẽ giúp bạn ở mọi giai đoạn trong hành trình hướng tới kết luận LLM. Với Dịch vụ Chuyên nghiệp của Dell, cho dù bạn cần hỗ trợ phát triển chiến lược, triển khai và tích hợp với các hệ thống khác của mình hay mở rộng quy mô để đáp ứng các yêu cầu kinh doanh mới hơn – chúng tôi sẽ luôn hỗ trợ bạn từng bước.
Với các giải pháp GenAI mạnh mẽ từ Dell Technologies và NVIDIA, giờ đây bạn có thể chuyển đổi các quy trình trong các lĩnh vực như vận hành khách hàng, tạo nội dung, phát triển phần mềm và bán hàng – đồng thời cung cấp khả năng bảo mật tại chỗ cần thiết để bảo vệ dữ liệu độc quyền của công ty bạn.
Bài viết mới cập nhật
Thuần hóa sự hỗn loạn của công nghệ: Giải pháp phục hồi sáng tạo của Dell
Sự cố CNTT nghiêm trọng ảnh hưởng đến 8,5 triệu hệ ...
Dell PowerScale và Marvel hợp tác để tạo ra quy trình làm việc truyền thông tối ưu
Hiện đang ở thế hệ thứ 9, giải pháp lưu trữ Dell ...
Bảo mật PowerScale OneFS SyncIQ
Trong thế giới sao chép dữ liệu, việc đảm bảo tính ...
Danh sách kiểm tra cơ sở bảo mật PowerScale
Là một biện pháp bảo mật tốt nhất, chúng tôi khuyến ...