Mô hình GPT-OSS của OpenAI + Nhà máy AI của Dell: Mở khóa AI doanh nghiệp theo điều kiện của bạn

Dell và Hugging Face đang cách mạng hóa việc triển khai AI với Dell Enterprise Hub. Từ các mô hình được xác thực trước đến tích hợp ứng dụng liền mạch, mối quan hệ hợp tác này giúp đơn giản hóa việc áp dụng AI cho doanh nghiệp. Khám phá cách các công cụ tiên tiến như Application Catalog và các container được tối ưu hóa giúp doanh nghiệp dễ dàng mở rộng quy mô AI.

Tin tức lớn trong thế giới AI: OpenAI vừa phát hành các mô hình ngôn ngữ trọng số mở đầu tiên kể từ GPT2. Được gọi là GPT-OSS, các mô hình này hoàn toàn mở, được cấp phép theo Apache 2.0 và có hai kích cỡ — tham số 120B và 20B. Dell Technologies là OEM đầu tiên và duy nhất cung cấp các mô hình này cho doanh nghiệp thông qua Dell Enterprise Hub trên Hugging Face.

Tại sao điều này lại quan trọng? Đối với doanh nghiệp, điều này có nghĩa là cuối cùng bạn có thể chạy các mô hình suy luận tiên tiến hoàn toàn tại chỗ, tùy chỉnh chúng khi cần và tích hợp chặt chẽ với các hệ thống dữ liệu hiện có của mình—không bị ràng buộc bởi nhà cung cấp, không để dữ liệu thoát khỏi tường lửa. Và khi kết hợp các mô hình này với Dell AI Factory, bạn sẽ có một lộ trình hoàn chỉnh, được xác thực để triển khai AI cấp doanh nghiệp.

Có gì mới trong GPT‑OSS?

Bản phát hành GPT-OSS có ý nghĩa quan trọng vì một số lý do sau:

  • Hai kích thước mô hình cho các nhu cầu khác nhau: Phiên bản 120B cung cấp khả năng lập luận tiên tiến, trong khi mô hình 20B đủ nhẹ để chạy trên một GPU hoặc thậm chí là PC AI Dell.
  • Cấp phép cho phép (Apache 2.0): Bạn có thể lưu trữ, sửa đổi, tinh chỉnh và phân phối lại các mô hình này—lý tưởng cho các nhóm doanh nghiệp cần sự linh hoạt và khả năng kiểm soát.
  • Chỉ văn bản và tối ưu hóa lý luận: Hoàn hảo cho những thứ như chatbot, phân tích tài liệu, thế hệ tăng cường truy xuất (RAG) và tác nhân kiến thức nội bộ.

Đây là tín hiệu cho thấy OpenAI không chỉ dành riêng cho các nhà nghiên cứu nữa mà giờ đây chúng đã đủ mạnh để đáp ứng khối lượng công việc của doanh nghiệp.

Những mô hình này được xây dựng như thế nào?

Về cơ bản, các mô hình GPT-OSS sử dụng một số lựa chọn thiết kế khiến chúng đặc biệt hấp dẫn đối với việc triển khai tại chỗ:

  •  Thay vì kích hoạt mọi tham số cho mọi mã thông báo, kiến trúc Hỗn hợp chuyên gia (MoE) chỉ kích hoạt một tập hợp con, giúp quá trình suy luận diễn ra nhanh chóng và tiết kiệm chi phí.
  • Lượng tử hóa 4 bit (MXFP4) giúp giảm đáng kể dung lượng bộ nhớ sử dụng, cho phép các mô hình lớn chạy trên ít GPU hơn, tối đa hóa hiệu quả.
  • Điểm chuẩn đưa các mô hình này vào cùng hạng với các mô hình dòng o độc quyền của OpenAI như o3-mini và o4-mini, nâng cao hiệu suất suy luận cạnh tranh.

Nói một cách đơn giản, chúng mạnh mẽ, hiệu quả và cởi mở—ba điều mà các doanh nghiệp luôn yêu cầu.

Tại sao doanh nghiệp nên quan tâm

Khi các doanh nghiệp chuyển sang AI, bảo mật dữ liệu, tuân thủ và chi phí là những yếu tố hàng đầu cần được quan tâm để đảm bảo triển khai có trách nhiệm. Các mô hình trọng số mở như GPT-OSS giải quyết vấn đề này một cách trực tiếp:

  • Người dùng có thể triển khai chúng hoàn toàn tại chỗ, sau tường lửa, không cần lệnh gọi API bên ngoài.
  • Doanh nghiệp có toàn quyền kiểm soát việc tinh chỉnh, kiểm toán và mở rộng mô hình sang lĩnh vực của mình.
  • Tránh được các khoản phí API định kỳ, vốn có thể tăng nhanh theo quy mô.

Phiên bản này cho phép các tổ chức điều chỉnh chiến lược AI phù hợp với chính sách bảo mật và ngân sách thực tế mà không ảnh hưởng đến khả năng.

Nhập Dell AI Factory

Dell AI Factory cung cấp mọi thứ doanh nghiệp cần để triển khai AI: máy chủ Dell PowerEdge, khả năng tăng tốc GPU, lưu trữ, mạng, phần mềm điều phối, máy tính cá nhân AI và các dịch vụ được quản lý. Khi tích hợp GPT-OSS vào hệ thống này, bạn sẽ có một lộ trình sẵn sàng cho AI tại chỗ được xác thực toàn diện.

Một số điểm nổi bật:

  • Phần cứng phù hợp với các mẫu máy: Máy chủ PowerEdge dòng Dell XE (như XE9780 và XE9780L) được tối ưu hóa cho các GPU cao cấp bao gồm NVIDIA và AMD—nhiên liệu mà GPT-OSS cần để suy luận và đào tạo nhanh.
  • Có khả năng mở rộng từ biên đến lõi: Mô hình 20B chạy thoải mái trên các nút nhỏ hơn cho các nhóm cục bộ, bao gồm cả trên PC AI, trong khi mô hình 120B hỗ trợ khối lượng công việc quy mô lớn trong các trung tâm dữ liệu.
  • Chi phí và hiệu quả: Dell ước tính chi phí suy luận LLM thấp hơn tới 62% so với triển khai trên nền tảng đám mây công cộng. Kết hợp với việc không mất phí API cho các mô hình nguồn mở, khoản tiết kiệm này là rất đáng kể.

Bảo mật và tuân thủ, tích hợp sẵn

Cả OpenAI và Dell đều đã đầu tư mạnh vào việc biến sự kết hợp này thành giải pháp sẵn sàng cho doanh nghiệp:

  • Các mô hình GPT-OSS đã trải qua quá trình đánh giá an toàn rộng rãi và thử nghiệm của nhóm đỏ trước khi phát hành.
  • Dell AI Factory áp dụng kiến trúc Zero Trust, mã hóa và chứng nhận tuân thủ (HIPAA, FedRAMP, v.v.) cho các ngành được quản lý chặt chẽ.
  • Và quan trọng nhất là dữ liệu không bao giờ rời khỏi trung tâm dữ liệu.

Đối với các ngành như tài chính, chăm sóc sức khỏe hoặc chính phủ, đây chính xác là loại thiết lập giúp việc áp dụng AI an toàn trở nên khả thi.

Tính linh hoạt và lựa chọn hệ sinh thái

Trọng số mở đồng nghĩa với việc bạn không bị bó buộc vào một nhà cung cấp hoặc lộ trình duy nhất. Điều này cho phép người dùng tinh chỉnh các mô hình với dữ liệu của riêng họ và xây dựng các quy trình RAG bằng cách sử dụng cơ sở kiến thức nội bộ. Doanh nghiệp cũng có thể tích hợp với các nền tảng như Dell Enterprise Hub trên Hugging Face hoặc NVIDIA NeMo để điều phối và giám sát.

Sự linh hoạt này có nghĩa là bạn có thể đổi mới theo tốc độ của riêng mình và thích ứng khi nhu cầu của bạn thay đổi.

Tại sao điều này lại quan trọng bây giờ

Sự kết hợp giữa các mô hình mở của OpenAI và Dell AI Factory đánh dấu sự chuyển dịch sang các mô hình suy luận mạnh mẽ hiện có thể truy cập, tùy chỉnh và triển khai theo điều kiện của bạn.

Đối với các doanh nghiệp đang tìm kiếm AI:

  • An toàn, chạy sau tường lửa,
  • Tiết kiệm chi phí vì không có phí API cho mỗi mã thông báo,
  • Có thể tùy chỉnh với khả năng tinh chỉnh theo tên miền của bạn và
  • Hiệu suất cao với khả năng suy luận tiên tiến…

…sự chờ đợi đã kết thúc.

GPT-OSS kết hợp với Dell AI Factory mang đến cho doanh nghiệp những lợi ích tốt nhất của cả hai nền tảng – khả năng AI mới nhất với khả năng kiểm soát và bảo mật khi triển khai tại chỗ. Đây là một chương mới cho AI doanh nghiệp, giúp doanh nghiệp nắm chắc vị trí dẫn đầu.