Hướng dẫn thiết kế—Trí thông minh nhân tạo trong doanh nghiệp – Inferencing

Tổng quan

AI sáng tạo, nhánh của trí tuệ nhân tạo (AI) được thiết kế để tạo dữ liệu, hình ảnh, mã hoặc các loại nội dung mới mà con người không lập trình rõ ràng, đang nhanh chóng trở nên phổ biến trên hầu hết các khía cạnh của kinh doanh và công nghệ.

Suy luận, quá trình sử dụng mô hình AI được đào tạo để đưa ra dự đoán đưa ra quyết định hoặc tạo kết quả đầu ra dựa trên dữ liệu đầu vào, đóng một vai trò quan trọng trong AI tổng quát vì nó cho phép ứng dụng thực tế và tạo nội dung hoặc phản hồi theo thời gian thực. Nó cho phép tạo nội dung gần như tức thời và trải nghiệm tương tác, đồng thời khi được thiết kế và quản lý phù hợp, sẽ làm như vậy với hiệu quả tài nguyên, khả năng mở rộng và thích ứng theo ngữ cảnh. Nó cho phép các mô hình AI tổng quát hỗ trợ các ứng dụng từ chatbot và trợ lý ảo cho đến hệ thống tạo ngôn ngữ tự nhiên nhận biết ngữ cảnh và hệ thống ra quyết định động.

Đầu năm nay, Dell Technologies và NVIDIA đã giới thiệu một dự án đột phá về AI tổng quát, với sáng kiến ​​chung nhằm đưa AI tổng quát đến các trung tâm dữ liệu doanh nghiệp trên thế giới. Dự án này cung cấp một tập hợp các thiết kế đã được xác thực cho các giải pháp phần cứng và phần mềm tích hợp đầy đủ cho phép các doanh nghiệp tạo và chạy các mô hình ngôn ngữ lớn (LLM) AI tùy chỉnh bằng cách sử dụng dữ liệu duy nhất có liên quan đến tổ chức của họ.

LLM là một loại mô hình AI tiên tiến đã được đào tạo trên một tập dữ liệu mở rộng, thường sử dụng các kỹ thuật học sâu, có khả năng hiểu, xử lý và tạo văn bản ngôn ngữ tự nhiên. Tuy nhiên, AI được xây dựng trên các mô hình công khai hoặc chung chung không phù hợp để doanh nghiệp sử dụng trong hoạt động kinh doanh của họ. Các trường hợp sử dụng của doanh nghiệp yêu cầu kiến ​​thức về miền cụ thể để đào tạo, tùy chỉnh và vận hành LLM của họ.

Dell Technologies và NVIDIA đã thiết kế một kiến ​​trúc có thể mở rộng, theo mô-đun và hiệu suất cao, cho phép các doanh nghiệp ở khắp mọi nơi tạo ra một loạt giải pháp AI tổng quát áp dụng riêng cho doanh nghiệp của họ, tái tạo lại các ngành của họ và mang lại cho họ lợi thế cạnh tranh.

Thiết kế dành cho suy luận này là thiết kế đầu tiên trong một loạt các thiết kế đã được xác thực dành cho AI tổng quát tập trung vào tất cả các khía cạnh của vòng đời AI tổng quát, bao gồm suy luận, tùy chỉnh mô hình và đào tạo mô hình. Mặc dù các thiết kế này tập trung vào các trường hợp sử dụng AI tổng quát, nhưng kiến ​​trúc này cũng có thể áp dụng rộng rãi hơn cho các trường hợp sử dụng AI tổng quát hơn.

 

Mục đích tài liệu

Hướng dẫn này mô tả Thiết kế đã được Xác thực của Dell dành cho Suy luận Trí tuệ Nhân tạo Sáng tạo với NVIDIA.

Nó mô tả kiến ​​trúc tham chiếu và thiết kế đã được xác thực cho một nền tảng mô-đun và có thể mở rộng dành cho trí tuệ nhân tạo tổng quát trong doanh nghiệp. Hướng dẫn tập trung cụ thể vào suy luận, là quá trình sử dụng mô hình được đào tạo để tạo dự đoán, đưa ra quyết định hoặc tạo kết quả đầu ra dựa trên dữ liệu đầu vào cho kết quả sản xuất. Các hướng dẫn tiếp theo sẽ giải quyết các thiết kế đã được xác thực để tùy chỉnh và đào tạo mô hình.

Hướng dẫn thiết kế này có thể được đọc cùng với sách trắng liên quan, Trí tuệ nhân tạo Sáng tạo trong Doanh nghiệp . Sách trắng cung cấp thông tin tổng quan về AI tổng quát, bao gồm các nguyên tắc, lợi ích, kiến ​​trúc và kỹ thuật cơ bản của nó; các loại mô hình AI tổng quát khác nhau và cách chúng được sử dụng trong các ứng dụng trong thế giới thực; những thách thức và hạn chế của AI tổng quát; và mô tả về các thành phần phần cứng và phần mềm khác nhau của Dell và NVIDIA sẽ được sử dụng trong loạt thiết kế đã được xác thực sẽ được phát hành.

 

Khán giả

Hướng dẫn thiết kế này dành cho bất kỳ ai quan tâm đến việc triển khai các giải pháp và cơ sở hạ tầng cho AI tổng quát, bao gồm các chuyên gia và các bên liên quan tham gia vào việc phát triển, triển khai và quản lý các hệ thống AI tổng quát.

Các vai trò chính bao gồm giám đốc điều hành CNTT và người ra quyết định như Giám đốc Công nghệ (CTO), Giám đốc Thông tin (CIO) và kiến ​​trúc sư hệ thống chính. Các thành viên khán giả khác có thể bao gồm quản trị viên hệ thống và nhân viên vận hành CNTT, kỹ sư và nhà phát triển AI, nhà khoa học dữ liệu và nhà nghiên cứu AI.

 

Suy luận mô hình AI

Giới thiệu

Chương này mô tả quy trình suy luận trong AI tổng quát và cách quy trình suy luận phù hợp với quy trình chung của hoạt động và phát triển AI tổng quát. Nó cũng trình bày nhiều trường hợp sử dụng cho cả ví dụ suy luận dựa trên ngôn ngữ và phi ngôn ngữ.

Suy luận là gì?

Suy luận trong AI đề cập đến quá trình sử dụng một mô hình được đào tạo để tạo dự đoán, đưa ra quyết định hoặc tạo kết quả đầu ra dựa trên dữ liệu đầu vào. Nó áp dụng kiến ​​thức đã học và các mẫu có được trong giai đoạn đào tạo của mô hình để phản hồi với nội dung mới và độc đáo.

Trong quá trình suy luận, mô hình được đào tạo xử lý dữ liệu đầu vào thông qua các thuật toán tính toán hoặc kiến ​​trúc mạng thần kinh để tạo ra đầu ra hoặc dự đoán. Mô hình áp dụng các tham số, trọng số hoặc quy tắc đã học để chuyển đổi dữ liệu đầu vào thành thông tin hoặc hành động có ý nghĩa.

Suy luận là giai đoạn cao điểm và hoạt động trong vòng đời của một hệ thống AI. Sau khi đào tạo một mô hình về dữ liệu có liên quan để tìm hiểu các mẫu và mối tương quan, suy luận cho phép mô hình khái quát hóa kiến ​​thức của nó và đưa ra dự đoán hoặc tạo phản hồi chính xác và phù hợp với bối cảnh cụ thể của doanh nghiệp.

Ví dụ: trong tác vụ xử lý ngôn ngữ tự nhiên như phân tích cảm tính, mô hình được đào tạo trên tập dữ liệu được gắn nhãn với các mẫu văn bản và nhãn cảm tính tương ứng (tích cực, tiêu cực hoặc trung tính). Trong quá trình suy luận, mô hình được đào tạo lấy dữ liệu văn bản mới, chưa được gắn nhãn làm đầu vào và dự đoán cảm xúc liên quan đến nó.

Suy luận có thể xảy ra trong nhiều ngữ cảnh và ứng dụng khác nhau, chẳng hạn như nhận dạng hình ảnh, nhận dạng giọng nói, dịch máy, hệ thống đề xuất và chatbot. Nó cho phép các hệ thống AI cung cấp kết quả đầu ra có ý nghĩa, giúp đưa ra quyết định, tự động hóa quy trình hoặc tương tác với người dùng dựa trên kiến ​​thức đã học và các mẫu được mô hình nắm bắt trong quá trình đào tạo. Suy luận AI sáng tạo là thứ cho phép các hệ thống AI tạo ra các phản hồi hoặc nội dung mạch lạc và có liên quan theo ngữ cảnh trong thời gian thực.

 

Quy trình phát triển mô hình AI và suy luận

Hình dưới đây cho thấy một quy trình công việc điển hình để phát triển AI tổng quát, mô tả nơi suy luận phù hợp với luồng công việc tổng thể. Mặc dù quy trình này có thể khác nhau giữa các tổ chức, nhưng quy trình cơ bản thường nhất quán.

Hình 1.   Quy trình AI sáng tạo

Ở bước 1, doanh nghiệp phải thiết lập chiến lược cho AI tổng quát bằng cách xem xét các mục tiêu và mục tiêu của mình, xác định các vấn đề muốn giải quyết hoặc cơ hội tạo ra và xác định trường hợp sử dụng hoặc các trường hợp cần giải quyết.

Bước 2 bao gồm chuẩn bị và quản lý dữ liệu. Nó có thể bao gồm làm sạch và ghi nhãn dữ liệu, tổng hợp dữ liệu, ẩn danh dữ liệu hoặc tạo dữ liệu tổng hợp nếu cần và đảm bảo chung rằng tập dữ liệu được quản lý tốt, chất lượng cao và sẵn có để đào tạo mô hình và tùy chỉnh mô hình. Các công cụ phần mềm như nền tảng Vận hành máy học (MLOps) có thể trợ giúp trong giai đoạn chuẩn bị dữ liệu.

Ở bước 3, công việc thực sự bắt đầu, đặc biệt nếu chúng ta đang đào tạo một mô hình từ đầu, đòi hỏi một lượng đáng kể dữ liệu được gắn nhãn liên quan đến trường hợp sử dụng, tài nguyên tính toán lớn và thời gian đào tạo tiềm năng đáng kể. Đây là bước mà cơ sở hạ tầng đã được xác thực, hiệu suất cao và tăng tốc có thể tạo ra sự khác biệt đáng kể về thời gian và hiệu quả để hoàn thành giai đoạn đào tạo. Chúng tôi cũng có thể đánh giá các mô hình hiện có và chọn một mô hình được đào tạo trước nếu mô hình đó phù hợp với doanh nghiệp hoặc sử dụng một mô hình được đào tạo trước làm cơ sở cho bước tùy chỉnh mô hình tiếp theo.

Bước 4 bao gồm việc tùy chỉnh một mô hình được đào tạo, cho dù đó là mô hình mà bạn đã đào tạo từ đầu hay có được dưới dạng một mô hình được đào tạo trước. Các phương pháp tùy chỉnh bao gồm tinh chỉnh, học nhanh có thể bao gồm cả điều chỉnh nhanh và điều chỉnh tham số (P-tuning), học chuyển giao và học tăng cường. Các phương pháp này được thảo luận chi tiết hơn trong  Generative AI trong  sách trắng Doanh nghiệp.

Bước 5 bao gồm suy luận, chủ đề của thiết kế đã được xác thực này. Bước này là nơi bạn triển khai và vận hành mô hình được đào tạo để liên tục tạo ra kết quả kinh doanh, tăng quy mô hoặc mở rộng quy mô tài nguyên máy tính khi cần thiết để đáp ứng nhu cầu. Bước suy luận cũng có thể được lặp đi lặp lại, vì dữ liệu mới và tùy chỉnh mô hình mới và các cơ hội tinh chỉnh được xác định để tối ưu hóa kết quả của các hoạt động suy luận trong thực tế.

 

Trường hợp sử dụng suy luận

Suy luận bằng cách sử dụng LLM để tạo ngôn ngữ tự nhiên trong AI tổng quát có nhiều trường hợp sử dụng thực tế trên nhiều lĩnh vực khác nhau. Mặc dù AI sáng tạo trong sách trắng Doanh nghiệp đã thảo luận về một số trường hợp sử dụng AI sáng tạo cho các ngành khác nhau, nhưng một số ví dụ đáng chú ý về các trường hợp sử dụng cụ thể dựa trên suy luận bao gồm:

  • Tạo ngôn ngữ tự nhiên —Các mô hình AI tạo có thể được sử dụng cho các tác vụ tạo văn bản như viết tài liệu, tạo đối thoại, tóm tắt hoặc tạo nội dung cho mục đích tiếp thị và quảng cáo.
  • Chatbot và trợ lý ảo —Trí tuệ nhân tạo thế hệ thứ hai hỗ trợ các tác nhân đàm thoại, chatbot và trợ lý ảo bằng cách tạo phản hồi bằng ngôn ngữ tự nhiên dựa trên các truy vấn hoặc hướng dẫn của người dùng.
  • Đề xuất được cá nhân hóa —Trí thông minh nhân tạo có thể tạo các đề xuất được cá nhân hóa cho sản phẩm, phim, nhạc hoặc nội dung dựa trên sở thích, hành vi và dữ liệu lịch sử của người dùng.
  • Tăng cường dữ liệu —Trí tuệ nhân tạo có thể tạo các mẫu dữ liệu tổng hợp để tăng cường các bộ dữ liệu hiện có, tăng tính đa dạng và kích thước của dữ liệu đào tạo cho các mô hình máy học.
  • Dịch vụ khách hàng và xử lý sự cố — Ngoài chatbot và trợ lý ảo, còn có một số ứng dụng suy luận trong môi trường xử lý sự cố và dịch vụ khách hàng, bao gồm các ứng dụng như:
  • Cơ sở kiến ​​thức tự phục vụ —Generative AI có thể tự động tạo và cập nhật các bài viết, Câu hỏi thường gặp và hướng dẫn khắc phục sự cố trong cơ sở kiến ​​thức. Khi khách hàng gặp sự cố, họ có thể tìm kiếm cơ sở kiến ​​thức để tìm các tài nguyên tự trợ giúp có liên quan cung cấp hướng dẫn hoặc giải pháp từng bước.
  • Phản hồi theo ngữ cảnh, giải quyết vấn đề và chủ động khắc phục sự cố —AI có thể phân tích các truy vấn hoặc mô tả vấn đề của khách hàng và tạo các phản hồi hoặc đề xuất khắc phục sự cố có liên quan theo ngữ cảnh. Bằng cách hiểu bối cảnh, hệ thống AI có thể đưa ra các đề xuất phù hợp, hướng dẫn khách hàng trong quá trình khắc phục sự cố.
  • Chẩn đoán tương tác —Trí tuệ nhân tạo có thể mô phỏng các cuộc hội thoại chẩn đoán tương tác để xác định các sự cố tiềm ẩn và hướng dẫn khách hàng cách giải quyết. Thông qua một loạt câu hỏi và câu trả lời, hệ thống có thể thu hẹp vấn đề, đưa ra đề xuất hoặc cung cấp các bước tiếp theo để khắc phục sự cố.
  • Định tuyến và leo thang thông minh —Các mô hình AI sáng tạo có thể định tuyến thông minh các yêu cầu của khách hàng hoặc khắc phục sự cố cụ thể dựa trên mức độ phức tạp hoặc mức độ nghiêm trọng của chúng. Họ có thể xác định khi nào một truy vấn phải được chuyển đến các đại lý hỗ trợ con người, đảm bảo sử dụng tài nguyên hiệu quả và giải quyết kịp thời.
  • Phân tích cảm tính và theo dõi cảm tính của khách hàng —Trí tuệ nhân tạo có thể phân tích cảm tính của khách hàng và các tín hiệu cảm xúc từ tin nhắn hoặc tương tác của họ. Phân tích này cho phép các tổ chức theo dõi mức độ hài lòng của khách hàng, xác định các vấn đề tiềm ẩn và thực hiện các biện pháp chủ động để giải quyết các mối lo ngại.

Mặc dù công việc xác thực mà chúng tôi thực hiện trên thiết kế này chủ yếu tập trung vào các ứng dụng văn bản và ngôn ngữ như những ứng dụng được mô tả ở trên, nhưng có những trường hợp sử dụng khác của suy luận AI tổng quát bao gồm:

  • Tổng hợp hình ảnh —Các mô hình AI sáng tạo có thể tạo hình ảnh thực tế ban đầu hoặc sửa đổi hình ảnh hiện có bằng cách áp dụng các phép biến đổi khác nhau, chẳng hạn như chuyển kiểu, tô màu hình ảnh hoặc độ phân giải siêu cao.
  • Sáng tác nhạc —Generative AI có thể tạo các sáng tác nhạc, hòa âm, giai điệu hoặc thậm chí toàn bộ bản nhạc ở nhiều thể loại hoặc phong cách khác nhau dựa trên các mẫu đã học được từ dữ liệu huấn luyện.
  • Tạo video —Các mô hình AI tạo có thể tổng hợp nội dung video mới hoặc sửa đổi các video hiện có, cho phép các ứng dụng như hoàn thành video, tạo deepfake hoặc nâng cao video.
  • Thế giới và môi trường ảo —Trí tuệ nhân tạo có thể tạo ra thế giới ảo, phong cảnh hoặc thiết kế kiến ​​trúc để sử dụng trong trò chơi điện tử, thực tế ảo (VR) hoặc mô phỏng.
  • Nhân vật ảo và hình đại diện —AI thế hệ mới có thể tạo nhân vật ảo, hình đại diện hoặc nhân vật kỹ thuật số thể hiện các đặc điểm, hành vi hoặc tính cách cụ thể.

Những ví dụ này cho thấy cách suy luận trong AI tổng quát được áp dụng trên các lĩnh vực khác nhau. Tính linh hoạt của AI tổng quát cho phép các ứng dụng sáng tạo và đổi mới trong việc tạo nội dung, nghệ thuật sáng tạo, môi trường ảo, cá nhân hóa, dịch vụ khách hàng, v.v. Các trường hợp sử dụng tiếp tục mở rộng khi các công nghệ AI tổng quát phát triển.

 

Những thách thức với suy luận

Suy luận, quá trình sử dụng một mô hình được đào tạo để tạo dự đoán hoặc phản hồi, có thể gặp một số thách thức. Những thách thức phổ biến liên quan đến suy luận trong AI bao gồm:

  • Tài nguyên tính toán —Suy luận có thể cần nhiều tính toán, đặc biệt đối với các mô hình lớn và phức tạp. Mặc dù tính năng suy luận có thể ít đòi hỏi hơn so với đào tạo hoặc tinh chỉnh mô hình, nhưng việc tạo dự đoán hoặc phản hồi trong thời gian thực có thể yêu cầu sức mạnh xử lý, bộ nhớ đáng kể và sử dụng tài nguyên phần cứng hiệu quả.
  • Độ trễ và khả năng phản hồi —Việc đạt được kết luận có độ trễ thấp và độ phản hồi cao là rất quan trọng trong nhiều ứng dụng thời gian thực. Cân bằng nhu cầu tính toán của mô hình với nhu cầu phản hồi nhanh có thể là một thách thức, đặc biệt khi xử lý khối lượng lớn yêu cầu đồng thời của người dùng.
  • Kích thước và hiệu quả của mô hình —LLM, chẳng hạn như GPT-3, có thể có hàng triệu hoặc thậm chí hàng tỷ tham số. Việc triển khai và chạy các mô hình như vậy một cách hiệu quả, đặc biệt là trên các thiết bị bị hạn chế về tài nguyên hoặc trong các tình huống điện toán biên, có thể là một thách thức do các yêu cầu về bộ nhớ và lưu trữ.
  • Khả năng mở rộng triển khai —Tăng quy mô triển khai mô hình xử lý nhu cầu ngày càng tăng của người dùng. Việc đảm bảo rằng hệ thống có thể xử lý các yêu cầu tham luận đồng thời và phân bổ động các tài nguyên để đáp ứng khối lượng công việc có thể phức tạp, đòi hỏi thiết kế và tối ưu hóa kiến ​​trúc cẩn thận.
  • Tối ưu hóa và nén mô hình —Tối ưu hóa và nén các mô hình cho suy luận là cần thiết để giảm các yêu cầu về bộ nhớ và tính toán, cho phép triển khai hiệu quả trên nhiều thiết bị hoặc nền tảng khác nhau. Cân bằng sự đánh đổi giữa kích thước mô hình, tốc độ suy luận và độ chính xác là một nhiệm vụ không hề đơn giản.
  • Liên tục học hỏi và thích ứng —Các mô hình được triển khai phải được điều chỉnh để phù hợp với dữ liệu đang phát triển hoặc nhu cầu của người dùng thay đổi theo thời gian. Việc kết hợp dữ liệu mới, đào tạo lại hoặc tinh chỉnh mô hình đồng thời giảm thiểu sự gián đoạn đối với quá trình suy luận có thể phức tạp và yêu cầu quản lý cẩn thận.
  • Khả năng giải thích và khả năng diễn giải —Hiểu và giải thích lý do đằng sau các dự đoán hoặc phản hồi của mô hình là rất quan trọng trong nhiều ứng dụng, đặc biệt là trong các lĩnh vực mà trách nhiệm giải trình, tính minh bạch và các cân nhắc về đạo đức có tầm quan trọng hàng đầu. Việc đảm bảo khả năng diễn giải các quyết định của mô hình trong quá trình suy luận có thể là một thách thức, đặc biệt đối với các mô hình phức tạp như mạng lưới thần kinh sâu.
  • Kiểm soát chất lượng và xử lý lỗi —Việc phát hiện và xử lý lỗi hoặc điểm không chính xác trong quá trình suy luận là rất quan trọng để duy trì chất lượng và độ tin cậy của hệ thống. Thực hiện các cơ chế xử lý lỗi, giám sát và kiểm soát chất lượng hiệu quả để xác định và khắc phục các vấn đề là điều cần thiết.

Những thách thức này làm nổi bật nhu cầu xem xét cẩn thận và tối ưu hóa trong các khía cạnh khác nhau của suy luận, từ hiệu quả tính toán và khả năng mở rộng đến tối ưu hóa mô hình, khả năng diễn giải và kiểm soát chất lượng. Giải quyết những thách thức này góp phần hiệu quả vào việc phát triển các hệ thống AI mạnh mẽ và đáng tin cậy để suy luận.

Dell Technologies và NVIDIA giúp giải quyết những thách thức này bằng cách hợp tác để cung cấp giải pháp phần cứng và phần mềm tích hợp và được kiểm chứng, được xây dựng trên cơ sở hạ tầng tốt nhất trong phân khúc có hiệu suất cao của Dell và sử dụng ngăn xếp phần mềm từng đoạt giải thưởng cũng như công nghệ tăng tốc hàng đầu trong ngành và Bộ phần mềm doanh nghiệp AI của NVIDIA.

Ngoài ra, các nền tảng Dell có khả năng phục hồi mạng, an toàn nội tại với các mô hình và lan can được đào tạo trước của NVIDIA AI đảm bảo các hoạt động AI an toàn với quyền riêng tư và tuân thủ.