AI sáng tạo trong doanh nghiệp

Tóm tắt điều hành

Sự phát triển của các ứng dụng và trường hợp sử dụng trí tuệ nhân tạo (AI) thật đáng kinh ngạc, với tác động trên gần như tất cả các khía cạnh của cuộc sống kinh doanh và cá nhân. AI sáng tạo, nhánh của AI được thiết kế để tạo dữ liệu, hình ảnh, mã hoặc các loại nội dung khác mà con người không lập trình rõ ràng, đang trở nên đặc biệt có tác động và ảnh hưởng.

Theo một nhà phân tích, quy mô thị trường AI toàn cầu được ước tính là 10,79 tỷ USD vào năm 2022. Dự kiến ​​sẽ đạt 118 tỷ USD vào năm 2032, tăng trưởng với tốc độ tăng trưởng kép hàng năm (CAGR) là 27% từ năm 2023 đến năm 2032

Cũng như vô số ứng dụng khác, các trường hợp sử dụng bao gồm:

  • Đại lý đàm thoại và chatbot cho dịch vụ khách hàng
  • Tạo nội dung âm thanh và hình ảnh
  • lập trình phần mềm
  • Bảo mật, phát hiện gian lận và thông tin về mối đe dọa
  • Tương tác và dịch thuật ngôn ngữ tự nhiên

Có rất ít lĩnh vực kinh doanh và xã hội không bị ảnh hưởng theo một cách nào đó bởi công nghệ này.

Mặc dù các mô hình AI tạo ra công khai như ChatGPT, Google Bard AI, DALL-E và các dịch vụ khác và chuyên biệt hơn đang hấp dẫn, vẫn có những lo ngại chính đáng về việc sử dụng chúng trong doanh nghiệp. Những mối quan tâm này bao gồm quyền sở hữu đầu ra, bao gồm các vấn đề về tính chính xác, tính trung thực và ghi nhận nguồn.

Do đó, các doanh nghiệp cần phải phát triển các Mô hình ngôn ngữ lớn (LLM) của riêng họ, được đào tạo trên các bộ dữ liệu độc quyền hoặc được phát triển và tinh chỉnh từ các mô hình được đào tạo trước đã biết.

Công nghệ Dell và NVIDIA

Dell Technologies và NVIDIA đã dẫn đầu bằng cách cung cấp những đổi mới chung cho AI và điện toán hiệu năng cao. Chúng tôi đang tích cực hợp tác trong không gian mới này để cho phép khách hàng tạo và vận hành các mô hình AI tổng quát cho doanh nghiệp.

  • Dell Technologies có cơ sở hạ tầng hàng đầu trong ngành bao gồm các máy chủ mạnh mẽ với khả năng tăng tốc đơn vị xử lý đồ họa (GPU) của NVIDIA, hệ thống lưu trữ dữ liệu, kết nối mạng, quản lý hệ thống, thiết kế tham chiếu và nhiều năm kinh nghiệm trợ giúp các doanh nghiệp với các sáng kiến ​​AI của họ.
  • NVIDIA có khả năng tăng tốc GPU hàng đầu, các giải pháp kết nối mạng đầu cuối, phần mềm quản lý cụm, phần mềm NVIDIA AI Enterprise, các mô hình nền tảng tiên tiến, được đào tạo trước bao gồm khung NeMo và chuyên môn để xây dựng, tùy chỉnh và chạy AI sáng tạo.

Chúng tôi hiện đang hợp tác trong một dự án AI tổng hợp mới có tên Project Helix, một sáng kiến ​​chung giữa Dell Technologies và NVIDIA, nhằm mang AI tổng hợp đến các trung tâm dữ liệu doanh nghiệp trên thế giới. Project Helix là một giải pháp toàn diện cho phép các doanh nghiệp tạo và chạy các mô hình AI tùy chỉnh, được xây dựng dựa trên kiến ​​thức về doanh nghiệp của họ. Chúng tôi đã thiết kế một cơ sở hạ tầng có thể mở rộng, theo mô-đun và hiệu suất cao, cho phép các doanh nghiệp ở khắp mọi nơi tạo ra một làn sóng các giải pháp AI tổng thể sẽ tái tạo lại các ngành của họ và mang lại cho họ lợi thế cạnh tranh.

AI sáng tạo là một trong những lĩnh vực AI thú vị và phát triển nhanh nhất hiện nay. Đây là một công nghệ biến đổi và sự kết hợp giữa cơ sở hạ tầng và phần mềm mạnh mẽ của Dell Technologies cùng với máy gia tốc, phần mềm AI và chuyên môn AI của NVIDIA là không ai sánh kịp.

Về tài liệu này

Trong báo cáo trắng này, người đọc có thể có được cái nhìn tổng quan toàn diện về AI tổng quát, bao gồm các nguyên tắc, lợi ích, kiến ​​trúc và kỹ thuật cơ bản của nó. Họ cũng có thể tìm hiểu về các loại mô hình AI tổng quát khác nhau và cách chúng được sử dụng trong các ứng dụng trong thế giới thực.

Sách trắng này cũng khám phá những thách thức và hạn chế của AI tổng quát, chẳng hạn như khó khăn trong việc đào tạo các mô hình quy mô lớn, khả năng thiên vị và lo ngại về đạo đức cũng như sự đánh đổi giữa việc tạo ra kết quả đầu ra thực tế và duy trì quyền riêng tư của dữ liệu.

Sách trắng này cũng cung cấp hướng dẫn về cách phát triển và triển khai các mô hình AI tổng quát một cách hiệu quả. Nó bao gồm các cân nhắc về cơ sở hạ tầng phần cứng và phần mềm từ Dell Technologies và NVIDIA, quản lý dữ liệu và các chỉ số đánh giá – tất cả đều dẫn đến kiến ​​trúc sản xuất có thể mở rộng, hiệu suất cao cho AI tổng quát trong doanh nghiệp.

Khán giả

Sách trắng này dành cho các nhà lãnh đạo doanh nghiệp Giám đốc công nghệ (CTO), Giám đốc thông tin (CIO), nhà quản lý cơ sở hạ tầng CNTT và kiến ​​trúc sư hệ thống, những người quan tâm, tham gia hoặc cân nhắc triển khai AI tổng quát.

Khái niệm nền tảng AI

Lý lịch

AI đã trải qua nhiều giai đoạn phát triển kể từ khi bắt đầu vào giữa thế kỷ 20. Các giai đoạn chính của sự phát triển AI, cùng với các khung thời gian gần đúng, là:

  1. Các hệ thống dựa trên quy tắc (những năm 1950-1960) —Giai đoạn đầu tiên của quá trình phát triển AI đề cập đến việc tạo ra các hệ thống dựa trên quy tắc, trong đó các chuyên gia mã hóa kiến ​​thức của họ thành một bộ quy tắc để máy tính tuân theo. Các hệ thống này bị hạn chế về khả năng học hỏi từ dữ liệu mới hoặc thích ứng với các tình huống mới.
  2. Học máy (những năm 1960-1990) —Giai đoạn tiếp theo của quá trình phát triển AI đề cập đến việc sử dụng các thuật toán học máy để đào tạo máy tính nhận dạng các mẫu trong dữ liệu và đưa ra dự đoán hoặc quyết định dựa trên các mẫu đó. Giai đoạn này chứng kiến ​​sự phát triển của các thuật toán như cây quyết định, hồi quy logistic và mạng lưới thần kinh.
  3. Deep learning (2010s-nay) —Giai đoạn tiếp theo của AI đề cập đến deep learning. Học sâu là một tập hợp con của học máy sử dụng mạng lưới thần kinh có nhiều lớp để nhận dạng các mẫu phức tạp trong dữ liệu. Giai đoạn này đã có hiệu quả trong việc xử lý dữ liệu hình ảnh, video và ngôn ngữ tự nhiên.
  4. AI sáng tạo (hiện tại) —Giai đoạn hiện tại đề cập đến AI sáng tạo. AI sáng tạo sử dụng các thuật toán học sâu để tạo nội dung như hình ảnh, video, nhạc và thậm chí cả văn bản gần giống với các mẫu của dữ liệu gốc. Giai đoạn này có tiềm năng to lớn để tạo ra các loại nội dung mới và tạo ra những hiểu biết và dự đoán mới dựa trên lượng lớn dữ liệu.

Mặc dù các giai đoạn này không được xác định nghiêm ngặt hoặc loại trừ lẫn nhau, nhưng chúng đại diện cho các mốc quan trọng trong quá trình phát triển AI và chứng minh mức độ phức tạp và phức tạp ngày càng tăng của các thuật toán và ứng dụng AI theo thời gian.

Định nghĩa và tổng quan

AI sáng tạo là một nhánh của trí tuệ nhân tạo xây dựng các mô hình có thể tạo ra nội dung (chẳng hạn như hình ảnh, văn bản hoặc âm thanh) không được lập trình rõ ràng bởi con người và có kiểu dáng và cấu trúc tương tự như các ví dụ hiện có. Các kỹ thuật AI sáng tạo sử dụng các thuật toán học sâu để học từ các tập dữ liệu lớn gồm các ví dụ, tìm hiểu các mẫu và tạo nội dung mới tương tự như dữ liệu gốc.

Một trong những khía cạnh quan trọng của AI tổng quát là khả năng tạo nội dung không thể phân biệt được với nội dung do con người tạo ra, nội dung này có nhiều ứng dụng trong các ngành như giải trí, thiết kế và tiếp thị. Ví dụ: AI tổng quát có thể tạo ra hình ảnh thực tế của các sản phẩm chưa tồn tại, tạo ra âm nhạc bắt chước phong cách của một nghệ sĩ cụ thể hoặc thậm chí tạo ra văn bản không thể phân biệt được với nội dung do con người viết.

Một lĩnh vực quan trọng của AI tạo ra là tạo ngôn ngữ tự nhiên (NLG), là một tập hợp con của xử lý ngôn ngữ tự nhiên (NLP) và liên quan đến việc tạo văn bản ngôn ngữ tự nhiên mạch lạc, trôi chảy và có phong cách tương tự như văn bản hiện có hoặc do con người tạo ra. NLG đã được sử dụng cho nhiều ứng dụng khác nhau, bao gồm chatbot, dịch ngôn ngữ và tạo nội dung.

Nhìn chung, AI tổng quát có khả năng thay đổi cách chúng ta tạo và sử dụng nội dung. Nó có tiềm năng tạo ra kiến ​​thức và hiểu biết mới trong các lĩnh vực khác nhau, khiến nó trở thành một lĩnh vực phát triển thú vị trong AI.

Sự tiến hóa

Những tiến bộ trong thuật toán học sâu và sự sẵn có của bộ dữ liệu lớn về văn bản ngôn ngữ tự nhiên đã thúc đẩy sự phát triển của NLG thành AI tổng quát. Các hệ thống NLG ban đầu dựa trên các phương pháp tiếp cận dựa trên quy tắc hoặc dựa trên mẫu, vốn bị hạn chế về khả năng tạo nội dung đa dạng và sáng tạo. Tuy nhiên, với sự gia tăng của các kỹ thuật học sâu như mạng thần kinh tái phát (RNN) và máy biến áp, có thể xây dựng các mô hình có thể học từ bộ dữ liệu lớn của văn bản ngôn ngữ tự nhiên và tạo văn bản mới đa dạng và sáng tạo hơn.

Một cột mốc quan trọng trong quá trình phát triển của AI thế hệ mới là sự phát triển của loạt mô hình Generative Pretraining Transformer (GPT) của OpenAI. Mô hình GPT ban đầu, được phát hành vào năm 2018, là một mô hình dựa trên máy biến áp được đào tạo trên một kho dữ liệu văn bản lớn. Mô hình có thể tạo văn bản mạch lạc và trôi chảy, có phong cách tương tự như dữ liệu gốc. Các phiên bản tiếp theo của mô hình, bao gồm GPT-2 và GPT-3, đã mở rộng ranh giới của những gì có thể với NLG, tạo ra văn bản ngày càng đa dạng, sáng tạo và thậm chí giống con người trong một số trường hợp.

Ngày nay, các kỹ thuật AI tổng quát được sử dụng trong nhiều ứng dụng, bao gồm tạo nội dung, chatbot, dịch ngôn ngữ, v.v. Khi lĩnh vực này tiếp tục phát triển, chúng ta có thể mong đợi thấy các mô hình AI tổng quát tinh vi hơn có thể tạo ra nội dung đa dạng và sáng tạo hơn nữa.

Mô hình máy biến áp

Mô hình máy biến áp là một loại mô hình học sâu thường được sử dụng trong NLP và các ứng dụng khác của AI tổng quát. Transformers đã được Vaswani và những người khác giới thiệu trong một bài báo chuyên đề vào năm 2017. Kể từ đó, chúng đã trở thành một khối xây dựng quan trọng cho nhiều mô hình NLP hiện đại.

Ở cấp độ cao, các mô hình máy biến áp được thiết kế để tìm hiểu các mối quan hệ theo ngữ cảnh giữa các từ trong một câu hoặc chuỗi văn bản. Họ đạt được việc học này bằng cách sử dụng một cơ chế gọi là tự chú ý, cho phép mô hình cân nhắc tầm quan trọng của các từ khác nhau theo trình tự dựa trên ngữ cảnh của chúng. Phương pháp này trái ngược với các mô hình mạng thần kinh tái phát (RNN) truyền thống, mô hình này xử lý tuần tự các chuỗi đầu vào và không có chế độ xem toàn cục của chuỗi.

Một lợi thế chính của các mô hình máy biến áp là khả năng xử lý song song các chuỗi đầu vào, giúp chúng nhanh hơn RNN đối với nhiều tác vụ NLP. Chúng cũng đã được chứng minh là có hiệu quả cao đối với một loạt các nhiệm vụ NLP, bao gồm mô hình hóa ngôn ngữ, phân loại văn bản, trả lời câu hỏi và dịch máy.

Sự thành công của các mô hình máy biến áp đã dẫn đến sự phát triển của các mô hình ngôn ngữ được đào tạo trước, quy mô lớn, được gọi là máy biến áp đào tạo trước tổng quát (GPT), chẳng hạn như dòng GPT của OpenAI và mô hình Đại diện bộ mã hóa hai chiều từ máy biến áp (BERT) của Google. Các mô hình được đào tạo trước này có thể được tinh chỉnh cho các nhiệm vụ NLP cụ thể với dữ liệu đào tạo bổ sung tương đối ít, giúp chúng có hiệu quả cao đối với nhiều ứng dụng NLP.

Nhìn chung, các mô hình máy biến áp đã cách mạng hóa lĩnh vực NLP và đã trở thành khối xây dựng chính cho nhiều mô hình AI sáng tạo hiện đại. Khả năng tìm hiểu các mối quan hệ theo ngữ cảnh giữa các từ trong chuỗi văn bản đã mang đến những khả năng mới cho việc tạo ngôn ngữ, hiểu văn bản và các nhiệm vụ NLP khác.

Đặc điểm khối lượng công việc

Khối lượng công việc AI sáng tạo có thể được phân loại thành hai loại: đào tạo và suy luận. Quá trình đào tạo sử dụng một tập dữ liệu lớn gồm các ví dụ để đào tạo mô hình AI tổng quát, trong khi suy luận sử dụng mô hình đã đào tạo để tạo nội dung mới dựa trên thông tin đầu vào. Chuẩn bị dữ liệu trước khi đào tạo cũng có thể là một nhiệm vụ quan trọng trong việc tạo các mô hình tùy chỉnh. Tất cả các khối lượng công việc này đều có các đặc điểm phải được xem xét khi thiết kế các giải pháp và cơ sở hạ tầng của chúng.

Các đặc điểm của khối lượng công việc AI tổng quát có thể khác nhau tùy thuộc vào ứng dụng cụ thể và loại mô hình được sử dụng. Tuy nhiên, một số đặc điểm chung bao gồm:

  • Cường độ tính toán — Khối lượng công việc AI tổng hợp có thể đòi hỏi cường độ tính toán cao, đòi hỏi lượng sức mạnh xử lý đáng kể để đào tạo hoặc tạo nội dung mới. Kịch bản này đặc biệt áp dụng cho các mô hình quy mô lớn như GPT-3, có thể yêu cầu phần cứng chuyên dụng như GPU để đào tạo hiệu quả.
  • Yêu cầu về bộ nhớ —Các mô hình AI thế hệ mới yêu cầu lượng bộ nhớ đáng kể để lưu trữ các tham số mô hình và các biểu diễn trung gian. Kịch bản này đặc biệt áp dụng cho các mô hình dựa trên máy biến áp như GPT-3, có nhiều lớp và có thể yêu cầu hàng trăm triệu hoặc thậm chí hàng tỷ tham số. Do đó, có đủ dung lượng bộ nhớ GPU là điều quan trọng.
  • Phụ thuộc vào dữ liệu —Các mô hình AI tổng hợp phụ thuộc nhiều vào chất lượng và số lượng dữ liệu đào tạo, điều này có thể ảnh hưởng lớn đến hiệu suất của mô hình. Chuẩn bị và làm sạch dữ liệu là những phần quan trọng của một giải pháp vì việc khai thác các bộ dữ liệu lớn, chất lượng cao là chìa khóa để tạo các mô hình tùy chỉnh.
  • Yêu cầu về độ trễ — Khối lượng công việc suy luận có thể có các yêu cầu nghiêm ngặt về độ trễ, đặc biệt là trong các ứng dụng thời gian thực như chatbot hoặc trợ lý giọng nói. Các mô hình phải được tối ưu hóa cho tốc độ suy luận, có thể liên quan đến các kỹ thuật như lượng tử hóa hoặc cắt tỉa mô hình. Các cân nhắc về độ trễ cũng ưu tiên các giải pháp tại chỗ hoặc kết hợp, trái ngược với các giải pháp hoàn toàn dựa trên đám mây, để đào tạo và suy luận từ các mô hình gần nhất với nguồn dữ liệu.
  • Độ chính xác của mô hình —Độ chính xác và chất lượng của nội dung được tạo là kết quả quan trọng đối với nhiều ứng dụng AI tổng quát và thường được đánh giá bằng cách sử dụng các chỉ số như mức độ phức tạp, điểm số đánh giá song ngữ (BLEU) hoặc đánh giá của con người.

Nhìn chung, khối lượng công việc AI tổng hợp có thể rất phức tạp và đầy thách thức, đòi hỏi phần cứng, phần mềm và kiến ​​thức chuyên môn chuyên dụng để đạt được kết quả tối ưu. Tuy nhiên, với các công cụ và kỹ thuật phù hợp, chúng có thể kích hoạt nhiều ứng dụng sáng tạo và thú vị trong các lĩnh vực như NLP, thị giác máy tính và nghệ thuật sáng tạo.

Các loại khối lượng công việc

Có một số loại khối lượng công việc AI tổng quát cụ thể; mỗi người có những yêu cầu khác nhau. Các cấu hình hệ thống được mô tả sau trong sách trắng này phản ánh các yêu cầu này.

Suy luận

Suy luận là quá trình sử dụng mô hình AI tổng quát để tạo nội dung dự đoán mới dựa trên đầu vào. Một mô hình được đào tạo trước được đào tạo trên một tập dữ liệu lớn và khi dữ liệu mới được đưa vào mô hình, nó sẽ đưa ra dự đoán dựa trên những gì đã học được trong quá trình đào tạo. Quá trình đào tạo này liên quan đến việc cung cấp chuỗi hoặc hình ảnh đầu vào vào mô hình và nhận kết quả là chuỗi hoặc hình ảnh đầu ra. Suy luận thường nhanh hơn và ít tính toán hơn so với đào tạo vì nó không liên quan đến việc cập nhật các tham số mô hình.

Tùy chỉnh mô hình

Tùy chỉnh mô hình được đào tạo trước là quá trình đào tạo lại mô hình AI tổng quát hiện có cho các trường hợp sử dụng dành riêng cho từng nhiệm vụ hoặc miền cụ thể. Đối với các mô hình lớn, việc tùy chỉnh sẽ hiệu quả hơn là huấn luyện mô hình trên tập dữ liệu mới. Các kỹ thuật tùy chỉnh được sử dụng ngày nay bao gồm tinh chỉnh, điều chỉnh hướng dẫn, học nhanh (bao gồm điều chỉnh nhanh và điều chỉnh P), học tăng cường với phản hồi của con người, học chuyển giao và sử dụng bộ điều hợp (hoặc máy biến áp có thể điều chỉnh).

Các loại tùy chỉnh hữu ích nhất là tinh chỉnh, học nhanh và học chuyển.

tinh chỉnh

Tinh chỉnh đào tạo lại một mô hình đã được đào tạo trước trên một tác vụ hoặc tập dữ liệu cụ thể, điều chỉnh các tham số của nó để cải thiện hiệu suất và làm cho nó trở nên chuyên biệt hơn. Phương pháp tùy chỉnh truyền thống này hoặc đóng băng tất cả trừ một lớp và điều chỉnh trọng số và độ lệch trên tập dữ liệu mới hoặc thêm một lớp khác vào mạng thần kinh và tính toán lại trọng số và độ lệch trên tập dữ liệu mới.

học hỏi nhanh

Học nhanh là một chiến lược cho phép sử dụng lại các mô hình ngôn ngữ đã được đào tạo trước cho các tác vụ khác nhau mà không cần thêm tham số mới hoặc tinh chỉnh với dữ liệu được gắn nhãn. Những kỹ thuật này cũng có thể được sử dụng trên các mô hình hình ảnh AI tổng quát lớn.

Dựa nhanh có thể được phân loại thành hai kỹ thuật rộng hơn: điều chỉnh nhanh và điều chỉnh P.

  • Điều chỉnh kịp thời là quá trình đào tạo lại một mô hình AI tổng quát được đào tạo trước cho các trường hợp sử dụng cụ thể theo nhiệm vụ hoặc theo miền cụ thể. Nó sử dụng các bộ dữ liệu phù hợp để cải thiện hiệu suất của nó trên một miền, trường hợp sử dụng hoặc tác vụ cụ thể hoặc để kết hợp kiến ​​thức bổ sung vào mô hình. Quá trình này cho phép mô hình thích ứng với các đặc điểm cụ thể của tập dữ liệu mới và có thể cải thiện độ chính xác cũng như hiệu suất của mô hình đối với tác vụ.
  • Điều chỉnh P hoặc điều chỉnh tham số, tập trung vào việc điều chỉnh lời nhắc hoặc hướng dẫn trong quá trình suy luận để định hình đầu ra của mô hình mà không sửa đổi các trọng số cơ bản của nó. Cả hai kỹ thuật đều đóng vai trò tùy chỉnh và tối ưu hóa các mô hình ngôn ngữ lớn cho các trường hợp sử dụng cụ thể.

học chuyển tiếp

Học chuyển đổi là một kỹ thuật truyền thống để sử dụng các mô hình AI tổng quát được đào tạo trước nhằm tăng tốc quá trình đào tạo trên các bộ dữ liệu mới. Kỹ thuật này bắt đầu với một mô hình được đào tạo trước đã học các tính năng hữu ích từ một tập dữ liệu lớn, sau đó điều chỉnh nó thành một tập dữ liệu mới với lượng dữ liệu đào tạo nhỏ hơn. Nó có thể nhanh hơn và hiệu quả hơn nhiều so với việc đào tạo một mô hình ban đầu trên tập dữ liệu mới vì mô hình được đào tạo trước đã hiểu các tính năng cơ bản của dữ liệu. Học chuyển rất hữu ích khi dữ liệu đào tạo hạn chế có sẵn cho một nhiệm vụ hoặc miền mới. Học chuyển giao thường không được sử dụng cho các LLM AI tổng quát nhưng hiệu quả với các mô hình AI chung.

Trong thiết kế giải pháp này, các cấu hình liên quan đến tùy chỉnh được tối ưu hóa để tinh chỉnh và P-tuning. Tuy nhiên, các cân nhắc về khả năng mở rộng và thiết kế kiến ​​trúc tổng thể vẫn áp dụng cho các kỹ thuật tùy chỉnh khác và cho các bộ dữ liệu không phải văn bản.

Đào tạo

Đào tạo là quá trình sử dụng tập dữ liệu để đào tạo mô hình AI tổng quát ban đầu. Đào tạo cung cấp các ví dụ mô hình từ tập dữ liệu và điều chỉnh các tham số mô hình để cải thiện hiệu suất của mô hình đối với nhiệm vụ. Đào tạo có thể là một quá trình tính toán chuyên sâu, đặc biệt đối với các mô hình quy mô lớn như GPT-3.

Trong quy trình làm việc từ đầu đến cuối dành cho AI tổng quát, trình tự chính xác của các bước này phụ thuộc vào ứng dụng và yêu cầu cụ thể. Ví dụ: quy trình làm việc chung cho LLM có thể bao gồm:

  • Tiền xử lý và làm sạch dữ liệu huấn luyện
  • Đào tạo một mô hình AI tổng quát trên dữ liệu
  • Đánh giá hiệu suất của mô hình được đào tạo
  • Tinh chỉnh mô hình trên một tác vụ hoặc tập dữ liệu cụ thể
  • Đánh giá hiệu suất của mô hình tinh chỉnh
  • Triển khai mô hình để suy luận trong môi trường sản xuất

Học chuyển giao cũng có thể được sử dụng tại các điểm khác nhau trong quy trình làm việc này để đẩy nhanh quá trình đào tạo hoặc cải thiện hiệu suất của mô hình. Nhìn chung, điều quan trọng là chọn các kỹ thuật và công cụ phù hợp cho từng bước của quy trình làm việc và để tối ưu hóa quy trình cho các yêu cầu và ràng buộc cụ thể của ứng dụng.

Các loại đầu ra

Loại dữ liệu được sử dụng và kết quả AI tổng quát khác nhau tùy thuộc vào loại dữ liệu được phân tích. Mặc dù trọng tâm của dự án này là về LLM, nhưng các loại mô hình AI tổng quát khác có thể tạo ra các loại đầu ra khác.

  • Văn bản —LLM có thể được sử dụng để tạo văn bản mới dựa trên lời nhắc cụ thể hoặc để biên dịch các phần văn bản dài thành các bản tóm tắt ngắn hơn. Ví dụ: ChatGPT có thể tạo các bài báo hoặc mô tả sản phẩm từ một vài chi tiết chính.
  • Hình ảnh —Các mô hình AI sáng tạo cho hình ảnh có thể được sử dụng để tạo hình ảnh chân thực về con người, đồ vật hoặc môi trường không tồn tại. Ví dụ: StyleGAN2 có thể tạo chân dung thực tế của những người không tồn tại.
  • Âm thanh —Các mô hình AI tạo âm thanh có thể được sử dụng để tạo âm thanh hoặc bản nhạc mới dựa trên các mẫu âm thanh hiện có hoặc để tạo mô phỏng giọng nói thực tế. Ví dụ: Tacotron 2 có thể tạo ra lời nói giống như một người cụ thể, ngay cả khi người đó chưa bao giờ nói những từ đó.
  • Video —Các mô hình AI sáng tạo dành cho video có thể được sử dụng để tạo video dựa trên cảnh quay hiện có hoặc để tạo hoạt ảnh chân thực của người hoặc vật thể. Ví dụ: DALL-E có thể tạo hình ảnh của các đối tượng không tồn tại và những hình ảnh này có thể được kết hợp để tạo video hoạt hình.

Trong mỗi trường hợp, mô hình AI tổng quát phải được đào tạo trên các tập dữ liệu lớn của kiểu dữ liệu phù hợp. Quá trình đào tạo được điều chỉnh theo các yêu cầu của kiểu dữ liệu và kiểu dữ liệu cụ thể vì các định dạng đầu vào và đầu ra khác nhau được yêu cầu cho từng loại dữ liệu. Những tiến bộ gần đây hiện có khả năng tích hợp các kiểu dữ liệu khác nhau, ví dụ, sử dụng mục nhập văn bản để tạo hình ảnh.