Giải phóng giá trị dữ liệu của bạn với GenAI theo ngữ cảnh cụ thể

Chuẩn bị dữ liệu của bạn để thúc đẩy các trường hợp sử dụng có mức độ ưu tiên cao.

Lợi ích kinh doanh của AI tạo sinh (GenAI) rất hấp dẫn. Một báo cáo gần đây của McKinsey ước tính rằng GenAI có thể tăng thêm số tiền tương đương từ 2,6 đến 4,4 nghìn tỷ USD hàng năm cho 63 trường hợp sử dụng mà họ đã phân tích. 1 Theo thời gian, các tổ chức sẽ tái cấu trúc môi trường CNTT, kiến ​​trúc dữ liệu và quy trình để tận dụng cơ hội chuyển đổi này.

Nhưng còn thời hạn gần hơn thì sao? Các tổ chức đang xác định những cơ hội AI có tính sáng tạo ở hiện tại mà không thể chờ đợi. Doanh nghiệp có thể tận dụng sức mạnh của GenAI như thế nào để nâng cao hiệu quả kinh doanh lúc này?

Tận dụng tối đa dữ liệu của bạn bằng cách giới hạn phạm vi

Các mô hình ngôn ngữ lớn (LLM) GenAI nhận được rất nhiều sự quan tâm đã được đào tạo và tinh chỉnh với lượng dữ liệu khổng lồ. Tuy nhiên, ngày nay rất ít tổ chức có đủ nguồn lực hoặc chuyên môn để đào tạo một mô hình từ đầu.

Một lựa chọn khả thi hơn cho nhiều tổ chức, đặc biệt là trong thời gian sắp tới, sẽ là tinh chỉnh hoặc tăng cường mô hình hiện có bằng dữ liệu theo ngữ cảnh cụ thể của riêng họ. Để kiểm soát hơn nữa phạm vi và chi phí, mô hình cơ sở có thể là mô hình ngôn ngữ dành riêng cho một lĩnh vực cụ thể, chẳng hạn như chăm sóc sức khỏe, dịch vụ pháp lý hoặc tài chính.

Việc tinh chỉnh hoặc tăng cường mô hình được đào tạo trước sẽ giới hạn phạm vi khám phá, thăm dò và làm giàu dữ liệu đối với các tập dữ liệu có liên quan đến trường hợp sử dụng bạn chọn. Nó cũng ít tốn thời gian hơn nhiều so với việc đào tạo một mô hình và mang lại một mô hình phù hợp và chính xác hơn so với việc sử dụng mô hình được đào tạo trước “nguyên trạng”.

Cơ sở dữ liệu RAG và Vector mang lại kết quả tốt hơn

Tạo tăng cường truy xuất, hay RAG, là một phương pháp để tăng nhanh mô hình ngôn ngữ hiện có với thông tin doanh nghiệp hoặc theo ngữ cảnh cụ thể. Dell Technologies tin rằng việc mở rộng mô hình sẽ sớm là một giải pháp thay thế phổ biến vì nó cho phép các tổ chức ràng buộc các trường hợp sử dụng GenAI.

RAG lấy dữ liệu từ các nguồn có cấu trúc và không cấu trúc, có thể là dữ liệu theo ngữ cảnh hoặc dữ liệu cập nhật mà mô hình ngôn ngữ không thể tự truy cập. Dữ liệu đích phải được chuyển đổi sang định dạng tương thích với cơ chế truy xuất. Để nâng cao độ chính xác và tốc độ truy xuất RAG, dữ liệu mục tiêu có thể được chuyển đổi thành biểu diễn vectơ và được lưu trữ trong cơ sở dữ liệu vectơ.

Bằng cách vẽ từ cơ sở dữ liệu vectơ, các mô hình GenAI có thể xử lý các mối quan hệ phức tạp giữa dữ liệu để có kết quả tốt hơn. Các công cụ và cách thực hành tốt nhất để tạo ra những cách trình bày này với nỗ lực hợp lý đều có sẵn và đang liên tục được cải tiến.

Khám phá, khám phá và làm phong phú dữ liệu chính, sau đó quan sát đầu ra

Dữ liệu để mô hình GenAI nhập vào cần phải được chuẩn bị để đảm bảo chất lượng dữ liệu, định dạng phù hợp và phân loại độ nhạy của dữ liệu. Cả dữ liệu có cấu trúc và phi cấu trúc đều cần thiết để tăng cường hoặc điều chỉnh các mô hình ngôn ngữ, vì vậy các phương pháp làm sạch, gắn nhãn và ẩn danh dữ liệu phải giải quyết được dữ liệu truyền thống nằm trong cả hồ dữ liệu và kho dữ liệu. Phần lớn dữ liệu phi cấu trúc có thể cần được sắp xếp và làm phong phú trước khi có thể sử dụng làm nguồn dữ liệu điều chỉnh.

Điều cần cân nhắc chính đối với một số trường hợp sử dụng nhất định là luồng hoặc trình tự từ, bước hoặc hoạt động—ví dụ: các bước xử lý yêu cầu bồi thường của công ty bảo hiểm hoặc trình tự câu hỏi-trả lời để giải quyết vấn đề của khách hàng. Việc chuẩn bị dữ liệu cho các mô hình GenAI có thể bao gồm cải thiện chất lượng và tóm tắt dữ liệu văn bản hoặc quy trình làm việc, bối cảnh câu hỏi và câu trả lời và bộ dữ liệu phản hồi hướng dẫn. 2

Các mô hình GenAI phải được điều chỉnh bằng các nguồn dữ liệu tốt nhất phù hợp với các trường hợp sử dụng. Trước khi dự án GenAI được đưa vào sản xuất, các nhà khoa học dữ liệu phải xác minh rằng dữ liệu được chuyển đổi có đáp ứng các mục tiêu của dự án hay không. Ngoài ra, điều quan trọng là phải đảm bảo dữ liệu nhạy cảm hoặc độc quyền được xử lý và bảo vệ đúng cách.

Cần có chuyên môn để phát triển nhanh chóng với GenAI

Không có gì ngạc nhiên khi một trong những hạn chế mà các tổ chức phải đối mặt khi đẩy nhanh các dự án GenAI của họ là sự khan hiếm các chuyên gia có kỹ năng khám phá, khám phá và làm giàu dữ liệu. Một báo cáo của ESG cho biết “39% tổ chức cho biết chuyên môn hoặc kỹ năng là một trong những thách thức lớn nhất mà họ gặp phải khi triển khai GenAI”, đây là tỷ lệ cao nhất trong tất cả các thách thức được liệt kê. 3

Một đối tác có năng lực, kinh nghiệm có thể tạo ra sự khác biệt lớn trong việc nhanh chóng xác định và ưu tiên các trường hợp sử dụng, sau đó chuẩn bị dữ liệu cũng như lựa chọn và tinh chỉnh các mô hình. Các tổ chức muốn giải quyết nhiều trường hợp sử dụng sớm hơn nhằm tối đa hóa tác động của GenAI có thể chuyển sang Dịch vụ tư vấn của Dell và tận dụng các chuyên gia tư vấn của chúng tôi để tăng tốc thời gian tạo ra giá trị từ việc đưa AI sáng tạo vào dữ liệu của họ.

Để biết thêm thông tin về nhiều dịch vụ của Dell Technologies dành cho Generative AI, vui lòng xem Dịch vụ dành cho Generative AI.

https://www.mckinsey.com/capabilities/mckinsey-digital/our-insights/the-kinh tế-potential-of-generative-ai-the-next-productivity-frontier
https://h2o.ai/blog2 /2023/streamline-data-preparation-for-fine-tuning-of-large-lingu-models/
3 https://www.techtarget.com/esg-global/research-report/research-report-beyond-the- genai-hype-real-world-đầu tư-trường hợp sử dụng-và-mối quan tâm/