Tăng tốc AI với Lakehouse dữ liệu mở, hiện đại

Giới thiệu Dell Data Lakehouse: hỗ trợ doanh nghiệp của bạn bằng AI ở mọi nơi, từ dữ liệu ở mọi nơi.

Tháng 10 năm ngoái, tôi đã viết về những thách thức ngăn cản các tổ chức khai thác hoàn toàn tiềm năng của AI để thúc đẩy kết quả kinh doanh. Kể từ đó, sự phát triển không ngừng của AI đã làm sáng tỏ hơn nữa một trong những thành phần quan trọng nhất tạo nên chiến lược AI thành công: nền tảng dữ liệu sẵn sàng cho AI.

Trong bối cảnh đầy rẫy dữ liệu phi tập trung, các hệ thống cũ, mối lo ngại về chủ quyền dữ liệu và các ứng dụng gốc trên nền tảng đám mây chỉ hoạt động trên dữ liệu trên đám mây, các tổ chức tiếp tục gặp khó khăn. Nghiên cứu từ Tập đoàn tư vấn Boston cho thấy rằng trong số hơn 50% các nhà lãnh đạo dữ liệu , sự phức tạp về kiến ​​trúc là điểm yếu lớn—đẩy các tổ chức vào tình trạng phức tạp đáng kể, tạo ra các chi phí có thể tránh được và mất thời gian quan trọng để định giá.

Những người thực hiện dữ liệu đang phải đối mặt với những thách thức ghê gớm. Kho dữ liệu truyền thống giới hạn dữ liệu trong các định dạng độc quyền, cản trở khả năng truy cập phổ biến. Hồ dữ liệu thiếu độ tin cậy và khả năng quản trị cũng như hoạt động không tốt. Và kiến ​​trúc hai tầng đưa ra hai lựa chọn dưới mức tối ưu: sử dụng dữ liệu cũ nhưng chất lượng cao từ nhà kho hoặc sử dụng dữ liệu mới nhưng không đáng tin cậy từ hồ. Sự xuất hiện của các kho dữ liệu nhằm mục đích giải quyết những vấn đề này, tuy nhiên các lựa chọn vẫn chưa đủ. Các giải pháp đám mây yêu cầu di chuyển và có chi phí rất cao ở quy mô lớn. Các giải pháp tại chỗ bị sa lầy bởi công nghệ cũ và độc quyền. Và nguồn mở, tuy có tính đổi mới, nhưng lại kéo theo chi phí tích hợp cao.

Đội ngũ CNTT cũng đang gặp khó khăn. Việc hợp nhất các nguồn dữ liệu khác nhau thành một nguồn sự thật duy nhất là một nỗ lực không ngừng nghỉ. Quản lý một loạt các công cụ cơ sở hạ tầng dữ liệu đang làm cạn kiệt tài nguyên. Sự phức tạp của việc giám sát nhiều thành phần nhấn mạnh sự cần thiết của sự đơn giản.

Rõ ràng, khách hàng xứng đáng nhận được câu trả lời tốt hơn. Và giống như tôi đã nói trước đây, một công cụ hoạt động dựa trên trọng lực dữ liệu của họ chứ không chống lại nó. Một thứ mang lại sự đơn giản và tăng tốc thời gian để có giá trị.

Hôm nay đánh dấu một cột mốc thú vị vì chúng tôi đang thực hiện lời hứa của mình với sự sẵn có rộng rãi của Dell Data Lakehouse . Sản phẩm mới này cung cấp cho khách hàng nền tảng dữ liệu tích hợp đầy đủ được xây dựng trên phần cứng được tối ưu hóa AI của Dell và bộ phần mềm đầy đủ, được hỗ trợ bởi công cụ truy vấn sáng tạo và mạnh mẽ của Starburst.

“Khi Dell tiếp tục dẫn đầu trong lĩnh vực đổi mới về lưu trữ và điện toán, Starburst tự hào cung cấp kiến ​​thức chuyên môn và dịch vụ phân tích kho dữ liệu hiệu suất cao. Giống như công nghệ lưu trữ của Dell tạo thành nền tảng của hồ dữ liệu, Starburst đóng vai trò là công cụ lưu trữ năng động, hài hòa dữ liệu thành thông tin chi tiết có thể hành động,” Justin Borgman, Giám đốc điều hành của Starburst cho biết. “Cùng nhau, chúng tôi nổi lên với tư cách là Dell Data Lakehouse và sẵn sàng xác định lại bối cảnh quản lý và phân tích dữ liệu.”

Năm lời hứa chính của Dell Data Lakehouse

Như chúng tôi đã thảo luận vào tháng 10, tầm nhìn của chúng tôi về kho lưu trữ dữ liệu mở, hiện đại bao gồm các thành phần chính nhằm giúp khách hàng giải quyết những thách thức lớn nhất về dữ liệu của họ. Dell Data Lakehouse mang lại năm lời hứa chính:

    1. Loại bỏ các silo dữ liệu . Tăng cường khám phá dữ liệu bằng truy vấn liên kết, an toàn, được hỗ trợ bởi Starburst, tăng tốc thời gian tìm hiểu thông tin chi tiết lên tới 90%¹ và tiết lộ các kiểu sử dụng cho phép tập trung dữ liệu thông minh hơn vào kho lưu trữ dữ liệu.
    2. Giải phóng hiệu suất ở quy mô lớn . Với một công cụ phân tán, song song quy mô lớn chạy trên cơ sở hạ tầng được thiết kế riêng giúp tách biệt điện toán và lưu trữ, bạn sẽ đạt được hiệu suất tuyệt vời và có thể mở rộng quy mô khi nhu cầu của bạn tăng lên.
    3. Kiểm soát dữ liệu của bạn . Định dạng mở 100% được định hướng và sẵn sàng cho tương lai với các tiêu chuẩn công nghiệp hiện đại như các định dạng tệp như Parquet, Avro, ORC và các định dạng bảng như Iceberg và Delta Lake. Quản trị dữ liệu tích hợp giúp bạn duy trì quyền kiểm soát dữ liệu của mình và trao quyền cho bạn điều hướng các bối cảnh đang phát triển một cách tự tin và rõ ràng.
    4. Dân chủ hóa những hiểu biết sâu sắc . Cung cấp cho nhóm dữ liệu của bạn quyền truy cập tự phục vụ để họ có thể tạo ra các sản phẩm dữ liệu chất lượng cao, thúc đẩy văn hóa cộng tác và khám phá để đưa doanh nghiệp của bạn phát triển. Tích hợp với hệ sinh thái rộng lớn gồm các công cụ như công cụ BI, AI và ML, cho phép tiếp cận đổi mới rộng rãi hơn trong toàn tổ chức.
    5. Một nền tảng đơn giản hóa. Được thiết kế để hợp lý hóa các dịch vụ triển khai, quản lý vòng đời và hỗ trợ, giải pháp chìa khóa trao tay này bao gồm các thành phần điện toán, phần mềm và lưu trữ mang lại chi phí hiệu quả và có thể dự đoán được so với các tùy chọn dựa trên đám mây. Dell Data Analytics Engine cho phép thu thập thông tin chi tiết nhanh hơn gấp 3 lần với chi phí chỉ bằng một nửa so với các công nghệ tương đương khác.2 Bộ lưu trữ Dell ECS có thể tiết kiệm tới 76% tổng chi phí sở hữu so với các ưu đãi trên đám mây công cộng.³ Và cuối cùng, Phần mềm Hệ thống Dell Lakehouse có thể mang lại những lợi ích đáng kể tiết kiệm hoạt động bằng cách giảm nỗ lực thủ công trong suốt vòng đời.

Công nghệ này, kết hợp với Dịch vụ của Dell, giúp các tổ chức đẩy nhanh kết quả AI ở mọi giai đoạn. Tận dụng các chuyên gia đáng tin cậy từ Dell Technologies, được vinh danh trong số các Công ty tư vấn quản lý tốt nhất thế giới năm 2023 của Forbes , để điều chỉnh chiến lược chiến thắng, xác thực bộ dữ liệu nhanh chóng, triển khai nền tảng dữ liệu của bạn và duy trì hoạt động an toàn, tối ưu hóa.

Thế hệ AI tiếp theo sẽ yêu cầu các tổ chức áp dụng kiến ​​trúc mới cho nền tảng dữ liệu của họ. Chúng tôi tin rằng nền tảng đó phải là một kho dữ liệu mở, hiện đại, đóng vai trò là điểm truy cập duy nhất, có độ bảo mật cao vào tất cả dữ liệu. Sự kết hợp mạnh mẽ của Dell Data Analytics Engine với tính toán ( PowerEdge ), lưu trữ đối tượng ( ECS ,  ObjectScale  và  PowerScale )  và Dịch vụ chuyên nghiệp mang đến cho các tổ chức khả năng thiết lập nền tảng cho nền tảng dữ liệu có khả năng mở rộng, hiệu suất cao cho kỷ nguyên AI.

Theo dõi NVIDIA GTC và Dell Technologies World để tìm hiểu thêm về Dell Data Lakehouse.

Tìm hiểu thêm về các thành phần của giải pháp trong blog kỹ thuật của chúng tôi hoặc trên trang web của chúng tôi . Liên hệ với người điều hành tài khoản Dell của bạn để khám phá Dell Data Lakehouse cho nhu cầu dữ liệu của bạn.

1 Xác nhận kinh tế ESG. McAfee, Nathan. Tháng 4 năm 2022. “Phân tích lợi ích kinh tế của Starburst Enterprise”
2 Kho dữ liệu đám mây so với Cloud Data Lakehouse: TCO của Snowflake so với Starburst và So sánh hiệu suất, do GigaOm xuất bản.
3 Xác thực kinh tế ESG do Dell Technologies tài trợ, “Phân tích lợi ích kinh tế của Dell ECS: Phân tích lợi ích kinh tế của việc lưu trữ đối tượng tại chỗ so với đám mây công cộng,” của Tony Palmer, tháng 7 năm 2022. Tiết kiệm chi phí dựa trên so sánh ESG của ECS với một giải pháp hàng đầu đám mây công cộng trong các tình huống lưu trữ đang hoạt động.