Tiết lộ những cải tiến mới nhất của Dell Data Lakehouse

Cho phép nhóm của bạn chuyển từ quản lý dữ liệu thông thường sang đổi mới với Apache Spark, khám phá lược đồ tự động, v.v.

Khi các doanh nghiệp khám phá tiềm năng của AI tạo sinh (GenAI), các chiến lược quản lý dữ liệu của họ ngày càng trở nên quan trọng. Một cuộc thăm dò gần đây của MIT Technology Review Insights đã xác định chất lượng dữ liệu, tính kịp thời, quản trị và bảo mật là những rào cản chính đối với việc triển khai và mở rộng AI hiệu quả. Rõ ràng là trong khi dữ liệu là thiết yếu, thì việc có nền tảng phù hợp để tổ chức và sử dụng dữ liệu là rất quan trọng.

Đây là lý do tại sao chúng tôi rất vui mừng khi công bố những cải tiến mới nhất cho Dell Data Lakehouse hợp tác với Starburst, như một phần của Nền tảng dữ liệu hỗ trợ AI và năng lực cơ sở hạ tầng với Dell AI Factory, được thiết kế để hỗ trợ cả kỹ sư dữ liệu và quản trị viên CNTT.

Kết nối tốt nhất trong lớp với các nguồn dữ liệu

Nền tảng của chúng tôi tích hợp liền mạch với hơn 50 đầu nối ngay khi xuất xưởng và hiện hỗ trợ các đầu nối Trino tùy chỉnh cho các nguồn dữ liệu độc quyền và duy nhất. Với một điểm truy cập duy nhất vào các nguồn này, Dell Data Lakehouse tạo điều kiện cho việc phân tích ad-hoc và tương tác trên các silo dữ liệu phân tán, giúp giảm việc di chuyển dữ liệu. Từ các cơ sở dữ liệu như Cassandra, MariaDB và Redis, đến các nguồn khác như Google Sheets và các tệp cục bộ hoặc thậm chí là một ứng dụng độc quyền trong môi trường của bạn, giờ đây người dùng có thể mở rộng quyền truy cập của mình hơn nữa vào các silo dữ liệu phân tán của họ.

Truy cập của công cụ bên ngoài vào siêu dữ liệu

Chúng tôi luôn cam kết với một hệ sinh thái mở bao gồm hỗ trợ Iceberg . Bây giờ chúng tôi đang mở rộng cam kết của mình bằng cách cho phép các công cụ bên ngoài như Spark và Flink truy cập siêu dữ liệu một cách an toàn trong Dell Data Lakehouse. Chức năng này cho phép cải thiện việc khám phá, xử lý và quản lý dữ liệu, có sẵn với các biện pháp bảo mật tùy chọn như Transport Layer Security (TLS) và Kerberos.

Trải nghiệm hỗ trợ được cải thiện

Các tính năng hỗ trợ nâng cao của chúng tôi cho phép quản trị viên dễ dàng tạo và tải xuống một gói nhật ký hệ thống đầy đủ được biên dịch sẵn. Điều này cải thiện trải nghiệm hỗ trợ bằng cách cung cấp đánh giá toàn diện về trạng thái hệ thống, cho phép nhóm hỗ trợ của Dell nhanh chóng phân tích và giải quyết các vấn đề.

Khám phá lược đồ tự động

Bản cập nhật mới nhất của chúng tôi hợp lý hóa việc khám phá lược đồ, cho phép bạn tự động xác định và kết hợp các lược đồ dữ liệu với sự can thiệp thủ công tối thiểu. Tự động hóa này nâng cao hiệu quả và giảm khả năng xảy ra lỗi của con người trong quá trình tích hợp dữ liệu. Ví dụ: khi một quy trình ghi nhật ký tạo một tệp nhật ký mới mỗi giờ, chuyển từ tệp nhật ký của giờ trước, thì việc khám phá lược đồ sẽ định vị các tệp mới được thêm vào để người dùng trong Dell Data Lakehouse có thể truy vấn chúng.

Chia sẻ kiến ​​thức về hệ sinh thái đối tác

Chúng tôi đã phát triển một nguồn tài nguyên gồm các bài viết, bài báo và kiến ​​trúc tham khảo để tích hợp Dell Data Lakehouse với các công cụ phổ biến. Điều này giúp loại bỏ sự phỏng đoán trong quá trình thiết lập và sử dụng, với các chủ đề từ việc thu thập dữ liệu thay đổi bằng Debezium đến quản trị dữ liệu nâng cao bằng Privacera Platform. Các bổ sung mới nhất của chúng tôi vào thư viện được liên kết tại đây để tham khảo:

Dịch vụ tư vấn

Tối ưu hóa Dell Data Lakehouse của bạn để cải thiện kết quả AI và hiểu biết chiến lược với Dịch vụ chuyên nghiệp của chúng tôi . Các chuyên gia của chúng tôi sẽ giúp triển khai Data Lakehouse, nguồn dữ liệu tích hợp, siêu dữ liệu danh mục và tối ưu hóa đường ống dữ liệu để hợp lý hóa hoạt động.

Bắt đầu khám phá

Để có trải nghiệm ảo, hãy ghé thăm Dell Demo Center để khám phá tương tác Dell Data Lakehouse với các phòng thí nghiệm được tuyển chọn. Để tham gia thực hành, hãy liên hệ với giám đốc tài khoản Dell của bạn để ghé thăm Trung tâm giải pháp khách hàng của chúng tôi tại Round Rock, Texas và Cork, Ireland. Tại đây, bạn có thể cộng tác với các chuyên gia để tham gia phiên thiết kế và tìm hiểu sâu về kỹ thuật.

Nhìn về phía trước

Chúng tôi rất vui mừng thông báo về sự tích hợp sắp tới với Apache Spark , có sẵn vào đầu năm 2025. Sự tích hợp này sẽ cho phép bạn xử lý lượng lớn dữ liệu có cấu trúc, bán cấu trúc và không có cấu trúc cho các trường hợp sử dụng AI trong một môi trường thống nhất. Chúng tôi mời bạn tiếp tục khám phá cách Dell Data Lakehouse có thể đáp ứng các nhu cầu cụ thể của bạn và giúp bạn tối đa hóa khoản đầu tư của mình.