Dấu chân dữ liệu toàn cầu đang phát triển với tốc độ theo cấp số nhân. Dự kiến nó sẽ là vài trăm zettabyte (tức là 1.000.000.000.000.000.000.000 byte và còn tiếp tục tăng) trong vài năm tới. Trong khi đó, một doanh nghiệp điển hình ngày nay quản lý hàng petabyte dữ liệu – trải rộng trên hệ thống tại chỗ, đám mây, biên và nhiều hệ thống khác nhau, từ cơ sở dữ liệu quan hệ, nhà kho, siêu thị dữ liệu và hồ dữ liệu.
Nhận thấy rằng truy cập dữ liệu thường là khía cạnh đầu tiên (và rườm rà nhất) của việc kích hoạt dữ liệu, Dell gần đây đã công bố quan hệ đối tác với Starburst Data , nền tảng dẫn đầu ngành cung cấp câu trả lời cho nhiều vấn đề mà các tổ chức đang gặp phải với dữ liệu của họ.
Doanh nghiệp theo hướng dữ liệu
Không thiếu các công cụ và nền tảng có thể giúp bạn quản lý dữ liệu của mình. Tuy nhiên, tốc độ chúng tôi tạo dữ liệu vượt xa tốc độ chúng tôi chuyển đổi dữ liệu thành thông tin chi tiết. Vì vậy, điều gì đã thay đổi và làm thế nào bạn có thể chuẩn bị tốt hơn cho doanh nghiệp của mình để thực sự được điều khiển bởi dữ liệu?
Một kiến trúc dữ liệu doanh nghiệp hiện đại cần nắm lấy một số nguyên lý chính:
-
- Dữ liệu sẽ vẫn được phân phối trên nhiều trung tâm dữ liệu, đám mây công cộng và biên – thường dẫn đến các silo dữ liệu. Bạn cần các giải pháp có thể giúp kết nối các silo dữ liệu này.
- Chuyển động dữ liệu rất tốn kém và dễ bị lỗi. Sẽ hiệu quả hơn nếu di chuyển các công cụ tiêu dùng đến gần dữ liệu hơn là di chuyển dữ liệu đến gần các công cụ.
- Chúng ta phải cân bằng tính linh hoạt và dễ dàng của việc dân chủ hóa dữ liệu vào tay các công dân dữ liệu với nhu cầu ngày càng tăng về bảo mật và quản trị .
- Kiến trúc dữ liệu mở, bao gồm các định dạng dữ liệu mở, tính toán và lưu trữ tách rời, đảm bảo không có sự khóa của nhà cung cấp và cung cấp khả năng tương tác với hệ sinh thái công cụ và nền tảng luôn thay đổi.
Hành trình của một trường hợp sử dụng dữ liệu
Một trường hợp sử dụng dữ liệu trải qua ba giai đoạn chính: thăm dò, kỹ thuật và vận hành. Những thách thức xung quanh việc truy cập dữ liệu khác nhau đối với từng giai đoạn này. Đây là một ví dụ.
-
- thăm dò . James là một nhà phân tích dữ liệu muốn tạo báo cáo trực tiếp hiển thị xu hướng doanh thu theo sản phẩm, khu vực và tuần. Khi James bắt đầu trường hợp sử dụng của mình, anh ấy cần truy cập nhanh vào dữ liệu trên nhiều hệ thống để khám phá và thử nghiệm. Điều này liên quan đến việc liên hệ với quản trị viên của từng nguồn dữ liệu để có quyền truy cập cá nhân, việc này thường tốn thời gian. Sau khi anh ta nhận được quyền truy cập, không có cách nào dễ dàng để khám phá dữ liệu liên quan đến trường hợp sử dụng của anh ta.
- kỹ thuật . Sau khi James biết chính xác dữ liệu nào sẽ sử dụng và quy trình xử lý cần thiết, Sally từ nhóm kỹ thuật dữ liệu sẽ tạo các đường dẫn dữ liệu để nhập dữ liệu này vào hồ dữ liệu/nhà chứa hồ, áp dụng các phép biến đổi và điều chỉnh quy trình làm việc để đạt hiệu suất cao. Báo cáo đã sẵn sàng để được xuất bản.
- Vận hành . Sau khi báo cáo được xuất bản, Lee từ nhóm điều hành đảm bảo các đường dẫn dữ liệu hoạt động đáng tin cậy để làm mới dữ liệu thường xuyên, do đó cung cấp thông tin chi tiết mới nhất cho doanh nghiệp.
Như bạn có thể thấy, việc kích hoạt một trường hợp sử dụng đơn lẻ thường liên quan đến nhiều cá tính người dùng, môi trường, công cụ và kết quả. Ngăn xếp dữ liệu hiện đại phải nắm bắt được những tương tác này của con người, quy trình và công nghệ, đồng thời cho phép con đường hiệu quả nhất để truy cập dữ liệu và chuyển đổi dữ liệu đó thành thông tin chuyên sâu.
Quan hệ đối tác của Dell Technologies và Starburst
Dell và Starburst cùng nhau mang đến cho bạn giải pháp Phân tích dữ liệu đa đám mây với các khả năng chính sau:
-
- Được xây dựng trên công cụ truy vấn liên kết mã nguồn mở rất phổ biến Trino, Starburst đơn giản hóa việc khám phá dữ liệu và tăng tốc truy cập dữ liệu bằng cách cho phép tiêu thụ dữ liệu tại chỗ – bất kể dữ liệu nằm ở đâu tại chỗ, đám mây hay biên.
- Với hơn 50 trình kết nối nguồn dữ liệu được hỗ trợ, bạn có thể kết nối ngay với hệ điều hành, kho dữ liệu, kho dữ liệu của mình và chạy các truy vấn nhanh như chớp để nhận thông tin chuyên sâu tức thì.
- Khi được yêu cầu, dữ liệu từ các nguồn từ xa có thể được duy trì trong hồ dữ liệu/nhà chứa hồ để khắc phục độ trễ của mạng/hệ thống và cung cấp SLA cấp sản xuất. Dell Elastic Cloud Storage (ECS) cung cấp các giải pháp lưu trữ đối tượng giống tốt nhất cho kho dữ liệu/nhà hồ hiện đại.
- Nó cung cấp một điểm truy cập dữ liệu duy nhất với tính bảo mật và quản trị thống nhất để đảm bảo quyền kiểm soát và quyền truy cập phù hợp.
- Bạn có thể tạo và xuất bản các sản phẩm dữ liệu , có thể được tổ chức theo miền – do đó hỗ trợ kiến trúc lưới dữ liệu.
- Tăng sức mạnh và mở rộng trải nghiệm phân tích và AIML trên toàn doanh nghiệp với các máy chủ Dell PowerEdge tốt nhất trong ngành.
Tìm hiểu thêm tại Dell Technologies World 2023
Bạn muốn tìm hiểu thêm về quan hệ đối tác của Dell và Starburst?
-
- Ghé thăm chúng tôi tại phiên đột phá Dell Technologies World 2023 , “Hãy trở thành người hùng dữ liệu của tổ chức bạn,” do Ranjeetha Raja, Giám đốc Quản lý Sản phẩm, Dell Technologies và Chip Starkey, Kiến trúc sư Giải pháp, Starburst Data, đồng trình bày.
- Chúng tôi cũng sẽ có mặt tại gian hàng quản lý dữ liệu và tổ chức một phòng thí nghiệm thực hành.
- Cuối cùng, hãy tham khảo Kiến trúc tham chiếu phân tích dữ liệu Multicloud để biết thêm thông tin về thông báo.
Bài viết mới cập nhật
Hướng dẫn định tuyến dựa trên nguồn Dell PowerScale
Chào mừng bạn đến với hướng dẫn của Dell PowerScale về ...
Sử dụng mẫu tùy chỉnh cho cảnh báo OneFS CELOG
Tổng quan Gần đây, nhiều câu hỏi đã được đặt ra ...
Hướng dẫn nâng cấp cho InsightIQ 5.1.0′
Nâng cấp phiên bản InsightIQ của bạn từ phiên bản 5.1.0 ...
Nâng cấp OneFS đã ký
Được giới thiệu như một phần của các cải tiến bảo ...