Việc sử dụng để phân tích dữ liệu là gì?
Analytics mang lại nhiều lợi ích cho các tổ chức khi họ bắt tay vào chuyển đổi kỹ thuật số , bao gồm:
- Tăng hiệu quả và cắt giảm chi phí hoạt động
- Tối đa hóa sự hài lòng của khách hàng
- Phát triển sản phẩm và dịch vụ mới
- Sử dụng dữ liệu phát trực tuyến để phản hồi các vấn đề và cơ hội trong thời gian gần như thực
Số lượng các trường hợp sử dụng có thể thực hiện được nhờ phân tích dữ liệu dường như là vô hạn và trên hết, hiện tại chúng ta mới chỉ bắt đầu nhìn thấy tiềm năng của máy học và các dạng trí tuệ nhân tạo khác để mở ra những giới hạn mới về những gì các tổ chức có thể đạt được với dữ liệu.
Nhưng khi chúng tôi tại Dell Technologies tương tác với khách hàng trong nhiều trường hợp sử dụng khác nhau, chúng tôi càng biết thêm rằng nhiều người vẫn đang vật lộn với nhiệm vụ tiên quyết là đưa dữ liệu vào môi trường phân tích của họ để triển khai các trường hợp sử dụng mà họ muốn. Nhiệm vụ này được gọi là ETL, hay “trích xuất, chuyển đổi, tải” và có thể định nghĩa nó là quá trình đọc dữ liệu từ một hoặc nhiều nguồn dữ liệu, chuyển đổi dữ liệu đó sang định dạng mới, sau đó tải dữ liệu đó vào một kho lưu trữ khác ( chẳng hạn như hồ dữ liệu) hoặc chuyển nó tới một chương trình [1] .
Dell Technologies và đối tác ISV phân tích dữ liệu viễn thông của mình, Cardinality, đã làm việc cùng nhau để giúp khách hàng giải quyết các vấn đề ETL phức tạp để họ có thể thực hiện loại phân tích mà họ muốn. Sau đây là các ví dụ thực tế minh họa ba điểm khó khăn chính mà khách hàng có xu hướng gặp phải với ETL và cách chúng tôi đã giúp giải quyết chúng.
dữ liệu cận thị
Các công ty viễn thông có rất nhiều dữ liệu, nhưng các rào cản về tổ chức hoặc kỹ thuật thường có thể gây khó khăn cho các kỹ sư dữ liệu và nhà khoa học dữ liệu trong việc truy cập vào dữ liệu họ cần. Nhóm phân tích dữ liệu tại một nhà khai thác viễn thông cấp 1 đã phải đối mặt với một thách thức như vậy. Chỉ có thể truy cập dữ liệu từ môi trường CNTT, nhóm không thể lấy dữ liệu họ cần để bắt đầu trả lời các câu hỏi về các yếu tố ảnh hưởng đến sự hài lòng của khách hàng. Để giải quyết vấn đề này, Cardinality đã tiến hành thử nghiệm trên diện tích nhỏ của máy chủ Dell EMC PowerEdgeđể chứng minh cho nhóm Vận hành mạng về giá trị có thể mở khóa bằng một trường hợp sử dụng đơn giản: phân tích thiết bị. Chỉ trong vài ngày sau khi định cấu hình Công cụ ETL của mình để nhập dữ liệu từ các đầu dò mạng của nhà điều hành, Cardinality đã có thể tạo bảng điều khiển thời gian thực của tất cả điện thoại di động và các thiết bị khác trên mạng và hiển thị thông tin quan trọng như loại SIM thẻ các thiết bị đang sử dụng và có thể nâng cấp lên mạng 4G. Nhà điều hành này đã có thể xây dựng dựa trên trường hợp sử dụng ban đầu này để tạo ra một trường hợp sử dụng Trải nghiệm khách hàng trong mạng phức tạp mang lại lợi ích kinh doanh có thể đo lường được bằng cách sử dụng công nghệ máy học để phân tích hơn 350 KPI của mạng nhằm dự đoán và tránh tình trạng rời bỏ khách hàng.
Độ phức tạp leo thang
Không gian công nghệ mới thường cung cấp cho các nhà phát triển nhiều công cụ để lựa chọn. Nhiều công cụ, cả nguồn mở và độc quyền, tồn tại trong thế giới phân tích dữ liệu (ví dụ: Informatica, Talend, Kafka, StreamSets, Apache NiFi, Airflow, v.v.). Mặc dù lựa chọn có thể tốt, nhưng việc sử dụng quá nhiều công cụ bởi quá nhiều người khác nhau trong một môi trường duy nhất có thể khiến việc quản lý trở thành một thử thách tốn kém.
Một nhà khai thác viễn thông mà Dell Technologies hợp tác gần đây đã trở thành nạn nhân của sự phức tạp ngày càng tăng có thể xuất hiện khi có quá nhiều sự lựa chọn và quá ít quyền kiểm soát. Theo thời gian, các nhà phát triển khác nhau đã quyết định sử dụng bất kỳ công cụ “hương vị của tháng” nào mà họ thấy thú vị và điều này dẫn đến tình huống gần như không thể gỡ lỗi các trường hợp sử dụng hiện có và tạo các trường hợp sử dụng mới.
Dell Technologies và Cardinality đã có thể nhanh chóng dọn dẹp mọi thứ bằng Công cụ ETL của Cardinality, công cụ này cung cấp cơ chế nhập dữ liệu tinh tế và dễ bảo trì. Kết quả là người vận hành giờ đây có thể xây dựng các trường hợp sử dụng mà không phải lo lắng về độ phức tạp của ETL.
tiêu hóa dữ liệu
Một biến thể về chủ đề phức tạp liên quan đến độ phức tạp của chính các nguồn dữ liệu.
Dell Technologies đã giúp một khách hàng khác đang gặp khó khăn với việc phải theo kịp nhiều định dạng dữ liệu từ các đầu dò mạng khác nhau. Việc có nhiều đầu dò rất phức tạp bởi thực tế là các nhà cung cấp đầu dò thỉnh thoảng thay đổi định dạng dữ liệu của họ, đòi hỏi phải làm lại và có chuyên môn về viễn thông để định dạng lại dữ liệu thành các định dạng được sử dụng cho phân tích. Một vấn đề khác là không phải lúc nào một số định dạng dữ liệu độc quyền, cũ hơn cũng có thể được sử dụng với các công cụ nhập mới hơn, gây ra các giới hạn về độ trễ và hiệu suất, đồng thời “sự khó tiêu” khi nhập này có thể hạn chế các loại trường hợp sử dụng thời gian thực có thể được đưa vào sản xuất .
Bằng cách hiện đại hóa môi trường của khách hàng với Cardinality ETL Engine, chúng tôi có thể giúp khách hàng bớt đau đầu khi phải quản lý vô số nguồn dữ liệu và có thể cải thiện đáng kể hiệu suất phát trực tuyến. Số lượng bản ghi dữ liệu được nhập và phân tích cú pháp mỗi ngày tăng từ 9 tỷ lên 23 tỷ và số lượng tệp cần phải loại bỏ do các vấn đề về chất lượng định dạng giảm xuống gần như bằng không.
Các vấn đề về hệ thống ống nước
Giải pháp Phân tích Nhà cung cấp Dịch vụ Dell Technologies với giải pháp Cardinality giúp giảm đáng kể các khó khăn khi nhập dữ liệu của khách hàng với Công cụ ETL cho phép khách hàng:
- Đưa vào sản xuất nhanh chóng với chức năng ETL “vượt trội” được xây dựng có mục đích cho môi trường viễn thông
- Thu thập dữ liệu phát trực tuyến và không phát trực tuyến với độ trễ thấp và thông lượng cao
- Giảm OPEX bằng cách giảm các tài nguyên cần thiết để quản lý nhiều định dạng dữ liệu từ các nguồn khác nhau
- Quy mô từ nhỏ đến lớn trên nền tảng phân tích dữ liệu thống nhất
Dell Technologies và Cardinality cung cấp cho khách hàng nền tảng vi dịch vụ dựa trên Kubernetes mở rộng đường truyền dữ liệu từ ETL đến phân tích đến các trường hợp sử dụng viễn thông dựng sẵn được điều chỉnh để chạy trên các cụm Dell EMC PowerEdge hiệu suất cao, có thể mở rộng và được tích hợp với Dell EMC Isilon và Pivotal Greenplum . Cùng với nhau, Dell Technologies và Cardinality cam kết đảm bảo rằng họ có thể tận dụng tối đa khả năng phân tích dữ liệu.
Bài viết mới cập nhật
Thuần hóa sự hỗn loạn của công nghệ: Giải pháp phục hồi sáng tạo của Dell
Sự cố CNTT nghiêm trọng ảnh hưởng đến 8,5 triệu hệ ...
Dell PowerScale và Marvel hợp tác để tạo ra quy trình làm việc truyền thông tối ưu
Hiện đang ở thế hệ thứ 9, giải pháp lưu trữ Dell ...
Bảo mật PowerScale OneFS SyncIQ
Trong thế giới sao chép dữ liệu, việc đảm bảo tính ...
Danh sách kiểm tra cơ sở bảo mật PowerScale
Là một biện pháp bảo mật tốt nhất, chúng tôi khuyến ...