Tăng tốc Insight bằng Bộ xử lý Intel® Xeon® có khả năng mở rộng thế hệ thứ 2 với Deep Learning Boost

Các kỹ thuật Trí tuệ nhân tạo (AI) đang nhanh chóng trở thành trọng tâm trong quá trình chuyển đổi kỹ thuật số của doanh nghiệp bằng cách tăng cường và trong nhiều trường hợp thay thế các kỹ thuật phân tích dữ liệu truyền thống. Những kỹ thuật này mang lại khả năng chủ động và quy định cho quy trình ra quyết định dựa trên dữ liệu của công ty, mang lại cho các công ty sớm áp dụng chúng một lợi thế cạnh tranh khác biệt. Những người áp dụng chúng muộn sẽ bị bỏ lại phía sau.

Intel nhận ra rằng các phương pháp AI, đáng chú ý nhất là học máy và học sâu, hiện là những thành phần quan trọng trong khối lượng công việc của công ty. Để giải quyết nhu cầu đào tạo và, có thể nói là quan trọng hơn, để các mô hình AI đưa ra quyết định nhanh hơn, Intel đã đặt những khối lượng công việc này lên hàng đầu với dòng bộ xử lý Intel® Xeon® Scalable thế hệ ^{thứ 2 mới.}

Bộ xử lý có khả năng mở rộng Intel® Xeon® thế hệ ^thứ 2

^{Bộ xử lý Intel® Xeon® Scalable thế hệ thứ} 2 mang đến nhiều chức năng mới và cải tiến, bao gồm khả năng triển khai Bộ nhớ liên tục Intel® Optane™ DC, tốc độ DRAM được cải thiện, khả năng xử lý lớn hơn cho các tập lệnh truyền thống chẳng hạn như FP32 độ chính xác đơn và bộ xử lý mới khả năng xử lý cho khối lượng công việc học sâu với tập lệnh Intel® Deep Learning Boost mới.

Deep Learning Boost trên Bộ xử lý có khả năng mở rộng Intel® Xeon® thế hệ ^{thứ 2}

Học sâu là quá trình phát triển các mô hình sử dụng mạng thần kinh nhân tạo, bao gồm nhiều đơn vị xử lý độc lập hoặc tế bào thần kinh, được kết nối trong một biểu đồ dày đặc. Mạng nơ-ron đã chứng minh khả năng đáng kinh ngạc trong việc xác định các mẫu chưa biết hoặc không lường trước được trong tất cả các loại dữ liệu và đã được áp dụng cho các lĩnh vực từ nhận dạng và phân tích hình ảnh và video, chuyển đổi âm thanh và ngôn ngữ, dữ liệu chuỗi thời gian và phân tích phát hiện bất thường.

Quá trình sử dụng mạng thần kinh để phát triển các mô hình tiên tiến được chia thành hai giai đoạn: đào tạo, trong đó dữ liệu hiện có được sử dụng để dạy mạng thần kinh cách xác định các mẫu; và suy luận, nơi mô hình được đào tạo tiếp xúc với dữ liệu mới và dự kiến sẽ đưa ra quyết định phù hợp. Và mặc dù quá trình đào tạo mạng lưới thần kinh đã trở thành trọng tâm của đổi mới phần cứng và phần mềm trong vài năm, nhưng theo suy luận, các doanh nghiệp đang nhận được lợi ích từ những nỗ lực AI của họ.

Suy luận có các yêu cầu phần cứng khác với đào tạo. Đào tạo yêu cầu số học dấu phẩy động có độ chính xác một nửa hoặc độ chính xác đơn và khả năng xử lý đồng thời nhiều vectơ lớn của dữ liệu tương tự. Suy luận có tổng yêu cầu điện toán thấp hơn nhiều, tập trung nhiều hơn vào độ trễ (thời gian đưa ra quyết định) và có thể tận dụng các định dạng số có độ chính xác thấp hơn, chẳng hạn như số nguyên 8 bit và 16 bit.

Dòng bộ xử lý Intel® Xeon® Scalable thế hệ ^{thứ 2 tập trung chủ yếu vào giai đoạn thứ hai (suy luận) này với một khả năng hoàn toàn mới được gọi là Deep Learning Boost.}Intel® Deep Learning Boost giúp giảm độ chính xác số học (số nguyên 8-bit và 16-bin) cho các đơn vị vectơ rộng 512-bit của Xeon (AVX512). Đây là một khả năng tuyệt vời để giảm suy luận chính xác vì bộ xử lý Intel® Xeon® hỗ trợ Deep Learning Boost có thể xử lý đồng thời 64 số nguyên 8 bit (hoặc 32 số nguyên 16 bit) trong một lệnh phần cứng duy nhất! Kết hợp điều này với khả năng thực hiện các hoạt động hợp nhất, chẳng hạn như Cộng nhân hợp nhất (FMA) trên các vectơ rộng có độ chính xác thấp này và thông lượng của hệ thống sẽ tăng lên đáng kể.

Dell EMC đã đo điểm chuẩn cho các cải tiến hiệu suất khả thi mà Intel® Deep Learning Boost có thể mang lại cho suy luận mạng thần kinh. Hình trên cho thấy mức độ cải tiến mà tổ chức của bạn có thể đạt được bằng cách triển khai bộ xử lý Intel® Xeon® Scalable thế hệ ^{thứ 2 với Intel® Deep Learning Boost.}Trong khi bộ xử lý Intel® Xeon® Scalable thế hệ thứ nhất (tên mã là “Skylake”) có khả năng xử lý 258 hình ảnh mỗi giây trên điểm chuẩn suy luận ResNet-50 ở độ chính xác đơn (FP32) và 389 hình ảnh mỗi giây ở số nguyên 8 bit ^giảm chính xác, các hướng dẫn mới mà Deep Learning Boost mang đến cho bộ xử lý Intel® Xeon® Scalable thế hệ ^{thứ 2 có thể tăng gấp ba lần thông lượng ở độ chính xác số nguyên 8 bit thành 1278 hình ảnh mỗi giây!}

Tại sao điều này quan trọng

Điều này có ý nghĩa gì đối với doanh nghiệp của bạn? Mỗi suy luận mà mô hình AI của bạn đưa ra là một thông tin chi tiết mà bạn chưa từng có trước đây hoặc một khối lượng công việc mà bạn đã tự động hóa để loại bỏ rào cản đối với quyết định. Mỗi thông tin chi tiết đó, mỗi rào cản được loại bỏ đó đều có thể dẫn đến một đợt bán hàng mới, một đợt bán thêm hoặc một quyết định đầu tư nhanh hơn. Đó là tiền trong túi của công ty bạn.

Khi các công ty trải qua quá trình chuyển đổi kỹ thuật số, việc sử dụng AI – và cụ thể là học sâu – sẽ rất quan trọng để giữ cho công ty của bạn cạnh tranh trong một thế giới dựa trên dữ liệu. Và trong khi đào tạo các mô hình AI là chủ đề bàn tán trong giai đoạn đầu này, suy luận sẽ là cách mà doanh nghiệp của bạn nhận ra lợi ích của AI. Các máy chủ Dell EMC PowerEdge được cung cấp bởi bộ xử lý Intel® Xeon® Scalable thế hệ ^{thứ 2 với Intel® Deep Learning Boost có thể giúp doanh nghiệp của bạn nhận ra toàn bộ tiềm năng của AI thông qua suy luận mô hình hiệu suất cao hơn.}Và hiệu suất cao hơn chuyển thành kinh doanh tốt hơn.