Đổi mới AI Edge: Phát hiện tư thế theo thời gian thực

Trải nghiệm khả năng phát hiện tư thế theo thời gian thực của Latent AI tại NVIDIA GTC 2025. Được hỗ trợ bởi máy trạm Dell Precision, hãy xem AI tiên tiến định nghĩa lại phân tích chuyển động.

Khi Tom Brady tung cú xoáy hoàn hảo hoặc Serena Williams giao bóng không thể trả lại, chuyển động của họ là kết quả của hàng nghìn giờ phân tích và hoàn thiện mọi chi tiết trong động tác của họ. Các vận động viên chuyên nghiệp từ lâu đã có thể tiếp cận các hệ thống phân tích chuyển động tinh vi do AI cung cấp, phân tích kỹ thuật của họ theo từng khung hình. Tuy nhiên, các hệ thống này theo truyền thống đòi hỏi tài nguyên điện toán khổng lồ, gửi video đến các trung tâm dữ liệu từ xa để xử lý.

Tại NVIDIA GTC 2025 , bạn sẽ tự mình trải nghiệm cùng một cấp độ phân tích chuyển động chuyên nghiệp. Latent AI đang mang đến những tiến bộ mới nhất của mình trong việc tối ưu hóa AI và tạo mẫu nhanh, để giới thiệu khả năng phát hiện tư thế theo thời gian thực, được hỗ trợ bởi các máy trạm Dell Precision 7875 và GPU NVIDIA RTX 6000 Ada Generation . Các máy trạm cấp thương mại này cho phép AI xử lý chuyển động ngay lập tức mà không cần dựa vào máy chủ đám mây hoặc kết nối internet.

Thách thức: Làm cho AI hoạt động ở nơi bạn đang ở

Các hệ thống AI truyền thống gửi dữ liệu của bạn đến các máy chủ xa để xử lý. Giống như việc phải gửi mọi bức ảnh bạn chụp đến phòng thí nghiệm để phát triển – chậm, kém hiệu quả và đôi khi không thể thực hiện được khi bạn không có kết nối tốt. Edge AI thay đổi điều này bằng cách xử lý dữ liệu ngay tại nơi dữ liệu được tạo ra, nhưng có một điều đáng lưu ý: hầu hết các mô hình AI đều được xây dựng với giả định rằng chúng sẽ có quyền truy cập vào các tài nguyên điện toán khổng lồ.

Đây là nơi cách tiếp cận của Latent AI nổi bật. Công nghệ tối ưu hóa Latent AI Efficient Inference Platform (LEIP) của họ chuyển đổi các mô hình AI phức tạp để chạy hiệu quả trên phần cứng có sẵn. Hãy nghĩ về nó như việc điều chỉnh động cơ – bạn có thể chạy cùng một thiết kế cơ bản trong mọi thứ, từ xe gia đình đến xe đua, nhưng bạn sẽ có được các mức hiệu suất khác nhau tùy thuộc vào phần cứng của mình.

Tại sao phần cứng cao cấp vẫn quan trọng

Tại NVIDIA GTC 2025 , Latent AI đang trình diễn công nghệ của mình trên máy trạm Dell 7875 Precision được trang bị nền tảng điện toán tăng tốc NVIDIA . Theo dõi chuyển động theo thời gian thực đòi hỏi độ chính xác đặc biệt, độ trễ nhỏ nhất cũng có thể ảnh hưởng đến độ chính xác. Phần cứng này đảm bảo hiệu suất cần thiết để xử lý liền mạch, tốc độ cao. Công nghệ của họ tối ưu hóa các mô hình AI trong hệ thống phát hiện tư thế để chạy ba mô hình trong một đường ống được tối ưu hóa cao:

Ước tính độ sâu: Xác định khoảng cách vật thể từ camera bằng MiDaS , một mô hình tận dụng xương sống SWIN Transformer để ước tính độ sâu đơn sắc mạnh mẽ.
Phát hiện đối tượng: Sử dụng YOLOv8 để phát hiện và theo dõi cá nhân, đảm bảo nhận dạng nhất quán ngay cả trong bối cảnh đông đúc.
Ước tính tư thế: YOLOv8s-Pose theo dõi các điểm chính trên cơ thể để phân tích và so sánh tư thế của người dùng với tư thế tham chiếu.

LEIP Optimize của Latent AI là công nghệ cơ bản giúp bản demo này khả thi. LEIP Optimize nén các mô hình AI và biên dịch khối lượng công việc vào mã gốc của thiết bị, tăng tốc độ suy luận và giảm thiểu độ trễ. Nếu không tối ưu hóa, các tác vụ này sẽ yêu cầu sức mạnh xử lý cực lớn hoặc gặp phải tình trạng tắc nghẽn hiệu suất. Bảng dưới đây minh họa các cải tiến mà LEIP Optimize cung cấp:

FPS (Khung hình trên giây) đo tốc độ xử lý dữ liệu đầu vào và tạo ra kết quả của mô hình AI, phản ánh khả năng phản hồi và hiệu quả của hệ thống—FPS càng cao, trải nghiệm AI càng mượt mà và phản hồi nhanh hơn. LEIP Optimize cung cấp tốc độ đường truyền tăng gấp 3 lần , giúp ước tính tư thế theo thời gian thực ngay cả trên các thiết bị biên.

Khoa học đằng sau tốc độ

Tối ưu hóa của Latent AI kết hợp lượng tử hóa mô hình với biên dịch nhận biết phần cứng để tối đa hóa hiệu suất trên các nền tảng. Quá trình bắt đầu bằng lượng tử hóa, giúp giảm độ chính xác của các định dạng số tốn kém về mặt tính toán (như số dấu phẩy động 32 bit) bằng các định dạng có độ chính xác thấp hơn (như INT8). Sau đó, nó biên dịch các mô hình lượng tử hóa này cụ thể cho từng phần cứng mục tiêu – trên RTX 6000, điều này có nghĩa là tối ưu hóa các đường dẫn thực thi để tận dụng Tensor Core thế hệ thứ 4 cho các hoạt động INT8, trong khi CPU của Dell Precision 7875 xử lý các tác vụ tiền xử lý. Các thiết lập tối ưu hóa được cung cấp dưới dạng LEIP Recipes , một tập hợp các cấu hình được đánh giá chuẩn và sẵn sàng thực thi để đẩy nhanh quá trình phát triển.

Biên dịch dành riêng cho phần cứng này có thể áp dụng rộng rãi và mở rộng vượt xa các hệ thống cao cấp. Đối với các mô-đun NVIDIA Jetson Orin , LEIP tạo mã tối đa hóa khả năng INT8 của GPU nhúng trong khi đối với PC công nghiệp x86 có GPU công suất thấp hơn, nó tạo ra các đường dẫn thực thi chuyên biệt cân bằng độ chính xác số nguyên với các tài nguyên tính toán khả dụng. Bằng cách điều chỉnh cả chiến lược lượng tử hóa và quy trình biên dịch theo các ràng buộc của từng nền tảng, LEIP duy trì hiệu suất nhất quán trên tất cả các kịch bản triển khai.

Vượt ra ngoài bản demo: Tác động thực tế

Nguồn: Exer AI: Ước tính tư thế vật lý trị liệu

Công nghệ đằng sau cuộc trình diễn này đang thúc đẩy sự thay đổi trong cách thế giới của chúng ta phân tích chuyển động. Sức mạnh của các đường ống AI có sẵn hơn bao giờ hết khi LEIP Optimize của Latent AI đưa các mô hình AI tiên tiến lên hàng đầu. Sự tiến bộ này trong ước tính tư thế theo thời gian thực ngụ ý rằng các nhà vật lý trị liệu có thể theo dõi chuyển động của bệnh nhân trong quá trình phục hồi chức năng mà không cần các kỹ sư DevOps cung cấp tài nguyên đám mây để xử lý dữ liệu của họ. Các hệ thống an toàn tại nhà máy có thể theo dõi tư thế của công nhân theo thời gian thực, ngăn ngừa chấn thương trước khi chúng xảy ra. Các ứng dụng thể dục có thể cung cấp chức năng hiệu chỉnh hình thức trong quá trình tập luyện tại nhà.

Mỗi ứng dụng này đều có thể mở rộng để phù hợp với phần cứng có sẵn và cho dù bạn được trang bị PC hiệu suất cao của Dell hay PC AI với nền tảng điện toán tăng tốc NVIDIA , bạn đều có thể tiếp cận những tiến bộ mới nhất về AI mà không cần phải thiết lập phức tạp.

Hãy tự mình trải nghiệm

Tại NVIDIA GTC 2025 , bạn sẽ được bước vào một hệ thống đại diện cho đỉnh cao hiện tại của khả năng AI biên. Sự kết hợp giữa công nghệ tối ưu hóa Latent AI , PC AI Dell Pro Max và GPU NVIDIA RTX 6000 Ada Generation tạo nên trải nghiệm giống như bước vào một cơ sở đào tạo thể thao chuyên nghiệp.

LEIP Optimize của Latent AI tận dụng tối đa phần cứng của bạn bằng cách chuyển đổi khối lượng công việc AI để phù hợp nhất với thiết lập của bạn. Điều này loại bỏ nhu cầu về các tài nguyên điện toán đám mây phức tạp trong khi vẫn cho phép chức năng AI ngay cả khi không có kết nối internet. Các giàn khoan dầu ngoài khơi, các địa điểm khai thác vật liệu và các môi trường ngoài lưới điện khác sử dụng LEIP để đưa AI đến những nơi mà kết nối đám mây có thể gây ra các mối lo ngại nghiêm trọng về an toàn. Tìm hiểu thêm về cách Latent AI tăng cường điện toán tại biên bằng cách theo liên kết này .

Hãy ghé thăm chúng tôi tại NVIDIA GTC 2025 tại gian hàng Dell số 1423 để xem một số bản demo thú vị. Nếu bạn muốn tìm hiểu thêm về PC AI Dell Pro Max với GPU NVIDIA RTX, hãy nhấp vào đây để khám phá cách PC hiệu suất cao của chúng tôi được thiết kế để có hiệu suất vô song.