Tương lai của AI sử dụng LiDAR

Giới thiệu

Phát hiện và đo khoảng cách ánh sáng (LiDAR) là phương pháp xác định khoảng cách từ cảm biến đến vật thể hoặc bề mặt bằng cách phát ra chùm tia laser và đo thời gian để ánh sáng phản xạ quay trở lại máy thu. Gần đây, chúng tôi đã thiết kế một giải pháp để hiểu cách sử dụng dữ liệu từ nhiều cảm biến LiDAR giám sát một không gian có thể được kết hợp thành hiểu biết nhận thức ba chiều (3D) về cách con người và vật thể di chuyển và hoạt động trong không gian công cộng và riêng tư. Đối tác chính của chúng tôi trong nghiên cứu này là Seoul Robotics, công ty hàng đầu về các công cụ phân tích và nhận biết LiDAR 3D.

Hầu hết mọi người đều quen thuộc với việc sử dụng LiDAR trên các phương tiện đang di chuyển để phát hiện các vật thể ở gần đã trở nên phổ biến trong các ứng dụng giao thông. LiDAR cố định hiện đang được áp dụng rộng rãi hơn cho hình ảnh 3D trong các ứng dụng mà máy ảnh được sử dụng theo truyền thống. 

Các ứng dụng LiDAR đa cảm biến có thể tạo ra bản đồ lưới 3D hoàn chỉnh với thông tin vị trí và độ sâu chính xác cho các đối tượng trong môi trường được giám sát chung. Công nghệ này khắc phục được một số hạn chế của máy ảnh 2D. Sử dụng AI, hệ thống LiDAR có thể cải thiện chất lượng kết quả phân tích dữ liệu được thu thập trong điều kiện thời tiết khắc nghiệt như mưa, tuyết và sương mù. Hơn nữa, LiDAR mạnh mẽ hơn camera quang học trong điều kiện ánh sáng xung quanh yếu hoặc tạo ra phản xạ và ánh sáng chói.

Một ưu điểm khác của LiDAR đối với thị giác máy tính liên quan đến bảo vệ quyền riêng tư. Việc triển khai rộng rãi các camera quang học có độ phân giải cao đã làm dấy lên mối lo ngại về khả năng vi phạm quyền riêng tư cá nhân và lạm dụng dữ liệu. 

Nhận thức LiDAR 3D là một giải pháp thay thế đầy hứa hẹn cho các hệ thống camera truyền thống. Dữ liệu LiDAR không chứa dữ liệu sinh trắc học có thể được tham chiếu chéo với các nguồn khác để nhận dạng duy nhất các cá nhân. Cách tiếp cận này cho phép người vận hành theo dõi các đối tượng ẩn danh nhằm duy trì quyền riêng tư của cá nhân. Do đó, điều cần thiết là phải xem xét việc thay thế hoặc tăng cường các camera như vậy để giảm chi phí đảm bảo dữ liệu được an toàn và sử dụng phù hợp. 

Thử thách

Trên toàn thế giới, các tổ chức sử dụng các giải pháp thị giác máy tính hỗ trợ AI để tạo ra không gian công cộng và riêng tư an toàn hơn, hiệu quả hơn chỉ bằng cách sử dụng camera nhiệt và hồng ngoại quang học. Các nhà khoa học dữ liệu đã phát triển nhiều công cụ học máy và mạng lưới thần kinh sâu để phát hiện và gắn nhãn các đối tượng bằng cách sử dụng dữ liệu từ các loại máy ảnh khác nhau này. 

Khi LiDAR trở nên quan trọng vì những lý do đã thảo luận ở trên, các tổ chức đang nghiên cứu các lựa chọn của họ để xem liệu LiDAR có được triển khai tốt nhất cùng với máy ảnh truyền thống hay không hoặc liệu có cơ hội thiết kế hệ thống mới chỉ sử dụng cảm biến LiDAR hay không. Rất hiếm khi các máy ảnh hiện tại có thể được thay thế bằng cảm biến LiDAR được gắn ở những vị trí chính xác được sử dụng ngày nay.

Dưới đây là ví dụ triển khai 2 cảm biến LiDAR cho một căn phòng cỡ trung bình:

Việc phát hiện vị trí của các vật thể đứng yên và người di chuyển trong không gian này (dòng chảy và chức năng) bằng LiDAR yêu cầu đặt các cảm biến một cách cẩn thận, hiệu chỉnh hình học của căn phòng và các thuật toán xử lý dữ liệu có thể trích xuất thông tin từ cả hai cảm biến mà không bị biến dạng hoặc trùng lặp. Việc thu thập và xử lý dữ liệu LiDAR để nhận biết 3D đòi hỏi một bộ công cụ và chuyên môn khác, nhưng các công ty như Seoul Robotics có thể trợ giúp.

Một khía cạnh khác của thiết kế hệ thống LiDAR cần được đánh giá là yêu cầu truyền dữ liệu. Trong hầu hết các môi trường lớn sử dụng triển khai camera hiện nay (ví dụ: sân bay/trung tâm giao thông, v.v.), dữ liệu camera được đưa trở lại một trung tâm tập trung để xử lý theo thời gian thực. 

Một camera quang thông thường trong hệ thống thị giác máy tính AI sẽ có độ phân giải và tốc độ làm mới là 1080@30FPS. Thông số kỹ thuật này sẽ chuyển thành ~4Mb/s lưu lượng mạng trên mỗi camera. Ngay cả với công nghệ mạng cũ hơn, hàng nghìn camera vẫn có thể được triển khai và xử lý. 

Mật độ dữ liệu được tạo và xử lý cho hệ thống LiDAR tăng đáng kể so với hệ thống video. Cảm biến LiDAR 32 kênh hiện có sẽ tạo ra dữ liệu từ 25Mb/s đến 50Mb/s trên phân đoạn mạng giữa thiết bị và nút xử lý AI. Các cảm biến LiDAR 128 kênh mật độ cao mới hơn tiêu thụ băng thông mạng lên tới 256Mb/giây, do đó, sẽ cần phải thay đổi một số điều so với chiến lược xử lý dữ liệu tập trung hiện tại. 

Giải pháp kỹ thuật

Việc thiết kế một hệ thống tiêu thụ toàn bộ dung lượng mạng của một địa điểm có lưu lượng LiDAR là không khả thi. Ngoài ra, việc nâng cấp mạng riêng của trang web để xử lý tốc độ cao hơn cũng có thể là một thách thức và tốn kém. Do đó, giải pháp hiệu quả nhất là thiết kế một giải pháp liên kết để xử lý dữ liệu LiDAR gần hơn với vị trí của các cảm biến.

Hình ảnh này hiển thị sơ đồ của các cấu trúc Tập trung và Liên kết để xử lý dữ liệu LiDAR.

 

Với việc chuyển sang kiến ​​trúc ở bảng điều khiển bên phải ở trên, có thể xử lý nhiều cảm biến LiDAR gần hơn với nơi chúng được gắn tại cơ sở và chỉ gửi mọi cảnh báo và sự kiện phát sinh trở lại vị trí trung tâm (nút chính) để biết thêm xử lý và đưa ra các hành động khắc phục. Cách tiếp cận này tránh được việc truyền dữ liệu LiDAR dày đặc tốn kém trên các phân đoạn mạng dài. 

Điều quan trọng cần lưu ý là việc xử lý dữ liệu LiDAR với hàng triệu điểm mỗi giây đòi hỏi khả năng tính toán đáng kể. Chúng tôi cũng xác nhận rằng việc tận dụng sức mạnh tính toán song song khổng lồ của các GPU như NVIDIA A2 đã nâng cao đáng kể độ chính xác của việc phát hiện đối tượng trong các nút xử lý phân tán. Dòng máy chủ Dell bền chắc Dell XR4000 sẽ là một lựa chọn tốt để xử lý từ xa trong nhiều môi trường.

Phần kết luận

LiDAR ngày càng trở nên quan trọng trong việc thiết kế AI cho các giải pháp thị giác máy tính nhờ khả năng xử lý các tình huống ánh sáng khó khăn và nâng cao quyền riêng tư của người dùng. LiDAR khác với máy quay video nên việc lập kế hoạch triển khai một cách cẩn thận là điều cần thiết.

Hệ thống LiDAR có thể được thiết kế theo cách tập trung hoặc liên kết hoặc thậm chí là kết hợp cả hai. Yêu cầu về băng thông mạng ngày càng tăng của LiDAR có thể khiến chúng ta phải suy nghĩ lại về cách triển khai các hệ thống xử lý dữ liệu hỗ trợ AI sớm hơn.