Dell và Northwestern Medicine hợp tác trên LLM đa phương thức chăm sóc sức khỏe thế hệ tiếp theo

Các mô hình ngôn ngữ lớn đa phương thức sáng tạo, hay mLLM, đã cho thấy những khả năng mới đáng chú ý trên nhiều lĩnh vực khác nhau, từ hình ảnh tĩnh đến video, dạng sóng cho đến ngôn ngữ, v.v. Tuy nhiên, tác động của các ứng dụng mLLM nhắm mục tiêu chăm sóc sức khỏe vẫn chưa được thử nghiệm, phần lớn là do rủi ro gia tăng và quy định ngày càng khắt khe gặp phải trong môi trường chăm sóc bệnh nhân. Sự hợp tác giữa Dell Technologies và Northwestern Medicine nhằm mục đích mở đường cho sự phát triển và tích hợp các MLLM định hướng chăm sóc sức khỏe thế hệ tiếp theo vào quy trình làm việc của bệnh viện thông qua quan hệ đối tác chiến lược dựa trên chuyên môn kỹ thuật và thực tế ở điểm giao thoa giữa chăm sóc sức khỏe và công nghệ.

Một ứng dụng thực tế của mLLM được nhấn mạnh trong một ấn phẩm nguồn mở gần đây của nhóm Nghiên cứu và Phát triển tại Northwestern Medicine, trong đó mô tả sự phát triển và đánh giá mLLM để giải thích chụp X-quang ngực. Những cách giải thích này được các bác sĩ cấp cứu đánh giá là chính xác và phù hợp trong bối cảnh cấp cứu như những cách giải thích của các bác sĩ X quang tại chỗ, thậm chí còn vượt qua cả những cách giải thích của bác sĩ X quang từ xa. Việc triển khai lâm sàng mô hình như vậy có thể mở rộng khả năng tiếp cận dịch vụ chăm sóc đồng thời hỗ trợ bác sĩ đưa ra quyết định. Nghiên cứu được bình duyệt này – nghiên cứu đầu tiên đánh giá lâm sàng một mLLM tổng quát để diễn giải X-quang ngực – chỉ là một ví dụ trong số rất nhiều cơ hội tạo ra tác động có ý nghĩa của các mLLM phù hợp với nhu cầu chăm sóc sức khỏe.

Điều này cho thấy cấu trúc mô hình của việc diễn giải X-quang ngực.  Các tia X hiện tại và trước đó được kết hợp thành một hình ảnh đầu vào duy nhất, chảy qua mô hình AI bao gồm bộ mã hóa hình ảnh và bộ giải mã văn bản, sau đó đưa ra kết quả quan sát và hiển thị.Hình 1. Cấu trúc mô hình giải đoán X-quang ngực 

Như được minh họa trong Hình 1, mô hình này là mô hình bộ mã hóa-giải mã tầm nhìn, sử dụng ViT-base và RoBERTa-base được huấn luyện trước tương ứng làm bộ mã hóa hình ảnh và bộ giải mã văn bản. Tổng cộng, hơn 1 triệu hình ảnh và báo cáo X quang đã được sử dụng để huấn luyện mô hình này bằng cách sử dụng một nút có 8 GPU trong ba tuần. Việc mở rộng phạm vi của các mô hình như vậy, chẳng hạn như sang các phương thức hình ảnh khác như chụp cắt lớp vi tính và chụp cộng hưởng từ, đòi hỏi khả năng phần cứng lớn hơn nhiều để đào tạo hiệu quả trên quy mô lớn.

Đáng chú ý, mô hình này được đào tạo chỉ sử dụng 8 đơn vị xử lý đồ họa (GPU) trong ba tuần. Như phần lớn nghiên cứu LLM đã chỉ ra, việc nhân rộng các phương pháp như vậy có nhiều hứa hẹn, kết hợp nhiều dữ liệu hơn và các mô hình lớn hơn để tạo ra các giải pháp mạnh mẽ hơn. Hệ thống bệnh viện tạo ra lượng dữ liệu khổng lồ trải rộng trên nhiều phương thức, chẳng hạn như giá trị phòng thí nghiệm bằng số, hình ảnh và video lâm sàng, dạng sóng và ghi chú lâm sàng văn bản tự do. Mục tiêu chính của sự hợp tác giữa Dell Technologies và Northwestern Medicine là mở rộng công việc này và mở rộng khả năng của các hệ thống chăm sóc sức khỏe để sử dụng dữ liệu của chính họ nhằm giải quyết các vấn đề lâm sàng và kết hợp các nền tảng tập trung vào dữ liệu tiên tiến với chuyên môn lâm sàng, tất cả đều hướng tới việc cải thiện kinh nghiệm của bệnh nhân và bác sĩ.

HPC tuân thủ HIPAA

Để hiện thực hóa tầm nhìn này, cần phải xây dựng các cụm điện toán hiệu suất cao (HPC) phù hợp với nhu cầu chăm sóc sức khỏe, trong đó có nhiều nút với các cấp độ tài nguyên điện toán, bộ nhớ và lưu trữ khác nhau được cung cấp cho người dùng để chạy song song các tác vụ và ở quy mô. Điều này cho phép quản lý tài nguyên tập trung với tính linh hoạt trong việc cung cấp tài nguyên cho các công việc khác nhau, từ thử nghiệm một nút đến đào tạo mô hình phân tán ồ ạt. Cấu trúc cụm HPC điển hình được minh họa trong Hình 2. Người dùng có thể kết nối với nút đăng nhập thông qua mạng riêng ảo (VPN) hoặc shell bảo mật (SSH). Các nút này cung cấp quyền truy cập vào các tài nguyên điện toán được yêu cầu trong mạng cụm HPC nội bộ cũng như phần mềm lập lịch công việc, chẳng hạn như slurm, để điều phối việc gửi và phân phối công việc. Các nút máy tính được kết nối với nhau với các cấp độ truy cập được cung cấp khác nhau, từ một GPU trên nút đa GPU đến hàng chục nút đa GPU. Một hệ thống tệp song song được chia sẻ được sử dụng để truy cập vào bộ lưu trữ dữ liệu.

Hình ảnh này mô tả thiết lập cụm HPC điển hình.  Người dùng có thể đăng nhập từ nhiều vị trí thông qua SSH/VPN, cho phép họ truy cập vào các tài nguyên điện toán dùng chung và hệ thống tệp dùng chung.Hình 2. Thiết lập cụm HPC điển hình

Tuy nhiên, điều cần cân nhắc đặc biệt trong hệ sinh thái xử lý dữ liệu bệnh viện là thông tin sức khỏe được bảo vệ, hay PHI. Đạo luật về trách nhiệm giải trình và cung cấp thông tin bảo hiểm y tế, hay HIPAA, yêu cầu mức độ bảo mật cơ bản để đảm bảo PHI được bảo vệ đầy đủ, đảm bảo quyền riêng tư của bệnh nhân đối với dữ liệu sức khỏe nhạy cảm. Do đó, HPC chăm sóc sức khỏe tuân thủ HIPAA phải tính đến tính bảo mật cao hơn và phân tách PHI. Nhưng chính xác thì việc tuân thủ HIPAA có nghĩa là gì? Phần sau đây sẽ mô tả một số thành phần chính cần thiết để đảm bảo tuân thủ HIPAA và bảo vệ dữ liệu nhạy cảm của bệnh nhân trong tất cả các khía cạnh hợp tác giữa bệnh viện. Mặc dù việc tuân thủ HIPAA có vẻ khó khăn nhưng chúng tôi chia các yêu cầu này thành hai khía cạnh chính: kho chứa dữ liệu và quản lý dữ liệu, như minh họa trong Hình 3.

Chúng thường có thể được nhóm thành một kho dữ liệu, thực hiện các biện pháp bảo vệ vật lý và kỹ thuật số để đảm bảo an ninh dữ liệu và quản lý dữ liệu hợp lý, xác định các phương pháp hay nhất và đảm bảo sự phát triển hợp tác liên tục giữa các đối tác chiến lược.Hình 3. Các khía cạnh chính cần thiết để đảm bảo tuân thủ HIPAA trong trung tâm dữ liệu chứa dữ liệu chăm sóc sức khỏe 

Đầu tiên, silo dữ liệu phải đảm bảo rằng quyền truy cập được cung cấp một cách an toàn và có thể kiểm soát được. Dữ liệu phải được mã hóa theo Tiêu chuẩn mã hóa nâng cao (AES), chẳng hạn như AES-256 sử dụng khóa 256 bit. Tường lửa đầy đủ, địa chỉ IP riêng và quyền truy cập qua VPN từ xa còn được yêu cầu để đảm bảo rằng PHI chỉ có thể được truy cập bởi các bên được ủy quyền và theo cách an toàn. Cuối cùng, kiểm soát truy cập vật lý đảm bảo quyền truy cập và giám sát được chứng nhận trong chính trung tâm dữ liệu.

Thứ hai, các biện pháp quản lý dữ liệu phải được thực hiện để đảm bảo rằng các biện pháp thực hành luôn được cập nhật và phù hợp với các mục tiêu của tổ chức. Thỏa thuận liên kết kinh doanh (BAA) mô tả trách nhiệm của mỗi bên liên quan đến việc bảo vệ PHI theo cách ràng buộc về mặt pháp lý và cần thiết nếu các hoạt động liên kết kinh doanh yêu cầu quyền truy cập PHI. Các giao thức bảo mật, cùng với kế hoạch khắc phục thảm họa, cần được vạch ra để đảm bảo bảo vệ PHI trong mọi tình huống. Cuối cùng, cần thực hiện phân tích rủi ro và bảo mật thường xuyên để duy trì sự tuân thủ các tiêu chuẩn hiện hành và xác định các lĩnh vực cần cải thiện.

Mặc dù nhiều trung tâm dữ liệu đã triển khai các biện pháp để đảm bảo tuân thủ các quy định như HIPAA, thách thức lớn nhất vẫn là cung cấp sự tách biệt theo yêu cầu giữa khối lượng công việc chung và khối lượng công việc tuân thủ HIPAA trong cùng một cơ sở hạ tầng. Để giải quyết vấn đề này, Dell Technologies đang hợp tác với Northwestern Medicine về một phương pháp tiếp cận mới sử dụng khả năng cung cấp linh hoạt, có kiểm soát để cho phép tuân thủ HIPAA theo yêu cầu trong các cụm HPC hiện có, như trong Hình 4. Thiết lập HPC này, sau khi được triển khai, sẽ tự động cung cấp khả năng phân tách mạng và cấu hình lại tài nguyên điện toán và lưu trữ dữ liệu, đảm bảo chúng được tách biệt khỏi phân bổ chung.

Phần cụm mới tuân thủ HIPAA này chỉ có thể được truy cập bởi những người dùng được chứng nhận thông qua VPN bằng cách sử dụng các nút đăng nhập chuyên dụng cung cấp khả năng lập kế hoạch công việc và quyền truy cập hệ thống tệp riêng biệt, cho phép truy cập vào các tài nguyên điện toán sẵn sàng cho AI mà không làm gián đoạn khối lượng công việc chung. Khi không còn cần thiết, quá trình cấu hình lại cụm tự động sẽ diễn ra, trả lại tài nguyên cho phân bổ chung cho đến khi cần khối lượng công việc tuân thủ HIPAA mới.

Khi cần thiết để hỗ trợ khối lượng công việc chăm sóc sức khỏe, mẫu Dell dành cho HPC tuân thủ HIPAA cho phép tách cụm HPC thành các phân vùng chung và tuân thủ HIPAA chỉ bằng một lần chuyển đổi, cung cấp khả năng phân tách mạng và quyền truy cập vào tính toán và lưu trữ dữ liệu tuân thủ HIPAA chuyên dụng trong khi vẫn duy trì khả năng phục vụ khối lượng công việc chung song song.Hình 4. Cụm HPC tuân thủ HIPAA thế hệ tiếp theo, được xây dựng dựa trên thiết lập điển hình được trình bày trong Hình 1 

Chuyên môn của chúng tôi về cơ sở hạ tầng điện toán cho các sáng kiến ​​trí tuệ nhân tạo (AI) mở rộng sang phát triển trung tâm dữ liệu và cơ sở hạ tầng trung tâm dữ liệu với mức độ bảo mật và kiểm soát phù hợp mà hệ thống y tế có thể tận dụng như một phần trong nỗ lực đạt được sự tuân thủ HIPAA .

Mô hình tích hợp điện toán chăm sóc sức khỏe tuân thủ HIPAA này nhằm mục đích dân chủ hóa lợi ích của cuộc cách mạng trí tuệ nhân tạo, cho phép các tổ chức chăm sóc sức khỏe sử dụng những công nghệ mới này và cung cấp dịch vụ chăm sóc tốt hơn, hiệu quả hơn cho tất cả mọi người.