Dữ liệu có thể tái tạo và bảo mật quyền riêng tư là yếu tố then chốt cho nghiên cứu sức khỏe não bộ. Tiến sĩ Gregory Kiar và Viện Child Mind đang giải quyết nhu cầu này thông qua khoa học mở, dữ liệu tổng hợp và điện toán hiệu năng cao cục bộ. Cùng với Dell Technologies và NVIDIA, họ đang xây dựng cơ sở hạ tầng cho các nhà nghiên cứu để đẩy nhanh quá trình hiểu biết, chẩn đoán và điều trị các vấn đề sức khỏe tâm thần và học tập, đồng thời bảo vệ quyền riêng tư của bệnh nhân.
Con đường của Tiến sĩ Gregory Kiar, từ kỹ thuật y sinh và điện tử đến nhà khoa học thần kinh, bắt đầu từ chính ngôi nhà của mình. Chứng kiến chị gái mình vượt qua chứng khó khăn học tập, ông bắt đầu tò mò về lý do tại sao não bộ của họ hoạt động khác nhau và điều đó dẫn đến sự khác biệt lớn như thế nào trong trải nghiệm thời thơ ấu mặc dù họ được nuôi dạy gần như giống hệt nhau. Mong muốn tìm hiểu lý do tại sao trải nghiệm của họ lại khác biệt đến vậy khiến ông phần lớn không có câu trả lời rõ ràng và khiến ông nhận ra rằng phần lớn nghiên cứu về sức khỏe não bộ được xây dựng trên nền tảng không đáng tin cậy của những tập dữ liệu nhỏ, không thể tái tạo.
Hiện nay, với tư cách là Giám đốc Trung tâm Đổi mới và Độ chính xác của Phân tích Dữ liệu (DAIR) tại Viện Tâm trí Trẻ em, Kiar dẫn dắt một nhóm giải quyết một trong những thách thức phức tạp nhất của ngành chăm sóc sức khỏe: xây dựng cơ sở hạ tầng dữ liệu có khả năng tái tạo mà các nhà nghiên cứu sức khỏe não bộ đang rất cần. Kiar và nhóm của ông đang phát triển hợp tác với các cộng đồng kỹ thuật và các nhà cung cấp công nghệ đẳng cấp thế giới để xây dựng các đường ống dữ liệu đáng tin cậy, có thể thúc đẩy hiểu biết, chẩn đoán và điều trị các vấn đề sức khỏe tâm thần và học tập.
Khủng hoảng khả năng tái tạo: xây dựng trên những khối đổ nát
Cuộc khủng hoảng về khả năng tái tạo trong nghiên cứu tâm lý học nổi lên rõ rệt nhất vào đầu những năm 2010, phơi bày những thách thức về dữ liệu và phân tích của lĩnh vực này. Khi một nhóm các nhà nghiên cứu cố gắng tái tạo 100 nghiên cứu tâm lý đã công bố, chỉ một phần ba kết quả có thể được tái tạo.
“Nó giống như việc xây dựng trên những khối đá có thể sụp đổ khi bạn cố gắng dẫm lên chúng,” Kiar mô tả. “Bạn không thể thúc đẩy lĩnh vực này một cách hiệu quả nếu bạn không biết những mảnh nền tảng nào là vững chắc.”
Nếu không có dữ liệu vững chắc, có thể tái tạo và mang tính đại diện, hậu quả sẽ lan rộng ra toàn bộ hệ thống sức khỏe tâm thần. Các nhà nghiên cứu không thể xác định các dấu ấn sinh học đáng tin cậy cho các tình trạng sức khỏe tâm thần, điều này có nghĩa là chẩn đoán vẫn còn quá chủ quan và các lộ trình điều trị thường bao gồm thử nghiệm và sai sót. Ngày nay, cứ năm trẻ em thì có một trẻ phải vật lộn với các rối loạn sức khỏe tâm thần, nhưng 70% các quận ở Hoa Kỳ lại thiếu một bác sĩ tâm thần nhi khoa hoặc vị thành niên. Hơn 75% tất cả các tình trạng sức khỏe tâm thần xuất hiện trước 25 tuổi, nhưng do kỳ thị, thông tin sai lệch và thiếu khả năng tiếp cận dịch vụ chăm sóc, thời gian trung bình giữa khởi phát triệu chứng và điều trị vượt quá tám năm.
Nhận thức này đã thôi thúc Kiar chuyển hướng sự nghiệp sang việc cải thiện độ tin cậy cơ bản của dữ liệu nghiên cứu sức khỏe não bộ. Tại Viện Child Mind, ông đã tìm thấy một tổ chức đặt khả năng tái tạo và khoa học mở làm nguyên tắc cốt lõi. “Viện Child Mind độc đáo bởi vì những nguyên tắc này không phải là thứ chúng tôi học để bổ sung,” Kiar nhận xét. “Chúng là một phần trong DNA của chúng tôi. Chúng tôi bắt đầu mọi dự án bằng cách đặt câu hỏi làm thế nào để có thể tái tạo và chia sẻ dữ liệu.”
Một cơ sở dữ liệu chưa từng có cho một thách thức chưa từng có
Dữ liệu sức khỏe não bộ đặt ra một thách thức riêng về quyền riêng tư. “Không giống như các lĩnh vực y tế khác, nơi dữ liệu có thể dễ dàng ẩn danh hơn, thông tin về sức khỏe tâm thần và học tập vốn mang tính cá nhân và xã hội”, Kiar giải thích. “Chỉ cần một lần quét não hoặc ghi chú lâm sàng, bạn có thể xác định được những cá nhân cụ thể nếu biết cách tìm kiếm.”
Bất chấp những hạn chế này, Viện Trí tuệ Trẻ em đã xây dựng được một thành tựu đáng chú ý. Thông qua nghiên cứu Mạng lưới Não bộ Khỏe mạnh, viện đã tuyển sinh hơn 7.100 trẻ em để được đánh giá chẩn đoán miễn phí. Công trình của họ đã tạo ra cơ sở dữ liệu lớn nhất từ trước đến nay về sự phát triển não bộ, bao gồm hàng chục nghìn giờ chụp ảnh não, đo lường hoạt động thể chất, đánh giá lâm sàng và dữ liệu khảo sát từ trẻ em gặp phải các rối loạn, khó khăn hoặc lo lắng về sức khỏe tâm thần và học tập.
Là đơn vị tiên phong toàn cầu về khoa học mở, Viện Child Mind chia sẻ dữ liệu này một cách tự do. Các nhà nghiên cứu độc lập đã sử dụng dữ liệu này trong hàng trăm ấn phẩm được bình duyệt. Viện đã tổ chức nhiều cuộc thi khoa học dữ liệu, thu hút hàng nghìn nhà nghiên cứu ở nhiều giai đoạn sự nghiệp khác nhau trên toàn thế giới tham gia giải quyết những câu hỏi hóc búa về rối loạn phát triển thần kinh và đào tạo một thế hệ nhà khoa học dữ liệu mới về phân tích sức khỏe tâm thần.
Tuy nhiên, Viện Tâm trí Trẻ em, giống như nhiều môi trường lâm sàng hoặc nghiên cứu khác, cũng đã thu thập vô số giờ ghi hình và ghi âm, ghi chú lâm sàng dạng tự do, nhật ký và báo cáo của bác sĩ lâm sàng. Dữ liệu phi cấu trúc này có thể chứa đựng những hiểu biết quan trọng khi chúng ta nâng cao hiểu biết về sức khỏe não bộ, nhưng hiện vẫn chưa có nền tảng nào cho phép các nhà nghiên cứu tận dụng cộng đồng khoa học dữ liệu để phân tích dữ liệu bệnh nhân nhạy cảm như thế này. Thông tin có thể thúc đẩy chẩn đoán sức khỏe tâm thần vẫn chưa được tiếp cận.
Xây dựng cơ sở hạ tầng cho dữ liệu bảo vệ quyền riêng tư
Việc giải quyết vấn đề riêng tư đòi hỏi nguồn lực tính toán khổng lồ. DAIR đang tạo ra các tập dữ liệu tổng hợp phản ánh trung thực dữ liệu bệnh nhân thực tế trong khi vẫn duy trì các biện pháp bảo vệ quyền riêng tư nghiêm ngặt, cho phép các nhà nghiên cứu huấn luyện các mô hình trên các bộ sưu tập lớn ghi chú lâm sàng, bản ghi âm và ảnh chụp não mà không làm lộ thông tin thực tế của bệnh nhân. Hệ thống máy tính hiệu năng cao Dell Pro Max được cấu hình với GPU NVIDIA RTX PRO cung cấp sức mạnh xử lý cần thiết để tạo ra các tập dữ liệu tổng hợp này ở quy mô lớn. Mặc dù khoa học dữ liệu trên các cụm máy tính hiệu năng cao thường có thể là một giải pháp cho các nhà nghiên cứu, nhưng chúng không thể được sử dụng khi làm việc với các tập dữ liệu nhạy cảm. Sức mạnh mà các hệ thống này mang lại cho phép các nhà nghiên cứu làm việc cục bộ với các công nghệ mới nhất, nhằm bảo vệ quyền riêng tư của dữ liệu.
Nền tảng cho những đột phá trong tương lai về sức khỏe tâm thần
Phương pháp tiếp cận độc đáo của Viện Child Mind đối với nghiên cứu thần kinh kết hợp việc tạo dữ liệu tổng hợp với khoa học dữ liệu cộng tác và sức mạnh tính toán do Dell Technologies và NVIDIA cung cấp. Cùng nhau, Viện Child Mind đang nỗ lực phân phối công khai các bộ dữ liệu sức khỏe não bộ có khả năng tái tạo đáng tin cậy và bảo mật quyền riêng tư, vốn trước đây không thể chia sẻ.
Nhóm của Kiar đang phát triển các kỹ thuật tạo dữ liệu tổng hợp có thể mở khóa hàng triệu bộ dữ liệu không thể truy cập trên toàn thế giới. Thông qua các cuộc thi liên tục và hợp tác cởi mở, họ đang đào tạo các nhà nghiên cứu sử dụng các công cụ này, đồng thời nâng cao hiểu biết của chúng ta về các tình trạng sức khỏe tâm thần và rối loạn học tập, đồng thời rút ngắn khoảng cách giữa khởi phát triệu chứng, chẩn đoán và điều trị hiệu quả.
Đây là bài viết đầu tiên trong loạt bài khám phá cách Viện Child Mind đang cách mạng hóa nghiên cứu sức khỏe tâm thần thông qua khoa học dữ liệu, hợp tác và đổi mới. Hãy theo dõi để tìm hiểu thêm về công trình đột phá của họ trong lĩnh vực tạo dữ liệu tổng hợp và các cuộc thi dữ liệu quy mô lớn.

Bài viết mới cập nhật
CPU cứu cánh: LLM dành cho mọi người
Tối ưu hóa các mô hình ngôn ngữ lớn Năm qua ...
Hướng dẫn thiết kế được Dell xác thực để suy luận và tùy chỉnh mô hình – Cập nhật tháng 3 năm 2024
Đổi mới liên tục với các thiết kế được Dell xác ...
Bắt đầu xây dựng các đường ống RAG trong doanh nghiệp của bạn với Dell Technologies và NVIDIA (Phần 1)
Trong bài viết trước, chúng tôi đã giới thiệu cách chạy ...
MLPerf™ Inference 4.0 trên Máy chủ Dell PowerEdge với CPU Intel® Xeon® thế hệ thứ 5
Giới thiệu Trong blog này, chúng tôi trình bày kết quả ...