Kiểu hình kỹ thuật số giới thiệu các loại dữ liệu mới cho bối cảnh lâm sàng

Nút nguồn: 1738309

“Ý tưởng này là tất cả dữ liệu bạn tạo ra thông qua các tương tác của bạn với công nghệ - cho dù đó là phương tiện truyền thông xã hội hay với các thiết bị - tất cả các đường dẫn kỹ thuật số đó thực sự có thể mang lại những hiểu biết độc đáo về bệnh nhân,” Brownstein nói trong buổi nói chuyện của mình tại hội nghị chuyên đề hàng năm của Viện Khoa học Tính toán Ứng dụng Harvard gần đây.

Kiểu hình kỹ thuật số của bệnh nhân có thể được chọn lọc từ các truy vấn tìm kiếm, dữ liệu lưu lượng truy cập internet và các cài đặt xã hội ảo như Facebook và Twitter. Các tập dữ liệu kỹ thuật số như thế này có thể hoạt động như tín hiệu cho các đợt bùng phát bệnh truyền nhiễm hoặc bệnh do thực phẩm tiềm ẩn. Họ cũng có thể cung cấp khả năng hiển thị rộng hơn mắc bệnh mãn tính, lạm dụng thuốc và chuyển hướng sử dụng thuốc, nơi thuốc không được sử dụng bởi người được kê đơn.

“Chúng tôi luôn nói rằng chúng tôi đang đặt công chúng trở lại với sức khỏe cộng đồng,” ông nói.

Xây dựng kiểu hình kỹ thuật số

John Brownstein, Giám đốc đổi mới, Bệnh viện Nhi đồng BostonJohn Brownstein

Nghiên cứu sức khỏe cộng đồng phân tích các tập dữ liệu phi kỹ thuật như thế này, một lĩnh vực nghiên cứu được gọi là tính toán hoặc dịch tễ học kỹ thuật số, Là một trường hợp sử dụng dữ liệu lớn. Brownstein, người cũng là giáo sư tin học y sinh tại Trường Y Harvard, cho biết một phần của quá trình định hình kiểu hình kỹ thuật số là nhập các tập dữ liệu lớn “từ nhiều nguồn mà chúng ta có thể xác định hoặc cóp nhặt trên web.

Dữ liệu internet phi tiêu chuẩn đến từ các nguồn như nguồn tin tức và các bài đăng trên blog; các trang mạng xã hội, chẳng hạn như Twitter, Facebook và Instagram; cũng như các trang web như Yelp và thậm chí là OpenTable, một ứng dụng được sử dụng để đặt chỗ tại một nhà hàng. Brownstein cho biết ông cũng tận dụng dữ liệu từ các nguồn truyền thống, chẳng hạn như Hồ sơ y tế điện tử.  

Theo Brownstein, những kho dữ liệu internet phi kỹ thuật này không chỉ cung cấp những tín hiệu ban đầu mới về các sự kiện sức khỏe cộng đồng và dân số, chúng còn cho phép các nhà nghiên cứu truy cập vào dữ liệu ở quy mô toàn cầu. Ông nói: “Bạn có thể tưởng tượng rằng dữ liệu chúng tôi có trên khắp các cơ sở y tế rất được tinh chỉnh về mặt địa lý.

Theo Brownstein, sau khi dữ liệu đã được thu thập, các công cụ được phát triển để sắp xếp dữ liệu theo vị trí và theo từ khóa, sau đó được ánh xạ tới các nguyên tắc phân loại và được sử dụng làm cơ sở dữ liệu có cấu trúc để phân tích. Đây là nơi Brownstein và nhóm của ông dựa vào các công cụ học máy để tách các tín hiệu tiềm năng khỏi nhiễu.

Tìm hiểu về kiểu hình kỹ thuật số không phải là nhiệm vụ dễ dàng. Một phần của sự phức tạp là do mọi người nói về thuốc hoặc các triệu chứng của họ theo những cách không mong muốn mà không liên quan đến các đơn vị phân loại y tế và thậm chí là phi y tế. Ví dụ về các tính năng khiến dữ liệu khó sắp xếp bao gồm lỗi chính tả, các biến thể chính tả, các từ được phát minh và thẻ bắt đầu bằng #.

Ông nói: “Phải mất rất nhiều công sức kiểm tra và phát triển để đến được nơi mà chúng ta có thể bắt đầu tổ chức nội dung này và thực hiện các cách mà mọi người nói về bệnh tật và mã hóa chúng theo các đơn vị phân loại truyền thống hơn.

Hệ thống cảnh báo sớm

Loại kiểu hình kỹ thuật số này đã được chứng minh là thành công. Brownstein đã xây dựng các công cụ “giám sát” sức khỏe cộng đồng như HealthMap, ra mắt năm 2006. Đây là một hệ thống y tế công cộng hướng tới bệnh nhân mà ông đồng sáng tạo và sử dụng dữ liệu internet như tin bài tổng hợp, bài đăng trên blog, trang web của chính phủ và dữ liệu xã hội để “theo dõi sự bùng phát dịch bệnh và theo dõi thời gian thực các xu hướng sức khỏe cộng đồng mới nổi”, theo trang web của mình.

Brownstein cho biết: “Đó là một hệ thống theo dõi toàn cầu về cơ bản liên kết nhiều nguồn dữ liệu nhất có thể mà chúng tôi có thể truy cập vào hàng trăm nghìn trang web và 15 ngôn ngữ khác nhau. Vào năm 2014, HealthMap đã phát triển bùng phát Ebola chết người ở Tây Phi một tuần trước khi có thông báo chính thức. Tín hiệu cảnh báo sớm đến từ một câu chuyện tin tức về một "cơn sốt xuất huyết bí ẩn" giết chết tám người ở Guinea.

Và, khi nhiều năm trôi qua, dữ liệu truyền thông xã hội và dữ liệu internet đang giúp tạo ra các kiểu hình kỹ thuật số mạnh mẽ hơn. Brownstein và nhóm của ông đang theo dõi dữ liệu về lưu lượng truy cập, chẳng hạn như mức tăng đột biến trên trang bệnh cúm của Wikipedia để đánh giá tình trạng sức khỏe toàn cầu. Họ cũng đang xem xét các trang web như OpenTable - việc hủy đặt chỗ có thể là tín hiệu về khả năng bùng phát dịch cúm - và Yelp, nơi thu hút các đánh giá về các doanh nghiệp và nhà hàng. “Tôi không chắc liệu mọi người có biết điều này hay không, nhưng 10% đánh giá trên Yelp có liên quan đến ngộ độc thực phẩm,” ông nói.

Trên thực tế, những người đánh giá thường đề cập đến các thành phần cụ thể mà họ tin rằng đã gây ra bệnh. Khi Brownstein và nhóm của ông chia sẻ thông tin đó với Trung tâm Kiểm soát và Phòng ngừa Dịch bệnh (CDC), cơ quan này đã vô cùng nghi ngờ, ông nói. Sau khi thực hiện phân tích của riêng mình, CDC nhận thấy rằng những người đánh giá đã chính xác một cách đáng ngạc nhiên.

Brownstein nói: “Từ quan điểm của chúng tôi, người tiêu dùng, bệnh nhân thông minh hơn nhiều so với những gì chúng tôi cấp cho họ.

Dấu thời gian:

Thêm từ Tìm kiếmCIO