Fuentes de Big Data en Medicina

Una definición simple de big data en medicina es “la totalidad de los datos relacionados con la atención médica y el bienestar del paciente” (Raghupathi 2014). Pero, ¿qué son exactamente estos tipos de datos y de dónde provienen?

La siguiente es una descripción general de los tipos y fuentes de grandes volúmenes de datos de interés para los proveedores de servicios de salud, investigadores, pagadores, legisladores e industrias. Estas categorías no se excluyen mutuamente, porque los mismos datos pueden provenir de una variedad de fuentes.

Esta lista tampoco es exhaustiva, porque la aplicación práctica del análisis de big data seguramente continuará expandiéndose.

Sistemas de información clínica

Estas son fuentes tradicionales de datos clínicos que los proveedores de atención médica están acostumbrados a ver.

  • Los registros electrónicos de salud (EHR) recopilan, almacenan y muestran información como datos demográficos, historial médico, problemas médicos activos, inmunizaciones, alergias, medicamentos, signos vitales, resultados de pruebas de laboratorio y radiología, informes de patología, notas de progreso creadas por la atención médica Proveedores y documentos administrativos y financieros.
  • Los registros médicos electrónicos (EMR) no son idénticos a los EHR y, por lo general, se refieren a los datos almacenados con un médico en particular.
  • Los intercambios de información de salud sirven como centros entre diferentes sistemas de información clínica.
  • Los registros de pacientes, mantenidos por organizaciones de atención de salud en sus propios pacientes, a menudo están vinculados a la HCE. Otros registros rastrean las inmunizaciones, el cáncer, el trauma y otros problemas de salud pública en una escala geográfica más amplia.
  • Los portales de pacientes les permiten a los pacientes acceder a la información personal de salud almacenada en el EHR de una organización de atención médica. Algunos portales de pacientes también permiten a los usuarios solicitar resurtidos de recetas e intercambiar mensajes electrónicos seguros con el equipo de atención médica.
  • Los almacenes de datos clínicos agregan datos a nivel del paciente de múltiples sistemas de información clínica, como EHR y otras fuentes enumeradas anteriormente

Datos de reclamaciones de los pagadores

Los pagadores públicos (por ejemplo, Medicare) y los pagadores privados tienen grandes depósitos de datos de reclamaciones sobre sus beneficiarios. Algunas aseguradoras de salud ahora también ofrecen incentivos para compartir sus datos de salud.

Estudios de investigación

Las bases de datos de investigación contienen información sobre los participantes del estudio, los tratamientos experimentales y los resultados clínicos. Los grandes estudios suelen ser patrocinados por compañías farmacéuticas o agencias gubernamentales. Una aplicación de la medicina personalizada es hacer coincidir a los pacientes individuales con tratamientos efectivos, según los patrones en los datos de los ensayos clínicos.

Este enfoque va más allá de la aplicación de los principios de la medicina basada en la evidencia, según la cual un proveedor de atención médica determina si un paciente comparte características generales (por ejemplo, edad, sexo, raza, estado clínico) con los participantes del ensayo. Con el análisis de big data, es posible seleccionar un tratamiento basado en información mucho más granular, como el perfil genético del cáncer de un paciente (ver más abajo).

Los sistemas de apoyo a la decisión clínica (CDSS) también se han desarrollado rápidamente y ahora representan una gran parte de la inteligencia artificial (IA) en medicina. Utilizan los datos de los pacientes para ayudar a los médicos en la toma de decisiones y, a menudo, se combinan con EHR.

Bases de datos genéticos

El depósito de información genética humana continúa acumulándose a un ritmo rápido. Desde la finalización del Proyecto del genoma humano en 2003, el costo de la secuenciación del ADN humano se ha reducido en un millón de veces. El Proyecto de Genoma Personal (PGP) , lanzado en 2005 por la Escuela de Medicina de Harvard, busca secuenciar y dar a conocer los genomas completos de 100,000 voluntarios de todo el mundo. El propio PGP es un excelente ejemplo de proyecto de big data debido a su gran volumen y variedad de datos. Un genoma personal contiene unos 100 gigabytes de datos. Además de secuenciar los genomas, el PGP también está recopilando datos de EHR, encuestas y perfiles de microbiomas.

Varias compañías ofrecen secuenciación genética directa al consumidor para la salud, rasgos personales y farmacogenética a nivel comercial.

Esta información personal podría ser sometida al análisis de big data. Por ejemplo, 23andMe dejó de ofrecer informes genéticos relacionados con la salud a nuevos clientes a partir del 22 de noviembre de 2013, para cumplir con la Administración de Drogas y Alimentos de EE. UU. Sin embargo, en 2015, la compañía comenzó a ofrecer ciertos componentes de salud de su prueba de saliva genética nuevamente, esta vez con la aprobación de la FDA.

Registros Públicos

El gobierno mantiene registros detallados de eventos relacionados con la salud, como inmigración, matrimonio, nacimiento y muerte. El Censo de los EE. UU. Ha recopilado vastas cantidades de información cada 10 años desde 1790. El sitio web de estadísticas del Censo tenía 370 mil millones de células en 2013, con aproximadamente 11 mil millones más cada año.

Búsquedas web

La información de búsqueda web recopilada por Google y otros proveedores de búsqueda web podría proporcionar información en tiempo real relacionada con la salud de una población. Sin embargo, el valor de los datos grandes de los patrones de búsqueda web puede mejorarse al combinarlos con las fuentes tradicionales de datos de salud .

Social Media

Facebook, Twitter y otras plataformas de medios sociales generan una gran variedad de datos las 24 horas del día, brindando una visión de los lugares, comportamientos saludables, emociones e interacciones sociales de los usuarios. La aplicación de los datos grandes de las redes sociales a la salud pública se ha denominado detección digital de enfermedades o epidemiología digital. Twitter, por ejemplo, se ha utilizado para analizar las epidemias de influenza entre la población general.

El proyecto de bienestar mundialque comenzó en la Universidad de Pensilvania es otro ejemplo del estudio de las redes sociales para comprender mejor la experiencia y la salud de las personas. El proyecto reúne a psicólogos, estadísticos y científicos de la computación que analizan el lenguaje utilizado cuando interactúan en línea, por ejemplo, al escribir actualizaciones de estado en Facebook y Twitter. Los científicos están observando cómo el lenguaje de los usuarios se relaciona con su salud y felicidad. Los avances en el procesamiento del lenguaje natural y el aprendizaje automático están ayudando en sus esfuerzos. Una publicación reciente de la Universidad de Pennsylvania examinó formas de predecir las enfermedades mentales mediante el análisis de las redes sociales. Parece que los síntomas de la depresión y otras afecciones de salud mental pueden detectarse mediante el estudio de nuestro uso de Internet.

El Internet de las cosas (IoT)

También se recogen y almacenan grandes cantidades de información relacionada con la salud en dispositivos móviles y domésticos .

  • Teléfonos inteligentes : miles de aplicaciones mHealth capturan información sobre la actividad física del usuario, la ingesta nutricional, los patrones de sueño, las emociones y otros parámetros. Las aplicaciones nativas de teléfonos celulares (por ejemplo, GPS, correo electrónico, mensajes de texto) también pueden dar pistas sobre el estado de salud de una persona.
  • Monitores y dispositivos portátiles: podómetros, acelerómetros, gafas, relojes y chips incrustados debajo de la piel también recopilan información relacionada con la salud y también pueden enviarlos a la nube.
  • Los dispositivos de telemedicina permiten a los proveedores de atención médica controlar los parámetros de los pacientes, como la presión arterial, la frecuencia cardíaca, la frecuencia respiratoria, la oxigenación, la temperatura, los registros de ECG y el peso.

Transacciones financieras

Las transacciones con tarjeta de crédito de los pacientes se incluyen en los modelos predictivos utilizados por Carolinas HealthCare System para identificar a los pacientes con alto riesgo de ser readmitidos en el hospital. El proveedor de atención médica con sede en Charlotte utiliza big data para dividir a los pacientes en varios grupos, por ejemplo, según la enfermedad y la ubicación geográfica.

Implicaciones éticas y de privacidad

Debe destacarse que, en algunos casos, puede haber importantes implicaciones éticas y de privacidad al recopilar y acceder a los datos en la atención médica. Las nuevas fuentes de big data pueden mejorar nuestra comprensión de lo que afecta a las personas y la salud de la población; sin embargo, es necesario considerar y monitorear cuidadosamente los diferentes riesgos. Ahora también se ha reconocido que los datos que antes se consideraban anónimos, se pueden volver a identificar. Por ejemplo, la profesora Latanya Sweeney, del Laboratorio de Privacidad de Datos de Harvard, revisó 1,130 voluntarios involucrados en el Proyecto Genoma Personal. Ella y su equipo pudieron nombrar correctamente al 42 por cientode los participantes en función de la información que compartieron (código postal, fecha de nacimiento, sexo). Este conocimiento puede aumentar nuestra conciencia de los riesgos potenciales y ayudarnos a tomar mejores decisiones para compartir datos.