Técnica de aprendizaje profundo predice resultados de tratamiento clínico
Actualizado el 28 Feb 2022
Una nueva técnica de aprendizaje profundo simula estrategias de tratamiento contrafactuales, dinámicas y variables en el tiempo, lo que permite a los médicos elegir el mejor curso de acción.
La técnica de aprendizaje profundo, llamada G-Net, de investigadores del MIT-IBM Watson AI Lab (Cambridge, MA, EUA), brinda una ventana a la predicción causal contrafactual, brindando a los médicos la oportunidad de explorar cómo podrían comportarse los pacientes con diferentes planes de tratamiento. La base de G-Net es el algoritmo de cálculo g, un método de inferencia causal que estima el efecto de las exposiciones dinámicas en presencia de variables de confusión medidas, que pueden influir tanto en los tratamientos como en los resultados. A diferencia de las implementaciones anteriores del marco de cálculo g, que han utilizado enfoques de modelado lineal, G-Net utiliza redes neuronales recurrentes (RNN), que tienen conexiones de nodos que les permiten modelar mejor secuencias temporales con dinámicas complejas y no lineales, como las que se encuentran en los datos de series temporales fisiológicas y clínicas. De esta forma, los médicos pueden desarrollar planes alternativos basados en el historial del paciente y probarlos antes de tomar una decisión.
Para construir, validar y probar las capacidades predictivas de G-Net, los investigadores consideraron el sistema circulatorio en pacientes sépticos en la UCI. Durante la atención crítica, los médicos deben hacer concesiones y juicios, como garantizar que los órganos reciban un suministro de sangre adecuado sin sobrecargar el corazón. Para ello, podrían administrar líquidos intravenosos a los pacientes para aumentar la presión arterial; sin embargo, demasiado puede causar edema. Como alternativa, los médicos pueden administrar vasopresores, que actúan contrayendo los vasos sanguíneos y elevando la presión arterial.
Para imitar esto y demostrar la prueba de concepto de G-Net, el equipo utilizó CVSim, un modelo mecánico de un sistema cardiovascular humano que se rige por 28 variables de entrada que caracterizan el estado actual del sistema, como la presión arterial, la presión venosa central, el volumen sanguíneo total y la resistencia periférica total, y lo modificaron para simular diversos procesos patológicos (p. ej., sepsis o pérdida de sangre) y efectos de las intervenciones (p. ej., líquidos y vasopresores). Los investigadores utilizaron CVSim para generar datos observacionales de pacientes para el entrenamiento y para la comparación de la "verdad sobre el terreno" con la predicción contrafáctica. En su arquitectura G-Net, los investigadores ejecutaron dos RNN para manejar y predecir variables que son continuas, lo que significa que pueden tomar un rango de valores, como la presión arterial y variables categóricas, que tienen valores discretos, como la presencia o ausencia de edema pulmonar. Los investigadores simularon las trayectorias de salud de miles de "pacientes" que presentaban síntomas bajo un régimen de tratamiento, digamos A, durante 66 intervalos de tiempo, y los usaron para entrenar y validar su modelo.
Al probar la capacidad de predicción de G-Net, el equipo generó dos conjuntos de datos contrafácticos. Cada uno contenía aproximadamente 1.000 trayectorias de salud de pacientes conocidas, que se crearon a partir de CVSim utilizando la misma condición de "paciente" como punto de partida en el tratamiento A. Luego, en el intervalo de tiempo 33, el tratamiento cambió al plan B o C, según el conjunto de datos. Luego, el equipo realizó 100 trayectorias de predicción para cada uno de estos 1.000 pacientes, cuyo tratamiento e historial médico se conocían hasta el intervalo de tiempo 33, cuando se administró un nuevo tratamiento. En estos casos, la predicción coincidió bien con las observaciones de "verdad en el terreno" para pacientes individuales y trayectorias promediadas a nivel de población.
Dado que el marco de cálculo g es flexible, los investigadores querían examinar la predicción de G-Net utilizando diferentes modelos no lineales, en este caso, modelos de memoria a corto plazo (LSTM), que son un tipo de RNN que pueden aprender de patrones de datos anteriores o secuencias, frente a los modelos lineales más clásicos y un modelo de percepción multicapa (MLP), un tipo de red neuronal que puede hacer predicciones utilizando un enfoque no lineal. Siguiendo una configuración similar a la anterior, el equipo descubrió que el error entre los casos conocidos y los predichos era menor en los modelos LSTM en comparación con los demás. Dado que G-Net puede modelar los patrones temporales de la historia de la UCI del paciente y el tratamiento anterior, mientras que un modelo lineal y MLP no pueden, pudo predecir mejor el resultado del paciente.
El equipo también comparó la predicción de G-Net en un entorno de tratamiento estático variable en el tiempo con dos enfoques de predicción contrafactual basados en aprendizaje profundo de última generación, una red estructural marginal recurrente (rMSN) y una red neuronal recurrente contrafactual (CRN), así como un modelo lineal y un MLP. Para ello, investigaron un modelo para el crecimiento tumoral sin tratamiento, radiación, quimioterapia y escenarios de radiación y quimioterapia. Para estas investigaciones, los investigadores generaron datos de observación simulados usando el volumen del tumor como la principal influencia que dicta los planes de tratamiento y demostraron que G-Net superó a los otros modelos. Una razón potencial podría ser que se sabe que el cálculo g es más eficiente estadísticamente que rMSN y CRN, cuando los modelos se especifican correctamente. Si bien G-Net ha funcionado bien con datos simulados, se necesita hacer más antes de que pueda aplicarse a pacientes reales. Dado que las redes neuronales se pueden considerar como "cajas negras" para los resultados de predicción, los investigadores están comenzando a investigar la incertidumbre en el modelo para ayudar a garantizar la seguridad.
“Nuestro objetivo final es desarrollar una técnica de aprendizaje automático que permita a los médicos explorar varios escenarios hipotéticos y opciones de tratamiento”, dijo Li-wei Lehman, científica investigadora del MIT en el Instituto de Ingeniería y Ciencias Médicas del MIT y líder de proyecto del MIT-IBM Watson AI Lab. “Se ha trabajado mucho en términos de aprendizaje profundo para la predicción contrafáctica, pero se ha centrado en un ajuste de exposición puntual”, o una estrategia de tratamiento estática que varía en el tiempo, que no permite el ajuste de los tratamientos según cambie la historia del paciente. Sin embargo, el nuevo enfoque de predicción de su equipo proporciona flexibilidad en el plan de tratamiento y posibilidades de alteración del tratamiento con el tiempo a medida que cambian el historial de covariables del paciente y los tratamientos anteriores. "G-Net es el primer enfoque de aprendizaje profundo basado en el cálculo g que puede predecir los efectos del tratamiento tanto a nivel de población como a nivel individual bajo estrategias de tratamiento dinámicas y variables en el tiempo".
Enlaces relacionados:
MIT-IBM Watson AI Lab