La IA pone en riesgo la información confidencial de la salud

Por el equipo editorial de HospiMedica en español
Actualizado el 23 Jan 2019
Los avances en las tecnologías de inteligencia artificial (IA), como las incorporadas en los rastreadores de actividad, teléfonos inteligentes y relojes inteligentes, pueden amenazar la privacidad de los datos de salud personales.

Investigadores del Instituto de Tecnología de Massachusetts (MIT, Cambridge, MA, EUA), la Universidad de California Berkeley (UCB; EUA) y otras instituciones, realizaron un estudio transversal de los conjuntos de datos de la Encuesta Nacional de Examen de Salud y Nutrición de los EUA (NHANES, por sus siglas en inglés) para evaluar la posibilidad de volver a identificar los datos de actividad física, medidos en el acelerómetro, a los que se les eliminó información de salud geográfica y protegida, utilizando máquinas de vectores de soporte (SVM) y métodos de aprendizaje automático de bosque aleatorio.

Los datos medidos en el acelerómetro se recolectaron durante siete días continuos, con el resultado primario siendo la capacidad de los algoritmos de SVM lineal y de bosque aleatorio para hacer coincidir los datos demográficos y de la actividad física agregada con los números de registros específicos individuales, y el porcentaje de coincidencias correctas realizadas por cada algoritmo. Los resultados mostraron que el algoritmo de bosque aleatorio reidentificó exitosamente los datos demográficos y de actividad física agregada de un promedio de 94% de los adultos y de 86% de los niños. El algoritmo SVM lineal reidentificó con éxito los datos demográficos y de actividad física del 85% de los adultos y el 68% de los niños. El estudio fue publicado el 21 de diciembre de 2018 en la revista JAMA Network Open.

“Los resultados señalan un gran problema; si eliminas toda la información de identificación, no te protege tanto como piensas. Alguien más puede regresar y volver a colocarla si tiene el tipo de información correcta”, dijeron el autor principal, Anil Aswani, PhD, de la UCB, y sus colegas. “Se podría imaginar a Facebook reuniendo los datos de los pasos de la aplicación en su teléfono inteligente, luego comprando datos de atención médica de otra compañía y comparándolos con los dos. Podrían comenzar a vender publicidad basada en eso o podrían vender los datos a otros”.

“Los empleadores, los prestamistas hipotecarios, las compañías de tarjetas de crédito y otros podrían usar la IA para discriminar por estado de embarazo o discapacidad, por ejemplo. Lo que me gustaría ver de esto son las nuevas regulaciones o reglas que protegen los datos de salud; pero en realidad hay un gran impulso para incluso debilitar las regulaciones en este momento”, concluyó el Dr. Aswani. “El riesgo es que si las personas no son conscientes de lo que sucede, las reglas que tenemos se debilitarán. Y el hecho es que los riesgos de que perdamos el control de nuestra privacidad cuando se trata de atención médica en realidad aumentan y no disminuyen”.

Los bosques aleatorios son un método de aprendizaje conjunto que combina una gran cantidad de árboles de decisión para hacer predicciones. Aunque los modelos de bosques aleatorios son difíciles de interpretar, este enfoque es una de las técnicas de aprendizaje automático más exitosas porque a menudo tiene la mayor precisión. Linear SVM es un algoritmo de clasificación popular que tiene una velocidad de computación rápida, es fácil de interpretar y tiene buena exactitud.


Enlace relacionado:
Instituto de Tecnología de Massachusetts
Universidad de California Berkeley



Últimas TI noticias