Sistemas tradicionales de apoyo a decisiones diagnósticas superan a la IA generativa en el diagnóstico de enfermedades

Por el equipo editorial de HospiMedica en español
Actualizado el 02 Jun 2025

A pesar de la creciente popularidad de herramientas de inteligencia artificial (IA) generativa como ChatGPT y Gemini en el ámbito sanitario, los sistemas tradicionales de apoyo a la toma de decisiones diagnósticas (DDSS, por sus siglas en inglés) siguen superándolos en precisión clínica. Ahora, un nuevo estudio que compara estos modelos de IA ha descubierto que ambos tipos de herramientas de IA tienen el potencial de complementarse mutuamente para tomar mejores decisiones de tratamiento.

Los informáticos del Hospital General de Massachusetts (MGH, Somerville, MA, EUA) desarrollaron DXplain, un sistema de apoyo de datos de diagnóstico (DDSS) especializado que aprovecha una extensa base de datos de perfiles de enfermedades y hallazgos clínicos para ayudar a los profesionales clínicos a generar y clasificar posibles diagnósticos.


Imagen: diferentes herramientas de IA tienen el potencial de complementarse entre sí para informar mejor las decisiones de tratamiento (Foto cortesía de 123RF)

Por el contrario, los modelos de lenguaje extenso (LLM) como ChatGPT y Gemini generan respuestas basadas en patrones en datos lingüísticos, sin la base de conocimiento médico estructurada de sistemas como DXplain. En el estudio, los investigadores evaluaron las capacidades diagnósticas de DXplain, ChatGPT y Gemini utilizando 36 casos de pacientes diversos, con y sin datos de laboratorio.

Los resultados, publicados en JAMA Network Open, mostraron que, con datos de laboratorio, DXplain identificó correctamente el diagnóstico el 72 % de las veces, en comparación con el 64 % de ChatGPT y el 58 % de Gemini. Sin datos de laboratorio, DXplain mantuvo una tasa de precisión superior, del 56 %, superando a ChatGPT (42 %) y Gemini (39 %).

Cabe destacar que cada sistema identificó diagnósticos que los demás pasaron por alto, lo que sugiere que un enfoque híbrido podría mejorar la precisión diagnóstica. Los investigadores proponen integrar el razonamiento estructurado de los sistemas DDSS como DXplain con las capacidades de procesamiento del lenguaje de los LLM para crear herramientas de diagnóstico más robustas.

“Estos sistemas pueden mejorar y ampliar los diagnósticos clínicos, recordando información que los médicos podrían olvidar en un momento de arrebato y sin estar sesgada por fallas comunes del razonamiento humano”, afirmó el Dr. Mitchell Feldman, autor correspondiente. “Y ahora, creemos que combinar las potentes capacidades explicativas de los sistemas de diagnóstico existentes con las capacidades lingüísticas de los modelos de lenguaje extensos permitirá un mejor apoyo automatizado a la toma de decisiones diagnósticas y mejores resultados para los pacientes”.


Últimas Cuidados Criticos noticias