¿Por qué la IA no puede servir como médicos calificados a pesar de las altas puntuaciones en las pruebas?

58A medida que la IA se empuja más a la práctica clínica, los riesgos que conlleva también requieren una estrecha atención. Kleesiek enfatizó que el factor humano sigue siendo crucial y que la IA debe implementarse bajo la guía de médicos con la experiencia para entender la tecnología y usarla correctamente.

BERLÍN, 22 de abril (Xinhua) — ¿Es un dolor de cabeza una señal de advertencia de derrame cerebral? ¿La tos requiere una radiografía? ¿Qué significan realmente los resultados anormales de las pruebas?

Con solo unos pocos toques para describir los síntomas y cargar informes médicos, las personas pueden recibir una evaluación pulida y aparentemente profesional de la inteligencia artificial (IA) en segundos. Cada vez más personas han comenzado a redir a él en busca de asesoramiento médico antes de ver a un médico.

Pero, ¿eso significa que la IA realmente puede diagnosticar y tratar a los pacientes?

Estudiante de recto en pruebas estandarizadas

Un estudio publicado a principios de abril por investigadores de la Universidad de Marburgo de Alemania y el Hospital Universitario de Giessen y Marburgo encontró que en una prueba de conocimiento estandarizada sobre la lesión renal aguda (IRA), varios modelos de lenguaje grandes (LLM) superaron a los profesionales médicos que participaron en la evaluación.

Los investigadores compararon 13 LLM disponibles públicamente con 123 participantes voluntarios en el 131o Congreso Anual de la Sociedad Alemana de Medicina Interna, incluidos estudiantes de medicina y médicos en medicina interna. Ambos grupos completaron la misma evaluación de conocimientos de AKI, que consistió en dos viñetas de casos y 15 preguntas de opción múltiple de mejor respuesta única.

Un hombre mira un robot humanoide en el área de exposición de Dassault Systemes en la Hannover Messe 2026 en Hannover, Alemania, el 21 de abril de 2026. Hannover Messe 2026, la feria comercial industrial insignia de Alemania, se inauguró el lunes con la inteligencia artificial industrial (IA) y los robots humanoides que se centran por primera vez. (Xinhua/Zhang Haofu)

Los LLM lograron una puntuación media de 13,5 sobre 15, o 90 por ciento, con varios modelos alcanzando una puntuación perfecta, mientras que los participantes humanos promediaron 7,3 sobre 15, o 48,7 por ciento. Los modelos también completaron la prueba mucho más rápido.

“Estos hallazgos muestran que los LLM pueden proporcionar conocimientos médicos fácticos muy rápidamente. Eso crea oportunidades para la práctica clínica cotidiana”, dijo Philipp Russ, el autor correspondiente del estudio.

Eslabón débil en el razonamiento clínico

Sin embargo, las altas puntuaciones en las pruebas estandarizadas no significan necesariamente que la IA tenga el juicio requerido para la atención clínica del mundo real.

Un estudio publicado en JAMA Network Open el 13 de abril encontró que los LLM todavía se quedan cortos en el razonamiento clínico, especialmente en las primeras etapas de un caso, cuando la información limitada a menudo les impide generar un diagnóstico diferencial apropiado.

Para reflejar mejor cómo se desarrolla el diagnóstico en la práctica, los investigadores de Mass General Brigham y otras instituciones evaluaron 21 LLM de frontera utilizando 29 viñetas clínicas estandarizadas. Los modelos fueron alimentados con información paso a paso, comenzando con detalles básicos como la edad, el sexo y los síntomas de un paciente, y seguido de los hallazgos del examen físico y los resultados de laboratorio. Su desempeño en cada etapa fue evaluado por los evaluadores de los estudiantes de medicina.

El resultado mostró que todos los modelos no lograron producir un diagnóstico diferencial apropiado más del 80 por ciento de las veces. Eso significa que a menudo no podían determinar de manera confiable la causa más probable, descartar una enfermedad grave u ofrecer una buena orientación sobre lo que debería investigarse a continuación.

Un hombre mira un robot humanoide en el área de exposición de Agile Robots en Hannover Messe 2026 en Hannover, Alemania, el 20 de abril de 2026. (Xinhua/Zhang Haofu)

“Los diagnósticos diferenciales son fundamentales para el razonamiento clínico y subyacen al ‘arte de la medicina’ que la IA no puede replicar actualmente”, dijo el autor corresponsal Marc Succi, y agregó que la promesa de la IA en medicina clínica sigue estando en su potencial para aumentar, no reemplazar, el razonamiento del médico.

Colaboración dirigida por médicos

Si la IA no está preparada para practicar la medicina por sí sola, ¿qué papel debería desempeñar en la atención médica?

Jens Kleesiek, director del Instituto de Inteligencia Artificial en Medicina del Hospital Universitario de Essen y de la Universidad de Duisburg-Essen, dijo que gracias a la IA, la colaboración entre médicos y computadoras está mejorando constantemente.

“Estamos en un punto en el que los sistemas digitales ya no solo proporcionan apoyo, sino que intervienen activamente en los procesos. Por ejemplo, al hacerse cargo de la documentación o coordinar los procedimientos”, dijo Kleesiek en la apertura del Congreso Anual de 2026 de la Sociedad Alemana de Medicina Interna el 18 de abril. “Esto cambiará fundamentalmente la atención médica”.

Aun así, la responsabilidad principal del médico permanece sin cambios. Kleesiek enfatizó que el factor humano sigue siendo crucial y que la IA debe implementarse bajo la guía de médicos con la experiencia para entender la tecnología y usarla correctamente.

Un hombre estrecha la mano de un robot humanoide de PaXini en la Hannover Messe 2026 en Hannover, Alemania, el 21 de abril de 2026. Hannover Messe 2026, la feria comercial industrial insignia de Alemania, se inauguró el lunes con la inteligencia artificial industrial (IA) y los robots humanoides que se centran por primera vez. (Xinhua/Zhang Haofu)

Marc Succi hizo un punto similar, diciendo que “los LLM en la atención médica continúan requiriendo un ‘humano en el bucle’ y una supervisión muy estrecha”.

A medida que la IA se empuja más a la práctica clínica, los riesgos que conlleva también requieren una estrecha atención. Fares Alahdab, profesor asociado de la Escuela de Medicina de la Universidad de Missouri, advirtió que los médicos experimentados a menudo son más capaces de detectar sugerencias defectuosas generadas por IA, mientras que los estudiantes de medicina pueden carecer del juicio necesario para detectar errores sutiles pero potencialmente peligrosos.

“Un riesgo más insidioso es la subcontratación del razonamiento, un proceso que tiende a ocurrir de forma gradual y casi imperceptible”, dijo, y agregó que los modelos de IA producen respuestas fluidas y pulidas que pueden llevar a los usuarios a abandonar la investigación independiente de información, la evaluación crítica y la síntesis de conocimientos. Con el tiempo, esto puede erosionar habilidades que deben reforzarse continuamente.

 

 

 

 

 

Ruth Canal
Ruth Canal
Vinculada al mundo de la salud y la investigación,mantiene un seguimiento constante de la información sanitaria y biomédica. Ha participado en proyectos formativos relacionados con comunicación científica.

Deja tu comentario

DEJA UNA RESPUESTA

Por favor ingrese su comentario!
Por favor ingrese su nombre aquí

spot_imgspot_imgspot_img

Articulos relacionados

Síguenos...

80FansMe gusta
9SeguidoresSeguir
26SeguidoresSeguir
1SuscriptoresSuscribirte

Últimas entradas