BATE DE VENTAJAS Y DESVENTAJAS – DESVENTAJA: La inteligencia artificial no es una cápsula mágica

Piyush Mathur, MD, FCCM

Artículo relacionado:

VENTAJA: La inteligencia artificial (AI) en la atención médica


Este debate de ventajas y desventajas se hizo en la conferencia de Stoelting 2019 titulada “Deterioro del paciente: El reconocimiento inmediato, la intervención rápida y el fin de la reanimación fallida”. Estos dos autores tienen experiencia en el campo de la implementación de inteligencia artificial para el manejo de pacientes que sufren deterioro en el entorno hospitalario.

Se supone que la inteligencia artificial (AI) promete curar muchos problemas que enfrenta la atención médica, como predecir la morbilidad y la mortalidad, y superar a los médicos en el diagnóstico. En realidad, pese a la creciente investigación, hay una cantidad limitada de algoritmos de AI clínicamente validados. Incluso a medida que aumenta la cantidad de aplicaciones de AI aprobadas por la Administración de Alimentos y Medicamentos de los EE. UU. (U.S. Food and Drug Administration), la implementación y el uso generalizado de estas aplicaciones han sido un desafío. El científico informático Rodney Brooks describió algunos de los desafíos de las predicciones de AI. Incluyen el sobrestimar o subestimar las soluciones, la imaginación de algoritmos mágicos, la escala de su implementación y las limitaciones en su rendimiento.1,2

Las limitaciones en su rendimiento son especialmente importantes en las soluciones de diagnóstico de AI. Muchos investigadores que usan redes neuronales artificiales han afirmado que mejoran el diagnóstico y superan a los médicos, como en el diagnóstico de enfermedades observadas en las radiografías de tórax.3 A menudo, estos algoritmos de alcance limitado y de poco espectro pueden detectar lesiones como atelectasias o infiltraciones en las radiografías de tórax. Sin embargo, pese a las afirmaciones sobre su alta precisión, ha sido difícil replicar y generalizar estas aplicaciones.4 En otros enfoques del aprendizaje automático, el algoritmo computarizado aprende de los datos registrados por el médico. En muchos conjuntos de datos de radiografías de tórax públicamente disponibles que sustentan estos algoritmos, los radiólogos denominan las lesiones como infiltración, bulto, atelectasia, etc. Estas evaluaciones clínicas se consideran el “estándar de oro”, pero se han observado diferencias significativas entre los evaluadores,5 lo que aumenta el espectro de conjuntos de datos mal denominados. Es probable que los algoritmos creados a partir de dichos conjuntos de datos mal denominados tengan errores significativos en sus resultados, lo que puede confundir al médico en la toma de decisiones.

La predicción de enfermedades basada en AI es igualmente problemática. En la investigación hecha por Tomasev y otros sobre la predicción del daño renal agudo, el sesgo de la predicción se introdujo a través del propio conjunto de datos. Su conjunto de datos de Asuntos de Veteranos de EE. UU. (U.S. Veteran Affairs) tenía solo el 6,4 % de pacientes mujeres; el rendimiento del modelo en estos pacientes fue más bajo que en el resto.6 El sesgo continúa siendo un desafío, incluso en conjuntos de datos administrativos y soluciones desarrolladas para el uso de ejecutivos de atención médica o compañías de seguros. Como lo demostraron Obermeyer y otros, estos sesgos se pueden introducir en el desarrollo de los algoritmos, pero también se pueden basar en el conjunto de datos usado o en la manera en la que se implementa el algoritmo.7 Estos algoritmos sesgados pueden dar lugar a la administración de un tratamiento inseguro o inadecuado a nuestros pacientes.

De hecho, el escaso valor predictivo sigue limitando la adopción de algoritmos de AI bien investigados. Los resultados basados en el “área debajo de la curva”, un reflejo estadístico del “ajuste del modelo”, se han aprovechado ampliamente para informar la precisión de estos algoritmos. Sin embargo, se deben considerar otros parámetros, como la sensibilidad y el valor predictivo positivo. Sin buenos valores predictivos ni resultados replicables, es poco probable que los médicos adopten algoritmos de AI.8

La adaptabilidad y la generalización de los algoritmos de AI son otro gran desafío en la atención médica. Aunque los expedientes médicos electrónicos son el principal medio para implementar muchos de estos algoritmos, las interfaces deficientes, el soporte limitado para los equipos de IT y la falta de soluciones integradas siguen limitando la facilidad de su adopción.

El marketing y la publicidad creados por algunas organizaciones también han tenido un efecto negativo y han generado la pérdida de credibilidad de la AI en muchos médicos. Algunos de los avances bien investigados se han promocionado enormemente para aprovechar el valor de mercado actual asociado con la AI. En una encuesta hecha por la empresa de capital de riesgo de Londres Marsh & McLennan Companies, Inc. (MMC) entre nuevas empresas europeas que usan AI, el 40 % en realidad no usa AI como parte de su producto.9

La AI promete ofrecer soluciones posiblemente más seguras para la atención médica, usando el volumen cada vez mayor de información de manera eficaz y reproducible. Sin embargo, se necesita liderazgo clínico y una validación clínica rigurosa para darse cuenta de este potencial al desarrollar e implementar algoritmos de AI (tabla 1).

Tabla 1: Soluciones para la implementación eficaz de la AI en la atención médica

Enfoque centrado en el paciente y en el proveedor de atención: primero, no hacer daño
Liderazgo clínico
Desarrollo y evaluación de modelos rigurosos
Soluciones que se puedan explicar o interpretar: evitar la caja negra
Validación clínica para la generalización y la adaptabilidad
Soluciones rentables

Todavía estamos en las primeras fases de investigación y desarrollo de algoritmos de AI para la atención médica. Claramente, el crecimiento de la AI ha sido exponencial y es probable que este ritmo continúe en el futuro cercano. Debemos estar preparados para destinar recursos clínicos y financieros y tecnologías de la información para ver un uso eficaz de estos algoritmos extraordinarios. Los médicos, especialmente los radiólogos y los oncólogos, ya están liderando el desarrollo de muchos algoritmos de AI para evitar que se introduzcan soluciones mal preparadas en su entorno de trabajo. Los profesionales de la anestesia y los médicos perioperatorios, que han sido los primeros en implementar la tecnología y que viven en un entorno en el que abundan los datos, también deben liderar la investigación, el desarrollo y la implementación de algoritmos de AI sustentables para ofrecerles una atención más segura a nuestros pacientes.

 

El Dr. Mathur es miembro del personal de Anestesiología/Cuidados Intensivos del Departamento de Anestesiología General y es responsable del mejoramiento de la calidad, Anesthesiology Institute, Cleveland Clinic, Cleveland, Ohio.


El autor no tiene conflictos de intereses para revelar.


Referencias

  1. Brooks R. https://www.technologyreview.com/s/609048/the-seven-deadly-sins-of-ai-predictions/. MIT technology review. 2017. Accessed December 9, 2019.
  2. Panetta K. https://www.gartner.com/smarterwithgartner/5-trends-appear-on-the-gartner-hype-cycle-for-emerging-technologies-2019/. Accessed August 29, 2019.
  3. Rajpurkar P, Irvin J, Ball RL, et al. Deep learning for chest radiograph diagnosis: a retrospective comparison of the CheXNeXt algorithm to practicing radiologists. PLoS Med. 2018;15:e1002686.
  4. Zech JR, Badgeley MA, Liu M, et al. Variable generalization performance of a deep learning model to detect pneumonia in chest radiographs: A cross-sectional study. PLoS Med. 2018;15:e1002683.
  5. Oakden-Rayner L. Exploring large-scale public medical image datasets. Acad Radiol. 2019.
  6. Tomasev N, Glorot X, Rae JW, et al. A clinically applicable approach to continuous prediction of future acute kidney injury. Nature. 2019;572:116–119.
  7. Obermeyer Z, Powers B, Vogeli C, et al. Dissecting racial bias in an algorithm used to manage the health of populations. Science. 2019;366:447–453.
  8. Ginestra JC, Giannini HM, Schweickert WD, et al. Clinician perception of a machine learning-based early warning system designed to predict severe sepsis and septic shock. Crit Care Med. 2019;47:1477–1484.
  9. Olson P. https://www.forbes.com/sites/parmyolson/2019/03/04/nearly-half-of-all-ai-startups-are-cashing-in-on-hype/#454f99e7d022. Forbes. Accessed March 4, 2019.