DERMATOLOGÍA
Las aplicaciones de detección de cáncer de piel directas al consumidor no detectan los cánceres potencialmente mortales
EADV · 04 octubre 2021
Un nuevo estudio revela que un modelo de aprendizaje automático directo al consumidor para detectar cánceres de piel clasificó incorrectamente los cánceres raros y agresivos como de bajo riesgo.
Los hallazgos presentados en el 30 Congreso de la Academia Europea de Dermatología y Venereología (EADV) sugieren que hacer que las aplicaciones basadas en tales modelos estén disponibles directamente para el público sin transparencia en las métricas de rendimiento para los cánceres de piel raros pero potencialmente mortales es algo éticamente cuestionable.
Los investigadores se centraron en dos tipos de cáncer de piel, el carcinoma de células de Merkel (CCM) y el melanoma amelanótico, cánceres raros pero especialmente agresivos que tienden a crecer rápidamente y requieren un tratamiento temprano. Crearon un conjunto de datos de 116 imágenes de estos cánceres raros y de lesiones benignas de queratosis seborreica y hemangiomas, y evaluaron estas imágenes con dos modelos de aprendizaje automático.
El primer modelo estudiado era un dispositivo médico certificado, vendido directamente al público a través de la tienda de aplicaciones y anunciado como capaz de diagnosticar el 95 por ciento de los cánceres de piel, al que los investigadores bautizaron como Modelo 1. El Modelo 2 estaba disponible solo para fines de investigación y se utilizó como referencia.
Los resultados mostraron que el Modelo 1 clasificó incorrectamente el 17,9 por ciento de los CCM y el 22,9 por ciento de los melanomas amelanóticos como de bajo riesgo. A su vez, el 62,2 por ciento de las lesiones benignas fueron clasificadas como de alto riesgo.
Para detectar la malignidad, la sensibilidad del Modelo 1 fue del 79,4 por ciento y la especificidad del 37,7 por ciento. En el caso del modelo 2, el CCM no se incluyó en los 5 primeros diagnósticos para ninguna de las 28 imágenes de CCM analizadas, lo que plantea la posibilidad de que el modelo no haya sido entrenado para la existencia de esta clase de enfermedad.
La elevada tasa de falsos positivos del Modelo 1 tiene consecuencias potencialmente negativas a nivel personal y social. Los resultados plantean una cuestión mayor sobre la seguridad de otros modelos de inteligencia artificial para detectar el cáncer de piel disponibles en el mercado.
Lloyd Steele, de la Universidad Queen Mary de Londres (Reino Unido) y autor principal del estudio, explica que "para mejorar, las evaluaciones de los modelos de aprendizaje automático deben tener en cuenta el espectro de enfermedades que se verán en la práctica. De momento, la mayor parte del rendimiento de esos modelos se basa en los datos de imagen disponibles, que son especialmente escasos cuando se trata de cánceres de piel poco frecuentes".
Una colaboración global entre grupos de investigación y hospitales puede ser un paso para abordar la carencia de datos de imagen sobre el cáncer de piel, que es un elemento crucial para que el aprendizaje automático tenga un alto rendimiento.
Para Marie-Aleth Richard, miembro de la Junta Directiva de la EADV, "el número de aplicaciones de detección del cáncer de piel disponibles para uso de los consumidores es cada vez mayor, pero como se ha demostrado en esta investigación, debe haber más transparencia en torno a la seguridad y la eficacia de estas aplicaciones. Además, estos dispositivos solo detectan lo que se muestra para analizar y no hacen un análisis sistemático de toda la superficie de la piel. La falta de transparencia podría poner vidas en peligro".