EVALUACIÓN POST- IMPLEMENTACIÓN DE UNA HERRAMIENTA DE DEEP LEARNING PARA LA CATEGORIZACIÓN DE DENSIDAD MAMARIA MAMOGRÁFICA EMBEBIDA EN EL FLUJO DE TRABAJO DE UN HOSPITAL DE ALTA COMPLEJIDAD (#21953)
Objetivos
El objetivo de este trabajo fue determinar la concordancia en la categorización de la densidad mamaria en mamografía, entre profesionales especialistas y una herramienta basada en Deep Learning, incluída en el flujo de trabajo de un hospital de alta complejidad embebido.
Materiales y Métodos
Se realizó un estudio de corte transversal retrospectivo con análisis de test diagnóstico. Para el análisis de la densidad mamaria como variable categórica ordinal, se utilizó el coeficiente de Kappa Ponderado Lineal. El proyecto se desarrolló en un hospital de alta complejidad con un equipo multidisciplinario del programa de Inteligencia Artificial en Salud institucional. La red neuronal desarrollada, bautizada Artemisia, en honor a la pintora barroca Artemisia Gentileschi, fue implementada el 25 de agosto del 2019. La meta de la implementación fue, que la red pudiera dar soporte a los médicos durante la realización del informe mamográfico, pudiendo poner a disposición del profesional la categorización de la densidad mamaria, con un nivel de experto. Se incluyeron en el estudio las mamografías de screening, anonimizadas, independientemente de la marca comercial del mamógrafo utilizado, guardadas en el sistema local. El período de observación fue desde el 1 de noviembre del 2019 hasta 30 de octubre de 2020.
Resultados
Las mamografías analizadas por la red neuronal durante el período definido fueron 8821, a cada una de ellas le correspondieron 4 placas, por lo que la red neuronal analizó un total de 35284 imágenes. Los usuarios eligieron interactuar con el algoritmo en todas las oportunidades. Participaron del estudio 11 profesionales que contaban con un rango de experiencia de 1 a 38 años en diagnóstico de imágenes de mama, con un valor de mediana= 10. Según lo esperado, la prevalencia de mama densa en la muestra fue de 39% (IC95% 38%-40.3%), acorde a la literatura y al estudio realizado en la etapa de evaluación. La prevalencia de cada una de las categorías fue la siguiente : A: 12,5%; B:48%; C:34%; D:4,8%.
La concordancia entre la red neuronal y la categorización realizada por los profesionales fue de k= 0,75 (IC95% 0,74-0,76). Para el análisis dicotómico mama densa / mama no densa la concordancia entre la red neuronal y el total de profesionales fue de k=0,83 (IC95% 0,82-0,84).
La sensibilidad de la red neuronal, para la distinción entre mama densa y mama no densa fue de 84.5% (IC95% 83.2%-85.6%) y la especificidad de 96.9% (IC95% 96.4%-97.4%). Para este análisis se tomó como ground truth la categorización realizada por cada profesional.
La concordancia entre la red neuronal y la categorización realizada por los profesionales fue de k= 0,75 (IC95% 0,74-0,76). Para el análisis dicotómico mama densa / mama no densa la concordancia entre la red neuronal y el total de profesionales fue de k=0,83 (IC95% 0,82-0,84).
La sensibilidad de la red neuronal, para la distinción entre mama densa y mama no densa fue de 84.5% (IC95% 83.2%-85.6%) y la especificidad de 96.9% (IC95% 96.4%-97.4%). Para este análisis se tomó como ground truth la categorización realizada por cada profesional.
Conclusiones
Los resultados de este trabajo muestran que la red neuronal analizada, persiste con un un alto nivel de acuerdo con los profesionales médicos en la categorización de la densidad mamaria en la mamografía, inmersa en el flujo de trabajo de un hospital de alta complejidad. El potencial de este tipo de herramientas para automatizar y estandarizar esta lectura es alto, haciendo factible cumplir con la meta de la implementación definida.
Tipo: Comunicaciones Libres
Palabras clave: Inteligencia Artificial,Informática Médica,Mamografía
Categorias: Informática Médica, Sistemas de Atención Médica
Institución: HIBA
Ciudad: Buenos Aires ,
País: Argentina