• GastroHUN: El primer gran repositorio abierto de imágenes endoscópicas del estómago para IA médica

Bogotá D. C., 14 julio de 2025 – Oficina de Comunicaciones HUN -

GastroHUN: El primer gran repositorio abierto de imágenes endoscópicas del estómago para IA médica

Con 8.834 imágenes de alta resolución y más de 4.700 secuencias de video, investigadores del Hospital Universitario Nacional de Colombia (HUN) y la Universidad Nacional de Colombia lideran una iniciativa sin precedentes para fortalecer la detección temprana del cáncer gástrico mediante inteligencia artificial.

Uno de los factores que contribuye al bajo índice de detección temprana es la variabilidad en la calidad de los exámenes endoscópicos.

El cáncer gástrico continúa siendo una de las principales causas de muerte por cáncer en el mundo. Solo en 2022, se registraron más de 960 mil nuevos casos y más de 660 mil muertes, según datos de la Organización Mundial de la Salud. La detección precoz sigue siendo el mayor desafío clínico.

Uno de los factores que contribuye al bajo índice de detección temprana es la variabilidad en la calidad de los exámenes endoscópicos, comenta el doctor Martín Gómez, Jefe del servicio de gastroenterología HUN, docente de la Facultad de Medicina UNAL y coautor del artículo publicado en la revista Nature Scientific Data.  Según el Dr. Gómez las tasas de omisión de lesiones pueden alcanzar hasta un 25% si el examen no sigue protocolos sistemáticos o si no se registran todas las regiones gástricas, por eso, para enfrentar este problema, GastroHUN ofrece una colección estandarizada de imágenes y videos que permite entrenar algoritmos capaces de auditar, asistir o incluso realizar diagnósticos automáticos.

El repositorio incluye imágenes y secuencias de video extraídas de 387 pacientes y anotadas por un equipo de cuatro expertos en gastroenterología

GastroHUN, primer conjunto de datos públicos a nivel mundial que documenta de manera sistemática la exploración completa del estómago mediante endoscopia, es un hito científico busca transformar el diagnóstico temprano de enfermedades gástricas, especialmente del cáncer, mediante el desarrollo de modelos de inteligencia artificial (IA), comenta el docente.

El repositorio incluye imágenes y secuencias de video extraídas de 387 pacientes y anotadas por un equipo de cuatro expertos en gastroenterología. Las fotografías cubren 22 puntos anatómicos del estómago, de acuerdo con el protocolo japonés Kenshi Yao, considerado el más efectivo para la detección de lesiones premalignas.

La base de datos GastroHUN fue desarrollada para responder a una necesidad crítica en la práctica clínica y la investigación: a nivel local y global, se estima que uno de cada cuatro casos de cáncer gástrico en etapa temprana pasa desapercibido durante la endoscopia del tracto digestivo superior. Con el objetivo de mejorar la calidad diagnóstica y apoyar el desarrollo de algoritmos de inteligencia artificial, este repositorio reúne exploraciones endoscópicas sistemáticas basadas en un protocolo utilizado por expertos líderes en la detección temprana del cáncer gástrico en Japón. Así lo afirman los autores del artículo, el Dr. Gómez, sus residentes y los docentes UNAL, Fabio González del grupo Machine Learning, Perception and Discovery Lab (MindLab) y Eduardo Romero, director del grupo de investigación CIM@LAB.

Se estima que uno de cada cuatro casos de cáncer gástrico en etapa temprana pasa desapercibido durante la endoscopia del tracto digestivo superior

Un recurso abierto, validado y confiable

Una de las fortalezas de GastroHUN es su nivel de curaduría, comenta el Dr. Gómez. Cada imagen fue anotada independientemente por dos residentes y dos especialistas en gastroenterología mediante un proceso de etiquetado cuádruple ciego. El repositorio de casos también incluye un mecanismo para evaluar el nivel de acuerdo entre evaluadores, lo cual permite seleccionar subconjuntos de datos con diferentes niveles de confiabilidad, útiles para entrenar o probar algoritmos con distintos grados de exigencia.

Este hito en innovación científica fue liderado por el  Dr. Martín Gómez, jefe de Gastroenterología del Hospital Universitario Nacional de Colombia, quien colabora estrechamente con sus residentes, así como con los profesores PhD Fabio González y PhD Eduardo Romero, director del grupo de investigación CIM@LAB.

Gracias a esta rigurosa validación, los investigadores disponen de un estándar de calidad único que acelera la adopción de herramientas de IA en entornos clínicos. “GastroHUN incluye imágenes, secuencias cortas y videoendoscopias que capturan el contexto dinámico de cada región gástrica, permitiendo trasladar los hallazgos de investigación a protocolos clínicos que mejoren la calidad y consistencia de las exploraciones endoscópicas”, señala el Dr. Gómez.

Además, el conjunto de datos está acompañado por modelos base de aprendizaje profundo —como ConvNeXt, ResNet y Transformers— que sirven como punto de partida para investigadores y desarrolladores en todo el mundo. El mejor modelo alcanzó una precisión del 88% en la clasificación automática de las 22 regiones anatómicas del estómago.

GastroHUN fue aprobado por el Comité de Ética del HUN, y todos los pacientes dieron su consentimiento informado. La información fue anonimizada siguiendo estrictos protocolos, lo que garantiza su uso ético para fines científicos y educativos.

“El acceso abierto a este repositorio fomenta la colaboración internacional y acelera la creación de soluciones para la salud pública. Nos enorgullece que Colombia encabece este avance en gastroenterología”, afirma el Dr. Gómez.

Un llamado a la comunidad investigadora

El artículo completo, publicado por Nature Scientific Data, está disponible en acceso abierto y puede consultarse junto con el código y los modelos en el repositorio oficial de GitHub del proyecto.

El equipo invita a la comunidad científica y tecnológica a utilizar y expandir este conjunto de datos. Entre los retos más urgentes se encuentran: mejorar la detección de metaplasias con luz blanca, automatizar la evaluación de la calidad del examen endoscópico, y desarrollar modelos capaces de sugerir diagnósticos o realizar auditorías en tiempo real.

“Este es apenas el inicio. Nuestro objetivo es que la inteligencia artificial no solo potencie la labor del gastroenterólogo, sino que también lleve exámenes de alta calidad a zonas rurales y poblaciones vulnerables. Con el equipo de ingenieros del proyecto “Programa de Detección Temprana de Lesiones de pre-malignidad y Cáncer Gástrico en zonas urbanas, rurales y dispersas en el Departamento de Nariño” financiado por MinCiencias, estamos desarrollando GastroVAR, una aplicación en tiempo real que ofrecerá retroalimentación al especialista durante el procedimiento”, concluye el Dr. Martín Gómez.

 (Por: fin/JGJ/ )