Zaragoza acogerá en 2025 el Congreso Internacional de la Sociedad Española para el Procesamiento del Lenguaje Natural

Zaragoza acogerá en 2025 el Congreso Internacional de la Sociedad Española para el Procesamiento del Lenguaje Natural

El Congreso Internacional de la Sociedad Española para el Procesamiento del Lenguaje Natural (SEPLN) que se ha celebrado este 2024 en Valladolid ya ha seleccionado a Zaragoza como sede del próximo año 2025.

El objetivo principal del congreso es ofrecer, tanto a la comunidad científica como a las empresas del sector, un foro donde presentar y compartir las últimas investigaciones y desarrollos en el ámbito del Procesamiento del Lenguaje Natural (PLN). Este congreso también da la posibilidad de dar a conocer aplicaciones reales en este ámbito, así como diversos proyectos I+D.

En el caso de la elección de Zaragoza como sede para la próxima reunión internacional ha influenciado «nuestra visión, que es conseguir crear una pequeña comunidad de referencia y con cierta repercusión sobre PLN en Zaragoza, que podamos ser el eje central junto con la Universidad de Zaragoza y otros grupos, empresas, o centros de investigación de la zona. También, que nos ubiquen en el mapa junto con la gente de País Vasco, Barcelona, Andalucía, Valencia, Alicante, Valladolid o Madrid», explican los investigadores del ITA centrados en el Lenguaje Natural.

Fue decisivo para la presentación de la candidatura un discurso sobre qué es el ITA, el posicionamiento de Aragón en la revolución tecnológica de la IA, nuestra relación con la Universidad, empresas y sector público para impulsar avances en áreas clave del procesamiento de lenguaje y la IA, además de las bondades de Zaragoza como ciudad.

CONGRESO SEPLN 2024

En el congreso celebrado en Valladolid, nuestros compañeros Rosa M. Montañés-Salas, Sergio Gracia-BorobiaMaría de la Vega Rodrigálvarez-Chamarro, Angel Borque-Fernando, Patricia A. Guerrero-Ochoa, Alejandro Camón-Fernández, Jorge Alfaro-Torres, Isabel Marquina-Ibáñez, Sofía Hakim-Alonso, Luis M. Esteban, Rafael del-Hoyo-Alonso presentaron el trabajo titulado: Hacia el diagnóstico y la caracterización del cáncer de próstata en Informes de Patología en español.

El estudio presentado se enmarca dentro del proyecto AI4HealthyAging, cuyo objetivo principal es el uso de tecnologías de IA para favorecer un envejecimiento saludable entre la población adulta. Dentro de uno de los paquetes de trabajo de dicho proyecto se han abordado varios casos de uso referentes a la detección temprana de riesgo de cáncer, centralizando los trabajos en los cánceres de próstata y colon. En el caso presentado aquí se ha desarrollado un sistema que, aplicando diversas técnicas de Procesado de Lenguaje Natural (PLN) en el contenido de informes médicos de Anatomía Patológica (AP) de cáncer de próstata (fruto de la realización de una biopsia), sea capaz de inferir un diagnóstico del mismo de forma rápida y automatizada para apoyar y mejorar los procesos de toma de decisiones en el entorno médico.

Para conseguir determinar el diagnóstico de cáncer partimos de una población de estudio controlada: todos los varones pertenecientes al Hospital Universitario Miguel Servet de Zaragoza con, al menos, una determinación de antígeno prostático en los últimos 5 años. De estos 95.000 pacientes, se recuperan los informes de aquellos con al menos 1 biopsia realizada (y por tanto su correspondiente informe de ese antígeno prostático), quedando un total de 10.563 pacientes y 24.981 informes de biopsia. Estos informes son anónimos en la etapa previa a su análisis. Este conjunto de textos, junto con una serie de expresiones y términos clave del dominio específico de cáncer prostático (contamos con el conocimiento experto) conforman la fuente de información que alimenta el sistema de PLN.

Este sistema se compone de dos bloques principales: Uno de ellos basado en técnicas de procesado más tradicionales como es el análisis léxico-morfológico de los textos y otro en el que se hace uso de los nuevos modelos de lenguaje basados en transformers del estado del arte, en este caso, modelos de lenguaje del dominio biomédico en español. Con todo ello, se procesan los informes disponibles y se extrae tanto el diagnóstico de cáncer de próstata como una serie de variables adicionales de interés construyendo un rico conjunto de datos (dataset) que puede alimentar otro sistemas de aprendizaje automático de carácter multimodal.

La distribución de las existencia de cáncer en la población estudiada coincide con la distribución media habitual de diagnósticos de cáncer en el lugar bajo estudio. Para verificar el correcto funcionamiento del sistema se llevó a cabo una validación y comparación frente al etiquetado manual realizado por el personal clínico almacenado en los registros hospitalarios, llegando a un acuerdo entre anotaciones del 96%.

Finalmente, con este trabajo se ha podido diseñar e implementar un sistema de análisis, etiquetado y extracción de información de informes médicos textuales eficiente y adaptable, así como construir un amplio conjunto de datos estructurado que sirven tanto para mejorar la capacidad predictiva y explicabilidad de otros modelos de riesgo de cáncer de próstata, apoyar y mejorar los procesos de detección temprana y enriquecer los repositorios hospitalarios.

En el ITA se aplica la IA a otros proyectos vinculados al sector salud, como el Misiones AI4HealthyAging. El objetivo del proyecto es la investigación y el desarrollo de un sistema inteligente descentralizado de toma y análisis de datos que permita a nuestro sistema de salud anticipar y actuar de manera temprana y ultra rápida en enfermedades psiquiátricas, neurológicas, motoras y degenerativas de gran prevalencia en el contexto del envejecimiento. Mediante el sistema inteligente se realiza un pronóstico temprano durante el seguimiento del paciente con insuficiencia cardíaca e ictus, gracias al diseño y construcción de algoritmos de Inteligencia Artificial (IA). Entre las enfermedades analizadas en este proyecto destacan: Cáncer de próstata, el cáncer de colon y la Sarcopenia.

El proyecto AI4HealthyAging se engloba dentro del programa Misiones de I+D en Inteligencia Artificial 2021 del Ministerio de Asuntos Económicos y Transformación Digital,  y forma parte de la Agenda España Digital 2025 y de la Estrategia Nacional de Inteligencia Artificial. Está financiado por la Unión Europea a través de los fondos Next Generation EU.

Lourdes Buisán Gabás

ARTÍCULOS DEL MÍSMO ÁMBITO

OTROS ARTÍCULOS

Skip to content