Investigación en IA Aplicada
Proyectos
- TUMORES: Diseño y desarrollo de modelos Deep Learning para el diagnóstico de tumores cerebrales pequeños. Convocatoria 2024 de ayudas UFV a Proyectos de Investigación. En colaboración con el IRYCIS (Instituto Ramón y Cajal de investigación sanitaria)
- MELANOMA: Deep Learning para la mejora del diagnóstico y la anticipación de inmunoterapias en melanoma. Convocatoria 2023 de ayudas UFV a Proyectos de Investigación
- Cribado coste-efectivo de cáncer de mama mediante mamografía, ecografía y termografía. Convocatoria 2019 de Proyectos I+D+i del Programa estatal de generación de conocimiento y fortalecimiento científico y tecnológico del sistema de I+D+i. Ref. PID2019-110686RB-I00 (2020-2022). Financiación: 81.433€
- Diseño de modelos Deep Learning de diagnóstico y tratamiento mediante análisis de imagen térmica para el Robot fisioterapéutico Adamo. Convocatoria 2022 del programa Cheque Innovación de la Comunidad de Madrid cofinanciado por el Fondo Europeo de Desarrollo Regional (FEDER). Nº expediente: 09/835799.9/22 (2022-2023). Financiación: 57.500 €.
- SECURHOME. Convocatoria INTERREG V-A España-Portugal 2014-2020 - Fondo Europeo de Desarrollo Regional (FEDER) (2018-2020). Financiación: 33.000 €
- PAUTA: Sistema integrado de apoyo y asistencia para polimedicados. Convocatoria Avanza Competitividad I+D+i (ámbito temático: Salud y bienestar social) - Plan AVANZA2. Ministerio de Industria, Turismo y Comercio. TSI-020302-2010-131 (2010-2012). Financiación: 271.232 €
Tesis
- Análisis de EEG como marcador de Enfermedad de Parkinson mediante técnicas de Deep Learning. Defendida en: Universidad Francisco de Vitoria el 9/Octubre/2023 con calificación Sobresaliente Cum Laude.
Patentes solicitadas
- TERAPIA: Method for processing an electroencephalography data file. Patente europea
Aplicaciones
Aplicaciones en el campo de la medicina para el estudio de enfermedades neuronales como el Parkinson o epilepsia. Usamos pruebas electroencefalográficas (EEG) para entrenar modelos convolucionales clásicos (CNN) o de grafos (GCNN). En el primer caso se ha hecho una transformación de los EEGs en imágenes que representan la actividad cerebral según los distintos tipos ondas cerebrales. En el segundo caso los EEGs se modelan como grafos de manera que los nodos representan los electrodos y las aristas la conectividad entre las distintas zonas del cerebro. También usamos técnicas de PLN (arquitecturas transformers) para clasificar etapas de la evolución de la enfermedad de Parkinson (EP) a partir de los EEG de pacientes. Otros trabajos en este campo incluyen el desarrollo de workflows semiautomáticos de machine learning pare crear modelos que permiten medir la supervivencia de un paciente operado de Aneurisma Aórtico Abdominal (AAA) a partir de datos clínicos o el análisis de imágenes termográficas de mama para determinar la viabilidad de un cribado coste-efectivo de cancer de mama usando la termografía como técnica de diagnóstico.
Uso de GANs para restauración virtual de paisajes artificiales con restos arqueológicos. La red red identifica las características clave determinadas por la lógica interna del estilo arquitectónico y añade los elementos arquitectónicos que faltan para obtener una imagen del edificio restaurado. A diferencia de otros estudios, no recibe ninguna información sobre qué elementos deben añadirse o dónde. Usamos imágenes de renders de templos griegos con elementos arquitectónicos faltantes que serán añadidos a la imagen de manera automática. Una versión mejorada utiliza transformers para definir los edificios mediante lenguaje natural.
Las aplicaciones son múltiples en el campo del patrimonio cultural con apps interactivas como guías o para acelerar los procesos arquitectónicos de rehabilitación.
El proceso se ha mejorado con el desarrollo de un sistema Text2Image específico del ámbito de la arquitectura y patrimonio que a partir de un texto descriptivo genera una imagen con los elementos arquitectónicos propio del estilo etiquetados que puede usarse para la reconstrucción virtual de imágenes de edificios en ruinas.
Implementación de un método híbrido para generar frases nuevas que aumenten los datos de entrenamiento par aaplicaciones de PLN, combinando cadenas de Markov y word embeddings para producir datos de alta calidad similares a un conjunto de datos de partida. También se ha trabajado con modelos mas complejos como los Transformers para el resumen de sentencias judiciales o la generación automática de entradillas de noticias.
Estamos desarrollando un traductor español-latín usando modelos Transformer sobre-entrenados con un dataset obtenido a partir de las obras de San Agustín.
Con la aparición de los modelos de atención se ha abierto la posibilidad de aplicar el PLN a otros ámbitos distinto del propio lenguaje. Usamos También usamos Transformers (y otros modelos derivados desarrollados por nosotros) para analizar señales biomédicas (EEGs) y para la generación de imágenes (Text2Image) en el ámbito de la arquitectura y el patrmonio histórico nacional.
Proyectos
- TECT-CI5G: Tecnologías Transformadoras en Ciberseguridad: Aprendizaje Profundo y Minería de Grafos para la Inteligencia en Tráfico de Red 5G. Convocatoria 2023 de Proyectos de Colaboración Público-Privada, Ministerio de Ciencia, Innovación y Universidades y Fondo Europeo de Desarrollo Regional (FEDER) (2024-2027). Financiación: 451.422 €
En el campo del audio, aplicamos Autoencoders para la reconstrucción de transmisiones de voz dañados. En este caso, el modelo recibe audios de voz con interferencias o cortes que lo hacen ininteligible y los reconstruye de manera automática. La reconstrucción se realiza sobre la onda del audio y no separando los diferentes sonidos como ocurre en la mayoría de los casos descritos hasta ahora. Esto tiene aplicaciones en comunicaciones de baja calidad donde el receptor tendría dificultades para entender el mensaje.
También desarrollamos modelos DL para eliminar el ruido de fondo y limpiar la voz humana en primer plano (denoising) en un proceso que incluye primero la clasificación del ruido de fondo y después su eliminación, para lo cual se usan modelos CNN+LSTM (clasificación) y Variational Autoencoders (limpieza), trabajando sobre espectrogramas.
Usando los datos del portal RASFF de la UE, creamos modelos predictivos usando perceptrones multicapa y redes convolucionales 1D que pueden predecir el tipo de producto con mayor posibilidad de estar contaminados en un momento dado, así como el país de origen y el contaminante más probable. Estos modelos permitirán la optimización de recursos a la hora de analizar productos en frontera, así como que análisis concreto realizar.
Aplicando técnicas de SNA (social network analysis) llevamos a cabo análisis cuantitativos y estructurales de las rutas de importación/exportación de alimentos a/desde la UE.