Actualmente las tecnologías de Visión Artificial están siendo adoptadas por los grandes proveedores de Cloud. Se ha visto que el alcance de Computer Vision, que son imágenes en el espectro visible, empieza a quedarse corto ante todas las posibilidades de imágenes que pueden existir. Este es un problema que se trata de extender con el análisis de imágenes. Para ello, se ha ido ampliando a otros tipos de casos en los cuales se utilizan diferentes tipos de espectros de imágenes.
Las imágenes multiespectrales son aquellas que representan otras frecuencias de onda que no necesariamente son visibles por el ojo humano. Estas franjas pueden abarcar el infrarrojo, el ultravioleta, o bien otras bandas de frecuencia de onda radioeléctricas.
El primer paso con estas imágenes, es su tratamiento, para hacerlas visibles al ojo humano. Esto se realiza a través de contrastes o mapas de colores que permitan entender dichas representaciones. Los ejemplos más claros son las radiografías o las imágenes de TAC.
Uno de los primeros casos en abordarse con este tipo de imágenes ha sido en el sector sanitario, en el cual se pueden tomar imágenes de rayos X y resultados de resonancias magnéticas entre otros. En estas se utilizan otros espectros radioeléctricos para la captación de diferentes afecciones o peculiaridades en el cuerpo. Del mismo modo que se han usado los modelos de Visión Artificial para imágenes en el espectro visible, también se han intentado extender para este tipo de imágenes.
Mediante técnicas de Deep Learning (especialmente en Transfer Learning) y utilizando redes neuronales ya entrenadas para la detección y clasificación de imágenes, estos modelos se especializan adaptando las últimas capas de estas redes.Con estos métodos y mediante la utilización de imágenes fuera del espectro visual, se han podido conseguir unos primeros resultados bastante aceptables. Estos avances y el conjunto de datos que se han podido recabar de diferentes centros médicos, han hecho posible crear modelos completamente personalizados para esta labor. Uno de los últimos modelos a los que se puede tener acceso, es uno desarrollado con imágenes pectorales de pacientes con COVID usando rayos X, mediante el cual se han podido observar los grados de afección de los mismos.
Por otra parte, desde Techedge, hemos llevado la iniciativa en la innovación dentro del campo de la Visión Artificial. El estado del arte de estos modelos nos ha servido para llevarlos a una serie de ámbitos diferentes y poder explorar sus capacidades.
Uno de los casos que hemos desarrollado junto al Instituto Astrofísico de Canarias (IAC), es un modelo de segmentación de imágenes satelitales, no solo en el espectro visible, sino también trabajando con diferentes bandas de frecuencias y siendo capaces de discernir los tipos de terreno que se encuentran en dichas imágenes. La finalidad de este modelo era medir el avance de la desertificación en diferentes áreas de Europa y realizar un análisis de la huella de carbono a través de una serie de sistemas adicionales.
Otro caso en el que se ha estado trabajando, es un sistema de detección de fallos en soldaduras a través de imágenes de rayos X. En este caso, los sistemas de Auto ML que se habían intentado utilizar para la detección de estos fallos, se habían desestimado, dado que los modelos de visión normal no eran suficientes para este modelo. Para ello, se han utilizado una serie de modelos de detección de objetos utilizando aumentación de datos y mejorando la calidad de las imágenes. De esta forma, se optimiza la detección de estos fallos. Este tratamiento de imágenes y el enriquecimiento de los datos, han sido factores determinantes para poder extender algunos de los modelos preexistentes y poderlos adaptar correctamente al caso de uso.
Estos casos de detección en imágenes multiespectrales suelen estar acompañados no solo de múltiples imágenes, sino de diversos ficheros descriptivos, los cuales ayudan a los Data Scientists en el entendimiento de los datos, a enriquecer la naturaleza de los mismos y al desarrollo de los modelos en cuestión. Algunas de las imágenes que se han tratado en estos casos tienden a ser de mucha resolución. Esto hace que las técnicas de análisis tiendan a ser especializadas en la ingesta y procesamiento de los sistemas de Machine Learning de las mismas.
Con toda la experiencia recabada en estos casos, lo que hemos podido aprender es que el tratamiento de problemas con Visión Artificial es mucho más amplio y complejo de lo que puede parecer en un principio. Estos sistemas pueden aplicarse no solo en detección de enfermedades o patologías en imágenes médicas, sino que también pueden extrapolarse al sector industria y energía para el control de calidad de los equipos, como por ejemplo para reparaciones que se han podido producir.
Como hemos visto, este tipo de análisis también puede ayudarnos a ver el impacto medioambiental de algunos procesos y a entender la evolución de diferentes entornos, sin importar que sea o no visible para nuestros ojos.
Muchos de estos problemas se están abordando hoy en día tanto en diferentes concursos, como en plataformas como Kaggle, intentando extender la versatilidad que nos ofrece el campo del Machine Learning. Esto nos puede llevar a pensar que con un volumen suficiente de datos y la constante evolución de los modelos, es posible la generación de modelos mucho más sofisticados y precisos.
Y tú, ¿tienes algún reto respecto al análisis de imágenes?