<img height="1" width="1" style="display:none" src="https://www.facebook.com/tr?id=974250883405448&amp;ev=PageView&amp;noscript=1">
Natural Language Processing centrado en Document AI

Procesamiento del Lenguaje Natural

,

PNL

,

Data Analytics

Natural Language Processing centrado en Document AI

Manuel Torres | Jun 08, 2021

La capacidad de poder gestionar múltiples documentos de texto en formato digital, puede aportar al negocio una nueva dimensión de posibilidades a la hora de gestionar y extraer datos dentro de documentos físicos, ahorrando así, en procesos de transcripción y análisis, donde pueden verse reflejados posibles errores humanos de transcripción y validación, además del tiempo que supone realizar este tipo de tareas manualmente.

Una encuesta global realizada por IDC, reveló que la pérdida de productividad de los trabajadores en tareas relacionadas con los documentos implica el 21,3% (lo equivalente a dos meses de trabajo al año). La aplicación de Inteligencia Artificial en documentos puede ayudarnos a reducir esta pérdida.

Tareas de clasificación de documentos como contratos, facturas, reclamaciones, la extracción de entidades en dichos documentos de nombres, teléfonos, correos, firmas, controlar errores, faltas de información, duplicados y la gestión de datos, son más fáciles gracias a herramientas como Google Document IA.

El uso de esta herramienta se puede aplicar en el ámbito legislativo y judicial, permitiendo ver cuales son las jurisdicciones y el margen legal que tienen diferentes tipos de contratos y reclamaciones. También en un ámbito mucho más amplio como la gestión de facturas y albaranes, donde estos se puedan digitalizar y tener un control de gastos e ingresos de la compañía. Por otra parte, también en gestiones de diversos contratos para encontrar posibles fechas y tener una gestión más eficaz del conjunto de clientes y sus facturas. Desde el punto de vista de la industria, puede ayudar a realizar navegaciones automáticas en manuales de maquinaria para agilizar reparaciones.

La herramienta de Document AI por parte de Google, utiliza el aprendizaje automático para extraer la información de los documentos, aprovechando así las oportunidades que nos ofrecen los datos sin estructurar dentro de los documentos físicos para aumentar la eficiencia operativa, obtener datos dentro de diversos documentos, mejorar la experiencia del cliente y ofrecer una ayuda a la hora tomar decisiones fundamentadas respecto a el contenido de estos.

El funcionamiento de Document AI está basado en 2 partes diferenciadas: la primera parte consiste en la extracción de los caracteres de texto del documento utilizando una tecnología llamada OCR (Optical Character Recognition), que se encarga de la digitalización del texto en la imagen escaneada del documento a un fichero de texto con el contenido de la misma.

Una vez finalizado, continuamos con la segunda parte. Esta consiste en un módulo basado en Inteligencia Artificial que se encarga de analizar y extraer posibles entidades dentro del texto suministrado, como a su vez extractos del contenido que pueden ser de relevancia, aplicando técnicas de reconocimiento del lenguaje natural. Este reconocimiento del lenguaje natural emplea técnicas de LSTM (Memoria a Corto y Largo Plazo en inglés) que toman cierta información del pasado de las frases del texto que se recaban para dar sentido al mismo.

Esta parte de interpretación del lenguaje natural está basada en la misma tecnología de Google que encontramos tanto en los asistentes de voz que se disponen en los móviles, como en sistemas de Google Home. Gracias a este tipo de tecnología, se pueden extraer datos no estructurados dentro de los textos.

La forma en que está planteada esta herramienta nos ayuda a analizar facturas, recibos, tablas y textos tal como lo podría hacer una persona, asociando una serie de conceptos y valores en dichas situaciones. De este modo, se pueden ir automatizando y agilizando los tiempos de subida de datos a las plataformas, acelerando la digitalización del dato y logrando que los datos sean precisos y se ajusten a las normativas que se están buscando en todo momento. 

Ejemplo de extracción de entidades en un formulario con Google Document AI.

Para facilitar el ajuste de los datos, Document AI ofrece una serie de características que permiten trabajar tanto con las clasificaciones que trae de serie, o bien adaptándolas a una serie de características específicas del sector o del negocio. Para ello, el sistema requerirá de una serie de documentos y ejemplos de esas nuevas clasificaciones a detectar, de tal modo que pueda aprender a identificarlas con claridad. Evidentemente, cuanta más documentación se le pase al sistema, mejor aprenderá a detectar estas nuevas entidades.

Toda esta información valiosa recabada de los documentos analizados se puede emplear para satisfacer las necesidades de clientes, aumentando las posibilidades de negocio, expansión y para conseguir un mayor apoyo a la hora de digitalizar y disponer de la información en cualquier momento y en cualquier lugar que se necesite.

Ejemplo de extracción de entidades en una factura con Google Document AI.

También debemos recalcar que, el acceso a la información, puede ser un punto importante, dado que diversos datos que se encuentran en los documentos, pueden tener un carácter confidencial o restringido a sólo un cierto público. Para ello, Google Cloud ofrece la seguridad de acceso a los datos restringidos a la organización, otorgando permisos solo a los usuarios correspondientes, de tal modo que, la información, sólo esté tratada y disponible para dichas personas con los permisos de acceso necesarios.

Como se puede comprobar, hay tantos casos de uso como tipo de documentación física involucrada, por lo que brinda una gran oportunidad de cara al público, sin requerir el desarrollo de sistemas de Inteligencia personalizados, ofreciendo una gran flexibilidad a la hora de su caracterización y su despliegue.

Para concluir, podemos afirmar que, esta herramienta, permite el uso de diferentes tipos de datos tanto de libre acceso, como privados. Tiene una gran cantidad de aplicaciones independientemente del sector, y ayuda significativamente en el paso a la digitalización de las empresas, llevando sus negocios a que puedan evolucionar con más dinamismo, ahorrando tiempos de gestión y análisis que se pueden traducir en ventajas estratégicas a corto y largo plazo.

¿Te gustaría aplicar esta solución a tu negocio?

Contacta con nosotros

¡Suscríbete!