12 Jul 2021 · Blog · Actualizada el 13 Jul 2021

Diferencia entre los OCR convencionales y nuestro sistema OCR “OCR-e”

digitalización de documentos
Automatización de datos con un sistema OCR

Durante las últimas semanas nos habéis estado preguntando cuál es la diferencia entre los OCR convencionales y nuestro sistema OCR “OCR-e”.

Con este contenido vamos a tratar de sintetizar donde radican las principales diferencias:

  • No es un simple lector de documentos:  Mientras que la mayoría de los OCR del mercado captura y descarga los datos, con mejor o peor precisión, lo relevante de OCR-e radica en retornar solo los datos relevantes del documento y clasificarlos en datos estructurados de manera inteligente, lo que permite tratarlos, generar alarmística e ingestarlos en los sistemas finales de gestión a través de procesos RPA’s.
  • Documentos con imperfecciones: Cuando se inicia un proyecto de este tipo y complejidad, decantarte por un sistema OCR puede resultar una decisión difícil de tomar, en parte no solo por la cantidad de documentos a digitalizar sino por la calidad en la que se encuentran los mismos. En muchos escenarios que nos hemos ido encontrando en las implantaciones de OCR-e, muchos de los documentos analizados contienen imperfecciones, baja resolución, ruido en el documento o simplemente vienen rotados tras un escaneo. En la vida real, la casuística de las imperfecciones puede llegar a ser muy alta.
    El sistema OCR-e, a través de la AI y el entrenamiento personalizado de los modelos, permite solventar estos problemas, lo que le permite ser un sistema flexible y robusto retornando confianzas de los datos extraídos con alta precisión, superiores al 97%. Esto elimina una gran cantidad de tiempo dedicada a la revisión y verificación de los datos.
  • Múltiples páginas en documentos: Otro de los puntos que cabe destacar y en los que fallan los sistemas OCR modernos, es la lectura en documentos de múltiples páginas, por ejemplo, en facturas y albaranes.
    La mayoría de los sistemas se basan en coordenadas para localizar la información a extractar lo que provoca errores en las lecturas o ineficiencia en el tratamiento posterior de la información. Para OCR-e este requisito, lejos de ser un problema, es una característica del sistema, al realizar entrenamientos personalizados del modelo y no usar coordenadas para la lectura de los datos.
  • Documentos cambiantes: En la actualidad, las organizaciones se enfrentan a requisitos y necesidades cambiantes lo que provoca que el sistema OCR implantado requiera de cierto dinamismo.
    OCR-e permite adaptarse a los cambios que se producen en las compañías a través del fácil reentreno de los modelos e incluyendo los nuevos campos a leer.

Para finalizar, OCR-e no es el típico producto OCR de mercado, sino que es un servicio formado por redes neuronales que, una vez entrenado, es capaz de adaptarse a las situaciones cambiantes de la vida real y abstrayéndose de la calidad de los documentos, depositando confianzas cercanas al 100% de la información extractada aplicando para ello técnicas de preprocesado y aprendizaje automático.

La automatización de facturas, albaranes, contratos y un largo etc de documentos que una compañía maneja en el día a día es la forma más eficaz de evitar errores humanos, reducir tiempos de respuesta y lo más importante, obtener un ROI desde el primer momento que el servicio es implantado.

Más artículos relacionados

análisis predictivo

03 Jun 2020 · Industria 4.0

Cómo el análisis predictivo aporta valor a tu organización

La capacidad de anticipar un problema con el análisis de datos predictivo supera el valor de la monitorización. ¿Qué pasaría si tuviéramos la capacidad de anticipáramos a los problemas de nuestra organización? Detectar fugas, la caída de la red, el funcionamiento de una máquina industrial antes de que se produzca...
Leer más
Sistema de CIC para la gestión de los trabajos de tala y poda

02 Abr 2020 · Eficiencia energética

Sistema de CIC para la gestión de los trabajos de tala y poda

En CIC hemos desarrollado una solución para la generación, planificación y ejecución de los planes de mantenimiento de tala y poda. Este sistema está implementado en varias empresas del sector de la distribución eléctrica, aunque es aplicable a cualquier otro negocio donde sea necesario hacer una gestión de la masa...
Leer más
Solución Data Lake escalable para una Ciudad Inteligente

30 Oct 2019 · Ciudades Inteligentes

Solución Data Lake escalable para una Ciudad Inteligente

CIC Consulting Informático ha participado en el libro de Comunicaciones del V Congreso de Ciudades Inteligentes, celebrada el pasado mes de junio, organizada por el Grupo TECMARED y la Secretaria del Estado para el Avance Digital (SEAD), con el apoyo institucional de RED.es. En el Libro de Comunicaciones del Congreso...
Leer más