Módulos

Manual de uso del OCR

 

 

Manual de uso del OCR

 ¿Qué es el sistema OCR (Reconocimiento Óptico de Caracteres) para facturas de tucomunidad.com?

Es una herramienta para el reconocimiento óptico de datos, que permite extraer la información (datos de la factura) contenida en un PDF o una imagen (factura digitalizada) para trasladarlos a los receptores de la factura de forma que puedan procesar y contabilizar la factura de manera automática sin necesidad de registrar manualmente los datos. Con este proceso se minimizan los errores manuales y se agiliza la contabilización y el pago.

Dado que los sistemas OCR son sistemas complejos, te recomendamos que leas este documento y sigas las sugerencias para el correcto funcionamiento y optimización del sistema.

Es preferible que leas el documento completo una primera vez y luego comiences a seguirlo paso a paso en una segunda lectura

 Conceptos básicos

Los campos necesarios dentro de una factura para conseguir automatizar su contabilización es un número relativamente pequeño de datos y se denominan metadatos (NIF/CIF emisor, NIF/CIF receptor, fecha factura, fecha de vencimiento, nº de factura, base imponible, % IVA, IVA e importe total)

Adicionalmente, se permite definir metadatos adicionales, ya que pueden ser de interés en determinados casos (nº contrato suministro, comentarios, segundos datos de IVA o en el caso de autónomos %IRPF, IRPF)

El mecanismo que se utiliza en un OCR consiste en hacer un “mapa” de una factura estándar (plantilla). En ese mapa se va a indicar en qué punto físico de la factura (coordenadas o pixeles) se encuentran cada uno de los datos que constituyen los metadatos (ubicación de los metadatos), es decir dónde va el CIF emisor, dónde el CIF receptor, etc… y qué tipo de dato es (una fecha, un número, un texto, etc…) de manera que posteriormente el OCR pueda ir a las facturas y encontrar cada dato en el punto dónde debe estar.

La plantilla se crea una única vez y es el mapa que se utiliza para que el OCR capture de forma automática los datos de todas las facturas posteriormente.

Un metadato puede estar en horizontal en el papel (esto es lo normal) o en vertical (a veces los CIF del emisor se encuentran escritos en vertical en el lateral de la factura)

En ocasiones un metadato siempre tiene el mismo valor en todas las facturas (p.e: el CIF emisor o el % IVA en determinados servicios). En estas ocasiones es mucho más práctico asignarle un valor fijo al metadato de forma que el OCR no tenga que trabajar en balde.

Las facturas no tienen siempre el mismo tamaño, la longitud del concepto de la factura puede variar, el número de productos facturados no es siempre el mismo, etc… Esta situación puede provocar que algunos metadatos no estén siempre en la misma ubicación. Para resolver esta circunstancia se emplea un truco, se define una referencia relativa, es decir, un texto fijo que siempre está cercano al metadato que se quiere identificar (por ejemplo, el texto “total” suele ir al lado del importe total de la factura). Estos textos que nos ayudan a mapear un metadato que no está siempre en el mismo punto de la factura se denominan puntos de referencia

En el gráfico que sigue a continuación podrás ver un ejemplo de estos conceptos

 

 ¿Qué tipo de facturas puedo introducir en el OCR?

El sistema de OCR de tucomunidad.com ofrece un rendimiento óptimo para facturas generadas como PDF original. MS Office permite crearlas desde Word, Excel y Power Point si al guardar eliges el formato PDF. Además la mayoría de los programas de facturación permiten crear facturas en formato PDF también.

 

 

Aunque también es posible introducir imágenes o PDF escaneados NO te recomendamos este método ya que tanto fotos como PDF escaneados pueden haberse movido al ser escaneadas lo cual dificulta la labor del OCR dando malos resultados

Si tu empresa emite cientos de facturas al mes consúltanos, para esos volúmenes existen otras soluciones alternativas al OCR

¿Cómo empiezo?

Lo primero que debes hacer es crear una plantilla partiendo de tu factura estándar de referencia. Debes ir al apartado de facturas…

Ahora selecciona Imp. OCR…

Selecciona plantillas…

Y haz click en nueva plantilla. El proceso de creación tiene tres pasos (seleccionar el fichero, asistente de creación y creación de campos)

El sistema te pedirá ahora que selecciones un fichero con una factura estándar en PDF para empezar a crear la plantilla a partir de ella (Recuerda que debe ser PDF original para obtener la máxima fiabilidad)

Te darás cuenta que existe un indicador que te avisa en qué paso te encuentras en cada momento:

El sistema se tomará unos segundos para reconocer el documento y crear un “mapa” del contenido de la factura estándar que le hemos proporcionado.

Puedes ayudarte con el asistente o bien pulsar el botón “siguiente” para ir paso a paso (nuestra recomendación en esta primera ocasión es que pulses “siguiente” y vayas paso a paso. Más adelante te enseñaremos a utilizar el asistente)

 Dar un nombre a la plantilla y crear los metadatos fijos

A partir de aquí vamos a darle un nombre a la plantilla y a decirle al OCR dónde están nuestros metadatos ((NIF/CIF emisor, NIF/CIF receptor, fecha factura, fecha de vencimiento, nº de factura, base imponible, % IVA, IVA e importe total)

Dale un nombre a tu plantilla y el idioma de la misma

 Ahora vamos a empezar con los metadatos. Nuestra recomendación es que empieces por los valores fijos (si es que los hay). Normalmente el CIF emisor lo suele ser.  Para ello debes seleccionar el metadato de la lista (los que tienen * son obligatorios, el resto son opcionales)

Selecciona que es de tipo fijo en el check, tipo CIF en el combo, dale el valor y pulsa “guardar”

¡Enhorabuena! Acabas de dar de alta el primer metadato de valor fijo. Continúa con el resto de metadatos fijos que tenga tu factura estándar, por ejemplo el tipo de IVA, si siempre es 21%

Puntos de referencia

Una vez que todos los metadatos fijos están resueltos, vamos a crear un punto de referencia. Para ello selecciona “Ptos. Referencia”  en el panel

Ahora debes, poner el nombre del texto del punto de referencia (¡Ojo! El nombre del punto de referencia debe coincidir con los primeros caracteres de la zona del pdf que hayas seleccionado. Escribe el nombre del punto de referencia tal como aparece en la factura), seleccionar con el ratón la zona de la factura donde aparece y dar al botón “Aceptar”

 

 Acabas de crear tu primer punto de referencia. ¡Ves como era fácil!

Ahora podrías crear el resto de puntos de referencia (I.V.A, Subtotal, etc…)

 Metadatos variables

Ya sólo nos quedan por definir los metadatos variables y habremos terminado de crear la plantilla.

Lo primero es seleccionar “Campos” en el panel

Ahora seleccionas el campo entre la lista de disponibles (nosotros vamos a hacer NIF/CIF Receptor), no es de valor fijo así que no pinches el check, está escrito en horizontal y es de tipo CIF.

Haz click con el ratón para seleccionar la zona de la factura donde está el metadato y acaba pulsando el botón “Aceptar”

 

 Has avanzado un poco más y has creado tu primer metadato sin punto de referencia.

Como sabemos que necesitas otro ejemplo, ahora vamos a crear un metadato con punto de referencia, el total de la factura.

Recuerda, seleccionas el campo entre la lista de disponibles (nosotros vamos a hacer Importe total), no es de valor fijo así que no pinches el check, está escrito en horizontal y es de tipo moneda con dos decimales. Además necesita un punto de referencia (marca el check de relativo y elige el punto de referencia más cercano “TOTAL FACTURA”)

Haz click con el ratón para seleccionar la zona de la factura donde está el metadato y acaba pulsando el botón “Aceptar”