Al principio del reconocimiento óptico de caracteres -OCR- había una necesidad de tener una fuente que pudiera ser reconocida por los equipos y por las personas, aunque bien es cierto que estaba casi más pensada para ser reconocidas por las máquinas que para el ojo humano.

A finales de la década de los sesenta, en 1966 se presentó la fuente OCR-A (Optical Character Reading), desarrollado por la European Computer Association Manufacturers Association (ECMA) y en el 68 se lanzó el OCR-B, en el que asesoró Adrian Frutiger.

La fuente OCR-A, con trazos simples y un espesor que permitía un fácil reconocimiento de los caracteres parecía una buena solución. Es un diseño un poco burdo que se basa en una retícula de 4×7 y tiene un ancho fijo -monoespaciada-, con la impresora requiere colocar los glifos a 0,254 cm. (0,10 pulgadas) de distancia y el lector requiere aceptar cualquier espacio entre 0,09 pulgadas y 0,18 pulgadas. Esta fuente también cuenta con una variación del tipo extendida. La OCR-A es actualmente ISO 1073-1:1976, denominada en Alemania como DIN 66008.

Aunque su objetivo de creación no había sido ese, quizás uno de los usos de más lucimiento que ha tenido la OCR-A ha sido para la película Matrix, aportando esa imagen de mecanización de datos a la estética y tema de la película.

La OCR-B que diseñó Adrián Frutiger en 1968 para Monotype era, en cierto modo, una respuesta europea a la OCR-A americana que se consideraba como una burda caricatura al alfabeto. Esta fuente de Frutiger está realizada en una retícula de 18×25 campos, casi cuatro veces más fina que la OCR- A, por lo que requería una capacidad de proceso mucho mayor para ser leída por una máquina. En 1973 se aceptó como estándar mundial y de ello el ISO 1073/II-1976 (E), refinado en 1979.

La OCR-B se creó especialmente orientada al mundo financiero y es ampliamente utilizada en la codificación numérica de producto -UPC, Código Universal de Producto habitualmente conocido como código de barras-. Contiene todos los símbolos ASCII así como símbolos específicos utilizados en el ámbito bancario. Aunque comparte los mismos objetivos de la OCR-A, es más fácil de lectura para el ojo y tiene un aspecto menos mecanicista.

El OCR -Optical Character Reading- es una aplicación dirigida al reconocimiento de un escrito a partir de una imagen para la digitalización de este como texto y que, por tanto, pueda ser editado y utilizado como tal por cualquier programa de edición textual.

El sistema es que partiendo de una imagen con sólo dos niveles de gris (binaria) el reconocimiento de estos caracteres se realiza basándose en la comparación con unos patrones o plantillas que contienen todos los posibles caracteres. La teoría es perfecta, pero las imágenes no, por lo que el resultado del OCR -sobre todo en sus primeras fases- podía ser surrealista. Como dice una de las leyes de Murphy aplicadas al diseño “El OCR (Optical Character Recognition) es una buena comedia”.

Actualmente la grafía latina de texto impreso se considera en gran medida un problema resuelto cuando tenemos una imagen clara, con una media del 99% en su precisión, por lo que ya no son necesarias las fuentes OCR. El reconocimiento de texto manual, escritura cursiva manual o texto impreso con otros caracteres idiomáticos -especialmente asiáticos- están aún en investigación.

Webocr, también conocida como base de OCR servicio Web o OCR en línea, es la nueva tendencia tanto para usuarios particulares como empresas y después de más de treinta años de desarrollo de los sistemas OCR de escritorio.

1 estrella2 estrellas3 estrellas4 estrellas5 estrellas (2 votos, promedio: 5,00 de 5)
Cargando...
1 Comentario

Los comentarios están cerrados.

Hablemos

Si tiene cualquier pregunta somos todo oídos :-)

Enviando

Inicia Sesión con tu Usuario y Contraseña

¿Olvidó sus datos?