jueves, 20 de noviembre de 2008

OCR (Reconocimiento Óptico de Caráceres)

El PDF trabaja por capas que son de arriba a abajo: -multimedia, texto imagen, texto, imagen vectorial, imagen bmp, soporte de formato.
Un PDf puede conntener de una capa a todas las capas.

Ejemplo: Cuando vemos una una imagen impresa y vemos una letra dos veces, a primera vista parece un texto normal, pero a nivel PDF una es una imagen que no se puede modificar.
Si queremos pasar el texto imagen a texto, se hace mediante un proceso llamado OCR, abriendo el PDF con el programa Adobe Acrobat y señalamos el texto imagen, vamos a documento, reconocer texto OCR, y Star, y así se guarda como texto.

Etiquetas:

0 comentarios:

Publicar un comentario

Suscribirse a Enviar comentarios [Atom]

<< Inicio