OCR | Reconocimiento óptico de caracteres

Recogemos en este artí­culo distintas aplicaciones, tecnologí­as y curiosidades relacionadas el Reconocimiento í“ptico de Caracteres. Para extraer el texto que ya no es texto, que es imagen, en formatos de archivo de imagen y/o pdf.

Hablaremos de:

  • Un servicio gratuito web,
  • dos aplicaciones de escritorio especí­ficas, una para fotografí­as y otra para capturas de pantalla,
  • la relación de Google con la tecnologí­a OCR, derechos de autor,
  • OCR colaborativo,
  • OCR en Adobe Acrobat,
  • Reconocimiento í“ptico Tipográfico online.

OCR Terminal | Servicio web

Servicio web gratuito:

  1. Te registras
  2. Subes la imagen o el pdf
  3. Te devuelve un archivo de texto en formato .txt o .rtf.
  4. Lo descargas o lo enví­as por email.

OCR

Dos limitaciones: máximo 30 páginas y sólo reconoce textos en inglés.

Ví­a: Convirtiendo imágenes y PDF en texto con Google OCR Terminal

TopOCR | Especializado en imágenes de cámaras digitales y smartphones

Esta app de escritorio está pensada para que en vez de que escanees los documentos los fotografí­es. En este tutorial te dan algunos consejos.

Soporta 11 idiomas, entre ellos español e inglés.

OCR

Descarga TopOCR | Windows

Ví­a: OCR Document Scanning With Smartphones [en]

JOCR | Para capturas de pantalla

JOCR es un app de escritorio gratuita para Windows útil para reconocer el texto de una captura de pantalla.

Trabaja rápido, haces la captura de toda la pantalla o de un área y JOCR copia en el portapapeles y en el bloc de notas el texto que ha reconocido en esa imagen.

Soporta varios idiomas, entre ellos inglés y español, antes del reconocimiento debes indicar el idioma del texto.

 OCR

 

Por supuesto puedes también intentar utilizar su tecnologí­a OCR para cualquier otra imagen, un documento escaneado o una fotografí­a que contenga un texto.

Descarga JOCR

Ví­a: How To Extract Text From Images (OCR) – Windows Only [en]

Google, ¿apoyando y abusando?

Google y sus soluciones:

OCR y derechos de autor

Los derechos de autor son la causa del litigio que The Authors Guild Inc. mantiene con Google. Según Guild Inc. los proyectos de las bibliotecas virtuales y digitales de Google han vulnerado los derechso de autor.

OCR

En http://www.googlebooksettlement.com/ los autores pueden reclamar dichos derechos.

Fuentes:

 

OCR colaborativo | reCAPTCHA

Este proyecto de código abierto de la School of Computer Science de la Universidad de Carnegie Mellon ofrece una tecnologí­a anti-spam al mismo tiempo que desarrolla y mejora su tecnologí­a OCR para la digitalización de libros.

El sistema es muy sencillo, los textos que su OCR no ha podido reconocer los va insertando en los millones de sitios webs que tienen este filtro anti-spam, el usuario hace el reconocimiento y el webmaster se asegura que no es un robot.

OCR

Puedes instalarlo mediante:

OCR en Adobe Acrobat

Si tienes Adobe Acrobat siempre puedes utilizar su OCR.

OCR

Tutorial en Desfaziendo Entuertos

Reconocimiento tipográfico online | WhatTheFont

Si lo que necesitas es averiguar el tipo que utiliza el texto de una imagen puedes utilizar WhatTheFont

OCR

Otros enlaces de interés:

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *