LEONARD
04-10-2012, 15:04:16
http://farm5.static.flickr.com/4118/4883579269_7a1c676ac6.jpg
Hola amigos, mas de alguna vez nos ha pasado que hemos escaneado algún documento o libro y deseamos editar su contenido, pero lamentablemente tenemos el texto del libro en formato imagen (Jpg,Gif, etc …) o simplemente con nuestra cámara de fotos le sacamos fotos a texto.
Es por eso que luego del salto les mostraremos 2 alternativas para convertir esas imágenes en texto y así poder editar la información.
Cómo extraer texto de una imagen
Utilizaremos el método conocido como OCR que sus siglas corresponden a Optical Charater Recognition, o en su traducción, reconocimiento óptico de caracteres.
Para lograr esto utilizaremos el software FreeOCR V3 el cual puedes descargar desde el siguiente enlace (http://www.paperfile.net/freeocr.exe).
Si bien, el programa es gratis, este no es tan bueno ni exacto como los programas de pagados como el ABBYY FineReader (el cual trae una versión trial por 15 días o 20 impresiones).
Una vez descargado, procederemos a instalar la aplicación, lo cual no nos traerá ningún inconveniente.
Ahora ejecutaremos nuestra aplicación y tendremos una interfaz como la siguiente.
http://farm5.static.flickr.com/4118/4883579239_09c66cfef8.jpg
Luego de abrir el programa instalaremos el idioma ESPAÑOL, ya que por defecto viene en Ingles. Para esto descargaremos el siguiente archivo (http://tesseract-ocr.googlecode.com/files/tesseract-2.00.spa.tar.gz) , luego descomprimiremos el archivo y pegaremos su contenido en la carpeta C:/FREEOCR/TESSDATA y reiniciamos nuestro programa.
http://farm5.static.flickr.com/4081/4883578719_665a8650d2.jpg
Seguido a esto haremos click en OPEN y elegimos la imagen a la cual deseemos extraer el texto.
Ahora solo nos resta marcar la opción OCR y esperaremos a ver los resultados.
http://farm5.static.flickr.com/4137/4883579151_33a36fd32e_b.jpg
Nuestra segunda opción es un servicio Web, al cual podemos ingresar por la dirección: http://www.free-ocr.com/ en donde nos encontraremos con la siguiente página.
http://farm5.static.flickr.com/4138/4884181984_e9ae65fd10.jpg
En donde marcaremos examinar, donde elegiremos la imagen a transformar en texto, luego escogemos el idioma, rellenamos el sistema de seguridad (re-captcha) y haremos click en “Send File”.
http://farm5.static.flickr.com/4096/4884182046_28c568aea9.jpg
Esperamos unos segundos y se desplegara una nueva pantalla con el texto extraído de la imagen que seleccionamos anteriormente.
http://farm5.static.flickr.com/4096/4884182156_c0377e295d.jpg
Por último les traemos una tercera y cuarta opción, las cuales también son servicios Web. Se trata de http://www.ocrterminal.com/, un sitio en el cual debemos registrarnos y se nos permitirá “scannear” hasta 20 páginas gratis, para luego cobrarnos por volumen mensual “scanneado”. Por último el sitio http://www.newocr.com/ el cual es muy similar al Free-Ocr y es completamente gratis.
Espero que este tutorial les haya sido de utilidad.
FUENTE: COMO LO HAGO
Buen post, no tenia ni idea...