{"id":459,"date":"2016-03-01T04:00:11","date_gmt":"2016-03-01T03:00:11","guid":{"rendered":"http:\/\/www.programaraciegas.net\/?p=459"},"modified":"2016-02-27T20:39:10","modified_gmt":"2016-02-27T19:39:10","slug":"lee-imagenes-desde-tu-mac-con-tesseract-de-forma-facil-y-gratuita","status":"publish","type":"post","link":"https:\/\/programaraciegas.net\/?p=459","title":{"rendered":"Lee im\u00e1genes desde tu Mac con Tesseract de forma f\u00e1cil y gratuita"},"content":{"rendered":"<p>A veces necesitamos manipular o acceder a la informaci&oacute;n escrita de una imagen o documento con im&aacute;genes incrustadas, esto es muy habitual por ejemplo para las personas ciegas o con baja visi&oacute;n. Para estas tareas se suele utilizar una herramienta software de <strong>reconocimiento &oacute;ptico de caracteres<\/strong> o las siglas en ingl&eacute;s <abbr title=\"Optical Character Recognition\">OCR<\/abbr>.<\/p>\n<p>Estas aplicaciones de OCR han sido, hasta hace poco, bastante caras de precio pero en la actualidad, y gracias al movimiento de <em>software libre<\/em>, disponemos de buenas alternativas libres y gratuitas. El ejemplo m&aacute;s conocido es <a href=\"https:\/\/es.wikipedia.org\/wiki\/Tesseract_OCR\">Tesseract<\/a>.<\/p>\n<p>Este motor OCR fue originariamente desarrollado por <em>Hewlett Packard<\/em> para ser un software de pago, tras 10 a&ntilde;os de explotaci&oacute;n fue donado como c&oacute;digo abierto a la comunidad. Actualmente <a href=\"http:\/\/www.google.com\">Google<\/a> se encarga de su mantenimiento y su nivel de precisi&oacute;n y soporte de varios idiomas lo convierten en una buena opci&oacute;n para competir con otros motores OCR de pago.<\/p>\n<p>MacOS X, el sistema operativo de Apple para sus ordenadores de sobremesa y port&aacute;tiles, dispone de una versi&oacute;n de <strong>Tesseract<\/strong> dentro de la comunidad de desarrollo. Esta versi&oacute;n puede ayudarnos en muchos momentos a acceder al contenido textual de una imagen o recurso visual de forma r&aacute;pida y gratuita.<\/p>\n<h2>Instalaci&oacute;n de Tesseract<\/h2>\n<p>Tesseract se distribuye de forma abierta con su c&oacute;digo fuente por lo que cualquiera puede visitar la <a href=\"https:\/\/code.google.com\/p\/tesseract-ocr\/\">p&aacute;gina web del proyecto Tesseract<\/a> y bajar su c&oacute;digo fuente y compilarlo en su m&aacute;quina utilizando las diversas herramientas de desarrollo. Cuando hay herramientas de desarrollo involucradas en una tarea muchos usuarios piensan que va a ser algo imposible, no es del todo as&iacute; en todos los casos.<\/p>\n<h3>Herramientas para desarrolladores que ayudan a todo el mundo<\/h3>\n<p>Las herramientas para desarrolladores, utilizadas de forma apropiada, pueden ayudar a cualquiera. Al igual que un cuchillo puede ser utilizado para defensa tambi\u00e9n nos puede ayudar a cortar el pan o una cuerda, s&oacute;lo debemos preocuparnos por aprender a utilizarlo de forma apropiada y responsable.<\/p>\n<p>La instalaci&oacute;n de <strong>Tesseract<\/strong> puede ser muy compleja a menos que hagamos uso de una de estas herramientas para desarrolladores, hablamos de <a href=\"http:\/\/brew.sh\/index_es.html\">Homebrew<\/a>. <em>Brew<\/em> o <em>Homebrew<\/em> es un gestor de paquetes que permite instalar r&aacute;pidamente librer&iacute;as y utilidades en <strong>MacOS X<\/strong>. La mayor&iacute;a de estas utilidades y librer&iacute;as est&aacute;n relacionadas con tareas de desarrollo pero otras son utilidades del sistema para el usuario, como es el caso de <strong>Tesseract<\/strong>.<\/p>\n<p>La instalaci&oacute;n de <em>Homebrew<\/em> y <em>Tesseract<\/em> se realizar&aacute; a trav&eacute;s del terminal.<\/p>\n<p>Para instalar <em>Homebrew<\/em> simplemente abre el terminal, localizado en la carpeta <strong>Utilidades<\/strong> que est&aacute; dentro de la carpeta de <strong>Aplicaciones<\/strong>.<\/p>\n<p>Una vez abierta la ventana del terminal escribe la siguiente l&iacute;nea de comandos:<\/p>\n<p><code><br \/>\n\/usr\/bin\/ruby -e \"$(curl -fsSL https:\/\/raw.githubusercontent.com\/Homebrew\/install\/master\/install)\"<br \/>\n<\/code><\/p>\n<p>Una vez instalado <strong>Homebrew<\/strong> podemos comprobar si se ha instalado correctamente. Para ello escribimos en el terminal el siguiente comando:<\/p>\n<p><code>brew --version<\/code><\/p>\n<p><strong>Atenci&oacute;n:<\/strong> los comandos del terminal son sensibles a may&uacute;sculas y min&uacute;sculas por lo que hay que tener cuidado en c&oacute;mo se escribe cada comando.<\/p>\n<h3>Instalaci&oacute;n r&aacute;pida de Tesserac<\/h3>\n<p>Una vez instalado <strong>Homebrew<\/strong> en nuestro equipo podemos instalar <strong>Tesseract<\/strong> con soporte para m&aacute;s de 30 idiomas con un simple comando de terminal:<\/p>\n<p><code>brew install tesseract --with-all-languages<\/code><\/p>\n<p>Instalando todos los lenguajes nos aseguramos que tendremos un soporte completo para nuestro idioma.<\/p>\n<h2>Utilizando Tesseract desde la consola de comandos<\/h2>\n<p>Usar <strong>Tesseract<\/strong> desde la l&iacute;nea de comandos es tan sencillo como llamarlo indicando el fichero de imagen y el nombre del fichero donde queremos que guarde el resultado. Un ejemplo:<\/p>\n<p><code>tesseract $HOME\/Desktop\/captura.png $HOME\/Desktop\/resultado<\/code><\/p>\n<p>El anterior ejemplo utilizar&aacute; el fichero de imagen <em>captura.png<\/em>, que puede ser una captura de pantalla guardada en nuestro escritorio, y guardar&aacute; el resultado del proceso OCR en el fichero resultado.txt que se guardar&aacute; en el escritorio. El problema de este comando es que intentar&aacute; realizar el proceso primero en ingl&eacute;s. Podemos indicar el idioma simplemente con el par&aacute;metro <q>-l<\/q>. El ejemplo quedar&iacute;a as&iacute; si queremos realizar el proceso de OCR para el idioma espa&ntilde;ol:<\/p>\n<p><code>tesseract $HOME\/Desktop\/captura.png $HOME\/Desktop\/resultado -l spa<\/code><\/p>\n<h2>Desinstalar Tesseract<\/h2>\n<p>Si por alguna raz&oacute;n no queremos seguir teniendo a <strong>Tesseract<\/strong> el comando es tan simple como:<\/p>\n<p><code>brew uninstall tesseract<\/code><\/p>\n","protected":false},"excerpt":{"rendered":"<p>A veces necesitamos manipular o acceder a la informaci&oacute;n escrita de una imagen o documento con im&aacute;genes incrustadas, esto es muy habitual por ejemplo para las personas ciegas o con baja visi&oacute;n. Para estas tareas se suele utilizar una herramienta software de reconocimiento &oacute;ptico de caracteres o las siglas en ingl&eacute;s OCR. Estas aplicaciones de &hellip; <\/p>\n<p class=\"link-more\"><a href=\"https:\/\/programaraciegas.net\/?p=459\" class=\"more-link\">Continuar leyendo<span class=\"screen-reader-text\"> \u00abLee im\u00e1genes desde tu Mac con Tesseract de forma f\u00e1cil y gratuita\u00bb<\/span><\/a><\/p>\n","protected":false},"author":1,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[37,38],"tags":[262,260,255,261],"class_list":["post-459","post","type-post","status-publish","format-standard","hentry","category-herramientas-software","category-macos-x","tag-mac","tag-ocr","tag-terminal","tag-tesseract"],"jetpack_featured_media_url":"","_links":{"self":[{"href":"https:\/\/programaraciegas.net\/index.php?rest_route=\/wp\/v2\/posts\/459","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/programaraciegas.net\/index.php?rest_route=\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/programaraciegas.net\/index.php?rest_route=\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/programaraciegas.net\/index.php?rest_route=\/wp\/v2\/users\/1"}],"replies":[{"embeddable":true,"href":"https:\/\/programaraciegas.net\/index.php?rest_route=%2Fwp%2Fv2%2Fcomments&post=459"}],"version-history":[{"count":0,"href":"https:\/\/programaraciegas.net\/index.php?rest_route=\/wp\/v2\/posts\/459\/revisions"}],"wp:attachment":[{"href":"https:\/\/programaraciegas.net\/index.php?rest_route=%2Fwp%2Fv2%2Fmedia&parent=459"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/programaraciegas.net\/index.php?rest_route=%2Fwp%2Fv2%2Fcategories&post=459"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/programaraciegas.net\/index.php?rest_route=%2Fwp%2Fv2%2Ftags&post=459"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}