Lee imágenes desde tu Mac con Tesseract de forma fácil y gratuita

A veces necesitamos manipular o acceder a la información escrita de una imagen o documento con imágenes incrustadas, esto es muy habitual por ejemplo para las personas ciegas o con baja visión. Para estas tareas se suele utilizar una herramienta software de reconocimiento óptico de caracteres o las siglas en inglés OCR.

Estas aplicaciones de OCR han sido, hasta hace poco, bastante caras de precio pero en la actualidad, y gracias al movimiento de software libre, disponemos de buenas alternativas libres y gratuitas. El ejemplo más conocido es Tesseract.

Este motor OCR fue originariamente desarrollado por Hewlett Packard para ser un software de pago, tras 10 años de explotación fue donado como código abierto a la comunidad. Actualmente Google se encarga de su mantenimiento y su nivel de precisión y soporte de varios idiomas lo convierten en una buena opción para competir con otros motores OCR de pago.

MacOS X, el sistema operativo de Apple para sus ordenadores de sobremesa y portátiles, dispone de una versión de Tesseract dentro de la comunidad de desarrollo. Esta versión puede ayudarnos en muchos momentos a acceder al contenido textual de una imagen o recurso visual de forma rápida y gratuita.

Instalación de Tesseract

Tesseract se distribuye de forma abierta con su código fuente por lo que cualquiera puede visitar la página web del proyecto Tesseract y bajar su código fuente y compilarlo en su máquina utilizando las diversas herramientas de desarrollo. Cuando hay herramientas de desarrollo involucradas en una tarea muchos usuarios piensan que va a ser algo imposible, no es del todo así en todos los casos.

Herramientas para desarrolladores que ayudan a todo el mundo

Las herramientas para desarrolladores, utilizadas de forma apropiada, pueden ayudar a cualquiera. Al igual que un cuchillo puede ser utilizado para defensa también nos puede ayudar a cortar el pan o una cuerda, sólo debemos preocuparnos por aprender a utilizarlo de forma apropiada y responsable.

La instalación de Tesseract puede ser muy compleja a menos que hagamos uso de una de estas herramientas para desarrolladores, hablamos de Homebrew. Brew o Homebrew es un gestor de paquetes que permite instalar rápidamente librerías y utilidades en MacOS X. La mayoría de estas utilidades y librerías están relacionadas con tareas de desarrollo pero otras son utilidades del sistema para el usuario, como es el caso de Tesseract.

La instalación de Homebrew y Tesseract se realizará a través del terminal.

Para instalar Homebrew simplemente abre el terminal, localizado en la carpeta Utilidades que está dentro de la carpeta de Aplicaciones.

Una vez abierta la ventana del terminal escribe la siguiente línea de comandos:


/usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"

Una vez instalado Homebrew podemos comprobar si se ha instalado correctamente. Para ello escribimos en el terminal el siguiente comando:

brew --version

Atención: los comandos del terminal son sensibles a mayúsculas y minúsculas por lo que hay que tener cuidado en cómo se escribe cada comando.

Instalación rápida de Tesserac

Una vez instalado Homebrew en nuestro equipo podemos instalar Tesseract con soporte para más de 30 idiomas con un simple comando de terminal:

brew install tesseract --with-all-languages

Instalando todos los lenguajes nos aseguramos que tendremos un soporte completo para nuestro idioma.

Utilizando Tesseract desde la consola de comandos

Usar Tesseract desde la línea de comandos es tan sencillo como llamarlo indicando el fichero de imagen y el nombre del fichero donde queremos que guarde el resultado. Un ejemplo:

tesseract $HOME/Desktop/captura.png $HOME/Desktop/resultado

El anterior ejemplo utilizará el fichero de imagen captura.png, que puede ser una captura de pantalla guardada en nuestro escritorio, y guardará el resultado del proceso OCR en el fichero resultado.txt que se guardará en el escritorio. El problema de este comando es que intentará realizar el proceso primero en inglés. Podemos indicar el idioma simplemente con el parámetro -l. El ejemplo quedaría así si queremos realizar el proceso de OCR para el idioma español:

tesseract $HOME/Desktop/captura.png $HOME/Desktop/resultado -l spa

Desinstalar Tesseract

Si por alguna razón no queremos seguir teniendo a Tesseract el comando es tan simple como:

brew uninstall tesseract

Primeros pasos con Swift

Swift es un nuevo lenguaje de programación creado por Apple buscando atraer a nuevos desarrolladores. La propia compañía lo describe en su página oficial de Swift como un lenguaje potente y sencillo de aprender.

Realmente Swift, en comparación con otros lenguajes, tiene una curva de aprendizaje menor y las herramientas proporcionadas por Apple para desarrollar con él lo hacen un lenguaje muy apropiado como primera opción para aprender a programar.

Recientemente Apple ha decidido donar su lenguaje a la comunidad de código abierto lo que permitirá a Swift estar presente en otras plataformas por lo que desarrollar una aplicación para iOS, OSX, Linux y otras plataformas será algo habitual en Swift.

Programando en Swift

Para programar en un lenguaje de programación lo primero que necesitamos son herramientas de desarrollo compatibles con ese lenguaje. Si somos usuarios del sistema operativo MacOS X sólo debemos ir a la aplicación de la Mac AppStore y descargar el entorno de desarrollo de Apple más conocido como xCode.

xCode, como otras aplicaciones específicas para una profesión, no es una herramienta sencilla de comprender con un primer vistazo pero tampoco es una tarea imposible. Iremos conociendo poco a poco esta herramienta junto con el aprendizaje de Swift en una serie de artículos publicados en este blog.

Para programar en otra plataforma distinta a MacOS X hay varias alternativas proporcionadas por la comunidad de código abierto de Swift los cuales trabajan en un compilador para varias plataformas. Actualmente el compilador funciona para el sistema operativo Linux.

Otra alternativa para ir practicando con Swift mientras aprendemos es utilizar una herramienta online creada por IBM para este objetivo. Esta herramienta es conocida como IBM Swift Sandbox y nos ofrece la posibilidad de crear y ejecutar un Playground de Swift a través de nuestro navegador web. Esta herramienta web, aunque recientemente ha solucionado algunos problemas de compatibilidad con dispositivos móviles para poder programar en cualquier momento desde cualquier lugar, presenta algunas barreras de accesibilidad relacionadas con el uso de esta herramienta por parte de usuarios de productos de apoyo por lo que se recomienda utilizar en su lugar xCode o el compilador de Swift para Linux. Esperemos que pronto esté disponible este compilador para otros sistemas operativos.

¿Qué es un Playground de Swift?

Con la creación de Swift Apple también desarrolló nuevas herramientas y conceptos que ayuden a los desarrolladores a realizar su trabajo con mayor efectividad. Una de sus creaciones es el Playground de Swift. Un Playground de Swift es un mini proyecto de aplicación que nos permite probar de forma rápida y controlada partes de código antes de que decidamos introducir ese nuevo código en nuestro proyecto de trabajo. Esto permite probar algoritmos y funciones de una forma cómoda, segura y, además, Apple ha incorporado herramientas de monitorización en los Playgrounds para obtener el rendimiento de los algoritmos ejecutados así como permitir hacer una depuración más intensa de nuestro código.

Nuestro primer programa en Swift

Supongamos que vamos a utilizar xCode para crear nuestro primer programa en Swift. Al abrir xCode aparecerá una ventana de bienvenida. En ella habrá diversos botones, entre ellos encontramos uno que nos permite empezar con un Playground de Swift de forma rápida, es el botón con el título Get started with a playground. Una vez pulsado nos pedirá que demos un nombre a nuestro fichero de Playground y seleccionar una de las plataformas para nuestro Playground: iOS, OSX o TVOS. Tras esto se nos consultará dónde guardar el fichero de nuestro Playground. Con esto xCode ya puede crear el entorno de desarrollo para que empecemos a jugar con nuestro Playground de Swift.

xCode presenta en su interfaz un area de menú con una barra de herramientas con las principales opciones de ejecución, depuración y visualización, y un area de trabajo. Los usuarios de VoiceOver pueden identificar estas zonas fácilmente si utilizan el gesto de dejar de interactuar con el item varias veces (VO+Mayúsculas+flecha arriba). Explorando la ventana desde arriba a la izquierda siguiendo la exploración hacia la derecha encontrará la barra de herramientas, identificada como Toolbar, una zona para controlar las pestañas abiertas en xcode y un area de trabajo. Este area de trabajo es identificada por VoiceOver con el título de ruta de nuestro proyecto, sería algo parecido a MyPlayground.playground split group. Interactuando con el area de trabajo encontraremos varios subcontenedores:
el editor de código, la barra de debug, la zona de debug y varias zonas relacionadas con el diseño visual de la interfaz. Esta zona puede que contenga todos, algunos o ningunos de estos subcontenedores ya que podemos modificar la visualización de xCode en las opciones del menú View de la barra de menú de xCode. Por ahora sólo nos interesa el subcontenedor donde se encuentra el editor de código, VoiceOver lo identificará con el nombre de nuestro fichero en edición; la barra de debug y el panel de debug o depuración, dentro de este panel encontraremos la opción de ejecución para nuestro Playground.

En el editor de código encontramos que ya hay escrito un código de ejemplo:


//: Playground - noun: a place where people can play
import Cocoa
var str = "Hello, playground"

Prueba a borrar todo ese código, escribir el siguiente código y pulsar el botón Execute que hay en la barra de debu:


print("Hola mundo!")

Tras ejecutar el código veremos que el texto Hola mundo! aparece en el area de depuración. ¡Enhorabuena, has creado tu primer programa en Swift!

Puede que sólo encuentres la barra de debug, identificada por VoiceOver como debug bar group y no encuentres el panel de debug, identificado por voiceOver como debug group. Esto puede suceder porque este panel de depuración se puede ocultar. Para hacer que se vea podemos entrar en la barra de debug y pulsar el botón show debug area o usar la opción de la barra de menú de xCode en el menú View o el atajo de teclado ()Comando+Mayúsculas+Y).

Un primer paso de otros muchos

Pensaréis que este programa no vale para nada pero si habéis seguido las instrucciones hasta aquí se supone que habéis adquirido los primeros conocimientos para comenzar a aprender Swift ya que ahora sabéis lo siguiente:

  • Saber escribir código y ejecutar código en un Playground
  • Usar la función print() que muestra un texto por pantalla

En futuros artículos iremos aprendiendo más cosas sobre este lenguaje de programación.

Cómo reproducir un sonido al iniciar sesión en OSX

Aunque el sistema operativo OSX posee muchas características de accesibilidad y usabilidad hay que reconocer que el número de eventos del sistema asociados a un sonido es insuficiente.

Por suerte para sus usuarios existen herramientas y aplicaciones para solucionar total o parcialmente este problema.

Sonido al iniciar la sesión

Uno de los eventos de sonido más reconocidos en el sistema operativo Windows de Microsoft es el inicio de sesión. Es habitual escuchar una fanfarria notificando que la sesión del usuario se ha abierto.

Detectar cuando sucede este evento es sencillo. Podemos lanzar una aplicación cuando el sistema operativo arranque. Para ello las preferencias del sistema posee un apartado en la que se indican qué aplicaciones se arrancarán con la sesión del usuario.

Crear aplicaciones con Automator no es demasiado complicado.

Al abrir Automator y pulsar el botón de nuevo documento debemos seleccionar aplicación como tipo de documento .

Al abrirse la interfaz de Automator nos aparece una acción ya creada con el texto Una aplicación recibe archivos y carpetas como datos de entrada. Debemos ignorar esto ya que la entrada de datos en nuestra aplicación para reproducir un sonido será ignorada.

Reproduciendo un sonido desde la terminal de OSX

Para que nuestra aplicación creada con Automator reproduzca un sonido utilizaremos un comando de la terminal de OSX que tiene esta funcionalidad. Es el comando afplay. Este comando puede reproducir sonidos en diversos formatos como AIFF, CAF o WAV.

Para poder utilizar un comando de la terminal en Automator debemos incluir una acción de tipo Ejecutar el script Shell que se encuentra dentro de la categoría utilidades de la biblioteca de acciones de Automator. Debemos añadir esta acción a nuestro flujo de aplicación de Automator, para ello debemos arrastrar el elemento Ejecutar el script Shell a la zona de acciones del flujo de trabajo (donde aparece el texto Una aplicación recibe archivos y carpetas como datos de entrada). Los usuarios de VoiceOver deben usar las funciones de arrastrar y soltar que incorpora este lector de pantallas.

Una vez que tengamos la acción añadida a nuestro flujo de Automator debemos introducir nuestro código del script para reproducir un sonido. Esto lo haremos dentro del cuadro de edición en el que por defecto viene el código cat. Debemos sustituir todo ese código por el nuestro.

Para nuestro ejemplo vamos a reproducir un sonido propio del sistema operativo. Será el fichero Blow.aiff que está en la carpeta /System/Library/Sounds/. El código sería el siguiente:

afplay /System/Library/Sounds/Blow.aiff

Una vez hecho esto podemos probar que nuestra aplicación funciona, para ello sólo debemos ejecutar nuestro flujo de trabajo desde el propio Automator utilizando la opción que se encuentra en el menú Flujo de trabajo. Nos saldrá una alerta indicando que Automator requiere acceso a los parámetros del Finder, podemos ignorar la advertencia ya que cuando demos a guardar nuestra aplicación no habrá ningún problema.

Guardamos nuestra aplicación en la carpeta de aplicaciones con el nombre que decidamos.

Ejecutando nuestra aplicación al inicio de la sesión

Con nuestra aplicación lista en la carpeta de aplicaciones ahora debemos hacer que se ejecute cada vez que el sistema se inicie. Para ello debemos ir a las Preferencias del sistema y en el panel de usuarios y grupos debemos seleccionar nuestro usuario y pulsar la pestaña items de inicio. Nos aparecerá una tabla con las aplicaciones que se abren al iniciar la sesión del usuario seleccionado y un par de botones para añadir o eliminar items de inicio.

Una vez añadida nuestra aplicación podemos cerrar las preferencias del sistema y reiniciar nuestro equipo para probar que se reproduce el sonido correctamente.

Puedes descargar el ejemplo de Sonido de inicio en formato Zip para probar y seguir el ejemplo.

Participación en las III jornadas de ingenieros de la universidad Pablo Olavide

El pasado 18 de septiembre participé en las III jornadas de ingenieros de la universidad Pablo Olavide de Sevilla. En estas jornadas se habló de tecnología, trabajo y proyectos de ingenieros para personas.

Se trataron temas tan diversos como la filosofía de trabajo para un desarrollador, software de inteligencia artificial y adquisición de conocimientos, guantes de realidad virtual, Big Data o la tecnología detrás de sensores autónomos.

Jonathan Chacón hablando sobre la tecnología para el ocio accesible

Las charlas mantuvieron un nivel tecnológico alto sin resultar incomprensible y el tono de todo el evento fue agradablemente informal.

El equipo organizador de las jornadas ha proporcionado los vídeos de las distintas intervenciones en las III jornadas de ingenieros para que todo el mundo pueda disfrutar de ellas.

Tecnología, inteligencia y accesibilidad

Mi participación se orientó en el potencial que nos ofrece las tecnologías, el concepto de inteligencia la necesidad y los beneficios de la accesibilidad y los gatitos.

Traté conceptos tan esotéricos como que una imagen sin alternativa es tan incomprensible para una persona ciega como para un módulo de inteligencia artificial que analiza contenidos en la Web. De este hecho se deduce que la accesibilidad no sólo beneficia a las personas con discapacidad.

Jonathan Chacón al comienzo de su charla de tecnología, inteligencia y accesibilidad

La acogida por parte del publico de los conceptos de diseño universal, accesibilidad como calidad del producto y la necesidad de diseñar para todos y para mañana fue bastante satisfactoria. Este hecho sigue haciéndome pensar en que, aunque los eventos y congresos de la Discapacidad por y para discapacitados son necesarios, también es necesario que la gente que sabe de accesibilidad participe en eventos y congresos de diseño, desarrollo y mercado.

Es necesario que alguien venga a decirte algo tan claro como que la accesibilidad beneficia a todo el mundo para darte cuenta de esa idea

El doctor y amigo Domingo Savio Rodriguez Baena me invitó a participar en el evento y él también coincide en mi visión de la necesidad de que estos conceptos de diseño universal, accesibilidad beneficiosa para todos y la discapacidad como característica común para todos los seres deben ser divulgados de forma más activa para que todo el mundo sea cosciente de esa realidad.

Gestos básicos de Narrador para Windows phone

Con la reciente aparición de Windows X para equipos de escritorio y portátiles cada vez está más cercana la fecha de publicación de Windows X para dispositivos móviles. Microsoft, siguiendo su programa de mejora de accesibilidad en sus productos, ya incluye de serie un lector de pantallas dentro de los servicios de accesibilidad de sus sistemas operativos. Este lector de pantallas es conocido como Narrador

Si la fórmula funciona mejor no cambiar

Narrador para Windows phone, a semejanza de otros lectores de pantalla para dispositivos móviles, utiliza un conjunto de gestos que el usuario debe hacer sobre la pantalla táctil para poder utilizar las diversas funciones de exploración que este servicio de accesibilidad proporciona.

La primera forma de exploración disponible con Narrador es la de arrastrar un dedo por la pantalla, con Narrador activado, y la síntesis de voz nos irá identificando el elemento situado bajo nuestro dedo.

Narrador también permite explorar la interfaz de la pantalla saltando entre los diversos controles de la interfaz. Para ello, al igual que sucede con Talkback y VoiceOver, deberemos usar los gestos de flick izquierda y flick derecha para saltar al elemento anterior o siguiente de la interfaz. Recordemos que un flick es un movimiento lineal de un dedo sobre la pantalla de forma rápida y seca como si estuviésemos limpiando una mota de polvo sobre la pantalla táctil.

Una vez hayamos localizado un botón, cuadro de textos o el control que estemos buscando podemos activar dicho control realizando el gesto de doble tap. Este gesto consiste en hacer una doble pulsación rápida con un dedo sobre la pantalla.

También podemos mantener una pulsación del dedo sobre el elemento que queramos activar y tocar la pantalla con otro dedo para simular el gesto de doble tap a semejanza del gesto de VoiceOver para iOS.

Granularidad o modos de exploración

Los lectores de pantallas proporcionan funciones para que un usuario pueda explorar un contenido utilizando distintos niveles de información: caracter a caracter, palabra a palabra, frase a frase, etc. Además pueden identificar ciertas marcas semánticas y saltar entre ellas como encabezados, contenedores, listas, botones, etc.

En el caso de los lectores de pantalla para dispositivos móviles, debido a sus limitaciones de interfaz al estar obligado el usuario a manejar el lector de pantallas mediante gestos la solución para modificar el nivel de exploración es incluir un selector de granularidad. En el caso de VoiceOver es el conocido como rotor y en Talkback se han incluido gestos para modificar esta granularidad.

En el caso de Narrador tenemos dos gestos para modificar el modo de exploración. Para modificar el nivel de exploración deberemos usar los gestos de flick arriba con un dedo o flick abajo con un dedo. Una vez modificado el modo de exploración deberemos usar los gestos de flick izquierda con un dedo y flick derecha con un dedo para explorar la pantalla con el modo de exploración seleccionado.

Desplazando la pantalla

En los dispositivos móviles se utilizan, en muchas ocasiones, interfaces más grandes que la pantalla del dispositivo por lo que es necesario desplazar el área de visualización en una dirección. Para realizar este movimiento de scroll debemos hacer un gesto de flick con dos dedos en la dirección contraria en la que queramos mover la pantalla. Por ejemplo, para mover el foco de visualización hacia abajo debemos hacer un gesto de flick con dos dedos de abajo hacia arriba como si arrastrásemos la pantalla de abajo hacia arriba.

Accesibilidad casi desde el principio

Narrador se puede configurar para que esté activo con el arranque del dispositivo como sucede también en los dispositivos iOS y Android.

Podemos también activar y desactivar Narrador mediante una combinación de teclas, aunque esta combinación, en mi opinión, no es muy acertada debido a que requiere que una tecla virtual de la pantalla deba ser pulsada obligando a una persona ciega a memorizar la posición de dicho botón virtual en su pantalla impidiendo que una persona ciega que no haya explorado el dispositivo antes pueda identificar dicha posición antes. La combinación de teclas para arrancar narrador es mantener pulsada la tecla virtual inicio y la tecla física de subir volumen.

Además de que la combinación de teclas puede ser compleja de reproducir por una persona ciega a causa de la tecla virtual tenemos el problema de que, por defecto, esta combinación de teclas está desactivada por defecto y es necesario activarla dentro del apartado de accesibilidad en la configuración del dispositivo.

Más teclas, más funciones y más accesibilidad

Narrador ofrece más gestos y funciones para explorar la interfaz de una aplicación. Todas estas funciones adicionales pueden consultarse en el manual de Narrador disponible desde la sección de accesibilidad en la configuración del dispositivo.

Narrador abre más posibilidades a las personas ciegas a la hora de elegir y utilizar otras plataformas de dispositivos móviles. Aunque en algunas funcionalidades pueda ser más pobre que su competencia para Android o iOS Narrador tiene la virtud de ser ejecutado como un servicio del sistema operativo y utilizar unas voces de Microsoft con muy buena calidad.

Comandos y conceptos básicos de VoiceOver para AppleWatch

Como Apple nos tiene acostumbrados, la aparición de su nuevo dispositivo, el Apple watch, ha salido a la venta con diversas características de accesibilidad disponibles desde que sacamos el producto de su caja. Entre estas características está la presencia de VoiceOver, el lector de pantallas de Apple para sus dispositivos con sistema operativo OSX, iOS y ahora WatchOS.

VoiceOver permite a una persona saber qué hay en la pantalla de un dispositivo simplemente tocando ese área y escuchando la síntesis de voz que VoiceOver utiliza para comunicarse con los usuarios. En el caso de VoiceOver para Apple watch es una versión reducida de la versión que ya disfrutamos en los dispositivos iPhone e iPad. Esto se debe a las limitaciones de potencia del Apple watch y a la diferencia de concepto de uso de este reloj inteligente.

Breve descripción básica del Apple watch

El Apple watch es un reloj de muñeca cuya superficie es por completo una pantalla táctil.

Colocando el dispositivo en nuestra muñeca izquierda y mirando hacia la pantalla encontramos que la totalidad de su frontal es liso ya que presenta una pantalla táctil que ocupa casi toda su superficie.

En su canto derecho encontramos dos elementos físicos:

  • La corona: es una pequeña rueda que puede ser girada hacia arriba o hacia abajo o presionada hacia adentro.
  • El botón de amigos: el cual da acceso a una serie de funciones especiales del reloj

En su canto izquierdo, por la parte superior, encontramos una pequeña ranura la cual es el altavoz del dispositivo.

Activando y desactivando VoiceOver

Para activar o desactivar VoiceOver simplemente debemos presionar tres veces rápidamente la corona del Apple watch.

En el Apple watch no es lo mismo tocar y presionar la pantalla

Apple ha desarrollado una tecnología llamada Force touch la cual permite identificar si el usuario está tocando la pantalla o está ejerciendo una presión sobre la pantalla. De esta forma un usuario puede tocar un botón presionarlo permitiendo al desarrollador diseñar diferentes reacciones a cada gesto del usuario.

En el caso de los gestos básicos de VoiceOver todos los gestos consisten en toques en la pantalla por lo que, en principio, no hay que realizar presiones sobre la misma para controlar a voiceOver.

Navegación básica en el Apple watch

Las versiones de VoiceOver permiten explorar una pantalla táctil simplemente arrastrando el dedo por la pantalla. Los usuarios de VoiceOver pueden explorar la pantalla de su Apple watch de esta forma conociendo la zona en la que se encuentra un control e, incluso, deduciendo el tamaño de dicho control.

VoiceOver para Apple watch también incluye dos gestos básicos para explorar los distintos elementos en pantalla simplemente saltando al siguiente elemento focalizable o al elemento anterior. Para ello debemos utilizar los gestos de flick a la izquierda o derecha. Un gesto de flick es un movimiento seco y corto en la pantalla táctil realizado con un dedo como si dibujásemos una línea recta corta en pantalla o limpiásemos la pantalla de una pelusa o mota de polvo. Con estos dos gestos lo que haremos es mover el foco de VoiceOver para poder interactuar con los distintos botones y controles que aparecen en la pantalla de nuestro dispositivo.

Una vez focalizado un botón o control podemos hacer diversas acciones con dicho control. La acción más básica es activar el control o hacer tap sobre él. Para activar un control con VoiceOver debemos hacer el gesto de doble tap, esto consiste en pulsar dos veces la pantalla en un tiempo aproximadamente menor a 1 segundo.

No hay rotor para VoiceOver para Apple watch pero si hay acciones

Debido a que el Apple watch es un dispositivo diseñado para realizar operaciones rápidas o consultas muy concretas se han reducido las capacidades de exploración y de funcionalidad de las interfaces para este dispositivos. Esto implica que la capa de accesibilidad también se ha reducido para no sobrecargar el proceso de ejecución del dispositivo. Con ello algunas funcionalidades más complejas de VoiceOver, como el rotor, han sido eliminadas en esta versión. Además, el gesto necesario para manipular el rotor de VoiceOver es muy complejo de realizar en una pantalla táctil de las dimensiones ofrecidas por el Apple watch.

Pero el que el rotor de VoiceOver no esté disponible no implica que podamos utilizar una de las funciones más útiles incluidas en este rotor: el menú de acciones. El menú de acciones consiste en poder realizar más de una función sobre uno de los elementos focalizados. Esta función del menú de acciones se asemeja a un menú contextual por el cual, y a modo de ejemplo, podríamos realizar una serie de acciones sobre un mensaje elegido de una lista como por ejemplo eliminarlo, volverlo a enviar, marcarlo como no leído, etc.

Para usar este menú de acciones sólo debemos focalizar un control o botón de la interfaz bien arrastrando el dedo por la pantalla o usando los gestos de flick a izquierda o derecha. Una vez focalizado el control o elemento debemos seleccionar la acción usando los gestos de flick arriba o flick abajo. Una vez seleccionada la acción sólo debemos activarla con el gesto de doble tap

Moverse entre páginas

La interfaz de Apple watch puede presentar distintas vistas o páginas en horizontal o vertical. VoiceOver nos permite movernos entre estas páginas con un gesto de flick con dos dedos para saltar a la página superior, inferior a la izquierda o derecha.

Como ejemplo indicar que en la pantalla de esfera del reloj podemos ir a la ventana de notificaciones con el gesto de Flick con dos dedos de arriba a abajo y podemos ir a la ventanas de vistazos con el gesto Flick con dos dedos de abajo a arriba.

Además los gestos de flick con dos dedos hacia abajo y hacia arriba nos permiten movernos o hacer scroll vertical en aquellas pantallas más grandes que la pantalla del dispositivo como podría ser un listado de tweets, una lista de eventos o mensajes, etc.

Subir y bajar el volumen de VoiceOver

El poder manipular el nivel de volumen de la voz sintética de un lector de pantallas es una de las funciones más indispensable para una persona ciega que utiliza lectores de pantalla. Por este hecho VoiceOver para Apple watch incluye gestos para modificar el nivel de volumen de la voz.

Para subir el volumen debemos hacer un gesto de doble tap con dos dedos en la pantalla manteniendo la pulsación en el último tap para luego subir los dedos hacia arriba.

Para bajar el volumen debemos hacer el mismo gesto de doble tap con dos dedos para luego bajar los dedos por la pantalla.

Para saber cuánto tiempo debemos mantener el segundo tap VoiceOver emitirá un breve sonido indicando que es el momento de arrastrar los dos dedos hacia arriba para subir el volumen o hacia abajo para bajar el volumen.

Modo de navegación por corona

VoiceOver nos permite sustituir los gestos de flick izquierda y flick derecha por giros en la corona del reloj. Para ello debemos activar el modo de navegación por corona. Para activar y desactivar este modo sólo debemos hacer un gesto de triple tab con dos dedos.

Modo byPass

A veces una aplicación o elemento no es compatible con el modo de activación de VoiceOver. Para evitar esta barrera de accesibilidad VoiceOver nos permite activar temporalmente un modo de funcionamiento por el cual el toque o gesto que realicemos a continuación en la pantalla táctil del dispositivo no será controlado por VoiceOver. Es lo que se llama modo byPass. Para activar este modo sólo debemos realizar el gesto doble tap mantenido con un dedo.

Resumen de gestos

A continuación podemos ver una tabla resumen con los gestos básicos disponibles para VoiceOver en el Apple watch.

Gesto Descripción
Flick izquierda Saltar al elemento anterior con el foco de VoiceOver
Flick derecha Saltar al elemento siguiente con el foco de VoiceOver
Doble tap Activar el botón, control o acción del elemento focalizado por VoiceOver
Flick arriba Seleccionar la acción anterior para el elemento focalizado
Flick abajo Seleccionar la acción siguiente para el elemento focalizado
Flick con dedos de izquierda a derecha Saltar a la página a la izquierda
Flick con dos dedos de derecha a izquierda Saltar a la página a la derecha
Flick con dos dedos de arriba a abajo Saltar a la página superior o hacer scroll hacia arriba
Flick con dos dedos de abajo a arriba Saltar a la página inferior o hacer scroll hacia abajo
Doble tab mantenido con dos dedos y arrastre hacia arriba Subir el volumen de VoiceOver
Doble tap mantenido con dos dedos y arrastre hacia abajo Bajar el volumen de VoiceOver
Triple tap con dos dedos Activar o desactivar el modo de navegación por corona
Doble tap mantenido Modo byPass