Convertidores de texto a voz

Las personas ciegas, desde hace unas décadas, han tomado el hábito de leer utilizando grabaciones de los textos de su interés. Para ello se han utilizado multitud de formatos mediante cintas magnetofónicas, las clásicas cassettes hasta llegar a la última tecnología de sonido digital utilizando CDs en formato Daisy.

El problema de leer un texto mediante una grabación de voz era que había que esperar a que un locutor, fuese de una organización de ciegos, una persona voluntaria o una colaboración con una institución, grabase el libro en audio y se editase para su correcta lectura. Esto provocaba que un ciego debiese esperar, al menos, 12 meses desde la aparición de un libro hasta la posibilidad, no asegurada, de leerlo en cinta.

En los últimos años la tecnología ha permitido la aparición de una alternativa más que fantástica, la utilización de la síntesis de voz digital, propia de equipos informáticos, para convertir textos digitales a grabaciones sonoras.

Al principio las voces eran demasiado metálicas y monótonas, por lo que este tipo de software era utilizado por personas que realmente lo necesitasen. En la actualidad la calidad de las voces ha mejorado tanto que es utilizado por multitud de personas y servicios de atención y comunicación sonora. Es un claro ejemplo de tecnología de uso exclusivo de personas con discapacidad que se ve empujada por el creciente interés de todos los públicos por su gran utilidad.

Las voces digitales dependen de un motor de síntesis de voz, capáz de comunicarse con la tarjeta de sonido del equipo informático para reproducir los diversos sonidos encadenados que formarán las frases habladas. Además, este motor de voz tendrá encuenta reglas lingüísticas y de entonación. Pero el motor de voz necesita de unos patrones sonoros o de pequeñas grabaciones de pronunciación que permitan definir el tono, el acento y la sonoridad final que tendrá la grabación, a este conjunto de datos se le conoce como una voz para un motor de síntesis.

En los sistemas operativos pertenecientes a la familia Microsoft Windows existen unas librerías para poder utilizar diversos motores de voz de forma sencilla para aumentar la compatibilidad entre software. Estas librerías son conocidas como SAPI (Speech Application Program Interface).

Puedes obtener el motor de síntesis de voz SAPI 5.1 de la página de descarga de SAPI 5.1 aunque en las versiones actuales de Microsoft Windows, más concretamente a partir de la versión de Windows XP, SAPI 5 ya viene incluida en el sistema.

En idioma castellano hay multitud de voces gratuítas para el formato SAPI 4. Para Microsoft Windows XP/2003/Vista (últimas versiones de este sistema operativo) se utiliza, de serie, el formato SAPI 5.1. Hay pocas voces gratuítas para este formato aunque podemos utilizar la voz de Isabel para SAPI 5.1. Hay compañías, como Loquendo o Nuance, que se dedican a crear voces de calidad para terminales de atención al cliente, puntos de venta automatizados o sistemas de megafonía para estaciones de transporte y aeropuertos.

En los equipos con MacOS X, el sistema operativo de Apple para sus equipos portátiles y de sobremesa, existe integrado en el sistema un motor de voz genérico que puede ser utilizado por diversos programas y servicios del sistema. Actualmente se incluyen varias voces con diversos acentos y efectos sonoros aunque el problema es que todas las voces están en inglés. Se pueden adquirir voces para otros idiomas.

En GNU-Linux tenemos varios motores o librerías de síntesis de voz como Festival, Mbrola o una versión para GNU-Linux de Eloquence. Todos estos motores de voz se utilizan en el sistema a través de un interfazque comunique las aplicaciones del sistema con el motor de voz, un ejemplo de este tipo de interfaz es Gnome-speech.

En un equipo informático con un motor de síntesis de voz instalado, con sus correspondientes voces, podemos utilizar algunos programas especializados en convertir textos digitales a ficheros de audio. Son los programas conocidos como conversores de texto a voz. Estos programas nos permiten convertir largos textos en formato Word, TXT, RTF o PDF en un conjunto de ficheros de sonido en formato MP3 que podemos escuchar con nuestro reproductor portatil de música mientras caminamos o utilizamos el transporte público.

Una opción sencilla y gratuíta es el programa DSpeech, que funciona tanto con SAPI 4.0 y SAPI 5.1 permitiendo convertir textos a formato WAV o MP3. Puedes obtener DSpeech en castellano y valenciano de la web de Tifloinforma. Su instalación es muy sencilla ya que sólo debes descomprimir el fichero comprimido en la carpeta donde quieras guardar DSpeech y ejecutar el archivo .EXE que hay en su interior.

Para MacOS X existe el programa Ghost reader. Este programa nos permite convertir cualquier documento de texto que pueda abrir la vista previa en un fichero mp3 o m4b utilizando las voces del sistema o unas voces compatibles con este programa e incluir el resultado de la conversión directamente en nuestra librería de iTunes para poder leer el documento en nuestro iPod, iPhone o dispositivo móvil de Apple.

Touch type, teclado virtual accesible para ciegos en Android

Una de las limitaciones más importantes que existen en Android, en cuanto a accesibilidad del sistema para usuarios ciegos, es la imposibilidad de utilizar el teclado virtual en pantalla debido a las limitaciones de exploración de los elementos en pantalla a través de la pantalla táctil. Con Talkback o spiel, los dos lectores de pantallas compatibles, actualmente, con Android no se puede explorar la pantalla tocando con los dedos ya que el usuario, cuando coloca un dedo en la pantalla, activa el elemento y después de la activación la síntesis de voz verbaliza qué se ha activado. Esto provoca que el intentar escribir utilizando el teclado en pantalla sea una operación bastante compleja.

La solución ofrecida por el equipo de desarrollo de accesibilidad de Google y el proyecto Eye-free es un tanto ridícula. Oficialmente dicen que se utilice un teléfono con teclado físico o se conecte un teclado externo vía Bluetooth para poder escribir cualquier cosa. Esta solución va en contra del mercado, en el cual cada vez aparecen más teléfonos con sólo pantalla y sin botones. El conectar un teclado externo Bluetooth implica introducir una clave numérica en el terminal para emparejar los dispositivos, ¿pero, si no podemos teclear cómo introduciremos la clave de emparejamiento?

La comunidad de usuarios y desarrolladores de Android no tiene porqué conformarse con las decisiones de Google para Android. Un ejemplo de esto es el proyecto Touch type, desarrollado por un grupo de desarrollo independiente de Google.

Teclado virtual a semejanza de iPhone

Touch type es un programa para Android que permite sustituir el teclado habitual en Android por otro teclado con la particularidad de ser compatible con la síntesis de voz y accesible en la gestión de gestos en la pantalla.

El método de escritura es muy similar a uno de los métodos que ya se utilizan en el iPhone o en el iPad. Se debe arrastrar el dedo por la parte baja de la pantalla, cada vez que el dedo se coloque sobre una letra, esta será verbalizada. Si dejamos de tocar la pantalla, la letra será introducida en el campo de texto.

Para saber más sobre Touch type puedes visitar la página oficial del proyecto Touch type para Android

Esperanzas en un Android accesible para ciegos

Actualmente el proyecto Touch type está en versión beta, por lo que su funcionamiento no es del todo fiable, pero los resultados obtenidos en esta versión inicial hacen que se tengan esperanzas en tener un Android accesible para ciegos a medio plazo.

Lo que queda por hacer en accesibilidad de Android

Tras obtener una solución para el teclado virtual en Android, sólo falta que los lectores de pantallas se puedan utilizar a través de gestos en la pantalla en lugar de utilizar trackballs, cursores o touchpads, así como algunos botones de navegación. Además se debe conseguir una mayor integración de las librerías de accesibilidad para las aplicaciones disponibles en el Market de Android. Con esto podríamos decir que Android será un duro competidor de iOs en cuanto a la accesibilidad para usuarios ciegos.

En cuanto a otros perfiles de discapacidad decir que Google sigue distraída sin prestar oídos a las necesidades de otros perfiles de discapacidad.

Convivencia de MacOS X y Windows dentro del hardware de Apple

Muchos usuarios que quieren dar el salto al sistema operativo de Apple tienen miedo del periodo de adaptación. Aunque MacOS X sea muy intuitivo es cierto que requiere de un periodo de adaptación, sobre todo si el usuario tiene que acostumbrarse a un nuevo producto de apoyo. Una de las posibles soluciones, para hacer que la experiencia del switcher (denominación que se da a la persona que cambia a otro sistema operativo) no sea tan traumática es utilizar 2 sistemas operativos en la misma máquina.

Boot camp

MacOS X, en sus últimas versiones, incluye una utilidad para estos usuarios que vienen de Windows pero quieren saltar a MacOS X manteniendo el uso de Windows. Esta utilidad se llama Boot camp y permite, desde MacOS X, crear una partición en el disco duro y comenzar el proceso de instalación de windows. Todo el proceso de creación y gestión de Boot camp es accesible pero cuando comience el proceso de instalación de Windows, al reiniciar la máquina, sólo dispondremos de la accesibilidad que proporcione Windows en su proceso de instalación, lo que es muy poca o nula accesibilidad.

Al utilizar Boot camp, en Windows, deberemos instalar una serie de drivers y aplicaciones que nos permitirá aprovechar más el hardware de Apple sobre Windows. Además, nos permitirá seleccionar con qué partición arrancaremos la próxima vez que encendamos el equipo. Con esta característica un usuario ciego puede decidir si arrancar Windows o MacOS X sin necesidad de acceder a Grub, Lilo o cualquier otro gestor de arranque.

Virtualización

Con la solución de Boot camp deberemos reiniciar el equipo cada vez que queramos cambiar de sistema operativo. Esta solución puede ser apropiada para aquellos usuarios que pasen largas sesiones en un sólo sistema operativo. Para los usuarios que trabajen en MacOS X y quieran, muy puntualmente, acceder a Windows para utilizar una aplicación concreta la mejor solución pasa por virtualizar.

La virtualización de un sistema operativo consiste en utilizar una aplicación de virtualización (cliente) que permita ejecutar otro sistema operativo como si fuese un programa.

Para MacOS X hay varias soluciones de virtualización: VMWare, Parallels, VirtualBox, etc. Cada una tiene sus ventajas y defectos.

La principal diferencia entre ejecutar un sistema operativo de forma nativa, como se haría con Boot camp en el caso de Windows, es que todos los recursos de hardware están disponibles para el sistema operativo. En el caso de una ejecución virtualizada, si ejecutasemos un Windows virtualizado, sólo podríamos acceder a los recursos que el cliente de virtualización nos permita. Esto se debe, principalmente, a que los recursos de la máquina deben repartirse entre los dos sistemas operativos que se están ejecutando: el sistema operativo base o anfitrión, que ejecuta el cliente de virtualización, y el sistema operativo virtualizado.

Algunas ventajas de la virtualización es la posibilidad de almacenar instalaciones completas de un sistema operativo en discos externos. De esta forma, si nuestro Windows comienza a ir más lento o se detectan problemas de ejecución que nos hacen pensar en que tenemos que reinstalar, podemos ir a la carpeta donde nuestro cliente de virtualización guarda sus máquinas virtuales (que es como se conoce a una instalación de un sistema operativo virtualizado) y sustituir el Windows corrupto por nuestra copia de seguridad. Todo el proceso de reinstalación de Windows, más de 45 minutos, se reducen a un par de minutos. Incluso algunos clientes de virtualización permiten copiar o descargar instalaciones ya creadas.

Problemas de accesibilidad y virtualización

La ejecución virtualizada de un sistema operativo puede crear conflictos con algunos productos de apoyo. Por ejemplo, se conoce el problema que existe con VMWare, uno de los clientes de virtualización más utilizados, y la tecla de bloqueo de mayusculas, utilizada por varios lectores de pantalla como tecla de función. Además, el teclado de MacOS X no posee la tecla Insert, tecla también utilizada por varios productos de apoyo. La solución pasa por remapear la función de una de las teclas duplicadas del teclado (comando, mayúsculas, etc) y asignarle a dicha tecla la función de tecla Insert.

Un problema que afecta tanto a sistemas operativos virtualizados como nativos es la poca tolerancia del driver de vídeo de Jaws a drivers gráficos un tanto especiales. En el caso de una instalación nativa, una vez hayamos instalado los drivers de Boot camp, no encontraremos problemas. En el caso de una instalación de windows virtualizada, deberemos evitar el modificar el tamaño de la ventana del cliente de virtualización. Se recomienda utilizar Windows virtualizado a pantalla completa. Además, deberemos instalar los drivers para Windows del software de virtualización que estemos utilizando.

Conclusiones

Con estas posibilidades de ejecutar Windows y MacOS X el camino del switcher se hace más cómodo. Sólo debemos decidir si queremos 2 instalaciones nativas, para largos periodos de uso de una de ellas; o instalación nativa de MacOS X y virtualizada de Windows, por lo que Windows irá un poco más lento pero podremos saltar de un sistema operativo a otro de forma muy rápida.

Android 2.3, una decepcionante novedad en accesibilidad

A principios de este mes de Diciembre Google publicó la última versión de su sistema operativo para dispositivos móviles, más conocido como Android.

Esta nueva versión, la 2.3, cuyo nombre en clave es galleta de jengibre, prometía incluir sustanciosas mejoras en accesibilidad para aquellos usuarios con discapacidad visual.

Tras la publicación de la noticia por parte de Google, muchos de los que estamos interesados en Android y su accesibilidad consultamos la lista de novedades y mejoras de esta nueva versión. el resultado fue del todo decepcionante. Ni una sola mención a cualquier mejora o característica de accesibilidad.

En la lista de correo del grupo de usuarios del proyecto Eyes-free, donde se localiza TalkBack el lector de pantallas oficial para Android, muchos usuarios publicaron mensajes transmitiendo sus quejas y decepción ante esta aparente ignorancia de Google por las necesidades de los usuarios de Android con discapacidad visual. Hasta la fecha ningún miembro del equipo de desarrollo de Eyes-free ha dado una respuesta a las decenas de preguntas hechas por los usuarios de Talkback en la lista.

Android puede ser una buena alternativa ante el inminente monopolio que se puede crear en un futuro temprano sobre plataformas accesibles para dispositivos móviles. Symbian está muriendo lentamente, Apple, con iOS, parece ganar cada día más terreno entre los usuarios con discapacidad, alternativas como Samsung Bada o Meego siguen sin una base de accesibilidad y, el gran contrincante de Apple en sistemas operativos para dispositivos móviles, nos referimos a Google, parece que no entiende que las leyes, cada vez más, obligarán a la adquisición de dispositivos accesibles por parte de las administraciones de países y grandes corporaciones.

Un servidor no entiende, actualmente, esta posición de Google de ignorar la necesidad de una solución accesible para Android. No se sabe, a ciencia cierta, si es incapacidad del proyecto Eyes-free por aportar una solución concreta y eficiente de accesibilidad para los usuarios con discapacidad visual. El equipo de desarrolladores ha hecho un buen trabajo con Talkback pero no es un producto terminado. No permite utilizar cualquier dispositivo con Android por parte de una persona ciega, no es compatible con las aplicaciones primarias de Android, como pueden ser el navegador Web o el cliente de correo electrónico. Hay programas alternativos en el Market de Android, la tienda on-line de aplicaciones para Android, pero esto imposibilita el hecho de identificar un teléfono con Android como un dispositivo accesible desde la caja.

Parece que el culpable de este desinterés por la accesibilidad se origina en Google al ver sus más recientes lanzamientos.

Google books, para iOS, es una aplicación para iPhone e iPad que permite acceder, comprar y leer libros en la tienda de libros de Google. La aplicación resulta accesible a la hora de manipular los libros, el acceso a la tienda y falla rotundamente en accesibilidad en su principal función: no permite leer los libros con lectores de pantalla. Un usuario ciego de iPhone o iPad podrá comprar libros electrónicos, ordenarlos en su librería, borrarlos o consultar el catálogo de obras disponibles pero no podrá leer ningún libro que haya adquirido.

Google Chrome OS, el sistema operativo de Google para equipos de sobremesa, ha aparecido sin ninguna característica de accesibilidad. Por no tener, no tiene ni teclas pegajosas, campana de sistema o un tema de alto contraste por defecto.

Esperemos que Google rectifique en su postura y comprenda que la accesibilidad y el diseño para todos son sellos de calidad en los proyectos de hardware y software.