Cómo crear una voz sintética con tu propia voz en macOS

La voz es una parte esencial de la identidad. No solo transmite información, también comunica personalidad, intención, estado de ánimo y cercanía. Por ese motivo, la posibilidad de conservar la voz y usarla como voz sintética en un ordenador no es un simple capricho tecnológico: es una herramienta con impacto real en autonomía, accesibilidad y dignidad, especialmente para personas que pueden perder la capacidad de hablar o que necesitan apoyos de comunicación.

También las personas con trastorno del espectro autista u otros perfiles de discapacidad cognitiva se pueden beneficiar de esta característica al incluir la voz de un familiar o un terapeuta de confianza para la persona. De esta forma la atención y la seguridad se unen a los beneficios de esta característica.

En el ecosistema de Apple podemos encontrar Personal Voice, más conocido como Voz personal, una función de accesibilidad que permite crear una voz sintética a partir de las grabaciones de una voz humana real.

Esta voz puede ser utilizada en el sistema para las notificaciones, el servicio de Live Speech (Voz en tiempo real) o para VoiceOver, el lector de pantallas de Apple.

Requisitos y consideraciones antes de empezar

En macOS Personal Voice está disponible solo en ordenadores con procesadores Apple silicon, y no está disponible en todos los idiomas o regiones. Además, Apple indica que para crear una Voz personal en el Mac necesitas tener contraseña de inicio de sesión configurada, ya que se solicita durante el proceso de creación.

Aunque el proceso oficialmente dura pocos minutos, este tiempo dependerá de la versión del hardware y del sistema operativo que estemos utilizando.

Crear tu voz paso a paso

En el menú de ajustes del Mac, debemos ir al apartado de accesibilidad y allí buscar la opción de Voz personal.

Dentro encontraremos el botón Crear una voz personal. Este botón comienza el proceso de creación.

Además en esta pantalla encontramos información sobre esta característica de accesibilidad, cuántas voces tenemos creadas, si queremos compartir nuestra voz con todos nuestros dispositivos de Apple y si queremos que nuestra voz pueda ser utilizada por otras aplicaciones como, por ejemplo, aplicaciones de lectura de libros.

El proceso de creación

Al pulsar el botón de Crear una voz personal daremos comienzo al proceso de creación.

Al comenzar el proceso de creación el sistema te guiará por una grabación de frases. El objetivo de estas lecturas es capturar suficientes muestras para que el modelo genere una voz que se parezca a la voz original.

Se puede grabar con el micrófono integrado del Macbook, pero se recomienda un micrófono externo o unos auriculares con micrófono integrado ya que con mejor calidad en la grabación obtendremos mayor calidad en la voz resultante.

Aparecerá la petición de autenticación en tu cuenta de iCloud. Tras identificarnos aparecerá un diálogo con información sobre el proceso:

Grábate,

Tendrás que leer en voz alta un conjunto de 10 frases.

Genera tu voz personal,

El Mac creará tu voz personal y la almacenará de forma segura.

Usa tu voz personal,

Usa la voz en tiempo real para decir lo que escribas.

Si has creado una voz personal, también la podrás usar con las funciones de lectura y voz, VoiceOver y las apps de comunicación aumentativa.

Y unos botones para cancelar y continuar.

Apple también contempla la posibilidad de pausar y retomar el proceso, guardando el progreso para continuar en otro momento.

Al pulsar el botón de Continuar deberemos seleccionar el idioma para realizar la grabación.

En el momento de escribir este artículo los idiomas disponibles son: inglés de Estados unidos, español de México y chino mandarín de China continental.

En nuestro caso elegiremos español y volveremos a pulsar en Continuar.

En el siguiente paso el sistema nos pregunta por el nombre que le daremos a la voz.

Luego se necesita realizar una descarga de un contenido previo para la grabación de 1Gb. Debemos esperar a que termine la descarga.

Si se necesita configurar algún aspecto de la red se puede volver al proceso al abrir de nuevo los ajustes del Macbook, accesibilidad y de nuevo entrar en el panel de Voz personal.

En la lista de voces veremos nuestra voz en un estado similar a quedan 10 frases por grabar.

Al terminar de grabar las frases el procesamiento se realizará de forma segura en el propio dispositivo y el sistema te avisará cuando la voz esté lista para usarse.

Durante el proceso de grabación tendremos que verbalizar frases del tipo: Estoy creando una voz personal con mi Mac, ¿Te gusta coleccionar pósters de películas?, .

En el caso de utilizar lector de pantallas es recomendable que utilicemos auriculares para evitar que la voz de VoiceOver se mezcle con la grabación.

Cada vez que grabemos una de las frases, pulsando el botón de grabar, podemos escuchar el resultado o pasar a la siguiente frase.

Una vez terminado el proceso de grabación se mostrará un mensaje del tipo:

Recibirás una notificación,

Cuando se haya terminado de generar tu voz personal, recibirás una notificación. El proceso no debería tardar más de un minuto..

Recomendaciones prácticas para una mejor calidad

Aunque el sistema guía el proceso, la calidad final suele mejorar cuando se graba en un entorno silencioso y estable, se mantiene una distancia constante al micrófono y se evita cambios bruscos de postura.

También ayuda leer con una dicción natural, sin forzar un tono de locutor, porque el objetivo no es interpretar, sino capturar la voz cotidiana. Si se tiene fatiga vocal, es preferible pausar y continuar más tarde; Apple permite retomar la grabación sin perder el progreso.

Uso de nuestra voz personal

Una vez creada la voz podemos activarla para compartirla entre todos nuestros dispositivos y con otras aplicaciones.Podemos realizar una prueba con la función de Voz en tiempo real que aparece en los ajustes de accesibilidad de nuestro Mac. Para ello en el campo de idioma dejamos el valor de Idioma de voz del sistema y como voz seleccionamos el nombre de nuestra voz personal.En el campo de frases para hablar introducimos el texto que queremos verbalizar y pulsamos el botón Hablar o pulsamos la tecla enter.

Creación de la voz en otros dispositivos

Este proceso también se puede completar en un iPhone, un iPad o unas Apple Vision Pro. Se recomienda realizar, en cambio, el proceso en el Mac porque el procesador es más potente y se pueden utilizar micrófonos externos con mayor facilidad.

Se puede consultar la ayuda oficial de Apple para la creación de voces en su portal de soporte.

Cómo usar la voz de VoiceOver con AppleScript para nuestros scriptss

Otra función muy útil para aquellos usuarios de VoiceOver es la de poder utilizar la voz de VoiceOver para dar mensajes.

Con esta función podremos utilizar la voz por defecto de VoiceOver para verbalizar un mensaje pero si VoiceOver no está disponible utilizará la voz del sistema.


on sayWithVoiceOver( textToSay )
try
tell application "VoiceOver"
output textToSay
end tell
on error
say textToSay
end try
end sayWithVoiceOver

Cambio automático de idioma para la voz de VoiceOver en MacOS High Sierra

Una de las novedades de High Sierra para VoiceOver es la posibilidad de que el propio VoiceOver cambie el idioma de la voz para que un texto sea leído con una voz en el idioma apropiado.

Esta característica es ya conocida en otros lectores de pantalla como NVDA, JAWS o el propio VoiceOver para iOS pero Apple no la ha incorporado para la versión de VoiceOver para MacOS hasta esta versión High Sierra.

Activar esta característica en VoiceOver para MacOS

Para activar el soporte de cambio automático de idioma debemos ir al menú rápido de control de características de voz. En el artículo menú rápido de características de voz o rotor en MacOS High Sierra para VoiceOver se puede conocer cómo acceder a este menú en MacOS High Sierra.

En el item de Voz debemos ir subiendo o bajando por el menú con la combinación de teclas mayúsculas+Control+ALT+Comando+ flecha arriba o abajo hasta encontrar el elemento Seleccionar automáticamente en función del idioma.

Una vez seleccionado ese elemento se activará la característica de cambio automático de idioma para VoiceOver en MacOS.

Para desactivar esta característica simplemente debemos realizar la misma operación que para activarla pero eligiendo en su lugar nuestra voz preferida en lugar del elemento Seleccionar automáticamente en función del idioma.

Probando su efectividad

Activando el modo de selección automática de voz de VoiceOver al leer los siguientes tres párrafos debería poder comprobarse el cambio de voz para adaptarse al idioma.

This text is written in English.

Este texto estáescrito en castellano.

Ce texte est écrit en français

menú rápido de características de voz o rotor en MacOS High Sierra para VoiceOver

En versiones anteriores de MacOS, el sistema operativo de Apple para ordenadores de escritorio y portátiles, los usuarios de VoiceOver podían modificar rápidamente características de la síntesis de voz en uso utilizando las combinaciones de teclas Control+ALT+Comando+flecha izquierda o derecha. Esta combinación nos permitía cambiar la voz en uso, su velocidad, tono, entonación y volumen.

Con la aparición de MacOS High Sierra ahora al usar dicha combinación de teclas VoiceOver lo que hace es cambiar el elemento del rotor, por ejemplo, cambiando entre navegación, caracteres, palabras o puntos de la ventana.

Para poder cambiar las características de la voz de VoiceOver en MacOS High Sierra simplemente tenemos que añadir la tecla de mayúsculas a la combinación de teclas anterior. Siendo que con Mayúsculas+Control+ALT+Comando+flecha izquierda o derecha accedemos al menú rápido para modificar las características de la voz y con Control+ALT+Comando+flecha izquierda o derecha accedemos al menú del rotor.

Los conflictos entre usuarios y los diccionarios de pronunciación de las síntesis de voz

Los usuarios con discapacidad visual severa habitualmente utilizan para acceder a sus dispositivos electrónicos un producto de apoyo conocido como lector de pantalla. Este tipo de software utiliza habitualmente una voz sintética para transmitir al usuario ciego la información del dispositivo.

Estas voces sintéticas o síntesis de voz suelen utilizar un diccionario de reglas y un conjunto fonético apropiado para el idioma del usuario. Incluso hay distintas versiones de un mismo idioma según la región como por ejemplo inglés de Estados unidos, británico o australiano así como español de España, de Méjico o español de Estados unidos.

Problemas de dicción y pronunciación

Algunos fabricantes de voces sintéticas utilizan locutores para grabar las voces originales y, tras un laborioso proceso de digitalización y análisis, se obtiene un cuadro fonético para crear los sonidos base para pronunciar los diversos contenidos textuales.

Algunas voces sintéticas son famosas por su calidad pero también las hay famosas por sus errores de dicción. Estos errores pueden originarse por un problema del locutor o por un error en el análisis previo de la información sonora. Por ejemplo, es conocido un error en una de las voces de la empresa Acapela group a la hora de pronunciar el monema type. En lugar de pronunciar tipe o táip se podía escuchar un silbido. Esto se debió a un error de asignación para el valor ype o type al que asignaron los fabricantes un tiempo concreto de la grabación en el que el locutor silbó para grabar posibles elementos para aportar emotividad a la síntesis de voz utilizando grabaciones de carcajadas, lloros, silbidos y demás.

Otro gran problema de pronunciación se origina en el diccionario de pronunciación que incluyen muchas voces. Este servicio es incluido por los fabricantes para aportar un poco de inteligencia a su síntesis de voz. El problema es que normalmente no hay un mecanismo para desactivar este diccionario de pronunciación interno y encontramos que algunos lectores de pantalla, al encontrar las siglas VB refiriéndose a Visual Basic la síntesis de voz pronuncia visto bueno. Otro problema conocido es el de signos de puntuación o caracteres no alfabéticos. Por ejemplo, es conocido el problema en OSX a la hora de pronunciar el carácter arroba (@), en lugar de pronunciar el carácter en castellano pronuncia algo parecido a alas.

Por último indicar un grave problema relacionado con la pronunciación de siglas, números romanos expresiones matemáticas imposibles o palabras en otros idiomas. Algunos ejemplos de estos problemas podemos encontrarlos a la hora de recorrer la agenda de contactos, por ejemplo, Carlos Vicente,al tener un nombre muy largo sólo se mostrará en la agenda como Carlos V y el lector de pantallas pronunciará Carlos quinto. Una versión de una voz sintética para Windows dejaba de funcionar si encontraba una expresión matemática imposible como era el ordinal femenino de 0 (0 ª). Podía pronunciar primera, segunda, tercera, … pero la expresión cerera no existe. Una voz sintética para Linux era incapaz de pronunciar, utilizando la voz en inglés o español, ciertas palabras en alemán u holandés donde se encontraban varias consonantes consecutivas sin ningún tipo de vocal. La síntesis de voz terminaba por marcar un error de ejecución y cerraba el lector de pantallas.

Soluciones a estos problemas

En un primer lugar el usuario puede transmitir al fabricante de la voz sintética y del lector de pantallas el problema. En el caso de no hacer caso como sucede con Apple, Freedom scientific o Acapela, podemos personalizar nuestro propio diccionario de pronunciación.

Los lectores de pantalla más avanzados suelen incluir una característica de personalización para el usuario para la corrección de errores de pronunciación. Así el nombre Jonathan podría pronunciarse correctamente como Yónathan.

Los lectores de pantallas más comunes para equipos de escritorio como JAWS, NVDA, Orca, VoiceOver o Dolphin Hal incluyen esta característica.

Instalar voces en OSX Lion

Ayer Apple publicó la nueva versión de su sistema operativo para ordenadores portátiles y de sobremesa, el conocido como OSX Lion o OSX 10.7. Esta nueva versión del sistema operativo de Apple trae numerosas novedades relacionadas con la accesibilidad pero la más notable de ella es que incluye voces en 23 idiomas.

Estas nuevas voces, entre las que se incluyen 2 voces para español de España y 2 voces para español de Latinoamérica, se ofrecen en 2 formatos: compact y normal. La versión compact es una voz de menor calidad de audio aunque su peso y agilidad es mayor que la versión normal, de mayor calidad. Esta versión compact, para el idioma por defecto de la instalación, es la que aparece instalada tras reiniciar el equipo durante el proceso de instalación o actualización del mismo a OSX Lion.

Instalar más voces en OSX Lion

Todas las voces de OSX Lion ofrecidas por Apple son gratuitas ya que se distribuyen bajo la licencia de compra de OSX Lion por lo que no deberemos pagar más por estas nuevas voces.

El proceso de instalación de estas nuevas voces puede resultar un tanto confuso al principio pero aplicando un razonamiento lógico puede que comprendamos las decisiones tomadas por Apple para aplicar el procedimiento para su correcta instalación.

Las voces son parte del sistema, como cualquier elmento del sistema en OSX Lion, su gestión tiene un representante en las preferencias del sistema por lo que deberemos ir hasta allí. Para ello podemos hacer click en la manzana de la esquina superior izquierda de la pantalla o pulsar Control+F2 para que el cursor vaya hasta la barra de menú. Debemos bajar hasta la opción preferencias del sistema ….

Una vez activada esta opción se nos abrirá el panel de preferencias del sistema. Recordemos que queremos manipular voces para nuestro equipo, por lo tanto, deberemos buscar algo relacionado con las voces. Una de las opciones del panel de preferencias del sistema se llama habla, resulta lógico que las voces se gestionen desde este apartado.

Al abrir el elemento del panel de preferencias del sistema relacionado con el habla nos aparecerá una serie de elementos relacionados con la voz del sistema. Entre ellos encontramos un botón desplegable etiquetado como voz del sistema. Al activar este botón se desplegará una lista con las voces disponibles en el sistema. La última opción de esta lista se denomina Personalizar …. Esta opción nos permite acceder a una nueva ventana en la que nos aparecerá una tabla ordenada en secciones de idioma donde encontraremos un listado con todas las voces disponibles para OSX Lion.

Podemos ir seleccionando las voces que queramos instalar activando o desactivando los diversos elementos presentes en la tabla de voces. Los usuarios de VoiceOver podrán activar o desactivar los elementos de la tabla con la combinación de teclas Control+Opción+Espacio. Una vez seleccionadas las voces que queramos instalar buscaremos, fuera de la tabla, el botón aceptar para comenzar la descarga. También podemos usar el botón reproducir para escuchar una breve demostración de la voz antes de descargarla.

El proceso de descarga es similar al proceso de instalación de algunas aplicaciones empaquetadas (MPKG) que requieren la aceptación de una licencia de uso. Tras la aceptación de la licencia comenzará la descarga y la instalación de las voces.

El proceso de descarga puede resultar lento ya que los servidores de Apple, estos días, están un tanto saturados ya que la mayoría de usuarios estamos descargando complementos y actualizaciones. Por esta razón y dado el peso de las voces es recomendable instalar las voces de 2 en 2. De esta forma podremos ir disfrutando de las voces más rápidamente ya que las nuevas voces sólo se activan tras terminar el proceso de descarga que haya abierto.

Tendencias en OSX Lion

Este artículo puede resultar ofensivo para algunos lectores al utilizar un estilo de redacción apoyado en explicaciones de guía utilizadas, comúnmente, para niños. No es objetivo de este autor el ofender sino el transmitir el hecho de que Apple quiere llevar al panel de preferencias del sistema la misma filosofía que la que se sigue en iOS, el sistema operativo de Apple para dispositivos móviles, en su apartado de ajustes en el que se controlan las personalizaciones y complementos del sistema y aplicaciones. Apple quiere que pensemos, antes de buscar por cualquier sitio del sistema, que si necesitamos un complemento o personalización busquemos en las preferencias del sistema. Esto se debe a que OSX Lion ofrece más áreas de usuario que sus versiones anteriores. El usuario puede perderse buscando por el Dashboard, escritorios virtuales, el LaunchpadMission control, el Finder o demás elementos del interfaz de OSX.