Estructura del contenido en una página HTML

En los artículos anteriores vimos la estructura general de un documento HTML, qué papel tiene el elemento <head> y cómo el <body> representa el contenido con el que el usuario interactúa.

En este artículo vamos a profundizar en cómo se organiza ese contenido dentro del <body> para que sea comprensible, navegable y accesible: hablaremos de landmarks (regiones), de secciones y de encabezados. La idea es construir una página que no solo se vea bien, sino que esté estructurada de forma que un lector de pantalla, un teclado o cualquier tecnología de asistencia pueda recorrerla como si fuese un mapa.

Estructura dentro del body

Cuando una página crece (menú, buscador, contenido, barras laterales, pie, etc.), el usuario necesita referencias para no perderse.

Visualmente se resuelve con columnas, cajas, colores y tamaños de letra. Pero para accesibilidad lo importante es la semántica, es decir: qué es cada zona y qué función cumple.

Para eso HTML nos ofrece elementos para definir regiones (<header>, <nav>, <main>, <footer>, <aside>), elementos para definir secciones (<article>, <section>) y encabezados: <h1> … <h6> para expresar jerarquía y permitir navegación por títulos de los contenidos.

Cuando se usan bien estas piezas, muchos lectores de pantalla permiten saltar por regiones (landmarks) y por encabezados de forma inmediata. Además, las herramientas de ayuda a la navegación para personas con discapacidad cognitiva entienden mejor la estructura de los contenidos y pueden ofrecer una mejor asistencia a los usuarios con discapacidad.

Landmarks

Los landmarks (regiones) son zonas del documento lo bastante importantes como para que el usuario quiera ir directamente a ellas (por ejemplo: navegación, contenido principal, pie).

A nivel técnico, se exponen como roles/landmarks en el árbol de accesibilidad.

En HTML moderno, muchos landmarks se consiguen sin ARIA, solo usando elementos semánticos:
• <header> (a nivel de página) suele exponerse como banner.
• <nav> como navigation.
• <main> como main.
• <aside> como complementary (contenido complementario).
• <footer> (a nivel de página) como contentinfo.

Importante matiz: el contexto importa. Por ejemplo, un <header> dentro de un <article> deja de ser landmark banner y pasa a ser un contenedor genérico, precisamente para evitar ruido y duplicidades.

Ejemplo de una estructura típica con landmarks y secciones

El siguiente ejemplo presenta una plantilla mental de cómo dividir una página en regiones y cómo dar sentido a cada bloque.

<body>

<a class=skip-link href=#contenido>Saltar al contenido principal</a>

<header>
<h1>Programar a ciegas</h1>
<p>Accesibilidad, usabilidad y desarrollo.</p>
</header>

<nav aria-label=Navegación principal>
<a href=/>Inicio</a>
<a href=/articulos/>Artículos</a>
<a href=/contacto/>Contacto</a>
</nav>

<main id=contenido>
<article>
<header>
<h2>Estructura del contenido en HTML</h2>
<p>Publicado el 1/01/2026</p>
</header>

<section>
<h3>¿Qué son los landmarks?</h3>
<p>
Los landmarks son regiones que ayudan a moverse por la página sin leerla de forma lineal.
</p>
</section>

<section>
<h3>Encabezados y jerarquía</h3>
<p>
Los encabezados crean un mapa del contenido y permiten saltar por secciones.
</p>
</section>
</article>
</main>

<aside aria-label=Contenido relacionado>
<h2>Artículos relacionados</h2>
<ul>
<li><a href=/?p=1331>Introducción a HTML</a></li>
<li><a href=/?p=1332>El head de una página HTML</a></li>
<li><a href=/?p=1344>El body de una página HTML</a></li>
</ul>
</aside>

<footer>
<p>&copy; 2026 Tyflos Accessible Software</p>
<a href=/accesibilidad/>Declaración de accesibilidad</a>
</footer>

</body>

Este ejemplo presenta los siguientes elementos clave:

  • Hay un enlace de salto (Saltar al contenido principal).
  • Hay un solo <main>, con un id para que el salto sea real.
  • La navegación principal está en <nav> y está etiquetada con aria-label para que, si en el futuro hay más de una navegación, podamos diferenciarlas.
  • El contenido principal está dentro de un <article> y dividido en <section> con encabezados.

El enlace para Saltar al contenido

Cuando una web repite cabecera y navegación en todas las páginas, un usuario que navega con teclado o lector de pantalla se encuentra siempre el mismo bloque antes de llegar al contenido real. WCAG exige un mecanismo para saltar bloques repetidos (criterio 2.4.1).

Un enlace de salto es la solución más habitual y sencilla.

Es opcional si ese enlace está siempre visible o si solo se muestra al recibir foco (lo habitual en muchos sitios).

Secciones

La estructuración en secciones y sub secciones definen la ordenación cognitiva general de los contenidos en una página web. Se suelen recomendar las siguientes reglas:

  • Usar <article> cuando el bloque tenga sentido por sí solo (una entrada de blog, una noticia, un comentario, una tarjeta de producto completa).
  • Usar <section> cuando se esté dividiendo un contenido en partes temáticas, normalmente con su propio encabezado.
  • Ambos elementos crean secciones en el documento y definen el alcance de cosas como <header> y <footer> internos.
  • No usar <section> como sustituto de <div>. Si no hay una sección temática real (y normalmente un encabezado que la titule), probablemente ese bloque sea un <div>.

Encabezados

Para una persona con discapacidad para el acceso a los contenidos digitales, como una persona ciega, los encabezados no son texto grande, más bien son un mecanismo de navegación y orientación.

Los encabezados definen la estructura de dependencias entre contenidos.

Un encabezado marca el comienzo de una sección dentro de los contenidos de la página.

Se suelen aplicar las siguientes reglas:

  • Siempre debe haber, al menos, un H1 en la página. 
  • Dentro del contenido del encabezado sólo debe haber texto o una imagen.
  • Ese texto o imagen debe representar el contenido que presenta el encabezado.
  • Nunca se debe usar encabezados para estilo visual.
  • Nunca se debe saltar niveles sin necesidad (por ejemplo, pasar de <h1> a <h4> porque sí).

Buenas prácticas para no crear ruido

Cuando se empieza a usar landmarks y ARIA, es fácil excederse en su uso. Un abuso o el renombrado excesivo de las regiones generan ruido y dificultan entender la página.

Se recomienda seguir estas reglas:

  • Un solo <main> por página.
  • Si hay varios <nav>, Es necesario poner nombre con aria-label (por ejemplo: Navegación principal, Navegación secundaria, Navegación de pie).
  • Se debe evitar crear regiones sin una razón semántica.
  • Usar <aside> para contenido complementario real (relacionado, pero no parte del hilo principal).

Cómo comprobar si la estructura es accesible

Se pueden detectar muchos fallos con herramientas automáticas, pero lo más fiable es realizar una verificación manual utilizando un lector de pantallas.
El lector de pantallas tiene una función para mostrar la estructura de encabezados en la página. De esta forma se puede observar si respetan el orden de anidamiento y si cuentan cómo se organiza el contenido en la página.
El lector de pantallas, por defecto, avisa cuando se ha encontrado una región (landmark). Es necesario revisar si aparecen regiones para la Navegación, Contenido principal, Pie, etc., y si tienen nombres claros cuando hay varias del mismo tipo.

La nueva app de entrenamiento neurológico de la ONCE ya está disponible

El Centro de Tiflotecnología e Innovación de la ONCE (CTI) ha anunciado la disponibilidad para descarga de ENTRENO, una nueva aplicación de entrenamiento neurológico orientada a mantener la mente activa mediante una experiencia moderna, directa y especialmente pensada para el uso cotidiano en el móvil.

La propuesta llega como una renovación completa del antiguo Gimnasio Cerebral, con un enfoque actualizado que combina entretenimiento, progresión y retos diarios, sin perder de vista el objetivo de entrenar capacidades cognitivas relevantes para la vida diaria.

Desde la presentación oficial se insiste en que ENTRENO no se limita a proponer minijuegos aislados, sino que estructura el entrenamiento en sesiones breves y repetibles, incorporando retos diarios que favorecen la constancia. Esa continuidad es clave si lo que se busca es reforzar habilidades como la memoria, la atención o la rapidez mental con pequeñas píldoras de práctica distribuida.

Además, la app persigue  mejorar la destreza general en el manejo de dispositivos móviles, haciendo que la interacción con el teléfono forme parte del propio entrenamiento.

Una app accesible, gratuita y pensada para evolucionar

ENTRENO nace, según se explica en los materiales asociados al lanzamiento, como respuesta a una demanda conocida de disponer de una aplicación accesible, divertida y suficientemente desafiante que sustituyera con garantías a la anterior generación de juegos de este estilo.

Aunque está diseñada para personas con discapacidad visual, no se plantea como un producto solo para un perfil, sino como una app inclusiva que puede disfrutar cualquier persona.

La aplicación se distribuye de forma gratuita y se apoya en un planteamiento de accesibilidad amplio, con compatibilidad con lectores de pantalla y ajustes que facilitan la interacción.

El CTI vincula además el lanzamiento con la iniciativa Modos ON, orientada a impulsar el videojuego accesible, lo que ayuda a entender por qué la app adopta un lenguaje de retos, progresión y recompensas que encaja bien con dinámicas de juego.

¿qué juegos incluye?

ENTRENO incorpora nueve juegos relacionados con distintas capacidades cognitivas para el entreno de la memoria, atención, rapidez mental, percepción y funciones ejecutivas como planificar, decidir o resolver problemas.

Los juegos están diseñados para que el entrenamiento no sea abstracto, sino conectado con situaciones reales. Ositos, por ejemplo, se plantea como una tarea de selección bajo reglas cambiantes en la que la clave no es solo reaccionar, sino inhibir respuestas automáticas y sostener la concentración mientras se atienden pedidos que varían. 

En De Pesca el entrenamiento se apoya en la discriminación auditiva y la velocidad de reacción, obligando a diferenciar señales útiles frente a estímulos negativos para una partida exitosa.

El juego de Mayormente lleva el foco al cálculo mental rápido y a la actualización de información bajo presión temporal. La mecánica de comparar resultados de operaciones sencillas, incrementando la dificultad, conecta con tareas muy comunes como estimar importes, cambios o decisiones rápidas en compras.

El juego de Ciudad Bullicio trabaja la capacidad de distinguir sonidos cotidianos y decidir con rapidez si dos estímulos son iguales o distintos, semejante a los procesos de discriminación y comparación auditiva que usamos continuamente al movernos en espacios urbanos.

Esa palabra me suena se orienta a la memoria verbal reciente, con una dinámica de memorización inicial y posterior reconocimiento frente a distracciones.

En Hal Revés el énfasis recae en la flexibilidad cognitiva y en la gestión de interferencias, obligando a responder de manera contraria a lo esperado.

El objetivo de Sónar es esquivar obstáculos guiándose por la información que aporta el sonar.

El juego de Semáforo se centra en la estimación temporal, pidiendo al usuario que cuente mentalmente un número de segundos y ejecute la acción en el momento justo.

El juego de Super Ahorro utiliza el contexto del supermercado para entrenar estimación y comparación de cantidades, planteando el reto de elegir la opción más barata cuando el precio no se presenta de forma directa.

Progresión, niveles y rutina diaria

Uno de los detalles más relevantes en una app de este tipo es cómo evita el estancamiento. En la documentación asociada se indica que cada minijuego dispone de diez niveles de dificultad creciente y que, al superar el nivel máximo, se activa un modo infinito.

La app busca ofrecer un recorrido de aprendizaje claro para quien empieza y, a la vez, garantizar recorrido a medio plazo para quien busca mantener el hábito.

Disponibilidad y requisitos mínimos

ENTRENO está disponible para iOS y Android y, según el anuncio del CTI, requiere como versiones mínimas iOS 13 y Android 6.

Puedes descargar ENTRENO para iPhone desde la AppStore o descargar ENTRENO para Android desde la PlayStore.

En la página de la noticia encontrarás varios videos con más información y tutoriales.

Accesibilidad en los videos de la administración y las empresas gracias a la IA

La accesibilidad audiovisual ha dejado de ser un proyecto excepcional reservado a grandes presupuestos y tiempos infinitos. La combinación de automatización, producción en la nube y flujos de trabajo estandarizados está cambiando la economía de los subtítulos, las transcripciones y las audiodescripciones, reduciendo de forma drástica el coste económico por minuto y, sobre todo, el tiempo necesario para hacer que un video o presentación multimedia sea completamente accesible.
En este nuevo contexto, la excusa de que no es asumible desde el punto de vista económico pierde fuerza, porque el mercado ya ofrece modelos operativos diseñados precisamente para industrializar la accesibilidad sin sacrificar la calidad.

Este cambio viene de la mano de la Inteligencia Artificial (IA) y las nuevas oportunidades de automatización que ofrece a empresas y profesionales.

Este cambio no es únicamente tecnológico, es también regulatorio y reputacional. El Acta Europea de Accesibilidad establece estándares obligatorios para garantizar la accesibilidad de productos y servicios y traslada a empresas privadas y entidades públicas una responsabilidad más clara en la eliminación de barreras.
Según las WCAG para que un contenido multimedia sea accesible debe incorporar, como mínimo, audiodescripciones, subtítulos y transcripciones, y hacerlo de forma consistente en volumen y en el tiempo.

El problema, hasta hace poco, era que hacer accesible un vídeo implicaba un esfuerzo grande en tareas especializadas que van mucho más allá de poner subtítulos. En audiodescripción se requiere detectar silencios y duraciones, escribir un guion específico, rehacer locuciones cuando procede, seleccionar tomas válidas y montar el resultado final. En subtitulado de tipo closed captions es necesario identificar personajes, transcribir diálogos y locuciones, describir músicas y sonidos relevantes y controlar métricas como caracteres por línea y caracteres por segundo para asegurar legibilidad y sincronización. Además, la accesibilidad moderna tiende a incorporar transcripciones navegables, capítulos y artefactos en diferentes formatos listos para publicación en múltiples plataformas. Cuando todo esto se aborda artesanalmente, cada minuto adicional de video arrastra el mismo esfuerzo y el mismo coste provocando que el proceso de hacer accesible un contenido multimedia fuese económicamente más caro.

La automatización para la accesibilidad

La automatización orientada a accesibilidad marca un punto de inflexión en las oportunidades de negocio y de la situación legal sobre el concepto de adaptaciones razonables para la accesibilidad. Una producción multimedia se puede convertir en un contenido accesible generando variantes accesibles de forma automatizada, supervisada y autónoma, sin exigir conocimientos de edición de vídeo al equipo que produce el contenido. Esto permite producir en masa en la nube, obtener distintos archivos y formatos, y resolver de forma práctica un problema frecuente.

Automatización con calidad

Pero la automatización no elimina la exigencia de calidad. En accesibilidad, la calidad no es un lujo, es un requisito funcional. Un subtítulo mal segmentado o una audiodescripción imprecisa no sólo incumple criterios, también compromete la comprensión y la experiencia de usuario. Por eso resulta especialmente relevante el modelo de compañías como LViS Vally, que combinan automatización con una metodología de revisión humana en dos fases para garantizar que los elementos accesibles sean precisos, claros, estén sincronizados y sean plenamente comprensibles para cualquier persona. Ese componente humano, incorporado como control de calidad estructural y no como corrección ocasional, es el puente entre la eficiencia de la producción automática y la fiabilidad que requieren contenidos institucionales, educativos, formativos o corporativos.

La excusa del coste económico ya no es válida. Empresas como LViS Vally ofrecen tarifas individuales de 40 euros por hacer accesible un minuto de contenido de video. Esos precios debían ser multiplicados por 20 o por 100 hace un par de años.

Nuevas oportunidades de negocio en la accesibilidad gracias a la IA

Desde la perspectiva de negocio, la discusión también ha cambiado. La accesibilidad ya no compite sólo por presupuesto, compite por el riesgo y la oportunidad. El incumplimiento puede traducirse en sanciones, reclamaciones o deterioro reputacional, mientras que la accesibilidad bien ejecutada mejora la transparencia, amplía la participación y refuerza la percepción de modernidad y responsabilidad social. Además, la reutilización del contenido y la mejora en difusión y posicionamiento son efectos colaterales habituales cuando se dispone de transcripciones, textos y metadatos reutilizables. En otras palabras, la accesibilidad no es únicamente coste, es también una inversión que amplifica el valor del contenido y su alcance.

Gracias a las nuevas oportunidades que nos ofrece la Inteligencia artificial el ecosistema actual reduce el coste de oportunidad de hacer accesibles los contenidos multimedia y debilita la narrativa de que no hay presupuesto como justificación estructural. Con obligaciones normativas más próximas, con expectativas sociales crecientes y con soluciones que combinan automatización y control humano de calidad, la accesibilidad audiovisual se está convirtiendo en una práctica estándar. La pregunta relevante ya no es si una organización puede permitirse hacer accesible su contenido, sino si puede permitirse no hacerlo cuando existen vías rápidas, escalables y económicamente racionales para cumplir y, al mismo tiempo, ampliar el impacto de su comunicación.

El body de una página HTML

En los artículos anteriores se presentó la estructura general de un documento HTML y se profundizó en el propósito del elemento <head>.

El elemento <body> representa el contenido del documento: aquello que el usuario percibe como la página y con lo que interactúa, incluyendo texto, navegación, imágenes, formularios y componentes de aplicación web.

El <body> no es únicamente un contenedor visual. En términos de accesibilidad y usabilidad, el cuerpo es el lugar donde se materializa la estructura semántica del contenido: cómo se organizan los títulos, qué se considera navegación, cuál es el contenido principal, qué partes son complementarias y qué regiones se repiten entre páginas.

Esta estructura, cuando se expresa con etiquetas semánticas adecuadas, facilita la navegación para lectores de pantalla, y mejora la efectividad general del documento para las personas que utilizan herramientas de apoyo a la comprensión.

Ejemplo completo de body

A continuación se muestra un ejemplo realista de <body> en una página de contenido, utilizando una estructura semántica típica con cabecera, navegación, contenido principal y pie. El objetivo del ejemplo es que se vea cómo se divide el cuerpo en regiones, no que sea un diseño definitivo.

<body>
<h1>Programar a ciegas</h1>
<p>Accesibilidad, usabilidad y desarrollo.</p>
<nav>
<a href="/">Inicio</a>
<a href="/articulos/">Artículos</a>
<a href="/contacto/">Contacto</a>
</nav>

<main>
<h2>El body de una página HTML</h2>
<p>Publicado el 19/01/2026</p>
<p>
El elemento <code>&lt;body&gt;</code> contiene el contenido principal del documento: texto, enlaces,
imágenes y controles interactivos.
</p>

<h3>Un enlace dentro del contenido</h3>
<p>
Un ejemplo de enlace descriptivo puede ser:
<a href="https://programaraciegas.net">Visitar Programar a ciegas</a>.
</p>

<h3>Una imagen con texto alternativo</h3>
<img src="/img/ejemplo.png" alt="Captura de una página mostrando un artículo con estructura semántica.">
</main>

<footer>
<p>&copy; 2026 Tyflos Accessible Software</p>
<a href="/accesibilidad/">Declaración de accesibilidad</a>
</footer>
</body>

En este ejemplo se puede ver que el <body> suele mezclar contenido estático (párrafos, títulos, imágenes) con contenido interactivo (enlaces, formularios) y con regiones que permiten comprender rápidamente la página (por ejemplo, navegación y contenido principal). El elemento <main> representa el contenido dominante de la página y, por buenas prácticas, debería ser único.

Estructura semántica dentro del body

A la hora de diseñar un sitio web hay que tener en cuenta la idea de no es qué se muestra, sino qué significa cada zona. Para expresar esa semántica, HTML ofrece diversos elementos como <header>, <nav>, <main> y <footer>, que ayudan a identificar regiones típicas de una página, y elementos como <article> y <section>, que ayudan a organizar el contenido en bloques con sentido propio.

Desde el punto de vista de la accesibilidad, estas etiquetas semánticas suelen traducirse en regiones o landmarks que muchos lectores de pantalla permiten identificar y recorrer con atajos de teclado.

Es importante matizar que el contexto importa: un <header> puede ser un banner cuando está directamente asociado al documento, pero no necesariamente cuando aparece dentro de un <article> o <section>. De forma equivalente, un <footer> dentro de un <article> no representa el pie global de la página, sino el pie de ese bloque.

Contenido habitual del body

Dentro del <body> se declaran, en primer lugar, los títulos que organizan la información mediante <h1>…<h6>, que permiten expresar jerarquía y ofrecer navegación por encabezados; a continuación se encuentra el texto en sí, normalmente en párrafos con <p>, citas con <blockquote> o fragmentos de código con <code> y <pre>; seguidamente suelen aparecer enlaces con <a>, que conectan el contenido con otras páginas o con secciones internas; y también se incluyen recursos no textuales como imágenes (<img>) o figuras (<figure> y <figcaption>), además de componentes de interacción como formularios (<form>, <label>, <input>, <button>) y otros controles.

Aunque visualmente todo parece contenido, para un lector de pantalla y para muchas herramientas, la diferencia entre un título, un párrafo, un bloque de navegación o un control de formulario es esencial porque define cómo se recorre y se comprende la página. Por eso conviene preferir semántica nativa de HTML frente a contenedores genéricos (<div>, <span>) cuando exista un elemento apropiado.

Accesibilidad en el body

La mayoría de barreras de accesibilidad aparecen dentro del <body> de la página ya que aquí es donde se incluye el contenido y la funcionalidad y se aplica el diseño.

Para evitar los problemas de accesibilidad más graves hay que prestar atención a los siguientes conceptos:

La estructura mediante encabezados debe reflejar la organización real del contenido, porque los títulos se usan para navegación rápida y orientación. Una jerarquía coherente y títulos que describen secciones, en lugar de textos decorativos, facilita que el usuario entienda el documento sin necesidad de leerlo linealmente.

Las regiones principales deberían estar identificadas de forma clara, normalmente con elementos semánticos (<nav>, <main>, <footer>) y, cuando sea necesario, con nombres accesibles (utilizando, por ejemplo, aria-label en una navegación si hay varias). Este enfoque permite saltar directamente a Navegación, Contenido principal o Pie desde el lector de pantalla.

Todo contenido no textual debe tener una alternativa textual cuando aporte información o cumpla una función. En imágenes, el mecanismo principal sigue siendo el atributo alt, que puede describir la imagen o estar vacío (alt=»») cuando sea decorativa y no deba anunciarse.

En los formularios, el control debe tener un nombre accesible. La forma más robusta suele ser asociar un <label> con el control mediante for/id, y solo cuando no sea viable se recurre a mecanismos como aria-label o aria-labelledby.

Por último, incluso con buena semántica, la experiencia se puede degradar si el foco del teclado no sigue un orden lógico o si hay elementos interactivos que no son realmente operables con teclado. El <body> es, por tanto, el lugar donde se debe verificar navegación por tabulador, foco visible, orden de lectura y coherencia entre lo visual y lo programático.

Más voces para idiomas no habituales en iOS con RHVoice

Desde 2023 Apple empezó a permitir que algunas aplicaciones aporten motores de síntesis de voz alternativos que pueden integrarse con VoiceOver y con cualquier app que utilice el motor TTS del sistema. RHVoice es una de esas aplicaciones, y su enfoque es especialmente interesante para quienes priorizan ligereza, rapidez y cobertura lingüística antes que la naturalidad “neuronal” de las voces comerciales.

RHVoice es un sintetizador de voz gratuito y de código abierto, pensado desde el inicio para ser útil a personas ciegas o con dificultad para acceder al texto impreso, y con especial interés en idiomas donde no siempre existen voces “premium” accesibles y de calidad para lectores de pantalla.

Al momento de escribir este artículo se incluyen voces para los idiomas luxemburgués, macedonio y albanés.

Este motor de síntesis de voz emplea síntesis paramétrica estadística (apoyándose en tecnologías abiertas como HTS y software relacionado). Debido a esto el tamaño de descarga suele ser reducido porque se almacenan modelos estadísticos en lugar de ficheros de sonido grandes.

Debido al pequeño tamaño de las voces la naturalidad puede ser inferior a la de sistemas basados en concatenación de grabaciones o redes neuronales, aunque la comprensibilidad de la voz es aceptable.

RHVoice en la App Store

La aplicación está publicada por Non-Routine LLC, es gratuita, ocupa alrededor de 10,5 MB y requiere iOS/iPadOS 16.2 o posterior. También ofrece versión para macOS (13.1 o posterior) y aparece listada para Apple Vision.

RHVoice no incluye voces “de serie”. Esto se hace para reducir el tamaño inicial y para que las actualizaciones de voces sean más simples.

Al abrir la app verás la lista de idiomas disponibles; al entrar en un idioma, se muestran las voces y puedes descargarlas con el botón correspondiente. Dentro de las opciones puedes cambiar entre dos niveles de calidad de voz.

Puedes descargar RHVoice desde la AppStore.

Más voces para tu iPhone y tu iPad con eSpeakNG

Desde iOS17 es posible instalar más voces para usar en los dispositivos móviles de Apple como el iPhone o el iPad.

Aunque la síntesis de voz en los dispositivos móviles actuales se asocia a voces neuronales de alta naturalidad y a catálogos cada vez más completos, también existe un espacio igualmente relevante para soluciones ligeras, abiertas y muy multilingües. En ese terreno se sitúa eSpeak-NG, una app disponible en la App Store que actúa como puente entre la biblioteca eSpeak-NG y VoiceOver, con el objetivo de hacer utilizables estas voces en iOS, iPadOS y macOS sin tener que recurrir a integraciones complejas por parte del usuario.

Este tipo de voces son de poco peso en memoria y muy personalizables. Además están disponibles en muchos idiomas para los que, oficialmente, no existen voces de alta calidad.

¿Qué es eSpeak-NG?

Se trata de la evolución comunitaria de eSpeak, el motor creado originalmente por Jonathan Duddington.

Este motor de síntesis de voz se enfoca en ofrecer soporte para muchos idiomas y variantes con un tamaño reducido y un consumo contenido de recursos, a costa de una sonoridad menos natural que la de sintetizadores basados en grabaciones humanas. Este enfoque, basado en síntesis por formantes, explica por qué eSpeak (y su “Next Generation”) sigue siendo útil en ámbitos donde la ligereza, la velocidad y la cobertura lingüística pesan más que el realismo.

eSpeak-NG en la AppStore

La app de eSpeak-NG para Apple, publicada por Yury Popov, se describe explícitamente como una “capa de compatibilidad” entre la librería eSpeak-NG y VoiceOver.

Con la instalación de esta app se consigue que el sistema y el lector de pantalla puedan acceder a esas voces y a su configuración sin que el usuario tenga que montar entornos externos, compilar nada o depender de otras soluciones.

Puedes instalar eSpeak-NG desde la AppStore.

Soporte para Vox libri

La aplicación de lectura de libros Vox libri es compatible con este motor. Esto implica que al instalar la aplicación de eSpeak-NG podremos utilizar las voces de eSpeak para leer nuestros libros con Vox libri.