Riffusion crea música de forma artificial

En la actualidad hay varios servicios de creación de imágenes utilizando inteligencia artificial. Estos servicios consisten en la creación de una imagen a partir de un texto introducido por el usuario.

Muchos de estos servicios como DallE-2 o StableDiffusion ofrecen resultados tan sorprendentes que han ganado algunas competiciones de arte digital sin que el jurado lo supiese.

De la imagen al sonido

Un grupo de ingenieros que colaboraron en StableDiffusion han dado el siguiente paso utilizando el mismo motor de inteligencia artifical para enseñarle a generar música. De este esfuerzo nace Riffusion.

Actualmente esta inteligencia artifical crea 5 segundos de música a partir de un texto introducido por el usuario. Su sistema de gestión de azar le permite ir generando nuevos bloques de 5 segundos introduciendo pequeñas modificaciones para que la música no resulte monótona e incluso realice transiciones a las nuevas frases introducidas por el usuario para que la música que se está creando evolucione a otras melodías de forma progresiva.

Escuchando los resultados obtenidos en esta primera versión de Riffusion y observando la evolución de sus hermanos a la hora de generar imágenes y vídeos esto hace pensar que estas nuevas inteligencias artificales para la generación de música tendrán una pronta progresión en calidad y en variedad.

Puedes colaborar con este proyecto desde el repositorio de Riffusion en Github..

Podcast sobre identidad en Internet en Varelalia

La socialización y las reglas de convivencia en Internet no están claras para todo el mundo, por esta razón es necesaria una educación básica sobre conceptos como la privacidad, la seguridad y, en este caso, cómo nos identificamos en Internet.

En el podcast de Varelalia de Enrique Varela hablo sobre todo esto buscando divulgar buen comportamiento y conocimiento sobre cómo nos deberíamos comportar en la red de redes.

Puedes escuchar el episodio de QECF de la identidad en internet en la página de Anchor del Podcast de Varelalia.

Trabajar de forma más accesible con VisualStudio Code usando lector de pantallas

El editor de código VisualStudio code o más conocido como VSCode incluye en sus últimas versiones la opción de activación del soporte de accesibilidad para usuarios de lectores de pantalla.

VSCode accesible en todas las plataformas

Aunque VSCode parece que proporciona accesibilidad en todas las plataformas no lo hace con la misma calidad o estabilidad.

Accesibilidad en Windows

Según la documentación oficial el soporte de accesibilidad para lectores de pantalla incluye a JAWS y NVDA aunque para este último se recomienda el uso de NVDA en modo foco en lugar del modo navegación.

Además también para NVDA existe una extensión de NVDA para VSCode para mejorar su comportamiento con este lector de pantallas.

En cualquier caso y con cualquier lector de pantallas se recomienda la navegación por salto por tabulación y el uso de las teclas para navegar entre paneles, pestañas y ventanas hijas.

Accesibilidad en MacOS

Al abrirse VSCode se detecta la presencia de VoiceOver y se abre un diálogo para activar la compatibilidad con lectores de pantalla.

La interfaz, aunque generada con tecnología web, resulta bastante accesible con el modo de navegación por grupos de las opciones de Internet de VoiceOver.

Quizás lo más problemático sean los mensajes emergentes para completar el código de forma automática o revisar el resultado en un simulador. Por suerte para los usuarios de VoiceOver todas estas opciones se pueden configurar.

En MacOS existe una opción para ver el estado de accesibilidad de VSCode. Pulsando el atajo de teclado Opcion+F1 accederemos a esta información.

Accesibilidad en Linux

Aunque el soporte para el lector de pantallas Orca está incluido para VSCode hay que mencionar que la estabilidad del lector de pantalla es aún menor cuando abrimos varias pestañas en VSCode.

El area de edición de código si resulta legible con Orca pero otros paneles como los mensajes de depuración o los paneles para acceder a ciertos elementos de configuración o de instalación de extensiones resultan totalmente inaccesibles para este lector de pantallas.

Accesibilidad en ChromeOS

Aunque VSCode dice soportar todas las plataformas el uso de esta aplicación utilizando ChromeVox, el lector de pantallas de ChromeOS, resulta totalmente improductivo ya que la experiencia es la de utilizar una página web con multitud de áreas dinámicas que carecen de encabezados o marcas semánticas.

Además el uso del teclado es conflictivo entre Chromevox y los propios atajos de VSCode.

Navegación en el completado de código

Para la función de completado de código automático aparece un mensaje emergente con una lista de opciones. Podemos navegar en esta lista de opciones utilizando los atajos de teclado Control+Flecha arriba y Control+Flecha abajo para seleccionar una de las posibles opciones.

En el caso de MacOS con VoiceOver es suficiente utilizar las flechas de arriba o abajo para moverse por la lista.

En cualquier caso es recomendable desactivar el completado automático de código y usarlo de forma manual con el atajo de teclado Control+Espacio.

Documentación oficial

El equipo de VSCode ha publicado información útil sobre las características de accesibilidad de este editor para diversos perfiles de accesibilidad. Puedes leer toda esta información en la página en inglés de accesibilidad de VSCode.

Colocate bien delante de tu Webcam gracias a CanYouSeeMe

A la hora de realizar una videoconferencia uno de los problemas más comunes de las personas ciegas es conocer si están situados correctamente con respecto a su webcam para que las otras personas participantes en la videoconferencia lo vean correctamente.

Este problema se complica cuando se va haciendo cada vez más habitual la verificación de identidad mediante una videollamada o foto desde la webcam como sucede en algunos procesos de identificación con la banca electrónica o la administración.

Tan común es este problema que ha surgido el proyecto Can you see me.

Este proyecto consiste en una aplicación para Windows que va dando instrucciones a la persona para que se coloque correctamente ante su cámara.

La aplicación realiza el proceso en local por lo que no se envía ninguna información a la nube por lo que la privacidad del usuario está garantizada.

Es un proyecto de software libre bajo la licencia GPL3 por lo que cualquier persona puede participar y mejorar el proyecto.

La aplicación está disponible para Windows y es compatible con los lectores de pantalla más habituales.

Puedes descargar Can you see me desde la web oficial.

Cambiar rápidamente el dispositivo de salida de voz para VoiceOver en Mac gracias a las actividades

El lector de pantallas de MacOS, más conocido como VoiceOver, permite seleccionar el dispositivo de salida para la síntesis de voz. Esta opción está disponible dentro de la categoría Sonido de las opciones de configuración de VoiceOver.

El problema de esta configuración es que no está disponible como elemento manipulable desde AppleScript por lo que para cambiar el dispositivo de salida de audio de VoiceOver tenemos que abrir las opciones de configuración de VoiceOver, ir a la categoría Sonido, cambiar el dispositivo y confirmar el cambio.

Esta operación puede ser tediosa sobre todo si es una operación que tenemos que hacer regularmente durante nuestro día de trabajo con nuestro equipo Mac.

Las actividades de VoiceOver al rescate

Una de las características más desconocidas de VoiceOver nos puede ayudar a cambiar de configuración de dispositivo de salida de forma muy rápida. Esta característica se conoce como actividades de VoiceOver.

En este sitio web ya hemos hablado de las actividades de VoiceOver y cuando se hizo era en una versión muy anterior a la actual en MacOS Ventura.

Actualmente las actividades se pueden activar de forma manual sin necesidad de estar asociadas a la apertura de una aplicación o servicio. Esto nos permite modificar varios aspectos de la configuración de VoiceOver de forma rápida.

Creando nuestra actividad

Vamos a crear una actividad que configure el dispositivo de salida de audio de VoiceOver.

Abrimos las opciones de configuración de VoiceOver, vamos a la categoría actividades y buscamos el botón Añadir actividad.

Al pulsar el botón introducimos el nombre de nuestra nueva actividad. Por ejemplo podemos utilizar el nombre Salida de voz personalizada.

Una vez introducido el nombre de la actividad buscamos el apartado ajustes adicionales que se incluirán y lo desplegamos.

Dentro buscamos la casilla de verificación Sonido y la verificamos. justo a su derecha encontramos el botón Definir. Al pulsarlo nos sale el panel de configuración de sonido de VoiceOver. Cambiamos el dispositivo de salida y pulsamos el botón de aceptar.

A diferencia de las actividades antiguas que tenían que asociarse a una aplicación ahora podemos dejar el campo de Usar esta actividad para: con el valor por defecto de Apps y sitios web… indicando que se podrá utilizar en cualquier aplicación.

Ahora podemos cerrar la ventana de configuración de VoiceOver y seguir utilizando nuestro equipo.

Activando nuestra actividad

Ahora podemos activar nuestra actividad cuando queramos abriendo el menú de selector de actividad. Este menú de VoiceOver se abre utilizando la combinación Vo+x.

Aparecerá una lista con las actividades disponibles. Seleccionamos la nuestra y pulsamos la tecla Enter.

Los cambios de configuración de VoiceOver se activarán mientras estemos en la ventana en la que activamos la actividad por lo que la voz de VoiceOver deberá reproducirse en el dispositivo seleccionado.

Dibujar diagramas con PlantUML

El proyecto de software libre PlantUML busca proporcionar un mecanismo para dibujar diagramas mediante un código sencillo en texto.

PlantUML utiliza la plataforma Java para su herramienta de generación de diagramas. Esto a diferencia de Mermaid facilita que la herramienta  pueda ejecutarse localmente aunque también se dispone de un servicio de PlantUML onLine.

Instalación de PlantUML

La instalación de PlantUML en sistemas MacOS y Linux es muy sencilla ya que se encuentra disponible en varios repositorios.

Por ejemplo instalar PlantUML en MacOS es muy sencillo si ya se posee la herramienta HomeBrew. Sería tan sencillo como ejecutar el siguiente comando en la Terminal de Mac:

brew install plantuml
Una vez instalada simplemente en la Terminal ejecutaríamos el comando plantuml pasando como parámetro el fichero de texto con la información de nuestro diagrama.

Ejemplo de diagrama de estado

Como vimos en el artículo sobre dibujar diagramas con Mermaid tenemos un diagrama de estado que representa los posibles estados de un ser vivo.

En PlantUML el código sería algo como:

@startuml
[*] --> Nacer
Nacer -> Crecer
Crecer -> Reproducirse
Reproducirse -> Envejecer
Envejecer -> Morir
Morir --> [*]
@enduml

El diagrama generado tiene el siguiente aspecto:

Diagrama de estados generado con PlantUML

Además PlantUML permite exportar a un formato ASCII en texto que puede resultar interesante para leer con líneas braille.

El anterior diagrama tiene el siguiente aspecto en ASCII:

,------.                                                  
|*start|
|------|
`------'
|
|
,-----. ,------. ,------------. ,---------. ,-----.
|Nacer| |Crecer| |Reproducirse| |Envejecer| |Morir|
|-----|---|------|---|------------|---|---------|--|-----|
`-----' `------' `------------' `---------' `-----'
|
,----.
|*end|
|----|
`----'

Conclusiones

En conclusión podemos indicar que PlantUML proporciona una herramienta local sencilla y rápida para generar cierto tipo de diagramas. Proporciona algunos mecanismos de personalización que la hacen interesante para usuarios ciegos que dispongan de línea braille aunque su sintaxis quizás pueda ser más engorrosa que Mermaid para algunos tipos de diagramas de ingeniería.