AImaginator, una contribución de Tyflos accessible software para usar Dall-E de forma más cómoda en MacOS

El uso de inteligencias artificiales para ayudar a personas con discapacidad es algo cada vez más común. Personalmente utilizo DALL-E para generar algunas imágenes que necesito utilizar en mi día a día.

Por este motivo y por evitar tener que utilizar el sitio web de OpenAI he creado el proyecto de AImaginator

AImaginator es una aplicación sencilla para MacOS que permite generar imágenes a partir de un texto que la describe.

Para utilizar AImaginator sólo necesitamos un ordenador Mac y una API key del servicio de OpenAI. El resto lo encontrarás en el repositorio de AImaginator en Github. En el repositorio también encontrarás el código fuente para mejorar la aplicación.

Aumenta tu concentración con tu Mac gracias a los sonidos de fondo

Dentro de las novedades en accesibilidad de MacOS Ventura hay una nueva opción dentro del apartado de Audición llamada sonidos de fondo.

Esta opción de accesibilidad consiste en la reproducción de un sonido monótono que permita a la persona aislarse del entorno acústico a su alrededor permitiendo aumentar su nivel de concentración.

Sonidos disponibles

Actualmente los sonidos disponibles son ruido rosa, ruido marrón, ruido blanco, océano, lluvia y arroyo.

Los sonidos de ruido blanco, marrón y rosa son útiles mientras se viaja en tren o avión ya que hacen las veces de un sistema de reducción de ruido.

Los sonidos de lluvia, arroyo y océano permiten relajarse o concentrarse un poco más.

Activar el sonido de fondo

Para activar este servicio primero debemos ir a los ajustes de accesibilidad de nuestro Mac. Para ello debemos abrir los Ajustes del sistema y buscar la categoría de accesibilidad.

También podemos ir a esta sección abriendo el panel de funciones rápidas de accesibilidad pulsando las teclas Opcion+Comando+F5 y pulsando el botón de Ajustes.

Una vez abierto el panel de configuración de accesibilidad debemos pulsar el botón de Audio dentro del apartado Audición.

En esta configuración encontraremos el apartado de Sonidos de fondo donde podremos activar o desactivar este servicio, seleccionar qué sonido se utilizará y el volumen con el que se reproducirá el sonido de fondo.

Cómo parar la grabación de pantalla de Quicktime desde el teclado en MacOS Ventura

Desde las primeras versiones de MacOS, el sistema operativo para ordenadores portátiles y de sobremesa de Apple, se ha incluido un software para realizar capturas de pantalla y grabación de audio y video. Este software se conoce como Quicktime.

Con Quicktime se pueden realizar capturas de toda la pantalla, de una ventana en concreto o de un área de la pantalla.

Las grabaciones de video y audio se pueden configurar para hacer la captura de un dispositivo en concreto.

Accesibilidad en Quicktime

Todas estas opciones resultaban bastante accesibles ya que la interfaz de usuario de Quicktime es bastante accesible.

Pero a la hora de realizar una grabación de la pantalla del Mac en uso esa interfaz se sustituía por una barra de botones flotante que nos permitía modificar las opciones de grabación y comenzar y parar el proceso.

Accediendo a la barra flotante

Los usuarios de VoiceOver para acceder a esa barra flotante tienen que usar la opción de abrir el selector de aplicaciones abiertas y buscar el primer elemento de la lista que es un cuadro de diálogo.

Para acceder a este selector de aplicaciones abiertas debemos pulsar la combinación VO+F1+F1

Pero al acceder a la barra flotante VoiceOver no encuentra el botón de parar y si utilizamos el botón de cerrar se cancelará la grabación.

Parar la grabación desde el teclado

Existe una combinación de teclas que nos permite parar la grabación en curso y que se guarde el video de nuestra pantalla en la carpeta seleccionada.

Esta combinación de tecla es Control+Comando+Escape y no está bien documentada dentro de la ayuda de MacOS ni la ayuda de Quicktime.

Desactivar el completado automático en Visual Studio Code

Aunque Visual Studio code, o más conocido como VSCode, ofrece multitud de herramientas automáticas para mejorar la experiencia mientras escribimos código algunas de estas herramientas pueden provocar conflictos con algunos productos de apoyo.

Es el caso de la herramienta de completado automático de código.

Esta herramienta muestra una ventana emergente que provoca conflictos con el foco de lectura de los lectores de pantalla provocando que se interrumpa la experiencia de introducción de código por parte del usuario.

Por suerte para los usuarios de lectores de pantalla esta herramienta se puede desactivar su aparición automática y los usuarios de lectores de pantalla pueden acceder al panel de sugerencias de completado de código de forma manual.

Editando la configuración de VSCode en JSON

Los ficheros de preferencias y configuración de VSCode están en formato JSON por lo que es sencillo su modificación.

Para acceder a nuestro fichero de configuración de VSCode sólo debemos seguir estos pasos:

  • Abrir VSCode
  • Pulsar la tecla F1 para acceder al asistente de ejecución de comandos de VSCode
  • En el cuadro de búsqueda escribir «preferencias json»  y elegir la opción Preferencias: Abrir configuración de usuario (JSON)Preferences: Open User Settings (JSON)

En VSCode aparecerá un fichero de texto con nuestras preferencias en formato JSON. Deberá ser algo parecido a esto:

{
  "editor.accessibilitySupport": "on",
  "workbench.startupEditor": "newUntitledFile",
  "workbench.activityBar.visible": false,
  "workbench.statusBar.visible": false,
  "editor.minimap.enabled": false,
  "workbench.editor.untitled.hint": "hidden",
  "breadcrumbs.enabled": false
}

Debemos incluir las opciones relacionadas con el completado automático de código.

La opción de editor.quickSuggestions controla si se debe abrir las sugerencias de completado mientras se escribe. Su formato es:

"editor.quickSuggestions": { "other": false, "comments": false, "strings": false },

La opción de editor.acceptSuggestionOnEnter controla si se deben aceptar las sugerencias automáticas pulsando la tecla enter. Es recomendable desactivar esta opción para que no haya forma de aceptar una sugerencia de forma involuntaria.

Su formato es:

"editor.acceptSuggestionOnEnter": "off",

La opción editor.quickSuggestionsDelay controla el tiempo de pausa que habrá para que aparezca una sugerencia en el código. Se recomienda un tiempo superior a 5 segundos si no queremos que haya posibilidad de cualquier sugerencia de forma automática. Su formato es:

"editor.quickSuggestionsDelay": 10,

La opción editor.wordBasedSuggestions activa un sistema de sugerencias por palabras. Es recomendable desactivar esta opción. 

Su formato es:

"editor.wordBasedSuggestions": false

Finalmente el código de nuestro JSON deberá quedar de la siguiente forma:

{
  "editor.accessibilitySupport": "on",
  "editor.quickSuggestions": {
    "other": false,
    "comments": false,
    "strings": false
  },
  "editor.acceptSuggestionOnEnter": "on",
  "editor.quickSuggestionsDelay": 10,
  "editor.wordBasedSuggestions": true,
  "workbench.startupEditor": "NewUntitledFile",
  "workbench.activityBar.visible": false,
  "workbench.statusBar.visible": false,
  "editor.minimap.enabled": false,
  "workbench.editor.untitled.hint": "hidden",
  "breadcrumbs.enabled": false
}

De esta forma la única posibilidad de utilizar la función de completado de código será pulsando el atajo de teclado Control+espacio para que aparezca la ventana con las sugerencias.

Riffusion crea música de forma artificial

En la actualidad hay varios servicios de creación de imágenes utilizando inteligencia artificial. Estos servicios consisten en la creación de una imagen a partir de un texto introducido por el usuario.

Muchos de estos servicios como DallE-2 o StableDiffusion ofrecen resultados tan sorprendentes que han ganado algunas competiciones de arte digital sin que el jurado lo supiese.

De la imagen al sonido

Un grupo de ingenieros que colaboraron en StableDiffusion han dado el siguiente paso utilizando el mismo motor de inteligencia artifical para enseñarle a generar música. De este esfuerzo nace Riffusion.

Actualmente esta inteligencia artifical crea 5 segundos de música a partir de un texto introducido por el usuario. Su sistema de gestión de azar le permite ir generando nuevos bloques de 5 segundos introduciendo pequeñas modificaciones para que la música no resulte monótona e incluso realice transiciones a las nuevas frases introducidas por el usuario para que la música que se está creando evolucione a otras melodías de forma progresiva.

Escuchando los resultados obtenidos en esta primera versión de Riffusion y observando la evolución de sus hermanos a la hora de generar imágenes y vídeos esto hace pensar que estas nuevas inteligencias artificales para la generación de música tendrán una pronta progresión en calidad y en variedad.

Puedes colaborar con este proyecto desde el repositorio de Riffusion en Github..

Podcast sobre identidad en Internet en Varelalia

La socialización y las reglas de convivencia en Internet no están claras para todo el mundo, por esta razón es necesaria una educación básica sobre conceptos como la privacidad, la seguridad y, en este caso, cómo nos identificamos en Internet.

En el podcast de Varelalia de Enrique Varela hablo sobre todo esto buscando divulgar buen comportamiento y conocimiento sobre cómo nos deberíamos comportar en la red de redes.

Puedes escuchar el episodio de QECF de la identidad en internet en la página de Anchor del Podcast de Varelalia.