¿Cómo incluir una firma en un documento PDF utilizando Inteligencia artificial?

La Inteligencia artificial poco a poco se está moldeando en nuevas herramientas de ayuda a personas con necesidades especiales. Una de estas necesidades es la de incluir una imagen con la firma de una persona en un lugar concreto de un documento PDF. Esta operación que puede resultar muy sencilla para la mayoría de personas es algo muy complicado para personas con discapacidad visual o con discapacidad motriz.

Las herramientas de Inteligencia artificial generativas como ChatGPT o Gemini pueden ayudarnos a realizar estas operaciones.

Un posible ejemplo

Imaginemos que tenemos un documento prueba.pdf con el siguiente texto:

Documento de prueba
Esto es un documento de prueba para probar la función de introducir una firma utilizando AI.

Para ello creamos este documento en formato PDF.

Además del texto básico debemos incluir alguna estructura de información que permita identificar dónde incluir la firma.

Por ejemplo, dejando un hueco suficiente.

Firmado:

 

 

 

 

En España el 1 de agosto de 2024

 

 

 

 

Además tenemos un fichero firma.jpg que contiene un dibujo de nuestra firma. Es importante que nuestra firma esté escrita en color negro y el fondo en color blanco.

Utilizando el siguiente prompt en ChatGPT o Gemini podemos conseguir firmar nuestro documento PDF:

En el documento prueba.pdf pega la imagen del fichero firma.jpg

La imagen debe colocarse entre las líneas con el texto «Firmado:» y «En España el 1 de agosto de 2024»
Modifica el tamaño de la imagen pegada para que encaje bien entre las dos líneas de texto. La imagen no debe ocultar las líneas con los textos «Firmado:» y «En España el 1 de agosto de 2024». Para ello reduce la altura de la imagen si es necesario y la imagen debe colocarse entre las dos líneas de texto indicadas

Cuidado con la precisión

Hay que recordar que estas herramientas generativas no son fiables al cien por ciento por lo que es recomendable revisar que el documento pdf no haya sido modificado en su texto y que la firma se haya incluido bien.

Además, hay que señalar que actualmente la mayoría de sistemas que convierten el lenguaje escrito en algo comprensible para los motores de Inteligencia artificial comprenden mejor el idioma inglés por lo que es recomendable que los prompts se escriban en inglés para facilitar la comprensión al motor de inteligencia y evitar ambigüedades.

Nuevas posibilidades para la accesibilidad 

El uso de herramientas de Inteligencia artificial está abriendo nuevos caminos para la accesibilidad para ayudar a personas con necesidades especiales a superar de forma autónoma barreras sociales y técnicas que persisten hoy en día. La Inteligencia artificial es una herramienta más y como tal debemos aprender a utilizarla para hacer un mundo más accesible.

¿Cómo enviar informes de error y sugerencias de Ray-ban Meta para mejorar su uso?

Las gafas inteligentes Meta Ray-ban se han convertido en un dispositivo de asistencia para personas ciegas. Aunque el dispositivo no se ha diseñado como producto de asistencia para personas con discapacidad resulta de utilidad el poder utilizar los micrófonos y la cámara junto con la inteligencia artificial que proporciona Meta a este dispositivo para que una persona ciega pueda resolver situaciones o dudas visuales consultando qué hay delante de la persona que está utilizando estas gafas inteligentes.

Aunque este tipo de utilidad utilizando Inteligencia Artificial ya está disponible utilizando un teléfono Android o un iPhone la posibilidad de tener las dos manos libres y utilizar comandos de voz de forma rápida hacen que el uso de unas gafas inteligentes con cámara sean un buen candidato de producto de apoyo para personas ciegas.

Fronteras lingüísticas y comerciales

Aunque estas gafas están a la venta en varios países e incluso se pueden adquirir a través de la tienda on-line de Ray-ban el acceso a los servicios de Inteligencia artificial de Meta no está en todos los países. A fecha de Junio de 2024 el servicio de Meta-AI sólo está disponible para Estados Unidos de America y Canadá.

Además, aunque podemos solicitar mediante comandos de voz que nos hable la respuesta a la consulta que le hagamos en el idioma de nuestra preferencia si hay que indicar que todas las preguntas y las funciones de dictado de mensajes o consulta de contactos se realizan con soporte en inglés y parcialmente en francés o italiano. 

Conexión a Internet a través de nuestro teléfono

Las Meta Ray-ban necesitan de conexión a Internet tanto para compartir los videos y fotografías así como para acceder a la inteligencia artificial de Meta. Para ello es necesario instalar la app Meta view en el teléfono.

Enviando informes de error y sugerencias

Una vez nos hayamos registrado en la aplicación Meta View podemos utilizar el servicio de ayuda incorporado en esta aplicación para acceder al formulario de ayuda.

Para ello, una vez abierta la aplicación Meta view debemos ir a la sección de Configuración, cuyo botón está situado en la parte inferior derecha de la pantalla.

Tras acceder a la sección de configuración deberemos deslizar la pantalla hacia abajo (con tres dedos de abajo a arriba si utilizamos VoiceOver) para que se listen todas las opciones disponibles en la sección de configuración.

Dentro de estas opciones encontraremos la opción Ayuda y asistencia, y dentro de este menú de ayuda podemos acceder al formulario mediante la opción Informar de un problema.

Al entrar en esta opción nos ofrece distintas categorías para notificar un error o enviar una sugerencia. Por ejemplo, para solicitar que mejoren la accesibilidad de la aplicación Meta view habría que elegir la categoría Meta view. Para notificar un problema de comportamiento de las gafas habría que seleccionar la categoría Hardware de las gafas y para enviar sugerencias para que incluyan el español o que ofrezcan Meta-AI en Europa o America Latina habría que elegir la categoría Otras.

Dependiendo de la categoría seleccionada se nos ofrecerán distintas opciones. Por ejemplo, si queremos solicitar que las Ray-ban Meta soporten los comandos en español habría que elegir la categoría Otras y seleccionar la opción Solicitud de función.

Los usuarios podemos mejorar un producto

Aunque Meta tiene su hoja de ruta para mejorar este producto y los servicios que lo acompañan los usuarios del producto podemos enviar informes de error y sugerencias para que, por ejemplo, el producto vaya mejorando a nuestra satisfacción. Por ejemplo, solicitando que se incluya el español entre las opciones para hablar y escuchar a las gafas, que mejoren la accesibilidad de la aplicación o que se pueda personalizar el botón de tomar fotografía para otra opción más útil para una persona ciega o con otro perfil. Siempre es recomendable hacer el informe de error de forma apropiada y explicar lo mejor posible la sugerencia y quienes se benefician con esa nueva característica.

Meta y Ray-ban han creado un producto útil para muchas personas pero los usuarios podemos hacer que el producto sea aún más útil.

Riffusion crea música de forma artificial

En la actualidad hay varios servicios de creación de imágenes utilizando inteligencia artificial. Estos servicios consisten en la creación de una imagen a partir de un texto introducido por el usuario.

Muchos de estos servicios como DallE-2 o StableDiffusion ofrecen resultados tan sorprendentes que han ganado algunas competiciones de arte digital sin que el jurado lo supiese.

De la imagen al sonido

Un grupo de ingenieros que colaboraron en StableDiffusion han dado el siguiente paso utilizando el mismo motor de inteligencia artifical para enseñarle a generar música. De este esfuerzo nace Riffusion.

Actualmente esta inteligencia artifical crea 5 segundos de música a partir de un texto introducido por el usuario. Su sistema de gestión de azar le permite ir generando nuevos bloques de 5 segundos introduciendo pequeñas modificaciones para que la música no resulte monótona e incluso realice transiciones a las nuevas frases introducidas por el usuario para que la música que se está creando evolucione a otras melodías de forma progresiva.

Escuchando los resultados obtenidos en esta primera versión de Riffusion y observando la evolución de sus hermanos a la hora de generar imágenes y vídeos esto hace pensar que estas nuevas inteligencias artificales para la generación de música tendrán una pronta progresión en calidad y en variedad.

Puedes colaborar con este proyecto desde el repositorio de Riffusion en Github..

Participación en las III jornadas de ingenieros de la universidad Pablo Olavide

El pasado 18 de septiembre participé en las III jornadas de ingenieros de la universidad Pablo Olavide de Sevilla. En estas jornadas se habló de tecnología, trabajo y proyectos de ingenieros para personas.

Se trataron temas tan diversos como la filosofía de trabajo para un desarrollador, software de inteligencia artificial y adquisición de conocimientos, guantes de realidad virtual, Big Data o la tecnología detrás de sensores autónomos.

Jonathan Chacón hablando sobre la tecnología para el ocio accesible

Las charlas mantuvieron un nivel tecnológico alto sin resultar incomprensible y el tono de todo el evento fue agradablemente informal.

El equipo organizador de las jornadas ha proporcionado los vídeos de las distintas intervenciones en las III jornadas de ingenieros para que todo el mundo pueda disfrutar de ellas.

Tecnología, inteligencia y accesibilidad

Mi participación se orientó en el potencial que nos ofrece las tecnologías, el concepto de inteligencia la necesidad y los beneficios de la accesibilidad y los gatitos.

Traté conceptos tan esotéricos como que una imagen sin alternativa es tan incomprensible para una persona ciega como para un módulo de inteligencia artificial que analiza contenidos en la Web. De este hecho se deduce que la accesibilidad no sólo beneficia a las personas con discapacidad.

Jonathan Chacón al comienzo de su charla de tecnología, inteligencia y accesibilidad

La acogida por parte del publico de los conceptos de diseño universal, accesibilidad como calidad del producto y la necesidad de diseñar para todos y para mañana fue bastante satisfactoria. Este hecho sigue haciéndome pensar en que, aunque los eventos y congresos de la Discapacidad por y para discapacitados son necesarios, también es necesario que la gente que sabe de accesibilidad participe en eventos y congresos de diseño, desarrollo y mercado.

Es necesario que alguien venga a decirte algo tan claro como que la accesibilidad beneficia a todo el mundo para darte cuenta de esa idea

El doctor y amigo Domingo Savio Rodriguez Baena me invitó a participar en el evento y él también coincide en mi visión de la necesidad de que estos conceptos de diseño universal, accesibilidad beneficiosa para todos y la discapacidad como característica común para todos los seres deben ser divulgados de forma más activa para que todo el mundo sea cosciente de esa realidad.