domingo, 1 de mayo de 2022

Tecnología texto a voz: ¿Qué es y cómo funciona?

La tecnología texto-a-voz lee en voz alta textos digitales, palabras en computadoras, teléfonos inteligentes y tabletas. Puede ayudar a personas que tienen problemas visuales o bien, dificultades con la lectura.

Existen herramientas texto-a-voz disponibles en casi todos los dispositivos digitales.

La tecnología texto-a-voz (TTS, text to speech) es un tipo de tecnología de asistencia que lee texto digital en voz alta. En ocasiones se conoce como tecnología “de lectura en voz alta”.

Con el clic de un botón o el toque de un dedo puede convertir en audio las palabras en una computadora o en otro dispositivo digital. Es muy útil para los niños que tienen dificultad para leer. Pero también puede ayudarlos con la escritura y la edición, e inclusive con la atención.

¿Cómo funciona el texto-a-voz?

El texto-a-voz funciona en casi todos los dispositivos digitales personales, incluyendo computadoras, teléfonos inteligentes y tabletas. Es en definitiva, la representación de audio digitalizada de texto de computadora en voz. El software TTS puede "leer" texto de un documento, página web o libro electrónico, generando un discurso sintetizado a través de los altavoces de una computadora.

La voz es generada por computadora y la velocidad de lectura generalmente puede aumentarse o disminuirse. La calidad de la voz varía, pero algunas voces suenan humanas. Incluso hay voces generadas por computadora que simulan niños hablando. Muchas herramientas de la tecnología de texto-a-voz resaltan palabras mientras son leídas en voz alta.

Algunas herramientas de texto-a-voz también tienen una tecnología llamada reconocimiento óptico de caracteres (OCR, por sus siglas en inglés). Esta tecnología permite que el texto-a-voz lea texto presente en imágenes.

Los programas TTS pueden ser útiles para una variedad de aplicaciones. Por ejemplo, la corrección de pruebas con TTS permite al autor captar frases incómodas, palabras faltantes o problemas de ritmo. TTS también puede convertir archivos de texto en archivos de audio MP3 que luego se pueden transferir a un reproductor MP3 portátil o CD-ROM. Esto puede ahorrar tiempo al permitir que el usuario escuche informes o materiales de antecedentes en la cama, en el camino a una reunión o mientras realiza otras tareas.

Incluso el mejor software de escritura de guiones incluye la funcionalidad TTS para que un escritor pueda asignar diferentes voces a los personajes de su guión. Luego, el escritor puede escuchar el diálogo para eliminar oraciones forzadas. También hay usos personales para TTS. ¿Atrasado en leer tu correo electrónico o blogs favoritos? Escuche archivos TTS mientras hace ejercicio, trota, limpia la casa o lleva al perro a pasear.

En el área de la educación, los programas TTS brindan una ventaja valiosa, particularmente para aprender nuevos idiomas. Los motores de voz están disponibles en una variedad de idiomas, incluidos inglés, español, alemán, francés y muchos más.

La tecnología "Texto a voz" marca una diferencia fundamental para las personas con discapacidad, como mala visión, dislexia visual, o las personas con pérdida del habla que pueden utilizar programas TTS especializados para convertir las palabras mecanografiadas en vocalizaciones.

Este tipo de software varía en calidad, al igual que los motores de voz. Las voces artificiales pueden sonar muy robóticas o bastante naturales. Los programas TTS de terceros pueden permitir una gran flexibilidad y, en muchos casos, una calidad de voz muy mejorada. La mayoría de estos programas asequibles vienen con una variedad de voces para elegir, tanto masculinas como femeninas. Algunos ofrecen voces con acentos. Para campos especializados de vocabulario, como la terminología médica, se requiere un programa médico de TTS.

La vocalización de TTS ha recorrido un largo camino y seguirá mejorando. El arte de diseñar software que pueda proporcionar una pronunciación e inflexión dependientes del contexto es una tarea muy complicada y que requiere mucho código. Antes de comprar un programa TTS, escuche muestras de las voces digitalizadas. Las voces que suenan poco naturales distraen la atención del contenido y pueden ser inadecuadas para algunos propósitos. Los motores de búsqueda revelarán una multitud de programas para elegir.

Fuentes consultadas:

Equipo de Understood

spiegato.com/ 

No hay comentarios:

Publicar un comentario