La profesora e investigadora de la Universitat Internacional de Cataluña, María Fitó-Carreras, durante la conferencia que ha impartido en la inauguración de Prosodia 2025. EFE/Roberto Ruiz Oliva

La IA generativa de voz, ¿una amenaza para los profesionales del pódcast?

Sevilla, (EFE).- La actual oferta de inteligencia artificial (IA) generativa de voz para la producción de pódcast no representa aún una amenaza para el empleo de los profesionales del audio, sobre todo locutores, ha indicado este jueves la profesora e investigadora de la Universitat Internacional de Catalunya, María Fitó-Carreras.

Esta experta ha ofrecido una conferencia sobre los potenciales usos de la inteligencia artificial generativa en la producción de pódcast en la inauguración de ‘Prosodia’, encuentro profesional que reúne en Sevilla a profesionales de este formato de información y entretenimiento.

«Lo que más me preocupa es que nos acostumbremos a estas voces anodinas, planas. En un futuro es muy probable que, cuando entremos en una plataforma, la mayoría de pódcast estén hechos total o parcialmente con IA», ha sentenciado Fitó-Carreras, quien cree que será entonces cuando, paradógicamente, la IA haga valorar «aquello hecho por humanos, con recursos humanos y para humanos».

«La voz es un dato personal que debería ser intransferible. Es nuestro ADN pero hemos empezado a jugar con cosas humanas y a ver cómo terminamos», ha advertido.

La inteligencia artificial generativa (IAG) de voz es capaz de generar mensajes en lenguaje humano mediante algoritmos de aprendizaje profundo, que aprenden a imitar los patrones vocales a partir de datos de habla.

Clonación de voz

Ante este contexto, esta investigadora ha presentado una radiografía de la IAG de voz aplicada a la producción de pódcast para responder si la actual oferta tecnológica representa una amenaza para los empleos de los profesionales del audio, en particular para los locutores.

Para ello, ha analizado los principales programas que emplean los creadores de pódcast para la clonación de voz -que ofrecen herramientas para mejorar el flujo de trabajo y optimizar los costes-, y ha establecido un marco comparativo.

El estado actual de la IAG de voz aplicada al pódcast pone de manifiesto tanto las oportunidades como las limitaciones que esta tecnología ofrece a los creadores y, según la investigación, se observa que la industria está adaptándose a las necesidades del sector.

Para ello, ofrece múltiples herramientas a través de plataformas especializadas que permiten clonar la voz, editar grabaciones, publicar pódcast y distribuirlos en varios idiomas.

Encuentro global ‘Prosodia’

No obstante, no se interpreta como una amenaza inmediata debido a la reproducción de una prosodia -la forma en que se habla- inexacta y la ausencia de elementos «paralingüísticos».

Creadores, productores, distribuidores y académicos del pódcast se reúnen en la tercera edición de ‘Prosodia’ para acercar nuevas tendencias, presentar un informe sobre la producción de audio en España en 2024 y analizar, entre otros asuntos, esos potenciales usos de la inteligencia artificial en esta industria.

Este encuentro, inaugurado por la consejera de Salud , Rocío Hernández, y representantes de la Diputación y el Ayuntamiento de Sevilla, de Fundación Cajasol y la compañía farmacéutica Roche, aborda también la rentabilidad del formato, sus métricas, la ética periodística o su éxito como herramienta de comunicación corporativa. EFE