Transcribe audio GRATIS (sin límite)

Transcribe audio GRATIS (sin límite)

Hace unas semanas me escribió un amigo para ver si podía ayudarle con la tesis que está escribiendo para el doctorado. La temática está relacionada con un violinista de jazz del siglo pasado, y para ello está entrevistando a varias personas cercanas a él.

El resultado son horas y horas de charlas que tiene que transcribir para luego dar forma y extraer lo que sea útil, y claro, el tiempo no es algo que sobre a alguien que está doctorándose mientras trabaja y tiene familia.

Así que me preguntó si conocía alguna herramienta de IA que pudiera ayudarle a transcribir esos audios automáticamente. Y la verdad, así de manera gratuita, no se me ocurrió ninguna. Pensé que podría subir el vídeo a YouTube en oculto y copiar la transcripción automática, o generar subtítulos automáticos en algún editor como CapCut y exportarlo en formato de subtítulo, para luego abrirlo con un programa de texto y darle forma.

Ninguna de las dos opciones parecía muy óptima para un trabajo de dimensiones colosales, así que decidí ponerme manos a la obra a crear un pequeño programa a medida con la ayuda de ChatGPT.

Si es la primera vez que haces algo así puede que te parezca largo y complejo, pero una vez lo pruebes, verás que en el fondo es sencillo y todo ha sido fruto de 3-4 prompts. Te dejo el código completo al final, y si tienes cualquier problema no dudes en comentar.

Requisitos de la herramienta:

  • Transcribe audio a texto (español y catalán)
  • El audio de entrada no tiene límite de tamaño o tiempo
  • Tiene que ser 100 % gratuita (nada de APIs de pago)
  • El resultado es un archivo de texto maquetado (puntuación, mayúsculas, etc)
Nota: para poder hacer esto necesitas tener Python instalado. Es 100 % gratuito y te lo explico aquí paso a paso; si te surge cualquier duda puedes comentar en el post e intentaré ayudarte. Una vez lo tengas, podrás crear tus propias herramientas a medida de manera muy sencilla.

Es importante pensar en todos los requisitos indispensables antes de empezar para ponérselos de manera clara a ChatGPT y no tener que estar editando secciones del código o reescribiéndolo continuamente.

Yo en este caso no me di cuenta de que el punto 2 podía ser un problema, y si lo hubiera especificado desde el principio me habría ahorrado unos cuantos minutos de pruebas.

Reconstrucción de los hechos

Read more