Gemini ya transcribe tus audios: así funciona, límites y cómo activarlo hoy

Portada Tecnología

Por Redacción:

Ciudad de México, martes 9 de septiembre de 2025. La app de Gemini añadió soporte oficial para subir archivos de audio y procesarlos directamente en la conversación: puedes transcribir, resumir y extraer puntos clave de notas de voz, entrevistas o podcasts sin pasar por herramientas externas. Según la cobertura técnica más reciente, los usuarios gratis pueden cargar hasta 10 minutos de audio con cinco prompts diarios, mientras que AI Pro/Ultra admiten hasta tres horas por archivo y múltiples adjuntos en una sola sesión; la novedad está disponible en Android, iOS y web. Estas capacidades se apoyan en las funciones de “audio understanding” documentadas por Google para los modelos Gemini 2.5, que incluyen descripción, resumen y transcripción textual de clips sonoros.

En la práctica, el flujo es sencillo y ya verificable: abrir gemini.google.com o la app móvil, adjuntar el audio (MP3/WAV/FLAC, entre otros) y pedir “transcribe”, “resúmelo por temas” o “extrae acuerdos y tareas con marcas de tiempo”. La app permite varios archivos en la misma conversación y —si lo necesitas— comprimirlos en ZIP para su análisis conjunto. Con este cambio, Google acerca a usuarios finales lo que ya ofrecía a desarrolladores vía API para casos de transcripción a escala y análisis de medios largos.

Para quienes trabajan en equipo o en clase, la integración con el ecosistema de Google sigue siendo relevante: en Meet, la opción “Take notes for me” (Gemini en Workspace) genera notas y transcripción durante la videollamada —según la documentación y demostraciones oficiales—, mientras que en la app de Gemini también puedes convertir fuentes en audio tipo “podcast” con Audio Overviews para repasar materiales sin leerlos. Son caminos distintos pero complementarios: Meet cubre la transcripción en vivo; Gemini app procesa audios que ya tienes.

Si hoy quieres configurarlo y evitar transcribir a mano: entra a la app de Gemini o a la web, autoriza el acceso a archivos, adjunta tu audio y formula la instrucción (por ejemplo: “transcribe palabra por palabra y agrega marcas de tiempo cada 30 segundos”). Si estás en Workspace y usas Meet, activa Gemini en tu dominio y, al iniciar la videollamada, pulsa “Take notes for me” para que genere notas y transcripción al cierre. Recuerda los límites de plan y que las funciones de audio de la app están ya desplegándose globalmente.

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *