Entrenamiento de Voces: Tu Agente Envía Audios por WhatsApp
Runia ahora soporta entrenamiento de voces personalizado. Tus agentes de IA pueden enviar mensajes de voz naturales a tus clientes por WhatsApp.

Desde hoy, los agentes de Runia pueden enviar mensajes de voz personalizados a tus clientes. Con el nuevo módulo de entrenamiento de voces, cada agente puede tener su propia voz única y natural, generando audios que suenan como una persona real. Es una forma más humana y cercana de atender a tus clientes por WhatsApp.
Qué hay de nuevo
Antes, tus agentes solo podían comunicarse por texto. Ahora, con el entrenamiento de voces, podés configurar una voz personalizada para cada agente y enviar audios automáticamente dentro de una conversación. El cliente recibe un mensaje de voz real, generado por IA, con la personalidad y tono que definas.
- Voces personalizadas: Entrená la voz de tu agente con muestras de audio reales para que suene natural y consistente
- Integración con WhatsApp: Los audios se envían directamente como notas de voz dentro de la conversación
- Generación automática: El agente decide cuándo enviar un audio según el flujo de conversación configurado
- Múltiples idiomas: Soporte para español, inglés y portugués con acento regional
Qué es el entrenamiento de voces
El entrenamiento de voces (también conocido como voice cloning) es una tecnología que permite crear una síntesis de voz a partir de muestras de audio. En lugar de usar una voz genérica de robot, podés entrenar al sistema con grabaciones reales para que el resultado suene como una persona específica.
En el contexto de Runia, esto significa que cada agente puede tener una identidad vocal propia. Si tenés un agente de ventas llamado "Carla", podés entrenar su voz para que los audios que envíe suenen consistentes con esa personalidad.
Cómo funciona
- Subís muestras de audio — Grabaciones de la voz que querés clonar (al menos 30 segundos de audio limpio)
- El sistema entrena el modelo — Runia procesa las muestras y genera un perfil de voz único
- Configurás el agente — Asignás la voz entrenada a uno o más agentes
- El agente envía audios — Cuando el flujo conversacional lo requiere, el agente genera y envía un audio automáticamente
Beneficios para tu negocio
Los mensajes de voz tienen un impacto diferente en la percepción del cliente. No es lo mismo leer un texto que escuchar una voz cálida y natural.
Texto vs. Audio: Comparativa
| Aspecto | Mensaje de texto | Mensaje de voz |
|---|---|---|
| Tono percibido | Neutral, puede malinterpretarse | Cálido, humano, claro |
| Atención del cliente | Puede ser ignorado | Mayor tasa de reproducción |
| Personalización | Limitada al contenido | Voz + contenido = identidad única |
| Velocidad de lectura | Variable según usuario | El cliente escucha a su ritmo |
| Cercanía | Baja | Alta — genera confianza |
Casos de uso
- Clínicas y consultorios: Recordatorios de turno con voz amable, confirmaciones y seguimiento post-consulta
- Tiendas online: Notificaciones de pedido listo, actualizaciones de envío y agradecimiento por compra
- Inmobiliarias: Presentación de propiedades con descripción en audio para crear una experiencia más personal
- Servicios profesionales: Seguimiento de clientes, respuestas a consultas frecuentes y onboarding de nuevos clientes
- Educación: Recordatorios de clase, notificaciones de inscripciones y comunicados a estudiantes
Cómo empezar a usarlo
Configurar entrenamiento de voces
Pasos para activar y configurar voces personalizadas en tus agentes
Tiempo estimado: 15-30 minutos
- 1
Acceder a la configuración del agente
Ingresá al panel de Runia, seleccioná el agente al que querés agregarle voz y andá a la sección "Voz" en la configuración.
- 2
Subir muestras de audio
Subí al menos 30 segundos de audio limpio de la voz que querés clonar. Asegurate de que las grabaciones no tengan ruido de fondo ni música.
- 3
Iniciar el entrenamiento
Hacé clic en "Entrenar voz" y esperá a que el sistema procese las muestras. Esto suele tardar entre 5 y 15 minutos.
- 4
Probar la voz generada
Una vez completado, podés escuchar una preview de la voz generada con textos de prueba para verificar que suena como esperás.
- 5
Activar en conversaciones
Habilitá el envío de audios en los flujos conversacionales del agente. Podés configurar en qué momentos el agente envía un audio en lugar de texto.
Si ya usas Runia, el módulo de voces está disponible directamente desde el panel de configuración de cada agente. No necesitás instalar nada extra.
¿Querés explorar todo lo que podés hacer con tus agentes? Ver más sobre chatbot de WhatsApp con IA
Preguntas frecuentes
Preguntas frecuentes sobre entrenamiento de voces
El mínimo necesario son 30 segundos de audio limpio, sin ruido de fondo. Sin embargo, recomendamos subir entre 2 y 5 minutos de grabación para obtener mejores resultados. Cuantas más muestras proporciones, más natural sonará la voz generada.
No. La tecnología de síntesis de voz actual produce resultados muy naturales, casi indistinguibles de una voz humana real. Al entrenar con muestras reales, el sistema captura matices como entonación, ritmo y acento regional.
Sí, cada agente puede tener su propia voz entrenada. Podés asignar voces diferentes según el sector (ventas, soporte, onboarding) o crear identidades vocales únicas para cada contexto.
Los audios se envían como mensajes de voz normales de WhatsApp. La calidad es tan natural que la mayoría de los clientes no distinguen la diferencia. Recomendamos ser transparentes cuando el cliente lo pregunte.
El proceso de entrenamiento toma entre 5 y 15 minutos, dependiendo de la cantidad de muestras proporcionadas. Una vez completado, la voz queda disponible inmediatamente para usar en tus agentes.
Actualmente soportamos español (con variantes regionales como argentino, mexicano, español), inglés y portugués. Estamos trabajando en incorporar más idiomas en las próximas actualizaciones.