La transcripción aparecerá aquí cuando inicies la llamada
🔐
Configuración del Agente
Ingresa la contraseña para acceder a los ajustes
⚙️ Configuración del Agente
Identidad del agente
Nombre del agente
Este nombre aparece en la interfaz y en el system prompt donde uses {agent_name}.
Voz (Minimax)
Voice ID
ID de la voz en Minimax T2A v2. Cambiá este valor para cambiar la voz del agente.
Velocidad de voz 1.15x
Transcripción de voz (STT)
Modelo STT (Groq Whisper)
Turbo es el más rápido para español. Large v3 es más preciso en acentos.
Modelo de IA (LLM)
Modelo LLM (Groq)
Tokens por respuesta 150
Menos tokens = respuestas más cortas y más rápidas.
Micrófono / VAD
Umbral de voz (SPEECH_THRESHOLD) 3
Volumen mínimo para que el sistema detecte que alguien está hablando. Más alto → ignora ruido de fondo, ventiladores, TV. Útil en ambientes ruidosos. Más bajo → detecta voces suaves o en habitaciones silenciosas. Puede captar ruido accidental.
Pausa para cerrar turno (SILENCE_DURATION) 1300 ms
Milisegundos de silencio necesarios para considerar que el cliente terminó de hablar y enviar el audio. Más alto → espera más antes de cortar. Ideal si el cliente habla con pausas largas o frases largas. Aumenta la latencia. Más bajo → corta más rápido. Menor latencia pero puede enviar antes de que el cliente termine la frase.
Duración mínima de audio (MIN_SPEECH_DURATION) 600 ms
Duración mínima que debe tener el audio grabado para ser enviado al servidor. Más alto → filtra golpes, toses y ruidos accidentales cortos. Puede descartar respuestas muy cortas como "sí" o "no". Más bajo → procesa respuestas muy cortas. Puede enviar ruidos accidentales breves.
Umbral para interrumpir al agente (BARGE_IN_THRESHOLD) 15
Volumen de voz necesario para interrumpir al agente mientras está hablando (barge-in). Más alto → el cliente necesita hablar más fuerte para interrumpir. Evita interrupciones accidentales. Más bajo → cualquier sonido detiene al agente. Puede causar interrupciones por ruido.
Cooldown post-agente (POST_AGENT_COOLDOWN) 600 ms
Tiempo de espera después de que el agente termina de hablar antes de comenzar a escuchar al cliente. Más alto → evita que el micrófono capture el eco final del agente. Útil sin auriculares. Más bajo → el sistema escucha más rápido. Riesgo de capturar el final del audio del agente.
Cooldown post-envío (POST_SEND_COOLDOWN) 1800 ms
Tiempo mínimo de espera después de enviar audio antes de permitir una nueva grabación. Más alto → evita grabaciones dobles o solapadas mientras el servidor procesa. Más seguro. Más bajo → el cliente puede hablar de nuevo más rápido. Riesgo de envíos duplicados si el servidor tarda.
Prompt del agente
Identidad, precios y comunicación
Define quién es el agente, los precios y cómo habla. Variables: {agent_name} y {fecha_hoy}.
Flujo de ventas
Define las etapas que debe seguir el agente para cerrar la venta. Se agrega automáticamente al final del prompt principal.