Junto Sales Agent — Red Cell × Claro Costa Rica

Alex

Asesora de Ventas · Red Cell

Inactivo

Etapas del flujo

Conversación en vivo

💬

La transcripción aparecerá aquí cuando inicies la llamada

⚙️ Configuración del Agente

Identidad del agente

Nombre del agente

Este nombre aparece en la interfaz y en el system prompt donde uses {agent_name}.

Voz (Minimax)

Voice ID

ID de la voz en Minimax T2A v2. Cambiá este valor para cambiar la voz del agente.

Velocidad de voz 1.15x

Transcripción de voz (STT)

Modelo STT (Groq Whisper)

Turbo es el más rápido para español. Large v3 es más preciso en acentos.

Modelo de IA (LLM)

Modelo LLM (Groq)

Tokens por respuesta 150

Menos tokens = respuestas más cortas y más rápidas.

Micrófono / VAD

Umbral de voz (SPEECH_THRESHOLD) 3

Volumen mínimo para que el sistema detecte que alguien está hablando.
Más alto → ignora ruido de fondo, ventiladores, TV. Útil en ambientes ruidosos.
Más bajo → detecta voces suaves o en habitaciones silenciosas. Puede captar ruido accidental.

Pausa para cerrar turno (SILENCE_DURATION) 1300 ms

Milisegundos de silencio necesarios para considerar que el cliente terminó de hablar y enviar el audio.
Más alto → espera más antes de cortar. Ideal si el cliente habla con pausas largas o frases largas. Aumenta la latencia.
Más bajo → corta más rápido. Menor latencia pero puede enviar antes de que el cliente termine la frase.

Duración mínima de audio (MIN_SPEECH_DURATION) 600 ms

Duración mínima que debe tener el audio grabado para ser enviado al servidor.
Más alto → filtra golpes, toses y ruidos accidentales cortos. Puede descartar respuestas muy cortas como "sí" o "no".
Más bajo → procesa respuestas muy cortas. Puede enviar ruidos accidentales breves.

Umbral para interrumpir al agente (BARGE_IN_THRESHOLD) 15

Volumen de voz necesario para interrumpir al agente mientras está hablando (barge-in).
Más alto → el cliente necesita hablar más fuerte para interrumpir. Evita interrupciones accidentales.
Más bajo → cualquier sonido detiene al agente. Puede causar interrupciones por ruido.

Cooldown post-agente (POST_AGENT_COOLDOWN) 600 ms

Tiempo de espera después de que el agente termina de hablar antes de comenzar a escuchar al cliente.
Más alto → evita que el micrófono capture el eco final del agente. Útil sin auriculares.
Más bajo → el sistema escucha más rápido. Riesgo de capturar el final del audio del agente.

Cooldown post-envío (POST_SEND_COOLDOWN) 1800 ms

Tiempo mínimo de espera después de enviar audio antes de permitir una nueva grabación.
Más alto → evita grabaciones dobles o solapadas mientras el servidor procesa. Más seguro.
Más bajo → el cliente puede hablar de nuevo más rápido. Riesgo de envíos duplicados si el servidor tarda.

Prompt del agente

Identidad, precios y comunicación

Define quién es el agente, los precios y cómo habla. Variables: {agent_name} y {fecha_hoy}.

Flujo de ventas

Define las etapas que debe seguir el agente para cerrar la venta. Se agrega automáticamente al final del prompt principal.