La sección Metrics profundiza más que Snapshot. Mientras Snapshot te dice "qué está pasando en este momento", Metrics responde "¿esto está funcionando?": específicamente, si tus entrevistas con IA están generando señales útiles para la contratación y dónde está perdiendo Candidatos el pipeline.
Metrics tiene dos pestañas: General (salud operativa) y Outcome Analysis (efectividad de contratación).
Pestaña General
La pestaña General hace seguimiento de la salud operativa: volumen de llamadas, tasas de finalización, patrones de abandono y cómo avanzan los Candidatos en el proceso después de su entrevista.
Llamadas iniciadas
La misma definición que en Snapshot: entrevistas en las que un Candidato se conectó. La adición clave aquí es la comparación de tendencia (por ejemplo, "+28% vs prev period"), que te indica si el volumen está creciendo, manteniéndose estable o disminuyendo.
Gráfica Volume / Completion
Una línea de tiempo (por hora o por día) que muestra dos series:
Volume (azul): cuántas entrevistas comenzaron en cada intervalo de tiempo.
Completed (verde): cuántas de esas llegaron a la etapa "finalizada".
La brecha entre las dos líneas es tu tasa de abandono. Si la brecha se ensancha durante ciertas horas, algo en esos horarios puede estar causando problemas: conexiones telefónicas, perfil demográfico de los Candidatos o cambios en la configuración del agente.
Consejo: cambia entre las vistas Hourly y Daily según lo que estés investigando. Hourly es útil para detectar patrones por hora del día (por ejemplo, picos de abandono durante el almuerzo). Daily es mejor para tendencias semana a semana.
Distribución del estado de las llamadas
Un desglose de todos los intentos de llamada, incluyendo las llamadas que nunca se contestaron:
Estado | Significado |
🔇 Not Taken | Nadie contestó. Se intentó la llamada, pero el Candidato no respondió. |
✅ Completed | El Candidato finalizó la entrevista completa hasta la etapa de cierre. |
⚠️ Unfinished | El Candidato se conectó pero se fue antes de completar todas las etapas. |
📅 Rescheduled |
|
❌ Declined | El Candidato se negó explícitamente a continuar. |
Importante: esta gráfica incluye las llamadas Not Taken, mientras que el KPI "Calls Started" no. Por eso el total aquí puede ser mayor que Calls Started. "Calls Started" mide la demanda (Candidatos que interactuaron), mientras que "Call Status Distribution" mide todos los intentos de contacto.
Una tasa alta de Not Taken (>50%) suele significar que los Candidatos no esperaban la llamada, el horario no es adecuado o el número telefónico se ve poco familiar. Una tasa alta de Declined sugiere que los Candidatos están optando por salir: revisa si el mensaje de apertura es claro sobre qué es la llamada y cuánto dura.
Distribución del estado de los Candidatos
Muestra cómo están distribuidos los Candidatos en los estados de tu pipeline de reclutamiento después de su entrevista con IA (por ejemplo, Scheduled Recruiter Interview, Rejected, Pending Rejection). Esto te dice qué les sucede a los Candidatos más adelante después de TalkScore, y es útil para entender si las puntuaciones están impulsando las decisiones correctas para el siguiente paso.
Histograma Duration
Distribución de la duración de las llamadas completadas en intervalos de tiempo (0–30s, 30–60s, 1–2m, 2–3m, 3–5m, 5–7m, 7–10m, 10m+).
Qué buscar:
Un grupo en 0–30s suele significar fallos técnicos o cortes inmediatos, no entrevistas reales.
Si la mayoría de las llamadas duran menos de 3 minutos, las entrevistas pueden ser demasiado cortas para generar puntuaciones confiables. El agente podría estar pasando demasiado rápido por las preguntas.
Si las llamadas duran consistentemente 10+ minutos, el agente puede ser demasiado verboso o el set de preguntas puede ser muy largo para el puesto.
Pestaña Outcome Analysis
Aquí es donde respondes la pregunta más importante: ¿las puntuaciones de IA predicen quién será contratado?
Outcome Analysis compara a los Candidatos que finalmente fueron contratados contra los que no, usando sus puntuaciones de la entrevista con IA como base. Para que esto funcione, los Candidatos deben haber sido clasificados (marcados como contratados o no contratados) en el sistema.
Usa al menos 30 días de datos para obtener resultados significativos. Las muestras pequeñas (sobre todo del lado de los contratados) significan que las conclusiones se deben sacar con cautela.
Candidatos clasificados
Total de Candidatos que tienen un resultado de contratación registrado. La división (por ejemplo, "40 contratados / 1520 no contratados") te muestra el tamaño de la muestra.
Porcentaje de contratados
Qué porcentaje de los Candidatos clasificados fueron contratados. Esto te da la tasa base contra la cual se miden todas las demás métricas de predictibilidad.
La puntuación predice el resultado de contratación
La métrica clave de predictibilidad. Se calcula así:
(% de Candidatos contratados que puntuaron 4–5) menos (% de Candidatos no contratados que puntuaron 4–5)
Resultado | Qué significa |
Positivo (por ejemplo, +18%) | Los Candidatos con puntuaciones altas tienen más probabilidades de ser contratados. La puntuación está aportando valor predictivo. Cuanto mayor sea el número, más fuerte es la señal. |
Cercano a cero | Los Candidatos contratados y los no contratados puntúan de forma similar. La puntuación no está diferenciando. |
Negativo | Los Candidatos no contratados en realidad puntúan más alto que los contratados. La rúbrica puede estar midiendo lo que no debe, o las decisiones de contratación se basan en criterios que la IA no evalúa. |
CEFR predice el resultado de contratación
El mismo concepto aplicado al dominio del idioma. ¿Los Candidatos con niveles CEFR más altos tienen más probabilidades de ser contratados?
Contratados con B2 o superior
El porcentaje de Candidatos contratados que alcanzaron un nivel CEFR B2 (intermedio-alto) o superior. Si este número es bajo para un puesto que requiere un buen nivel de inglés, puede haber un desajuste entre el umbral de idioma y tus estándares reales de contratación.
Brecha de fluidez — contratados vs no contratados
La diferencia en las puntuaciones promedio de fluidez en el idioma entre Candidatos contratados y no contratados. Una brecha más amplia significa que las habilidades de idioma son un factor importante en la contratación.
Mayor brecha de puntuación
La dimensión de habilidad blanda con la mayor diferencia promedio de puntuación entre Candidatos contratados y no contratados. Esta es tu señal de contratación más fuerte: la habilidad que más diferencia a quién recibe una oferta.
Menor brecha — señal más débil
La dimensión donde los Candidatos contratados y los no contratados puntúan de forma más similar. Esta habilidad no está ayudando a diferenciar a los Candidatos y puede valer la pena restarle énfasis o reconsiderarla en la rúbrica.
Distribución de TalkScore — contratados vs no contratados
Un histograma lado a lado que muestra la distribución de puntuaciones para cada grupo. Lo ideal es ver una separación clara: los Candidatos contratados agrupándose en 4–5 y los Candidatos no contratados dispersos hacia abajo. Si las dos distribuciones se superponen mucho, la puntuación no es un filtro útil.
Filtros disponibles
Tanto la pestaña General como Outcome Analysis admiten estos filtros, que actualizan todas las gráficas y métricas de forma dinámica:
Rango de fechas: Last 7 days, Last 30 days o un rango de fechas personalizado.
Assessment: filtra por un agente de IA específico o ve todas las evaluaciones.
Campaign: filtra por una campaña de reclutamiento específica o ve todas las campañas.
Flujos de trabajo comunes
Validar tu rúbrica de puntuación
Ve a Metrics → Outcome Analysis y configura el rango de tiempo en al menos 30 días.
Revisa Score Predicts Hiring Outcome. ¿Es positivo y significativo (idealmente >10%)?
Mira la gráfica TalkScore Distribution. ¿Hay una separación visible entre contratados y no contratados?
Revisa el Biggest Score Gap: esta es la habilidad que tu rúbrica mide mejor.
Revisa el Smallest Gap: considera si esta habilidad debería seguir en la rúbrica o reemplazarse por algo más predictivo.
Si las puntuaciones no están prediciendo los resultados, contacta a tu representante de Talkpush con tus hallazgos; pueden revisar y refinar los criterios de puntuación.
Investigar una finalización baja
Ve a Metrics → General.
Revisa el histograma Duration: ¿hay muchas llamadas que terminan en menos de 60 segundos? Esas pueden ser fallos técnicos, no entrevistas reales.
Mira la gráfica Volume / Completion: ¿las caídas en finalización coinciden con momentos específicos del día?
Revisa Call Status Distribution: ¿la proporción de Unfinished frente a Completed es inusualmente alta?
Ve a Assessments → [agente] → Overview → Dropout by Stage para ver exactamente en qué punto se van los Candidatos.
Abre algunos reportes de Candidatos con entrevistas incompletas en Reports para leer las transcripciones y entender por qué los Candidatos abandonaron.
Ver también
Para consistencia de la puntuación y desviación de la rúbrica, consulta Score Calibration.


