Un pipeline automático que convierte datos en vivo en benchmarks de alta calidad para la evaluación de chatbots.
Un marco de código abierto para servir y evaluar enrutadores LLM, optimizando el enrutamiento de solicitudes a diferentes modelos según sus capacidades.