LMSYS.org Características

Arena Hard Auto
Un pipeline automático que convierte datos en vivo en benchmarks de alta calidad para la evaluación de chatbots.
RouteLLM
Un marco de código abierto para servir y evaluar enrutadores LLM, optimizando el enrutamiento de solicitudes a diferentes modelos según sus capacidades.