Ganador Histórico en Competencia de IA para Programadores
El miércoles a las 5 pm PST, el Instituto Laude anunció al primer ganador del K Prize: el brasileño Eduardo Rocha de Andrade, quien recibirá $50,000 pese a resolver solo 7.5% de los problemas planteados.

Un Nuevo Estándar para la Evaluación de IA
Creado por Andy Konwinski (cofundador de Databricks y Perplexity), el K Prize se diferencia de benchmarks tradicionales como SWE-Bench al usar problemas de GitHub posteriores al 12 de marzo, evitando contaminación en los entrenamientos.
- Premio mayor: $1 millón para el primer modelo open-source que supere 90% de aciertos
- Comparativa: SWE-Bench registra 75% en su prueba fácil vs 34% en la compleja
- Enfoque: Favorece modelos pequeños y abiertos con computación limitada
Impacto en la Industria Tecnológica
Expertos como Sayash Kapoor de Princeton destacan la necesidad de estos desafíos:
«Sin pruebas libres de contaminación, no podemos evaluar realmente las capacidades de la IA»
Konwinski enfatiza: «Si no superamos 10% en benchmarks limpios, debemos reevaluar el hype sobre ingenieros de software IA».