El enfoque inusual de xAI: priorizar guías de videojuegos
Diferentes laboratorios de inteligencia artificial tienen prioridades distintas. Mientras algunos se centran en usuarios consumidores o empresas, xAI, la startup de Elon Musk, ha puesto un énfasis particular en mejorar las guías y respuestas para videojuegos, según revelaciones recientes.
La obsesión de Musk con Baldur’s Gate
Un informe detallado de Business Insider destacó cómo Elon Musk está involucrado personalmente en los desarrollos de xAI. En un caso ocurrido el año pasado, el lanzamiento de un modelo se retrasó varios días porque Musk no estaba satisfecho con cómo el chatbot respondía preguntas detalladas sobre el videojuego «Baldur’s Gate». Ingenieros de alto nivel fueron desviados de otros proyectos para mejorar esas respuestas antes del lanzamiento.
BaldurBench: un benchmark informal para comparar modelos
Para comprobar si los esfuerzos de xAI dieron resultado, se realizó una comparación informal, bautizada como «BaldurBench», entre Grok (de xAI), ChatGPT, Claude y Gemini. Se plantearon cinco preguntas generales sobre Baldur’s Gate a cada modelo.
Resultados y estilos de cada IA
Grok ofreció información bastante buena, aunque con un lenguaje denso y jerga de videojuegos como «save-scumming» o «DPS». También mostró predilección por el uso de tablas y la teoría detrás del juego.
ChatGPT prefirió listas con viñetas y fragmentos de oraciones, mientras que Gemini tendió a resaltar en negrita palabras importantes.
La mayor sorpresa fue Claude, que mostró especial preocupación por no arruinar la experiencia del jugador con spoilers. Al preguntarle sobre composiciones de grupo recomendadas, cerró su consejo diciendo: «no te estreses demasiado y simplemente juega con lo que te suene divertido».
¿Vale la pena el esfuerzo?
Es importante tener en cuenta que este es un ámbito en el que, según los reportes, xAI se ha esforzado específicamente para alcanzar la paridad con otros modelos. Por lo tanto, no debe sorprender que, tras el esfuerzo reportado, los consejos de Grok resultaran similares a los de sus competidores. Sin embargo, el ejercicio demuestra que xAI puede lograr buenos resultados cuando se lo propone.
La comparación, más allá de los estilos narrativos, revela que todos los modelos extraen información de guías similares disponibles en línea, y que las mayores diferencias radican en la presentación y el tono utilizado para asistir al jugador.