Grok de xAI mejora respuestas sobre Baldur’s Gate: Así se comparan los principales modelos de IA

El enfoque inusual de xAI: priorizar guías de videojuegos

Diferentes laboratorios de inteligencia artificial tienen prioridades distintas. Mientras algunos se centran en usuarios consumidores o empresas, xAI, la startup de Elon Musk, ha puesto un énfasis particular en mejorar las guías y respuestas para videojuegos, según revelaciones recientes.

La obsesión de Musk con Baldur’s Gate

Un informe detallado de Business Insider destacó cómo Elon Musk está involucrado personalmente en los desarrollos de xAI. En un caso ocurrido el año pasado, el lanzamiento de un modelo se retrasó varios días porque Musk no estaba satisfecho con cómo el chatbot respondía preguntas detalladas sobre el videojuego «Baldur’s Gate». Ingenieros de alto nivel fueron desviados de otros proyectos para mejorar esas respuestas antes del lanzamiento.

BaldurBench: un benchmark informal para comparar modelos

Para comprobar si los esfuerzos de xAI dieron resultado, se realizó una comparación informal, bautizada como «BaldurBench», entre Grok (de xAI), ChatGPT, Claude y Gemini. Se plantearon cinco preguntas generales sobre Baldur’s Gate a cada modelo.

Resultados y estilos de cada IA

Grok ofreció información bastante buena, aunque con un lenguaje denso y jerga de videojuegos como «save-scumming» o «DPS». También mostró predilección por el uso de tablas y la teoría detrás del juego.

ChatGPT prefirió listas con viñetas y fragmentos de oraciones, mientras que Gemini tendió a resaltar en negrita palabras importantes.

La mayor sorpresa fue Claude, que mostró especial preocupación por no arruinar la experiencia del jugador con spoilers. Al preguntarle sobre composiciones de grupo recomendadas, cerró su consejo diciendo: «no te estreses demasiado y simplemente juega con lo que te suene divertido».

¿Vale la pena el esfuerzo?

Es importante tener en cuenta que este es un ámbito en el que, según los reportes, xAI se ha esforzado específicamente para alcanzar la paridad con otros modelos. Por lo tanto, no debe sorprender que, tras el esfuerzo reportado, los consejos de Grok resultaran similares a los de sus competidores. Sin embargo, el ejercicio demuestra que xAI puede lograr buenos resultados cuando se lo propone.

La comparación, más allá de los estilos narrativos, revela que todos los modelos extraen información de guías similares disponibles en línea, y que las mayores diferencias radican en la presentación y el tono utilizado para asistir al jugador.

Comparte este artículo

Otras notas de tu interés:

Economia

Anthropic supera a OpenAI en clientes empresariales: un hito impulsado por Ramp

Negocios

Disrupt 2026: Seis nuevas etapas para la innovación y el emprendimiento

Negocios

Anthropic Lanza Claude for Small Business: Una Nueva Suite de IA para Pequeñas Empresas

Espectáculos y Entretenimiento

Vance y Rubio bromean sobre participar en “The Apprentice”

Economia

Guerra en Irán y auge de energía limpia en China: El telón de fondo de las conversaciones Trump-Xi

Economia

Opinión pública en EE.UU. exige al Congreso una regulación clara de las criptomonedas

Negocios

Anthropic y Cat Wu: La IA que anticipa las necesidades del futuro

Politica

xAI de Elon Musk enfrenta demanda por turbinas de gas sin control ambiental en Mississippi

Economia

Choque Explosivo en el Senado: Wall Street y Criptomonedas en el Centro del Debate

Negocios

Notion revoluciona el trabajo con su nueva plataforma de agentes AI