Grok de xAI mejora respuestas sobre Baldur’s Gate: Así se comparan los principales modelos de IA

El enfoque inusual de xAI: priorizar guías de videojuegos

Diferentes laboratorios de inteligencia artificial tienen prioridades distintas. Mientras algunos se centran en usuarios consumidores o empresas, xAI, la startup de Elon Musk, ha puesto un énfasis particular en mejorar las guías y respuestas para videojuegos, según revelaciones recientes.

La obsesión de Musk con Baldur’s Gate

Un informe detallado de Business Insider destacó cómo Elon Musk está involucrado personalmente en los desarrollos de xAI. En un caso ocurrido el año pasado, el lanzamiento de un modelo se retrasó varios días porque Musk no estaba satisfecho con cómo el chatbot respondía preguntas detalladas sobre el videojuego «Baldur’s Gate». Ingenieros de alto nivel fueron desviados de otros proyectos para mejorar esas respuestas antes del lanzamiento.

BaldurBench: un benchmark informal para comparar modelos

Para comprobar si los esfuerzos de xAI dieron resultado, se realizó una comparación informal, bautizada como «BaldurBench», entre Grok (de xAI), ChatGPT, Claude y Gemini. Se plantearon cinco preguntas generales sobre Baldur’s Gate a cada modelo.

Resultados y estilos de cada IA

Grok ofreció información bastante buena, aunque con un lenguaje denso y jerga de videojuegos como «save-scumming» o «DPS». También mostró predilección por el uso de tablas y la teoría detrás del juego.

ChatGPT prefirió listas con viñetas y fragmentos de oraciones, mientras que Gemini tendió a resaltar en negrita palabras importantes.

La mayor sorpresa fue Claude, que mostró especial preocupación por no arruinar la experiencia del jugador con spoilers. Al preguntarle sobre composiciones de grupo recomendadas, cerró su consejo diciendo: «no te estreses demasiado y simplemente juega con lo que te suene divertido».

¿Vale la pena el esfuerzo?

Es importante tener en cuenta que este es un ámbito en el que, según los reportes, xAI se ha esforzado específicamente para alcanzar la paridad con otros modelos. Por lo tanto, no debe sorprender que, tras el esfuerzo reportado, los consejos de Grok resultaran similares a los de sus competidores. Sin embargo, el ejercicio demuestra que xAI puede lograr buenos resultados cuando se lo propone.

La comparación, más allá de los estilos narrativos, revela que todos los modelos extraen información de guías similares disponibles en línea, y que las mayores diferencias radican en la presentación y el tono utilizado para asistir al jugador.

Comparte este artículo

Otras notas de tu interés:

Economia

Centros de datos orbitales: ejecutivos tecnológicos cuestionan la viabilidad de la visión de Musk

Politica Internacional

Corea del Norte reafirma su poderío militar con nuevas pruebas de armas

Politica Internacional

Administración Trump limita el lanzamiento del último modelo de OpenAI

Economia

Última oportunidad: Ahorra hasta $190 en el Founder Summit 2026 – Precio límite esta noche

Economia

Control gubernamental en el lanzamiento de modelos de IA en Estados Unidos: ¿hacia una regulación sin precedentes?

Negocios

OpenAI, SpaceX y Apple se suman a la tendencia de chips personalizados para reducir la dependencia de Nvidia

Politica Internacional

Gobierno de EE. UU. frena el lanzamiento de GPT-5.6 de OpenAI

Economia

OpenAI nombra a Prabhjeet Singh como primer director general en India

Economia

Reguladores de Wall Street investigan el mercado de predicciones Polymarket

Economia

Polymarket demanda por anuncios engañosos en redes sociales