Grok de xAI mejora respuestas sobre Baldur’s Gate: Así se comparan los principales modelos de IA

El enfoque inusual de xAI: priorizar guías de videojuegos

Diferentes laboratorios de inteligencia artificial tienen prioridades distintas. Mientras algunos se centran en usuarios consumidores o empresas, xAI, la startup de Elon Musk, ha puesto un énfasis particular en mejorar las guías y respuestas para videojuegos, según revelaciones recientes.

La obsesión de Musk con Baldur’s Gate

Un informe detallado de Business Insider destacó cómo Elon Musk está involucrado personalmente en los desarrollos de xAI. En un caso ocurrido el año pasado, el lanzamiento de un modelo se retrasó varios días porque Musk no estaba satisfecho con cómo el chatbot respondía preguntas detalladas sobre el videojuego «Baldur’s Gate». Ingenieros de alto nivel fueron desviados de otros proyectos para mejorar esas respuestas antes del lanzamiento.

BaldurBench: un benchmark informal para comparar modelos

Para comprobar si los esfuerzos de xAI dieron resultado, se realizó una comparación informal, bautizada como «BaldurBench», entre Grok (de xAI), ChatGPT, Claude y Gemini. Se plantearon cinco preguntas generales sobre Baldur’s Gate a cada modelo.

Resultados y estilos de cada IA

Grok ofreció información bastante buena, aunque con un lenguaje denso y jerga de videojuegos como «save-scumming» o «DPS». También mostró predilección por el uso de tablas y la teoría detrás del juego.

ChatGPT prefirió listas con viñetas y fragmentos de oraciones, mientras que Gemini tendió a resaltar en negrita palabras importantes.

La mayor sorpresa fue Claude, que mostró especial preocupación por no arruinar la experiencia del jugador con spoilers. Al preguntarle sobre composiciones de grupo recomendadas, cerró su consejo diciendo: «no te estreses demasiado y simplemente juega con lo que te suene divertido».

¿Vale la pena el esfuerzo?

Es importante tener en cuenta que este es un ámbito en el que, según los reportes, xAI se ha esforzado específicamente para alcanzar la paridad con otros modelos. Por lo tanto, no debe sorprender que, tras el esfuerzo reportado, los consejos de Grok resultaran similares a los de sus competidores. Sin embargo, el ejercicio demuestra que xAI puede lograr buenos resultados cuando se lo propone.

La comparación, más allá de los estilos narrativos, revela que todos los modelos extraen información de guías similares disponibles en línea, y que las mayores diferencias radican en la presentación y el tono utilizado para asistir al jugador.

Comparte este artículo

Otras notas de tu interés:

Economia

InScope recauda $14.5 millones en financiación Serie A para impulsar la automatización de informes financieros con IA

Negocios

Startup Battlefield 200: La Batalla por el Futuro de las Startups Tecnológicas

Economia

Lucid Motors despide al 12% de su plantilla en 2025 en busca de rentabilidad

Negocios

Meta Horizon Worlds abandona la realidad virtual y apuesta todo al móvil

Cines y Teatros

Toy Story 5 Enfrenta a los Juguetes Tradicionales contra un Villano de Inteligencia Artificial

Familia y Crianza

Pepper, el robot profesor AI, llega a las aulas de una escuela privada en Hialeah

Cines y Teatros

Toy Story 5: Los Juguetes Clásicos se Enfrentan a una Tableta con IA Malvada

Economia

Ofertas de Última Oportunidad para Disrupt 2026: Fechas y Tarifas Exclusivas

Arte y Cultura

IA en el Cine: El Debate que Enciende a los Cineastas Independientes

Economia

Aumento Alarmante de Ataques de Jackpotting a ATMs: FBI Advierte sobre el Malware Ploutus