Tecnologia

Portada » Artículos » Google AI y los Errores Ortográficos: El Talón de Aquiles de los Modelos de Lenguaje

Google AI y los Errores Ortográficos: El Talón de Aquiles de los Modelos de Lenguaje

mayo 27, 2026

¿Cuántas ‘P’ hay en ‘Google’? La Respuesta de la IA Revela un Problema de Fondo

Recientemente, la inteligencia artificial de Google, conocida como AI Overview, ha vuelto a ser noticia por sus respuestas erráticas. Al preguntarle cuántas ‘P’ tiene la palabra ‘Google’, el sistema respondió que dos. Pero también afirmó que hay “exactamente 1 ‘r’ en la palabra ‘poop’”, y que la palabra ‘periodismo’ contiene dos ‘d’, aunque la escribió como “j-o-u-r-n-a-d-i-s-m”. Incluso al deletrear el apellido del presidente de Estados Unidos, lo escribió como “t-r-p-u-m”.

Un Problema Conocido: Los LLMs y la Ortografía

No se necesita ser un profeta para predecir que la integración masiva de inteligencia artificial en el buscador de Google generaría controversia. No es la primera vez que ocurre: en el pasado, AI Overview citó publicaciones satíricas de The Onion y Reddit, recomendando comer rocas o poner pegamento en la pizza. Ahora, los errores ortográficos han sido el centro de atención.

Google reconoció el problema en una declaración: “Contar palabras ha sido un desafío conocido para los modelos de lenguaje grandes (LLMs), y estamos trabajando para solucionar este problema en particular”.

¿Por qué los LLMs No Saben Deletrear?

Estos errores básicos de ortografía pueden parecer graciosos, pero tienen una explicación técnica. Los LLMs, el tipo de inteligencia artificial que impulsa chatbots y generadores de texto, no están diseñados para entender la ortografía. Durante años, ha sido una broma recurrente: cuando una empresa presenta un nuevo modelo de IA, se le pregunta cuántas ‘r’ tiene la palabra ‘fresa’ (strawberry). Estas IA, capaces de programar una aplicación en segundos o resolver problemas matemáticos complejos, deletrean como un niño de jardín de infantes.

Los investigadores han explicado que la IA no percibe las oraciones como unidades de lenguaje compuestas por palabras y letras. Muchos LLMs se basan en arquitecturas de transformers, que dividen el texto en tokens (palabras, sílabas o letras según el modelo). En lugar de “leer” como un humano, la IA convierte el texto en representaciones numéricas y las contextualiza para generar respuestas lógicas.

“Los LLMs se basan en la arquitectura de transformers, que notablemente no lee texto. Cuando ingresas un prompt, se traduce en una codificación. Al ver la palabra ‘the’, tiene una codificación de lo que significa, pero no sabe sobre ‘T’, ‘H’, ‘E’”. – Matthew Guzdial, investigador de IA y profesor asistente en la Universidad de Alberta.

La arquitectura basada en tokens es inherentemente limitante. Los investigadores no son optimistas en cuanto a resolver el problema de la ortografía. Sheridan Feucht, estudiante de doctorado en la Universidad Northeastern, señaló: “Es difícil definir qué es exactamente una ‘palabra’ para un modelo de lenguaje. Incluso si los expertos humanos acordaran un vocabulario de tokens perfecto, los modelos probablemente aún encontrarían útil ‘fragmentar’ las cosas aún más. Mi opinión es que no existe un tokenizador perfecto debido a esta vaguedad”.

Más Allá de los Errores Ortográficos: Lecciones sobre la Confianza en la IA

Aunque estos fallos no son una prioridad urgente para los investigadores – dado que la utilidad de los LLMs no radica en su capacidad para deletrear – nos recuerdan que la inteligencia artificial no es perfecta. No podemos confiar ciegamente en los resultados de la IA sin verificar su precisión. La próxima vez que uses Google AI Overview, recuerda que hasta los sistemas más avanzados pueden tropezar con lo más básico: el abecedario.

Representación de un servicio de IA que promete respuestas sin filtros, pero que aún lucha con la ortografía básica.

Este artículo se basa en la información disponible sobre los problemas de ortografía en Google AI y modelos de lenguaje grandes, sin añadir datos externos.

Tags errores ortográficos, Google AI, Inteligencia Artificial, LLMs, modelos de lenguaje grandes, ortografía, tokenización

Comparte este artículo

Otras notas de tu interés:

Negocios

Friend 2.0: el wearable de IA de Avi Schiffmann ahora tiene voz y sube de precio

julio 30, 2026

Negocios

LinkedIn lanza un botón para reportar el ‘AI slop’ generado por IA

julio 30, 2026

Tecnologia

Modelos de IA de Anthropic hackearon 3 organizaciones durante pruebas de seguridad

julio 30, 2026

Tecnologia

Google Chrome corrigió más fallos de seguridad en junio que en los últimos dos años

julio 30, 2026

Economia

Okta refuerza la seguridad de identidades de IA con la adquisición de Permiso Security por casi $200 millones

julio 30, 2026

Familia y Crianza

Padres Alineados con Trump Impulsan Normas de Seguridad en Línea para Niños en EE.UU.

julio 30, 2026

Familia y Crianza

Padres alineados con Trump impulsan reglas de seguridad en línea para niños en el Capitolio

julio 30, 2026

Economia

Ingenieros de despliegue avanzado (FDE): el talento más codiciado en la era de la IA

julio 30, 2026

Economia

Nscale Adquiere Anyscale por $1.65 Mil Millones para Fortalecer su Plataforma de Nube de IA

julio 30, 2026

Economia

Nscale Adquiere Anyscale por $1.65 Mil Millones para Dominar la Nube de IA

julio 30, 2026