Así son las nuevas gafas Android XR de Google: manos a la obra
Durante la conferencia Google I/O de esta semana, tuvimos la oportunidad de probar brevemente las próximas gafas con inteligencia artificial de Google. No se trata de las gafas solo de audio que la compañía dijo que comenzarán a enviarse este otoño, sino de las que ofrecen una experiencia combinada de audio y visual.
Una pantalla en la lente para información superpuesta
Anunciadas por primera vez en el evento del año pasado, estas gafas Android XR cuentan con una pantalla en la lente que coloca información útil frente a ti, superpuesta sobre el mundo real. Esto incluye widgets que pueden mostrar cosas como el clima, direcciones para caminar, detalles de recogida de Uber, traducción en vivo y más, incluso widgets que tú mismo diseñes usando inteligencia artificial.

Las gafas también se emparejarán con teléfonos iOS y Android, según señaló la compañía, tanto en el formato solo de audio como en la futura versión con pantalla. Las gafas con pantalla están pensadas para ser el siguiente paso más allá de la primera generación de gafas de audio que saldrán a finales de este año. Fueron desarrolladas en colaboración con Warby Parker, Gentle Monster y Samsung, combinando la tecnología de Google con la estética de diseño de esas marcas.
Prototipo pulido aunque no definitivo
Las gafas que probamos eran todavía un prototipo, aunque lo suficientemente pulido como para ser probado externamente. Los representantes que demostraban las gafas XR explicaron que el prototipo permitía a Google no preocuparse por los detalles cosméticos relacionados con diferentes estilos y formas, para centrarse en experimentar con la tecnología de pantalla más libremente y sus impactos en la duración de la batería. Esto significa que estas gafas son muy diferentes de cualquier versión futura de gafas en cuanto a ajuste, forma, dimensiones y atención al detalle. Es más como poder experimentar con el interior de las gafas, pero en un marco básico y cómodo.
La versión final de las gafas podrá detectar cuándo se colocan en la cabeza y cuándo se quitan, pero las que probamos no tenían esta función.
Activación de Gemini y primeras pruebas
Para activar Gemini, se realiza una pulsación de dos segundos en el lado derecho de la montura de las gafas. Un sonido de inicio suena, indicando que Gemini está encendido y escuchando. En la versión de demostración, iniciar Gemini también inicia la cámara al mismo tiempo, pero la versión final permitirá al usuario configurar si desea encender la cámara cuando Gemini se inicia.
En una primera prueba, reproducimos música a través de las gafas pidiendo a Gemini que pusiera un artista favorito. El lugar era demasiado ruidoso para evaluar la calidad del sonido, ya que la música estaba al volumen máximo y todavía era relativamente difícil de escuchar con claridad y detalle. Sin embargo, la impresión inicial de esta experiencia limitada fue que las gafas no serían un gran sustituto de auriculares de mayor calidad, aunque servirían si solo quisieras algo de música mientras estás al aire libre, caminando, haciendo senderismo o haciendo tareas domésticas. La ventaja de no tener auriculares puestos es que puedes escuchar más fácilmente a alguien que habla, en comparación con las experiencias de modo de transparencia en dispositivos como los AirPods de Apple.
Para apagar la música, toca una vez en el lateral de la montura, aproximadamente en el medio, como si tocara tu sien.
Captura de fotos y manipulación con IA
En la segunda prueba, presionamos el botón de captura de fotos para tomar una foto de una persona. La pantalla estaba apagada, por lo que la foto se transfirió a nuestro teléfono y reloj. (Más adelante podrás capturar video con una pulsación larga, pero esta opción no estaba disponible para probar con el prototipo. En el caso del video, verías una vista previa del video en miniatura en lugar de una foto).
También puedes simplemente pedirle a Gemini que tome una foto sin tener que presionar el botón de foto, y realizar algún tipo de manipulación con IA en el resultado. Por ejemplo, puedes decir algo como: «Toma una foto y convierte a la persona en un personaje de anime». La foto se envía al teléfono, luego a los servidores de Gemini y Nano Banana, y regresa en su versión editada. En el lugar de Google I/O, donde el Wi-Fi estaba bajo una carga pesada, el viaje de ida y vuelta tomó alrededor de 45 segundos.
Pantalla y widgets: información a la vista
Con la pantalla activada, verás una pantalla de inicio simple en tu campo de visión. La versión de demostración tenía algunos widgets precargados que mostraban el clima y una cuenta regresiva para el evento Google I/O. También podías construir lanzadores rápidos para aplicaciones específicas, como Google Maps o Translate, si esas estuvieran entre tus casos de uso principales de las gafas.
El prototipo tenía solo una pantalla sobre el ojo derecho, pero la plataforma puede admitir pantallas simples y dobles, así como gafas solo de audio. La imagen en sí era un poco borrosa, pero lo atribuimos a nuestros lentes de contacto con prescripción, que implican usar un lente optimizado para visión lejana en un lado y otro para visión cercana en el otro. Cuando cerramos un ojo, la imagen se enfocó mejor, pero la experiencia casi de inmediato nos causó algo de fatiga visual sobre el ojo derecho, y no está claro si la prescripción fue la única culpable.
Traducción en vivo: uno de los mejores usos
Una de las mejores demostraciones fue la experiencia de traducción de idiomas en las gafas, respaldada por la aplicación Google Translate en el teléfono. Uno de los demostradores habló español rápido, y las gafas detectaron automáticamente el idioma y mostraron el texto en inglés en la pantalla, mientras Gemini hablaba en inglés en nuestro oído. Podemos imaginar a viajeros de todo el mundo comprando las gafas solo por esta experiencia.
Cabe señalar que Translate funcionará también en las gafas solo de audio, solo que sin el texto mostrado en las gafas. En su lugar, podrías ver la transcripción en el teléfono, si es necesario, además de la retroalimentación de audio en tiempo real.
Navegación con Google Maps integrado
Otra demostración consistió en usar las gafas para navegar. Aunque obviamente no pudimos salir a caminar y salir del lugar para probar su precisión, sí pudimos hacernos una idea de cómo funciona. Puedes iniciar la experiencia de Google Maps pidiéndole a Gemini que navegue a un destino, que puede ser incluso algo tan vago como «la cafetería más cercana».
Gemini activará Google Maps en el teléfono y, después de una breve demora mientras se carga la experiencia, las gafas mostrarán indicaciones paso a paso. Cuando miras hacia adelante, se mostrará la información de tu próximo giro. Pero si necesitas orientarte en el espacio, mira hacia el suelo para ver tu punto azul en un mapa. También puedes girar a la izquierda y a la derecha para rotar en el espacio, como si intentaras que el punto azul apunte en la dirección correcta en tu teléfono. Luego, cuando levantes la vista nuevamente, puedes seguir caminando sin que el mapa estorbe. Debido a que la experiencia está vinculada a Google Maps en tu teléfono, los destinos guardados como «casa» y «trabajo» ya estarán disponibles.
Identificación de objetos con Gemini
También pudimos usar brevemente las gafas para identificar una variedad de objetos en nuestra vista y hacer preguntas sobre ellos. Las gafas inicialmente tuvieron dificultades para identificar una réplica de una pintura de Monet en un estante frente a nosotros, pero eso se debió a que el prototipo no activaba automáticamente la cámara; hubo que encenderla nuevamente desde la aplicación. Aun así, tomó un par de preguntas antes de que Gemini dijera que parecía un Monet, incluso después de acercarnos para enfocar la firma de Monet en la parte inferior izquierda.
Otras pruebas fueron más fluidas, ya que las gafas identificaron inmediatamente la planta en el estante y respondieron preguntas sobre diferentes recetas en un libro. Aun así, estas son cosas que podrías hacer hoy con Google Lens (u otros modelos de IA integrados en aplicaciones de chatbot), aunque suponemos que es interesante poder hacerlo sin tener que sacar el teléfono en absoluto.
Disponibilidad y futuro
Google dice que tendrá más que compartir sobre sus gafas Android XR con pantalla a finales de este año, cuando expanda su programa de probadores de confianza. Mientras tanto, la compañía cree que el audio será suficiente para las necesidades de algunos usuarios, lo que quizás sea una forma inteligente de restar importancia al hecho de que no tiene sus gafas con pantalla listas, a pesar de la competencia de Meta y Snap en este frente.
Al igual que la versión con pantalla, las gafas de audio también proporcionan acceso a Gemini AI de Google, que se escucha de forma privada a través de los altavoces del marco de las gafas. Puedes hacer cosas como escuchar música a través de las gafas, presionar un botón para tomar una foto, hacer una llamada o acceder a las aplicaciones de tu teléfono desde estas gafas, como en las futuras versiones con pantalla.
El acceso a otras aplicaciones de terceros no estaba entre los elementos que probamos, pero las gafas permitirán a los usuarios decirle a Gemini cosas como «toma los ingredientes de esta receta y agrégalos a mi lista de compras». En otro ejemplo que Google mostró durante la keynote del evento, las gafas podían ver una comida que el usuario estaba cocinando en la estufa y ofrecer comentarios sobre la comida, como si la carne ya estaba completamente cocida o no.