dIArio #29: Google I/O y el humo

Share
dIArio #29: Google I/O y el humo

Hoy te traigo un especial sobre el evento de Google de esta semana pasada.

Hay unas cuantas cosas interesantes pero creo que ha sido decepcionante tanto la ausencia de un nuevo modelo de Veo, como los resultados del modelo que lo reemplaza.

Como dije en este vídeo, veo a muchos influencers de IA hablando maravillas de Gemini Omni y sus capacidades para editar vídeo, explicando que eso es lo que lo diferencia de Seedance 2.0. Y eso es lo que pasa cuando la gente crea contenido centrado en el hype para ganar visitas pero no han probado los modelos más allá de cuatro vídeos de capibaras surfeando.

Como se ve en ese vídeo (y en otros tantos que he compartido), Seedance 2.0 también puede editar vídeo. La diferencia es que, por lo que hemos podido ver hasta ahora, el modelo chino lo hace mejor y además es más versátil. Así que lo interesante de Omni será si podremos usarlo a bajo coste y sacrificar calidad por presupuesto y velocidad.

Pero no todo es humo, así que vamos con las noticias


Modelos

Google ha lanzado Gemini 3.5 Flash, el primer modelo de la familia 3.5 y, según la propia compañía, el más potente que tiene hasta la fecha para programación y agentes autónomos, superando a Gemini 3.1 Pro. Corre cuatro veces más rápido que otros modelos frontera y en pruebas internas fue capaz de construir un sistema operativo desde cero. Ya está disponible globalmente y el 3.5 Pro llega el mes que viene. Construir un sistema operativo entero suena increíble, sobre todo si no te bloquean funciones de manera aleatoria como a mí.
Fuente

Gemini Omni es la nueva familia multimodal de Google, pensada para "crear cualquier cosa a partir de cualquier entrada". La primera variante, Omni Flash, traga texto, imágenes, audio y vídeo y escupe clips de unos 10 segundos con audio sincronizado, físicas realistas y personajes consistentes, jubilando a Veo dentro de la app Gemini. Cuando todos esperábamos un Veo 4 que luchara contra el gigante chino, llega esto con la excusa de la edición pero que, en términos generales, es simplemente peor.
Fuente

Google DeepMind ha conectado Street View con Project Genie, su "world model" que genera entornos 3D interactivos; ahora cualquier lugar real de Google Maps se puede convertir en un paisaje navegable dentro de Genie. Se despliega a nivel global para suscriptores de AI Ultra mayores de edad. Espero que sea más preciso que el propio maps cuando estás intentando llegar al restaurante a tiempo.
Fuente

Agentes y desarrollo

Spark es un agente personal que corre en máquinas virtuales de Google Cloud y sigue trabajando aunque apagues todo. Construido sobre Gemini 3.5 Flash y el harness de Antigravity, se conecta de forma nativa a Gmail, Docs, Sheets, Slides y Drive, y por MCP a apps de terceros como Canva, OpenTable o Instacart. Arranca con testers de confianza y la semana que viene pasa a beta para suscriptores de AI Ultra en EE. UU. Todos están pivotando hacia los modelos agénticos y creo que en el futuro puede ser un problema, entre otras cosas por esto.
Fuente

Gemini for Science es una colección de herramientas en Google Labs para investigación, con generación de hipótesis con Co-Scientist, descubrimiento computacional con AlphaEvolve y ERA, y análisis de literatura con NotebookLM, además de conectar Antigravity con más de 30 bases de datos de ciencias de la vida. Llegó con dos artículos en Nature el mismo día, con resultados como un fármaco reutilizado que bloqueó el 91 % de una respuesta ligada a la fibrosis hepática en organoides de Stanford. Está bien recordar de vez en cuando que la IA no se resume a ChatGPT y Nano Banana.
Fuente

Búsqueda y compras

Google ha hecho el mayor cambio a su caja de búsqueda en más de 25 años añadiendo un buscador que se expande solo, procesa texto, imágenes, archivos, vídeos y pestañas de Chrome, y usa Gemini 3.5 Flash por defecto. Suma "agentes de información" que vigilan 24/7 cosas como pisos en alquiler o precios, y una UI generativa que te monta al vuelo dashboards, simulaciones y mini-apps interactivas. AI Mode alcanzó los 1.000 millones de usuarios mensuales en su primer año, aunque imagino que no precisamente por voluntad de los usuarios.
Fuente

Ask YouTube permite buscar en YouTube con lenguaje natural y preguntas complejas en lugar de palabras clave: pides "consejos para enseñar a un niño a montar en bici" y te compila Shorts y vídeos largos en una respuesta estructurada, con opción a preguntas de seguimiento. De momento solo para suscriptores Premium mayores de 18 años en EE. UU. Al menos parece que aquí el creador sí recibirá la visita, a diferencia de lo que pasa con las búsquedas en LLM.
Fuente

Universal Cart es un carrito único que junta lo que añades desde Search, Gemini, YouTube y Gmail, y trabaja en segundo plano vigilando bajadas de precio, restocks e incluso compatibilidades (avisarte de que esa placa base y ese procesador no se llevan bien al montar un PC). Está montado sobre Google Wallet y su Universal Commerce Protocol, con un protocolo de pagos (AP2) para que el agente compre solo dentro de los límites que le marques. Si todavía no hemos solucionado que respondan a preguntas sencillas sin inventarse todo, darle acceso autónomo para comprar e información sobre lo que buscas parece desde luego una gran idea.
Fuente

Dispositivos y contenido

Samsung y Google han enseñado por primera vez sus gafas Android XR "Intelligent Eyewear", hechas con Gentle Monster (estilo más loco) y Warby Parker (clásicas), pensadas como complemento del móvil. Integran Gemini para navegación por voz, recomendaciones según el contexto, resúmenes de notificaciones, recordatorios y traducción en tiempo real que imita la voz del hablante y traduce menús y carteles. Las primeras unidades llegan este otoño en mercados seleccionados con chips Snapdragon. Cuando lleguen las de Apple ya estaremos todos y empezará la nueva guerra ahora que en los teléfonos todo se ha aplanado bastante.
Fuente

Google Pics es la nueva herramienta de Workspace para generar y editar imágenes, construida sobre el modelo Nano Banana. Su truco es tratar cada elemento de la imagen como un objeto independiente: seleccionas, mueves, redimensionas o transformas partes concretas sin tocar el resto, además de editar y traducir el texto que aparece dentro. Se integra de inicio en Slides y Drive, con marca de agua SynthID en todo. Google con Nano Banana es como un niño con zapatillas nuevas que quiere enseñárselas a todo el mundo.
Fuente

Google ha ampliado sus marcas de agua invisibles SynthID y la verificación C2PA a la app Gemini, y pronto a Search y Chrome (con detección también en Circle to Search y Lens). Dice tener ya marcados más de 100.000 millones de imágenes y vídeos y 60.000 años de audio. Además, OpenAI, Kakao e ElevenLabs adoptarán SynthID sumándose a Nvidia, justo antes de que entren en vigor el AI Act europeo y la California AI Transparency Act en agosto de 2026. Estas marcas de agua servirán en un juicio, pero no van a evitar que tu suegra se crea ese vídeo de gatos bailando el último trend de TikTok que ha visto en Facebook.
Fuente


Y hasta aquí las noticias del evento de Google I/O. Una semana completita, la verdad. He intentado compactar las más interesantes en mi opinión, pero si tienes curiosidad, puedes echar un ojo en la web oficial.

Nos vemos el jueves con más IA, un abrazo.
Amaiur.