mayo 23, 2025

Google I/O 2025: noticias destacadas de la conferencia

Un repaso de las principales novedades y próximas aplicaciones para las tecnologías de Google

Este martes 20 de mayo pudimos ver la conferencia de Google de este año, con muchos anuncios y detalles sobre el entorno del gigante tecnológico. Todo con un gran peso de su modelo de IA, Gemini, y nuevas aplicaciones tanto a nivel de software como de hardware.

Aquí dejamos un repaso a las noticias destacadas para este año en productos y servicios de Google:

Novedades de software


Gemini 2.5 Pro y Flash

Nuevas funciones para Gemini 2.5 Pro, con capacidad para hablar con distintas voces y en distintos idiomas (incluso en una misma oración),  también la integración de la cámara para que describa lo que ve. Gemini 2.5 Flash (la versión más ligera y barata) también ha mejorado en cuanto a rendimiento. 

Se puede probar gratuitamente a través de Google AI Studio.

Traducción en tiempo real para Google Meet

Gracias a la IA se pueden generar voces en tiempo real que adaptan lo que dice cada participante de la conversación. Por el momento sólo funciona con inglés y español. Está en fase beta para suscriptores de los planes Google Al Pro y Ultra.

Project Astra

Aplicaciones para smartphone o gafas inteligentes, que reaccionan en tiempo real a un input de vídeo y audio, es decir, pueden responder a preguntas que le hace el usuario sobre el entorno que pueden ver a través de una cámara. Aunque aún no hay ninguna fecha de lanzamiento confirmada.

Project Mariner

La nueva tecnología de agentes, es decir, la IA que puede interactuar directamente con las aplicaciones que usan los usuarios. Potencialmente quieren integrarlo para las búsquedas en el navegador, interactuar en páginas web, realizar llamadas en nombre del usuario o buscar y dictar una información concreta en un PDF. 

Gemini Diffusion

Una versión experimental, con lista de espera para la beta abierta. Los generadores de texto, por lo general, funcionan de manera secuencial para escribir. Es decir, que cada token, cada palabra generada es condicionada por lo anterior para tener coherencia; por eso podemos ver en la mayoría de casos como se genera el texto de principio a fin. 

En el caso de las imágenes, normalmente, los píxeles se generan por difusión, todos en conjunto pasan de ruido a una imagen cohesiva de manera paralela. La idea de esta nueva herramienta es aplicar este método a la generación de texto, así todas las líneas se generan a la vez y en cuestión de segundos pasan de ruido a un texto coherente.

Notebook LM

Ahora estará disponible en IOS y Android. Además de la opción de generar un audio a modo de podcast sobre la documentación que uno sube, también incluirá la opción de generar vídeo.

Veo 3

El nuevo modelo de generación de vídeo y audio nativo con IA. Un clip íntegramente creado usando esta herramienta fue el que abrió la conferencia.

Novedades de las búsquedas y el entorno Google en general

Nuevo AI Mode en Google Search: buscan mejorar la integración de la IA a las búsquedas, en un futuro incluirá más información recogida por sus modelos y generación de gráficos en función de la información. Debería estar disponible en unas semanas, aunque primero en Estados Unidos.

Se ha hecho también mucho énfasis en la integración de Project Mariner al buscador y el entorno general de Google. Además del Personal Context, es decir, la capacidad de dar permiso al entorno de Google para utilizar los contenidos de correos, imágenes y demás multimedia personal para adaptar la IA al usuario o incluso responder por él.

Novedades de Hardware


Google Beam

Un nuevo sistema de vídeo con renderización volumétrica. A través de 6 cámaras el aparato recrea una imagen con profundidad de la persona en una videollamada, aunque seguiría siendo a través de una pantalla. 

Gafas XR

Google vuelve a lanzarse a esta tecnología con la que integran sus avances en IA con un nuevo sistema operativo, Android XR, especializado para la realidad aumentada, virtual y mixta. Las gafas se han podido probar en persona en el evento, por lo que sabemos funcionan mediante voz y proyectan en el cristal una interfaz. Esto da potencial para integrar los subtítulos y traducciones automáticas, búsquedas en el navegador o aplicaciones concretas tipo GPS.

Nueva generación de TPU (Tensor Processing Unit)

Ironwood es el nuevo modelo de chip de procesamiento, pensado para la computación a gran escala, ante la demanda que supone el desarrollo de IA. Aún está en acceso anticipado, pero estarán disponibles a final de año.

Compártelo:

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos requeridos están marcados *

Publicar comentario