Innovaciones como Veo, Whisk y Project Mariner redefinen la creatividad, la automatización y la personalización digital, abriendo oportunidades inéditas para usuarios y creadores en el ecosistema tecnológico actual.
El futuro de la colaboración entre humanos e inteligencia artificial está tomando forma en los laboratorios de Google. Tras el evento Google I/O, Google Labs ha presentado una serie de innovaciones en IA generativa que prometen transformar la creatividad, la productividad y la personalización digital. Proyectos como Veo, Whisk, Project Mariner y NotebookLM no solo muestran el avance tecnológico de la compañía, sino que también redefinen la manera en que las personas interactúan con la información y las herramientas digitales. Según lo reportado por Google Labs en una conversación con Sonya Huang, de Sequoia Capital, estos desarrollos marcan el inicio de una nueva etapa en la relación entre humanos y máquinas inteligentes.
HACÉ CLICK AQUÍ PARA UNIRTE AL CANAL DE WHATSAPP DE DIARIO PANORAMA Y ESTAR SIEMPRE INFORMADO
La percepción pública sobre el liderazgo de Google en inteligencia artificial ha cambiado de manera notable en las últimas semanas, especialmente después de las presentaciones en Google I/O. De acuerdo con Google Labs, la aceleración en el lanzamiento de productos y la calidad de sus modelos han sido factores determinantes para este giro. Thomas Iljic, responsable de Whisk y Veo, atribuyó este cambio a la solidez de los modelos desarrollados por Google, mientras que Jaclyn Konzelmann, líder de Project Mariner, destacó la cantidad de productos y experiencias completamente nuevas que han surgido en poco tiempo.
Simon Tokumine, encargado de NotebookLM, señaló que el reconocimiento externo es el resultado de años de trabajo interno en IA generativa. “Para nosotros, esto se siente como el final del primer capítulo y el inicio del segundo”, afirmó Tokumine en declaraciones recogidas por Google Labs. La compañía ha logrado posicionarse en los primeros lugares de los principales rankings de IA, y sus modelos son considerados de vanguardia en la industria.
En el ámbito creativo, Google Labs ha apostado por fusionar el cine y los videojuegos a través de la generación de video e imagen con IA. Thomas Iljic explicó que herramientas como Veo y Whisk permiten a los usuarios construir mundos virtuales, definir escenarios y personajes, y luego “filmar” dentro de esos entornos. Este enfoque, conocido como "world-building“, facilita la iteración y el refinamiento de las creaciones, permitiendo pausar, corregir y rehacer escenas de manera sencilla.
Iljic subrayó que la clave está en el concepto de "show and tell“, donde los usuarios no solo escriben instrucciones, sino que también pueden mostrar ejemplos visuales o actuar como referencia para la IA. “No todo se hace a través de texto; es más intuitivo mostrar y actuar, o dar una referencia como inspiración”, explicó Iljic, según lo publicado por Google Labs. Esta metodología democratiza la creación visual, permitiendo que cualquier persona, sin importar su experiencia previa, pueda experimentar con la narrativa audiovisual.
Whisk se orienta al público general, facilitando la creación y el remix de contenidos visuales en contextos tan variados como chats entre amigos o presentaciones empresariales. Por su parte, Veo y Flow están pensados para cineastas y creadores avanzados, ofreciendo herramientas sofisticadas para la producción de video con IA. La última versión de Veo, conocida como VO3, ha superado a sus predecesoras en calidad y adherencia a las instrucciones, y ahora incorpora la generación simultánea de audio y video, lo que amplía las posibilidades expresivas y la viralidad de los contenidos.
A pesar de estos avances, Iljic reconoció que aún existen retos técnicos, como la consistencia de personajes en escenas múltiples y la propagación de cambios a lo largo de un proyecto. Sin embargo, se mostró optimista respecto a la reducción de costos y el aumento de velocidad en la generación de video, anticipando que estas tecnologías serán cada vez más accesibles.
Productividad y asistentes inteligentes: Project Mariner
En el terreno de la productividad, Project Mariner representa un salto hacia la automatización inteligente de tareas en el navegador. Jaclyn Konzelmann relató que el proyecto nació con la idea de crear agentes capaces de explorar y actuar en nombre del usuario, más allá de responder preguntas o generar contenido. Inicialmente lanzado como una extensión de Chrome en diciembre pasado, Mariner ha evolucionado gracias al feedback de un grupo de usuarios de prueba, quienes valoraron especialmente la capacidad del agente para tomar el control del ratón, hacer clic, desplazarse y escribir en formularios.
La versión más reciente de Mariner, anunciada en Google I/O, permite a los usuarios delegar tareas que se ejecutan en segundo plano en máquinas virtuales, sin interrumpir su trabajo en el navegador local. Una de las innovaciones clave es la integración de contexto: Mariner puede acceder a todas las pestañas abiertas y utilizar esa información para completar tareas complejas, como agregar ingredientes de una receta a un carrito de compras en Instacart.
Konzelmann destacó la capacidad multitarea del agente, que puede gestionar hasta diez tareas simultáneamente, y la importancia de ofrecer al usuario la opción de supervisar o retomar el control en cualquier momento. “El usuario puede ver al agente en acción, pausar la tarea o recibir un resumen de lo realizado al finalizar”, explicó Konzelmann, según Google Labs.
En cuanto a los desafíos técnicos, la líder de Mariner reconoció que aún existen áreas de mejora en la calidad del modelo y la velocidad de ejecución. La decisión de utilizar capturas de pantalla, en lugar de interactuar directamente con el código de las páginas web, responde a la intención de desarrollar habilidades aplicables más allá de los sitios web tradicionales. Konzelmann anticipó que la automatización de tareas cotidianas, como la planificación de viajes o la gestión de compras en línea, será solo el comienzo, y que el verdadero potencial de Mariner radica en su capacidad para operar de manera omnipresente en todos los dispositivos del usuario y en su interacción con otros agentes.
El impacto de Mariner en el comercio electrónico podría ser significativo. Al eliminar la fricción humana en el proceso de compra, se abren nuevas oportunidades para la evolución de los modelos de negocio y la personalización de la experiencia de usuario. “Podríamos ver la aparición de un ‘carrito universal’ que agregue productos de diferentes tiendas y permita realizar compras con un solo clic”, sugirió Konzelmann en la conversación recogida por Google Labs.