Google lanzó Whisk, una innovadora herramienta de generación de imágenes que permite a los usuarios crear visuales únicos combinando varias imágenes, en lugar de depender de textos descriptivos.
Con Whisk, los usuarios pueden arrastrar y soltar varias imágenes para el sujeto, la escena y el estilo de la imagen que les gustaría generar con IA. Utilizando el modelo Gemini y el avanzado sistema Imagen 3 de Google, Whisk “extrae la esencia” de las imágenes ingresadas y las reinterpreta para crear visuales únicos. Algunos ejemplos incluyen una morsa con una corona de flores, una ciudad sobre un pez y un gato brillante con cuernos descansando sobre un nenúfar.
Si no tienes imágenes a mano, puedes hacer clic en un ícono de dado para que Google complete algunas imágenes para las indicaciones. Los usuarios también pueden refinar los resultados con indicaciones adicionales en texto y ajustar los diseños para obtener resultados personalizados.
De acuerdo con Google, Whisk está diseñada más como una herramienta para la exploración creativa rápida que para ediciones minuciosas, ofreciendo a artistas y creativos la posibilidad de visualizar ideas rápidamente.
Google también anunció Veo 2 y mejoras para Imagen 3
Además de Whisk, Google también presentó presentó Veo 2, una actualización a su modelo avanzado de generación de videos con IA, junto con una versión mejorada de su modelo de generación de imágenes Imagen 3.
De acuerdo con Google, estas mejoras prometen un realismo sin precedentes y nuevas posibilidades creativas para usuarios en plataformas como YouTube Shorts y herramientas empresariales.
Veo 2 ofrece un realismo mejorado, una mayor comprensión de la física y expresiones humanas más detalladas. También ahora permite a los usuarios especificar géneros, ángulos de cámara o efectos cinematográficos mediante indicaciones personalizadas. El modelo genera videos de alta calidad en resoluciones de hasta 4K y duraciones de varios minutos, con aplicaciones que van desde narrativas creativas hasta producciones profesionales. Además, los videos de Veo 2 incluyen marcas de agua invisibles de SynthID para garantizar un uso responsable y prevenir la desinformación. Inicialmente disponible a través de la herramienta VideoFX de Google Labs, Veo 2 se expandirá a YouTube Shorts en 2024.
Por su parte, Imagen 3 mejora las capacidades de generación de imágenes de Google, ofreciendo visuales más brillantes y mejor compuestos, con mayor nivel de detalle. La herramienta ahora admite una amplia gama de estilos artísticos, desde el fotorealismo hasta el anime. Google dijo que Imagen 3 ya se está implementando globalmente a través de ImageFX para usuarios en más de 100 países.