ADVERTISEMENT

| Tech

OpenAI lleva la generación de imágenes con IA directamente a ChatGPT

El chatbot ahora puede generar imágenes originales o modificar existentes de forma nativa.

OpenAI lleva la generación de imágenes con IA directamente a ChatGPT [Imagen: marozhkastudio/Adobe Stock; ilgmyzin/Unsplash]

OpenAI está incorporando la generación de imágenes directamente dentro de ChatGPT. Impulsado por su modelo multimodal insignia, GPT-4o, el chatbot ahora puede crear imágenes directamente desde la interfaz de chat.

La función estará disponible inicialmente para los usuarios de ChatGPT Plus, Pro, Team y la versión gratuita. Los usuarios de las versiones Enterprise y Education la recibirán próximamente.

“Hoy lanzamos una de las cosas más divertidas y geniales que hemos hecho… imágenes nativas en ChatGPT”, dijo el CEO de OpenAI, Sam Altman, al inicio de una transmisión en video el martes. Altman reconoció que la función había sido muy esperada, especialmente desde que competidores como Google Gemini han ofrecido generación de imágenes integrada desde mediados de 2024.

ChatGPT ahora permite a los usuarios generar imágenes a partir de indicaciones, conversaciones y archivos cargados. Los usuarios pueden crear imágenes completamente nuevas o transformar imágenes existentes. OpenAI asegura que el “conocimiento del mundo” con el que fue entrenado el modelo GPT-4o permite a ChatGPT comprender mejor los contextos en los que se utilizan las imágenes.

Texto en tu imagen

También es mejor siguiendo instrucciones para renderizar texto dentro de las imágenes, según la compañía.

Los usuarios pueden perfeccionar las imágenes usando lenguaje natural. Por ejemplo, al diseñar un personaje para un videojuego, el modelo puede mantener coherencia visual a lo largo de múltiples iteraciones a medida que el usuario realiza ajustes.

OpenAI espera que las personas utilicen esta herramienta para crear imágenes laborales que requieran precisión (como diagramas, infografías, contenido de marca), imágenes con mucho texto (carteles informativos, tarjetas de presentación), imágenes fotorrealistas con iluminación y texturas precisas, y visuales que se beneficien del contexto de la conversación.

Al simplificar el proceso con un solo modelo multimodal que maneja todas las tareas de generación de imágenes, OpenAI está posicionando a ChatGPT como una herramienta de referencia tanto para la creación de imágenes personales como profesionales.

Author

  • Mark Sullivan

    Mark Sullivan es redactor sénior de Fast Company y cubre temas de tecnología emergente, inteligencia artificial y políticas tecnológicas. Antes de incorporarse a Fast Company en enero de 2016, Sullivan escribió para VentureBeat, Light Reading, CNET, Wired y PCWorld. Síguelo en Twitter @thesullivan

    View all posts

Author

  • Mark Sullivan

    Mark Sullivan es redactor sénior de Fast Company y cubre temas de tecnología emergente, inteligencia artificial y políticas tecnológicas. Antes de incorporarse a Fast Company en enero de 2016, Sullivan escribió para VentureBeat, Light Reading, CNET, Wired y PCWorld. Síguelo en Twitter @thesullivan

    View all posts

Sobre el autor

Mark Sullivan es redactor sénior de Fast Company y cubre temas de tecnología emergente, inteligencia artificial y políticas tecnológicas. Antes de incorporarse a Fast Company en enero de 2016, Sullivan escribió para VentureBeat, Light Reading, CNET, Wired y PCWorld. Síguelo en Twitter @thesullivan

ADVERTISEMENT

ADVERTISEMENT