OpenAI lleva la creación de imágenes directo a ChatGPT

OpenAI lleva la generación de imágenes con IA directamente a ChatGPT

[Imagen: marozhkastudio/Adobe Stock; ilgmyzin/Unsplash]

Por Mark Sullivan 2 minutos de lectura

OpenAI está incorporando la generación de imágenes directamente dentro de ChatGPT. Impulsado por su modelo multimodal insignia, GPT-4o, el chatbot ahora puede crear imágenes directamente desde la interfaz de chat.

La función estará disponible inicialmente para los usuarios de ChatGPT Plus, Pro, Team y la versión gratuita. Los usuarios de las versiones Enterprise y Education la recibirán próximamente.

“Hoy lanzamos una de las cosas más divertidas y geniales que hemos hecho… imágenes nativas en ChatGPT”, dijo el CEO de OpenAI, Sam Altman, al inicio de una transmisión en video el martes. Altman reconoció que la función había sido muy esperada, especialmente desde que competidores como Google Gemini han ofrecido generación de imágenes integrada desde mediados de 2024.

ChatGPT ahora permite a los usuarios generar imágenes a partir de indicaciones, conversaciones y archivos cargados. Los usuarios pueden crear imágenes completamente nuevas o transformar imágenes existentes. OpenAI asegura que el “conocimiento del mundo” con el que fue entrenado el modelo GPT-4o permite a ChatGPT comprender mejor los contextos en los que se utilizan las imágenes.

Texto en tu imagen

También es mejor siguiendo instrucciones para renderizar texto dentro de las imágenes, según la compañía.

Los usuarios pueden perfeccionar las imágenes usando lenguaje natural. Por ejemplo, al diseñar un personaje para un videojuego, el modelo puede mantener coherencia visual a lo largo de múltiples iteraciones a medida que el usuario realiza ajustes.

OpenAI espera que las personas utilicen esta herramienta para crear imágenes laborales que requieran precisión (como diagramas, infografías, contenido de marca), imágenes con mucho texto (carteles informativos, tarjetas de presentación), imágenes fotorrealistas con iluminación y texturas precisas, y visuales que se beneficien del contexto de la conversación.

Al simplificar el proceso con un solo modelo multimodal que maneja todas las tareas de generación de imágenes, OpenAI está posicionando a ChatGPT como una herramienta de referencia tanto para la creación de imágenes personales como profesionales.

Mark Sullivan

Mark Sullivan es redactor sénior de Fast Company y cubre temas de tecnología emergente, inteligencia artificial y políticas tecnológicas. Antes de incorporarse a Fast Company en enero de 2016, Sullivan escribió para VentureBeat, Light Reading, CNET, Wired y PCWorld. Síguelo en Twitter @thesullivan
View all posts

Mark Sullivan

Mark Sullivan es redactor sénior de Fast Company y cubre temas de tecnología emergente, inteligencia artificial y políticas tecnológicas. Antes de incorporarse a Fast Company en enero de 2016, Sullivan escribió para VentureBeat, Light Reading, CNET, Wired y PCWorld. Síguelo en Twitter @thesullivan
View all posts

Sobre el autor

Mark Sullivan Mark Sullivan es redactor sénior de Fast Company y cubre temas de tecnología emergente, inteligencia artificial y políticas tecnológicas. Antes de incorporarse a Fast Company en enero de 2016, Sullivan escribió para VentureBeat, Light Reading, CNET, Wired y PCWorld. Síguelo en Twitter @thesullivan

Explora otros temas

Las épicas fotos de Artemis II muestran la Tierra, la Luna y las estrellas como nunca antes las habías visto

En México 4 de cada 10 personas se automedica: el síntoma de un sistema que no alcanza

Por qué las mujeres líderes están dejando atrás las antiguas normas laborales y triunfando gracias a ello

La dignidad como modelo de negocio competitivo

OpenAI lleva la generación de imágenes con IA directamente a ChatGPT

Texto en tu imagen

Author

Author

Fast Company México

Lo Último

Texto en tu imagen

Author

Author