Créditos de imagen: Bryce Durbin/TechCrunch
OpenAI presentó hoy una versión mejorada de su herramienta de conversión de texto a imagen, DALL-E, que utiliza ChatGPT, el chatbot viral de OpenAI, para aliviar parte del dolor de las indicaciones.
La mayoría de las sofisticadas herramientas de creación de imágenes impulsadas por IA de hoy en día toman indicaciones (descripciones de imágenes) y las convierten en obras de arte en una variedad de estilos, desde fotorrealistas hasta fantasía. Pero diseñar el vector correcto puede ser un desafío, hasta el punto de que la “ingeniería ágil” se ha convertido en una verdadera profesión.
La nueva herramienta de OpenAI, DALL-E 3, utiliza ChatGPT para ayudar a completar reclamos. A través de ChatGPT, los suscriptores de los planes ChatGPT premium de OpenAI, ChatGPT Plus y ChatGPT Enterprise, pueden escribir una solicitud para una imagen y refinarla a través de conversaciones con el chatbot, recibiendo los resultados directamente dentro de la aplicación de chat.
ChatGPT tomará un breve mensaje de no más de unas pocas palabras y lo hará más descriptivo, brindando más dirección al modelo DALL-E 3.
La integración de ChatGPT no es la única novedad en DALL-E 3. DALL-E 3 también crea imágenes de mayor calidad que reflejan las indicaciones con mayor precisión, dice OpenAI, especialmente cuando se trata de indicaciones más largas. Maneja mejor el contenido que históricamente ha obstaculizado los modelos de generación de imágenes, como texto y manos humanas.
Además, DALL-E 3 tiene nuevos mecanismos para reducir el sesgo algorítmico y mejorar la seguridad, o eso dice OpenAI. Por ejemplo, DALL-E 3 rechazará solicitudes que soliciten un retrato al estilo de artistas vivos o representaciones de figuras públicas. Los artistas ahora pueden optar por no utilizar parte (o la totalidad) de sus obras de arte para entrenar a futuras generaciones de modelos OpenAI para convertir texto en imagen. (OpenAI, junto con algunos de sus competidores, se enfrenta a una demanda por supuestamente utilizar obras de artistas protegidas por derechos de autor para entrenar sus modelos de imágenes generativas de IA).
El lanzamiento de DALL-E 3 se produce cuando la carrera por la IA generativa se intensifica, especialmente en el campo de la síntesis de imágenes. Competidores como Midjourney y Stability AI continúan mejorando sus modelos de generación de imágenes, presionando a OpenAI para que se mantenga a flote.
OpenAI planea implementar DALL-E 3 para usuarios premium de ChatGPT en octubre, seguido de laboratorios de investigación y sus clientes de API. La compañía no ha dicho cuándo (o si) planea lanzar una herramienta web gratuita, como lo hizo con DALL-E 2 y el modelo DALL-E original.
«Gurú del alcohol. Analista. Defensor de la comida. Aficionado extremo al tocino. Experto total en Internet. Adicto a la cultura pop. Pionero de viajes sutilmente encantador».