Hay un nuevo editor de fotografías de Apple, si sabes dónde buscarlo. iPhone Kings se ha asociado con investigadores de la Universidad de California en Santa Bárbara para crear una herramienta que le permite editar fotografías e imágenes mediante instrucciones de texto. No tiene un lanzamiento oficial, pero los investigadores están organizando una demostración que puedes probar tú mismo, que se ha detectado por primera vez. Tecnología extrema.
El proyecto se llama Edición de imágenes guiada por modelo de lenguaje grande multimodal (MGIE). Actualmente, existen muchos programas de edición de fotografías con IA en el mercado. Photoshop ahora viene con herramientas de inteligencia artificial integradas, y otras, como DALL-E de OpenAI, le permiten editar imágenes y crearlas desde cero. Sin embargo, si has intentado utilizarlos antes, sabes que puede resultar un poco frustrante. En muchos casos, la IA tiene dificultades para entender exactamente lo que se busca.
La innovación de MGIE añade otra capa de interpretación de la IA. Cuando le dices a la IA lo que quieres ver, MGIE primero utiliza IA basada en texto para que tus instrucciones sean más claras y descriptivas. «Los resultados experimentales muestran que las instrucciones expresivas son esenciales para la edición de imágenes basada en instrucciones», dijeron los investigadores en un artículo. papel Publicado en arXiv. «MGIE puede conducir a una mejora significativa».
Apple ha publicado una versión de código abierto del software en github. Si es inteligente, puede obtener una copia de MGIE ejecutándose usted mismo, pero los investigadores configuraron la herramienta en… abrazo de cara. Funciona un poco lento cuando hay mucha gente usándolo, pero es una experiencia divertida.
Los gigantes tecnológicos como Apple están gastando miles de millones de dólares en proyectos que nadie verá jamás, por lo que es muy posible que la llamada herramienta MGIE nunca obtenga un lanzamiento oficial. Apple no respondió de inmediato a una solicitud de comentarios.
Lo probamos aquí en la oficina de Gizmodo. Subí una foto de mi colega y asesor más cercano Kyle Barr con gafas de sol extrañas que tomé en Netflix en… Salón de electrónica de consumo de este año. Le dije a Amnistía Internacional: «El hombre está parado en el desierto». Antes de crear la imagen, MGIE extrapola lo siguiente:
«El hombre lleva un casco de metal y está parado en un entorno desértico. El entorno circundante es árido y árido, con dunas de arena que se extienden hasta donde alcanza la vista».
Después de jugar con la herramienta durante mucho más tiempo del que debería, está claro que está sujeta a muchas de las mismas limitaciones que cualquier otro generador de imágenes de IA. Muchas veces, los resultados son extraños y no se parecen en nada a lo que usted ordenó. Pero en algunos casos, hizo un trabajo impresionante y, en defensa del software, la IA funcionó mejor con temas familiares. “Familiares” no es algo que llamarías las gafas de sol de Kyle.
«Gurú del alcohol. Analista. Defensor de la comida. Aficionado extremo al tocino. Experto total en Internet. Adicto a la cultura pop. Pionero de viajes sutilmente encantador».