- Sam Altman ha vuelto a sorprender a la industria de la IA.
- El jueves, OpenAI presentó su nuevo modelo de conversión de texto a video, Sora.
- La capacidad de Sora para producir vídeos de alta resolución ha conmocionado a Internet.
Sam Altman ha asombrado a la industria de la IA. otra vez.
Esta vez, no es por A. Expulsión de choque de OpenAITampoco es por nada relacionado con ello. ChatGPT. En cambio, se debe a un nuevo modelo de IA llamado Sora.
el jueves es Le presentó al mundo a Sora.que toma su nombre de la palabra japonesa que significa «cielo», puede crear vídeos de hasta un minuto de duración con texto.
OpenAI dice que su objetivo es sora Se trata de enseñar a la IA cómo “comprender y simular el mundo físico en movimiento, con el objetivo de entrenar modelos que ayuden a las personas a resolver problemas que requieren interacción con el mundo real”.
Esta es una forma un poco aburrida de describir lo que realmente puede hacer el modelo. Puede crear vídeos de alta definición de todo, desde California durante la fiebre del oro del siglo XIX hasta animaciones 3D similares a una producción de Dreamworks. Todo lo que te pide es un simple mensaje de texto.
Cabe señalar que esta no es la primera vez que se utiliza este tipo de tecnología.
Runway, una startup con sede en Nueva York y respaldada por Google y Nvidia, tiene una herramienta basada en inteligencia artificial que crea videos a partir de texto. Meta tiene algo similar llamado Vídeo emo. El mes pasado, Google presentó su versión de texto a video llamada Lumière.
¿Es el revuelo que los rodea comparable al de Sora? no exactamente.
Esto se debe en parte a que el liderazgo de Altman es de propiedad privada. Abierto AI Esto le da la libertad de promover esta tecnología, aunque todavía se está probando su posible daño. (Nota: la liberación de Sora se limita a los «miembros del Equipo Rojo» que lo someterán a pruebas de riesgo, así como a artistas visuales y cineastas seleccionados).
Es por eso que su anuncio de Sora en las redes sociales no solo incluyó un hipervínculo a un blog que explica el nuevo modelo de IA; Implicaba una interacción directa con las personas que lo seguían.
En X, recibió solicitudes rápidas de los usuarios sobre videos que querían ver creados por Sora.
«Nos encantaría mostrarte lo que Sora puede hacer. Responde con subtítulos para los videos que te gustaría ver y comenzaremos a crear algunos». el escribio. Las solicitudes llegaron a raudales.
La personalidad de Internet MrBeast le pidió un vídeo de Mono jugando al ajedrez en el parque. Otro pidió ver Golden retrievers transmitiendo en la montaña. El director ejecutivo de Nothing, Carl Pei, solicitó un vídeo de Will Smith comiendo espaguetis. Muchas otras personas también lo han hecho.
Nikunj Kothari, socio de Khosla Ventures, destacó el impacto de la estrategia de Altman comparándola con la forma en que Google se ha comprometido. Una gran actualización de su modelo de IA, Geminia través de una publicación de blog el mismo día en que Sora fue liberado.
Google anuncia algo sorprendente dijo en x, al expandir la «ventana contextual» de Gemini (la cantidad de palabras que un modelo de IA puede procesar alrededor de un símbolo objetivo) en hasta 1 millón. Es un gran progreso, pero es un progreso que Google no ofrece como Altman.
«No hay un patio de recreo, no puedo intentarlo yo mismo. Hay algunos vídeos impresionantes en la entrada del blog, pero no están destinados a mí en absoluto», escribió Kothari en X, mientras destacaba que Altman estaba «demostrando» las habilidades de Sora. por Recibir solicitudes de otros.
«Esto eclipsará en gran medida los impresionantes logros de Google. Google se está quedando atrás y necesita 'comprar' para captar la participación de nuevo», dijo Kothari.
Sin embargo, es posible que el revuelo no dure mucho.
El lanzamiento de un modelo de IA capaz de producir vídeos impresionantes podría plantear nuevas amenazas a la industria creativa, que ya ha planteado preocupaciones sobre la posibilidad de que la IA generativa pueda hacerse cargo de sus trabajos. Después de las huelgas que presenció Hollywood el año pasado.
La adopción generalizada de esta tecnología también podría causar estragos en las elecciones de este año si es utilizada por malos actores que buscan crear videos falsos de personas como Donald Trump o Joe Biden.
Es probable que esto también dé lugar a nuevas demandas para que OpenAI sea transparente sobre los datos que utiliza para entrenar sus modelos de la misma manera que lo son los modelos de código abierto.
Pero por ahora, la gente está aceptando las exageraciones de Altman.
«Gurú del alcohol. Analista. Defensor de la comida. Aficionado extremo al tocino. Experto total en Internet. Adicto a la cultura pop. Pionero de viajes sutilmente encantador».