- Experimenta cargas ultra rápidas gracias a una unidad de estado sólido (SSD) de alta velocidad, una inmersión más profunda con retroalimentación háptica, gatillos adaptivos y el nuevo audio 3D, además de una nueva generación de increíbles juegos de PlayStation
Lo que Midjourney hizo para las imágenes fijas y ChatGPT para la escritura, una nueva cosecha de aplicaciones apunta a hacer para el video: escupir clips animados basados solo en un aviso.
A diferencia de las aplicaciones completas de edición de video AI como Runway Gen-1 o programas de script a película como InVideo, estos nuevos programas no funcionan con videos existentes, sino que crean películas completamente sintéticas.
Sin embargo, este es un campo muy incipiente, muy por detrás de los generadores de imágenes fijas y texto.
Los clips están limitados a 4 segundos o menos, dependiendo del servicio; Y a menudo tienen una apariencia caricaturesca o dibujada a mano. No engañarás a tus amigos con deepfakes de estos servicios en el corto plazo. Dicho esto, estos creadores de videos sintéticos representan una frontera emocionante en las herramientas de creatividad de IA, una que los desarrolladores y artistas impulsarán rápidamente en los próximos meses y años.
Contents
¿Qué hace que los mejores generadores de video AI?
El realismo y el detalle son los factores clave en el vídeo sintético. Ninguna de estas aplicaciones imita completamente la vida real, pero a veces se acercan. La pista Gen-2, por ejemplo, puede incluso modelar iluminación cambiante y movimientos finos. Más allá de abordar las formas, los colores y el movimiento, las aplicaciones deben proporcionar suficiente resolución para que sus creaciones sean claras.
La mayoría no hace eso (las resoluciones van de 480p a 1080p). Y el formato cuadrado que más usa parece más establecido para la publicación en línea similar a un meme que un intento de creación de películas. Por supuesto, en un máximo de 4 segundos, ninguno de estos clips se acerca a las proporciones de la película, pero algunos son incluso más cortos, a los dos segundos.
A veces, sin embargo, los videos sintéticos tienen demasiados detalles con alucinaciones surrealistas que no se encuentran ni en la vida real ni en las indicaciones que los usuarios les dan de comer.
Hemos visto cosas como gatos cuyos cuerpos desaparecen y utensilios de comer que se derriten en las caras de las personas. Todo eso podría ser genial si se especificara en el mensaje, pero no lo fue. Parece que puede haber una relación directa entre la sofisticación de la aplicación y su tendencia a alucinar. Los programas que intentan proporcionar más detalles también pueden proporcionar detalles surrealistas.
Los videos sintéticos tienen demasiados detalles con alucinaciones surrealistas que no se encuentran ni en la vida real ni en las indicaciones que los usuarios les dan de comer.
Sean cuales sean las cualidades de la aplicación, la capacidad de refinar los resultados es clave. Por ejemplo, ¿qué tan bien puede entender indicaciones complejas sobre colores, ángulos de cámara, movimientos y más? Algunas aplicaciones también proporcionan filtros para diferentes looks estilísticos.
Pero por muy buena que sea la aplicación, puede tomar varios lazos para hacer las cosas bien: la IA generativa produce resultados diferentes cada vez. Para dar cuenta de esto, le dimos a cada aplicación tres intentos para cada mensaje que probamos y luego elegimos el mejor. También configuramos las aplicaciones en su configuración de mayor calidad (para atributos como la resolución y la velocidad de fotogramas). Todas estas herramientas en línea se probaron en el navegador Chrome.
El precio también importa. Mientras que una de estas aplicaciones es gratuita, las otras cobran por la duración de los clips producidos o por el número de indicaciones de creación de video. Los precios se vuelven confusos rápidamente, con facturación por semana o mes, descuentos para suscripciones de un año y la capacidad de comprar suplementos a las suscripciones.
A menos que se indique lo contrario, fijamos el precio de los servicios en función del compromiso más pequeño posible, por mes o por semana.
Producto | Precio | Letra chica | Formato | Duración máxima (segundos) | Resolución máxima | Tipo de archivo | Accesible |
---|---|---|---|---|---|---|---|
Artesanía | 3.99/semana | 25 avisos/día | cuadrado | 2 | 720p | .MP4 | Web, Móvil |
ModelScope | Gratis | N/A | cuadrado | 4 | 720p | .MP4 | Telaraña |
RunwayML | $15/mes (625 créditos) | 5 créditos por segundo | 16:9 | 4 | 720p | .MP4 | Telaraña |
Runway Gen-2 es el primer producto de la compañía en crear video AI completamente sintético. (Gen-1 usa IA para modificar videos existentes). Como tal, muestra muchas promesas, pero también muchas peculiaridades. La aplicación genera clips detallados y de aspecto rico en forma de pantalla panorámica 16: 9 a una resolución de 1080p, con efectos sofisticados. Una película que hicimos de un gato, por ejemplo, muestra el parpadeo de sus bigotes, los árboles balanceándose con el viento y la luz y la sombra bailando en su cara. Las imágenes no son del todo realistas, sino representaciones sofisticadas, en algún lugar entre imágenes en vivo y las mejores escenas de videojuegos.
La aplicación también puede entender indicaciones complejas: no solo «gato atigrado naranja», sino también «gato atigrado naranja en una alfombra blanca enrollando una bola rosa de hilo, iluminación cálida, realista». Otras aplicaciones rivales como Gencraft también pueden entender estas especificaciones, pero muestran menos detalles y sofisticación en sus representaciones.
Tal vez como un efecto secundario de lo ambiciosa que es Runway Gen-2, también puede ir demasiado lejos en su creatividad. La aplicación tenía una tendencia a alucinaciones salvajes que no vimos en los rivales. En un intento de representar el atigrado, por ejemplo, el gato estaba ausente, pero la bola de hilo brotó en la mano humana. En otra prueba, un caballo ganó una rueda de bicicleta. Sin embargo, la IA generativa es un juego de prueba y error, y generalmente obtuvimos resultados bastante buenos en tres intentos. Aunque a veces incluso los mejores intentos tenían alucinaciones leves, como un orbe blanco brillante de otro mundo que flotaba entre el gato y su bola de hilo.
Cada una de estas tonterías te cuesta, aunque no demasiado. Los precios de Gen-2 se basan en créditos: cinco de ellos compran un solo segundo de video. Los nuevos usuarios obtienen 125 créditos gratuitos, antes de tener que actualizar a planes mensuales, a partir de € 15 por 625 créditos que expiran al final del mes. Puede comprar créditos adicionales que no expiran a partir de € 10 por 1000.
Gencraft es uno de los pioneros en el campo emergente de los generadores puros de texto a video. Pero como tal, tiene límites. La aplicación era experta en renderizar un gato atigrado naranja, por ejemplo, y podía entender modificadores sofisticados en el mensaje, como agregar una alfombra blanca y una bola de hilo rosa (y es relativamente rápido: renderiza sus videos de dos segundos en menos de 30 segundos). Pero hacer que los gatos sean correctos es prácticamente un requisito previo para cualquier herramienta de creación en línea. Gencraft luchó con los nuevos memes de Internet, como «Astronauta montando a caballo» o «Will Smith comiendo espaguetis». Estas imágenes eran bloqueadas o distorsionadas: la cabeza de Smith parecía cambiar de forma, y sus ojos se hincharon, por ejemplo.
Gencraft proporciona algunas herramientas para ajustar sus resultados. Puedes elegir entre una colección de 31 estilos. Nuestro Tabby apareció radicalmente diferente en las opciones Dibujos animados, Pintura al óleo, Abstracto y Realista. («Realista» es un poco superfluo, ya que las imágenes tienden hacia eso si simplemente optas por no elegir un estilo en absoluto). También puede especificar palabras clave de temas o atributos que desea excluir de un video, como «bizco» o «fondo borroso».
Gencraft tiene algunas limitaciones adicionales. Está limitado a videos de dos segundos que aparecen en formato cuadrado. Rival Runway Gen-2 y el ModelScope gratuito admiten hasta cuatro segundos; y Runway también proporciona un formato ancho 16: 9 y resolución de 1080p (frente a 720p para Gencraft).
Gencraft ofrece un nivel gratuito que le permite 10 mensajes de creación de video por día, pero los clips tienen marcas de agua. Puede actualizar a 25 avisos sin marcas de agua por día por € 3.99 a la semana, o avisos ilimitados por € 9.99 por semana.
ModelScope Text to Video Synthesis se convirtió en una sensación en Internet cuando se utilizó para generar el meme de video «Will Smith comiendo espaguetis». Y tienes muchas oportunidades de probar tus propias ideas locas. Alojado en el centro de desarrolladores de IA Hugging Face, ModelScope es gratuito y puede producir videos de hasta 4 segundos, lo cual es largo para esta tecnología emergente.
Por supuesto, «gratis» tiene un inconveniente: estás al capricho de los servidores del sitio, que a menudo se sienten abrumados y no pueden completar tu trabajo en el primer (o segundo, o tercero) intento. Empujar la herramienta a su configuración de mayor calidad (como la velocidad de fotogramas) perjudica aún más sus posibilidades. A veces, solo tienes que esperar un momento más tranquilo para hacer las cosas. Y Hugging Face no proporciona almacenamiento: tendrás que descargar tus videos justo después de hacerlos. (No espere, o una falla en el servidor podría eliminarlos).
Los clips de ModelScope no tienen los detalles de alta gama de las creaciones de Runway Gen-2 (aunque tampoco tienen las imágenes alucinatorias de Runway). Pero tienen una calidad caricaturesca de alta calidad que rivaliza con los proveedores pagos Gencraft y Vercel. Su representación de un gato atigrado naranja era atractiva. Aunque como todos los sujetos de ModelScope, el gato estaba bastante inquieto, saltando por todas partes. Will Smith también fue bastante frenético, metiéndose pasta en la boca con las manos desnudas. Pero, por caricaturesco que fuera, el sujeto era bastante reconocible como el famoso actor. La versión también inquieta de Gencraft estaba más distorsionada. Runway Gen-2 creó una versión de ensueño y surrealista que se veía genial pero no se parecía mucho a Smith.
Con el apoyo de la comunidad de desarrolladores y un precio cero, vale la pena mantenerse al día con ModelScope a medida que esta tecnología avanza rápidamente.
¿Quieres saber más sobre el uso de la IA para el trabajo creativo? Aquí está nuestro desglose de los 5 mejores generadores de imágenes AI de texto a video.