En Resumen
- Leonardo AI anunció el lanzamiento de su nuevo modelo, Leonardo Phoenix, destacándolo como líder en la generación precisa de imágenes y texto.
- El lanzamiento de Leonardo Phoenix introduce funciones avanzadas como "Mejora de las sugerencias" y "Editar con IA", mejorando la experiencia creativa de los usuarios.
- Aunque el nuevo modelo de Leonardo ofrece características avanzadas, como la eliminación de fondos y la ampliación de imágenes, algunas funciones anteriores como la guía de imágenes y el fotorealismo aún no son compatibles.
Leonardo AI, un popular servicio de imágenes generativas, anunció recientemente el lanzamiento de su nuevo modelo, Leonardo Phoenix. Este lanzamiento llega poco después del lanzamiento de su modelo SD3 por parte de Stability AI, que ofreció una impresionante adherencia a las indicaciones y capacidades de generación de texto, pero fue empañado por la controversia en torno a sus términos de licencia y un malentendido de la anatomía humana.
Los creadores de Leonardo estaban, como era de esperar, entusiastas sobre su último lanzamiento.
“No queremos exagerar esto, pero realmente creemos que Phoenix es uno de los principales modelos en cuanto a su capacidad para seguir fielmente las indicaciones de un usuario," escribieron en un anuncio por correo electrónico. La actualización del modelo de IA vino con una renovación del sitio web de Leonardo.
Leonardo Phoenix se promociona como un modelo que ofrece una mejor adherencia rápida, texto claro y preciso dentro de las imágenes, calidad de imagen superior y un mayor control creativo. La actualización también introduce nuevas funciones como "Mejora de las sugerencias" y "Editar con IA", las cuales ayudan a los usuarios a convertir automáticamente sugerencias básicas en más detalladas e instruir a la IA para cambiar las sugerencias de formas específicas, respectivamente.
Sin embargo, debido a la nueva arquitectura, algunas funciones anteriormente disponibles como la guía de imágenes, elementos y fotorealismo aún no son compatibles. También es importante tener en cuenta que los costos de tokens son temporalmente más bajos para el nuevo modelo, pero volverán a los precios estándar el próximo lunes.
Reconocimientos de Ideogram
Si bien los modelos de Stable Diffusion requieren que los usuarios tengan los conocimientos técnicos para instalarlos en sus computadoras locales, Leonardo AI es fácilmente accesible a través de su propio sitio web. Esta facilidad de uso invita a una comparación natural con Ideogram, MidJourney o Dall-E 3, que también son generadores de imágenes de IA basados en la web.
Antes del lanzamiento de Leonardo Phoenix, Decrypt comparó estos modelos—de manera local y utilizando la versión web—y concluyó que "Ideogram puede ser el mejor generador de imágenes actualmente en el mercado." Cuando salió SD3, nuestra prueba rápida concluyó que era "mejor que SDXL para muchos casos de uso, pero no lo suficiente como para reemplazarlo."
Ideogram se mantuvo fuerte en nuestras pruebas subjetivas, pero ¿será Leonardo lo suficientemente bueno para vencerlo?
Leonardo versus Ideogram
Para comparar los modelos, proporcionamos el mismo prompt base a ambos. También activamos una función disponible en ambos servicios para mejorar nuestro prompt y generar mejores imágenes.
Interpretación de prompt
Prompt Base: Un hombre y una mujer cenando en un restaurante futurista, ilustración al estilo de Vincent Van Gogh. El restaurante tiene un letrero que dice "Welcome to Emerge, by Decrypt."
Queríamos probar qué tan bien los modelos identifican artistas relevantes y movimientos artísticos, en este caso, el estilo artístico de Vincent Van Gogh, quien tiene una técnica característica y fácilmente reconocible. Leonardo supera a Ideogram en cuanto al estilo. Además, sus capacidades de generación de texto resultaron más poderosas en este ejemplo.
El enfoque de Leonardo en el estilo llevó a la fusión del restaurante con el pasto en un picnic.
Ideogram optó por un enfoque más seguro, centrándose en la escena en lugar del estilo. Es más fácil corregir la generación de Leonardo con inpaint. Ideogram requeriría técnicas más sofisticadas (como el uso de IPAdapter o Img2Img) para lograr resultados aceptables porque la imagen no se asemeja en absoluto al estilo.
Ganador: Leonardo
Adherencia al prompt y conciencia espacial
Prompt Base: Un perro parado sobre un gato. A la izquierda, hay un robot con una pantalla que dice “Emerge”, a la derecha hay un doctor de temática de terror con una jeringa que lleva una máscara de gas. El fondo mezcla elementos de tecnologías emergentes como ADN y genética, código binario, exploración espacial y extraterrestres, electrónica y tecnología futurista.
Aquí queríamos probar qué tan bien los modelos comprenden la posición de elementos específicos en la indicación. Ambos fueron precisos en sus generaciones, entendiendo la posición de cada elemento solicitado, el fondo y el texto.
Ideogram generó una imagen que combina todos los elementos y es más estéticamente agradable. Leonardo generó una representación más precisa, lo cual es evidente en los pequeños detalles. Por ejemplo, Ideogram no logró generar buenas manos para el doctor, y los elementos en la mesa no son más que generaciones abstractas desordenadas que lucen bien pero no significan nada.
Ganador: Empate. Leonardo gana en términos de precisión, Ideogram gana en términos de estética.
Ronda de bonificación: Decidimos comenzar con esta generación para probar la función "Editar con IA" de Leonardo. Le pedimos a Leonardo que "diera a la imagen un estilo vintage de los años 70 sin cambiar sus elementos", y lo generó casi perfectamente en el primer intento, solo faltaba el gato.
Es importante destacar que esta función modificó en gran medida la generación y no es simplemente comparable al uso de IPAdapters en Stable Diffusion.
Fotorrealismo
Prompt Base: foto profesional, primer plano de un hombre caucásico, vistiendo un suéter negro, rostro serio, iluminación dramática, naturaleza, sombrío, clima nublado, bokeh.
La imagen de Ideogram era más fotorrealista que la de Leonardo. Se centró en el sujeto y todas sus características, mientras que Leonardo, nuevamente, se centró más en el estilo y otros elementos que rodean al sujeto como la estética sombría y la iluminación dramática.
Ganador: Ideogram
Comparación de características
Tanto Ideogram como Leonardo son sitios web que permiten al público acceder a sus respectivos modelos de IA generativa. También ofrecen niveles de pago que mejoran sus capacidades. Si bien las comparaciones de imágenes son convincentes, también vale la pena examinar los detalles técnicos. Después de todo, el factor decisivo podría ir más allá de los modelos mismos, abarcando las ofertas de servicios generales de cada uno.
Mejora rápida y manejo de imágenes
- Mejora del Prompt: Tanto Leonardo como Ideogram ofrecen funciones de mejora de la prompt para refinar y mejorar las indicaciones de los usuarios. En Leonardo, esto se llama "Mejorar Prompt", mientras que Ideogram se refiere a ello como "Prompt Mágica". Estas herramientas tienen como objetivo garantizar resultados óptimos al expandir automáticamente las indicaciones básicas en versiones más detalladas y efectivas.
- Tamaño de la Imagen: Leonardo AI admite resoluciones de imagen más grandes en comparación con Ideogram. Para una relación de aspecto de 16:9, Leonardo puede generar imágenes de hasta 1376x768 píxeles, mientras que Ideogram está limitado a 1280x720 píxeles. Esta diferencia en el tamaño máximo de la imagen puede ser significativa para los usuarios que requieren salidas de mayor resolución.
- Relaciones de Imagen: Ambos servicios ofrecen una amplia gama de relaciones de aspecto de imagen para elegir. Sin embargo, Leonardo AI ofrece una capa adicional de conveniencia al proporcionar referencias de relaciones de aspecto comúnmente utilizadas en diversas plataformas de redes sociales.
- Velocidad y Cantidad de Generación: Mientras que el proceso de generación de imágenes de Ideogram tiende a ser más lento, su nivel gratuito permite más generaciones de imágenes. Por otro lado, el nivel gratuito de Leonardo AI impone límites más estrictos en la cantidad de imágenes debido a las mayores demandas computacionales de sus modelos. Este compromiso entre velocidad y cantidad puede influir en tu elección.
Edición avanzada y personalización
- Editar con IA: Leonardo AI ofrece una función de "Editar con IA", que actualmente no tiene Ideogram. Esta herramienta permite a los usuarios proporcionar instrucciones en lenguaje natural para modificar sus indicaciones de formas específicas, como "cambiar el abrigo a rojo", "agregar un sombrero azul", "darle un aspecto vintage" o "agregar iluminación dramática". La IA ajusta la indicación en consecuencia, permitiendo un control más preciso sobre las imágenes generadas. Es similar al plugin instructPix2Pix que los usuarios de Stable Diffusion han estado utilizando desde el año pasado.
- Eliminación de Antecedentes: Leonardo AI ofrece una funcionalidad de eliminación de fondos, que Ideogram no tiene. Esta característica puede ser particularmente útil para usuarios que trabajan con otro software de edición de imágenes o aquellos que buscan aislar y resaltar sujetos específicos dentro de sus imágenes generadas.
- Ampliación de Imágenes: Leonardo AI proporciona una función de ampliación que permite a los usuarios mejorar la resolución de sus imágenes generadas. Esta capacidad no está disponible actualmente en la plataforma Ideogram, lo que requiere el uso de herramientas adicionales.
- Generación Instantánea de Imágenes: Leonardo AI ofrece un generador de imágenes instantáneo similar a la función "Imagine" de Meta o las generaciones instantáneas de Krea. Esta herramienta genera imágenes en tiempo real a medida que el usuario escribe su indicación, proporcionando una experiencia más dinámica e interactiva en comparación con la generación tradicional por lotes.
- Animación y lienzo en tiempo real: Leonardo AI permite a los usuarios crear animaciones básicas a partir de sus imágenes generadas y ofrece un lienzo en tiempo real para tareas de inpainting y outpainting intensivas. Estas funciones no están disponibles actualmente en la plataforma Ideogram.
- Entrenamiento de modelos: Leonardo AI permite a los usuarios entrenar sus propios modelos basados en una selección curada de imágenes. Esta función requiere recursos computacionales significativos y no es ofrecida por Ideogram. Esto podría ser una ventaja significativa para usuarios con necesidades especializadas.
- Flexibilidad: Leonardo AI presume de una amplia variedad de modelos, siendo Phoenix su oferta más capaz, comparable al modelo propietario de Ideogram. Sin embargo, la compañía también ofrece otros modelos propietarios como Leonardo Kino, Leonardo Vision y un Modelo Lightning, así como modelos de código abierto afinados por la comunidad como Dreamshaper y Absolute Reality.
Variedad de precios y modelos
- Precio por Generación: En cuanto a precios, la version paga de Ideogram ofrece generaciones lentas ilimitadas a partir de $20 al mes, mientras que el nivel Artisan Unlimited de Leonardo, que ofrece una oferta comparable, tiene un precio de $30 al mes. Para usuarios que requieran velocidades de generación más rápidas o características adicionales, Leonardo AI puede ser la opción más rentable, a pesar de su estructura de precios generalmente más alta.
Conclusión
Leonardo proporciona una interfaz de usuario completa con una amplia gama de funciones diseñadas para usuarios que buscan extraer el máximo valor de sus imágenes generadas. La integración de procesamiento de lenguaje natural para una edición rápida y manipulación de generación también es una ventaja significativa. Para usuarios avanzados, especialmente aquellos dispuestos a invertir en servicios premium, Leonardo es claramente la opción más convincente, especialmente dada su extenso conjunto de funciones.
Sin embargo, para los usuarios casuales centrados principalmente en generar imágenes visualmente impresionantes con un esfuerzo mínimo, el enfoque simplificado de Ideogram, junto con sus capacidades de generación de sugerencias mejoradas por IA, puede resultar más adecuado.
Si bien Leonardo parece mostrar una ligera ventaja en la generación de cadenas de texto más largas dentro de las imágenes, la diferencia no es sustancial.
En última instancia, la decisión entre los dos servicios puede depender de las prioridades individuales, siendo Leonardo el mejor para aquellos que buscan un control creativo integral y herramientas avanzadas, mientras que Ideogram atrae a los usuarios que priorizan una experiencia de generación de imágenes optimizada pero sencilla.
En nuestra opinión, Leonardo realmente le quita la corona a Ideogram. Si bien Ideogram a veces puede generar imágenes superiores, la cantidad de funciones que proporciona Leonardo es convincente. Ya seas nuevo en las imágenes generativas o un profesional, Leonardo puede cumplir tus espectativas.
Ganador General: Leonardo
Editado por Ryan Ozawa.