Stability AI presentó una nueva versión de su inteligencia artificial que permite generar imágenes a partir de descripciones en texto. Tras el lanzamiento de Stable Diffusion 3, la empresa ha trabajado en una versión más pequeña y menos demandante. El resultado es Stable Diffusion 3 Medium, un modelo capaz de correr en un portátil o PC de consumo.
De acuerdo con la compañía, Stable Diffusion 3 Medium es el modelo abierto de conversión de texto a imagen más avanzado que existe. Esta versión de 2.000 millones de parámetros puede ofrecer imágenes fotorrealistas, comprender indicaciones complejas, generar textos legibles y sin errores ortográficos o artefactos.
«A diferencia de SD3 Large, SD3 Medium es más pequeño y funcionará eficientemente en hardware de consumo», dijo Christian Laforte, uno de los directores ejecutivos de Stability AI. «SD3 Medium sobresale en todas las capacidades mencionadas y es comparable a la versión actual de SD3 Large API que se utiliza hoy».
Una de las características más importantes de Stable Diffusion 3 Medium (SD3 Medium) es que puede ejecutarse en una GPU de consumo estándar sin degradación del rendimiento. Si tienes una tarjeta de video con al menos 5 GB de memoria VRAM podrás generar imágenes. Eso sí, Stability AI recomienda 16 GB de VRAM, una cantidad que encontramos en las tarjetas de gama media y alta de NVIDIA y AMD.
- CHECALO -
Stable Diffusion 3 Medium está optimizado para las GPU de NVIDIA
Sobre esta línea, los creadores de Stable Diffusion 3 Medium se asociaron con NVIDIA para desarrollar una versión optimizada para TensorRT. Si tienes una GPU GeForce RTX, obtendrás un aumento de hasta 50 % en el rendimiento comparado con la versión normal. En el caso de AMD, el fabricante ha optimizado la inferencia para sus tarjetas de consumo, empresarial y las APU más recientes que se incluyen en ordenadores de escritorio y portátiles.
Además, Stable Diffusion 3 Medium también ofrece ajuste fino, lo que le permite personalizarlo a través de pequeños conjuntos de datos. Para mostrar su poderío, Stability AI publicó tres imágenes generadas a través de lenguaje natural. Los resultados son sorprendentes y van de la mano con lo que ya hemos visto en SD3.
Aquellos interesados podrán acceder a Stable Diffusion 3 Medium a través de la API, Hugging Face. o por medio del canal Stable Artisan en Discord. El modelo es de uso gratuito para fines no comerciales, como investigación académica, aunque los usuarios pueden solicitar una licencia si lo usarán en otra clase de proyectos.
DERECHOS DE AUTOR
Esta información pertenece a su autor original y fue recopilada del sitio https://hipertextual.com/2024/06/stable-diffusion-3-medium-inteligencia-artificial-pc-consumo