【Stable Diffusion 3 Medium发布:技术挑战和管理困境的双重压力】
Stable Diffusion 3的发布引发了广泛关注和争议。Stability AI推出了Stable Diffusion 3 Medium,一款旨在将文本提示转换为图像的模型。然而,该模型生成的人体图像却被网友批评为畸形和技术倒退,与其他先进的图像合成模型相比表现逊色,如Midjourney和DALL-E 3。
Reddit上的用户详细描述了SD3 Medium在渲染人类形象,尤其是四肢如手和脚方面的明显失败。例如,一些用户展示了模型生成的手部和全身图像的畸形问题。
Stability AI解释了这些问题部分源于他们严格过滤了SD3的训练数据,以避免成人内容(NSFW)。然而,这种过滤导致模型在描绘人类解剖结构时缺乏准确性,尤其是在生成手部图像方面,这一问题曾经在Stable Diffusion 2.0时期也有过类似的挑战。
公司最近的困境,包括高管离职和裁员潮,加剧了这些技术和管理上的挑战。虽然Stability AI仍在努力通过改进和发布新模型来克服这些问题,但其现状引发了社区对公司未来和其技术发展的担忧。
总体来看,这次发布展示了在AI图像生成领域面临的技术和管理挑战,也突显了数据集和训练过程对模型性能的关键影响。随着技术和数据集的改进,未来的AI图像生成模型有望更好地应对这些挑战。