Nostr Web Client

【Stable Diffusion 3 Medium发布：技术挑战和管理困境的双重压力】

Stable Diffusion 3的发布引发了广泛关注和争议。Stability AI推出了Stable Diffusion 3 Medium，一款旨在将文本提示转换为图像的模型。然而，该模型生成的人体图像却被网友批评为畸形和技术倒退，与其他先进的图像合成模型相比表现逊色，如Midjourney和DALL-E 3。

Reddit上的用户详细描述了SD3 Medium在渲染人类形象，尤其是四肢如手和脚方面的明显失败。例如，一些用户展示了模型生成的手部和全身图像的畸形问题。

Stability AI解释了这些问题部分源于他们严格过滤了SD3的训练数据，以避免成人内容（NSFW）。然而，这种过滤导致模型在描绘人类解剖结构时缺乏准确性，尤其是在生成手部图像方面，这一问题曾经在Stable Diffusion 2.0时期也有过类似的挑战。

公司最近的困境，包括高管离职和裁员潮，加剧了这些技术和管理上的挑战。虽然Stability AI仍在努力通过改进和发布新模型来克服这些问题，但其现状引发了社区对公司未来和其技术发展的担忧。

总体来看，这次发布展示了在AI图像生成领域面临的技术和管理挑战，也突显了数据集和训练过程对模型性能的关键影响。随着技术和数据集的改进，未来的AI图像生成模型有望更好地应对这些挑战。

Reply to this note

Please Login to reply.

Discussion

No replies yet.