文章摘要
【关 键 词】 AI模型、图像生成、消费级、合作优化、性能挑战
Stability AI最新推出了Stable Diffusion 3 Medium模型,这是一个拥有20亿参数的文本到图像生成模型,可在消费级PC和个人消费系统上运行。
据称,这是目前最先进的模型之一,能够理解复杂的提示词并生成高质量的图像,具有照片级的真实感和灵活的风格表现。
此外,SD3 Medium还具备排版功能,并且在资源利用上更为高效,适合标准消费级GPU运行。
合作方面,Stability AI与英伟达和AMD合作,优化了模型在各自硬件上的性能。
公司还强调了安全、负责任的AI实践原则,并在模型训练到部署的全过程中实施了广泛的测试和保护措施。
然而,SD3 Medium发布后,却因为生成的手脚等人体图像存在结构上的问题,受到了用户群体的广泛嘲笑。
Reddit上的用户帖子和讨论指出,这一模型在绘制人物时出现了不自然的扭曲,尤其是在手脚等部位的描绘上,与之前的Stable Diffusion版本相比似乎有所退步。
一些用户认为,这是由于训练数据集中过滤掉了成人内容(NSFW),导致模型在生成人体图像时缺乏必要的参考。
尽管面临批评,Stability AI表示将继续根据用户反馈改进SD3 Medium,扩展功能并优化性能,旨在为生成式AI的艺术创作领域设立新标杆,服务专业与业余爱好者。
对于这家成立于2020年、一度估值达10亿美元的初创公司而言,SD3 Medium的发布在管理动荡时期是一个重要里程碑,尽管遭遇挑战,公司依然致力于推动生成式AI技术的发展。
原文和模型
【原文链接】 阅读原文 [ 2820字 | 12分钟 ]
【原文作者】 AI前线
【摘要模型】 glm-4
【摘要评分】 ★★★★★
© 版权声明
文章版权归作者所有,未经允许请勿转载。
相关文章
暂无评论...