[币界网]AI图像生成器对比：SD3 vs SDXL vs MidJourney vs Ideogr

时间：2024-06-14|浏览：331

欧易(OKX)

用戶喜愛的交易所

币安(Binance)

已有账号登陆后会弹出下载

稳定性人工智能最新的大型发布SD3在人工智能社区引起了相当大的轰动。SD3承诺提高即时遵守性、效率、准确性和整体质量,昨天上线,希望在图像生成方面树立一个新的基准。我们很快就开始观察SD3与其前身SDXL以及其他领先机型MidJourney和Ideogram相比有多好。

我们的面对面比较对每个模型都使用了相同的提示,以确保公平竞争,尽管由于模型之间的内在差异,这似乎是非常规的。评估包括各种场景,测试模型处理详细艺术提示和日常场景的能力。SD3和SDXL使用相同的种子,稳定扩散世代使用标准化的负面提示,比赛场地变得平坦。

以下是我们对各种图像类型的结果。所有图像按相同顺序显示:SD3(左上)、SDXL(右上)、MidJourney(左下)和Ideogram(右下)。我们将分享我们对每一个的看法,但你也可以自己判断。

插图

提示:一只巨型蜘蛛在丛林中追逐一名女子的手绘插图,极度恐怖、痛苦、黑暗和令人毛骨悚然的景色、恐怖、模拟摄影影响的暗示、素描。

SD3和SDXL都采用了让人想起旧漫画的黑白风格。然而,SD3的输出要详细得多,捕捉到了蜘蛛的腿和女人痛苦的表情等复杂的元素。MidJourney采用了一种更巧妙的方法,制作了一幅充满活力的插图,虽然在视觉上很有吸引力,但偏离了提示的“手绘”和“草图”指示。Ideogram的解释反映了SD3的风格方法,但添加了提示中没有指定的蓝色色调,也不是草图。

就准确性而言,SD3和Ideogram正确地描绘了逃离蜘蛛的女人,与提示的叙述紧密一致。相反,SDXL和MidJourney错误地显示了该女子接近蜘蛛的画面,这与提示相矛盾。考虑到提示的草图规格,SD3的黑白、高度详细的插图比Ideogram的彩色构图更准确,后者缺乏面部细节。

获胜者:SD3。

非标准代

提示:一只穿着西装的蜥蜴。

SD3对一只穿着西装的蜥蜴进行了精确的描绘,并严格遵循提示。这只蜥蜴保留了其自然的外表,有鳞片和爬行动物的特征,无缝地融入了一套剪裁得体的西装中。相比之下,SDXL、MidJourney和Ideogram将蜥蜴拟人化,转而创造了人形蜥蜴。

SDXL和MidJourney的版本非常详细和逼真,类似于照片。MidJourney的输出具有逼真的纹理和深度,几乎类似于模拟摄影,但并没有生成套装。Ideogram的肖像经过了大量编辑,类似于政客们拍摄的官方照片,看起来精致而正式。尽管这些输出质量很高,但SD3在真实性、即时性和准确性方面表现出色,使其结果最可信。

获胜者:SD3。

房间里的大象:“L”字

提示:一个美丽的女人躺在草地上。

SD3显然出了问题。

这一提示之所以被删除,是因为人工智能艺术界首先注意到的一件事是SD3无法生成躺在草地上的人的照片。事实上,这很快就变成了一个迷因。

SDXL展示了这名女子的腰部以上照片,重点是她的上半身和脸部。MidJourney和Ideogram选择了特写图像。MidJourney的结果是最逼真的,展示了女性特征和周围草地的精细细节。然而,它过分强调了散焦效果,不仅模糊了背景,还模糊了女性身体的某些部分。Ideogram避免了过度的bokeh问题,保持了女性身体和草地的清晰。

至于SD3,这是一个莫名其妙的失败。事实上,SD3似乎很难生成人类“躺”在草地上,甚至任何东西上的图像。我们尝试了照片、插图和渲染。我们试着培养男人、女人、老人、孩子,以及任何与人相似的人。这种“撒谎”的姿势把它们都变成了巨大的怪物。

获胜者:SD3被淘汰,这场比赛是MidJourney和Ideogram的平局。