选择其实很简单,两者成图各有侧重。
特点:
Stable diffusion 更擅长局部修改,操作更加复杂,可控性强,但瑕疵多,难以一次完美。
Midjourney 张张精品,上手容易,局部修改效果不佳,往往需要多次生成结果。如果需要生成某一类作品,只要成功一次以后,再做就简单很多了。比如人物头像。另外有一些限制,作为公司产品,有一些类似图片,比如儿童,色情图片是不能够生成的。
两者的选择不仅仅看作品效果,还要看使用条件。
前提:
Stable diffusion 的使用前提是8G的 3060 的N显卡,大多数的笔记本是不具备这个条件的,即使有这个条件,笔记本也不适合绘图,不仅仅是发热量大,更重要的是生成图片的速度太慢,一次可能需要4s-60s才能生成一张图,4s还是仅仅简单的文生图(一般不用这个),如果是图生图,没有30s出不来。
绘图中,显卡最重要的不是代数,而是显存,有12GB以上才算入门,我日常用的是22GB的,算是中等了,绘图不会有一直等待的感觉,大概10s左右能生成我想要的结果。
Midjourney 的使用前提是能够科学上网,这点大多数中国人都不具备,其次是付费,Midjourney 是完全付费的,不再有免费使用阶段。对于电脑设备没有任何要求。
第三个前提是提示词。
两者使用的前提都是对英文提示词有一定了解,不过这点容易解决,会英文或者有百度翻译就够了。只要会说中文,翻译一下就差不多,然后学会一些特定的描述方式。比如,人物+角度+距离+背景。以这种固定公式描述,基本上都可以画出比较满意的图片。
怎么选择?
对于大多数中国人来说,选择 Stable diffusion ,完全免费,想画什么图都可以,有点黑科技的味道。这也确实是目前大多数人的选择。
Midjourney 可能更适合一些本身职业是绘画相关的人。生成一些产品的精品图片等,再配合自己的绘画技能改一改就能用,很省时间。SD也可以做这种,但效果还是要看自己的提示词技巧。
个人体验
Stable diffusion 我自己之前花了一千五百元买了 SD 的课程,学习如何实现 AI 模特,确实实现了。
但是 SD 对于手指的控制太难,花费的时间和收入不成正比,不划算。SD生成的结果很依赖大模型,要下载适合自己生成场景的大模型才能更好地生成结果。Midjourney就不要每次下载模型,不用倒腾下载和安装各种插件,会提示词就行。
Midjourney 我也买了中等会员,一个月几百块,是按照时间算的(真·花钱买时间)。
有两种模式,快速的比较快成图,大约30s左右吧,龟速的不用钱(中等会员起步才有),我没用完所有时间,可以Torbo加速生成。大约做了一千零两三百张吧,两三个月。图片确实精美,但是想要调节成自己想要的细节,难如登天。
为什么得不到自己想要的图片?因为自己本身就没想好要什么样的图,即使想好的,图都给 MJ 了,但是它给的图片还是首要根据提示词生成,然后根据你的垫图有一些偏向,差距还是蛮大的,即使你把参数调高,改动还是太大。
SD恰恰相反,图生图,改动太小,内容几乎没有变化,改一小部分,比如蓝宝石变红宝石,可以实现,但未必和你想象的一样,可能色泽不满意,可能位置偏移,可能多了彩带,可能偏了方向。参数调大,改动又太大。
这些是我自己的使用感受,不是不能生成图片,甚至我现在已经能比较好地生成图片了,可是太不划算了,对于我一个程序员而言,绘画对我来说并没有太大用途。除非我卖课培训或者搞一些噱头。
总体来说,成图的时间成本很高。