2023年12月22日midjourney v6版本更新了,一雄觉得这个版本更新还是有比较大的不同的,虽然很多人说出的图看着和5.2版本的不明显,事实上是有不少的差别的。
我们先看看官方对于midjourney v6版本更新有哪些说法,
-
更准确的提示跟随和更长的提示: V6模型能更准确地跟随提示,并且可以处理更长的提示,这允许创建更详细和复杂的图像请求。
-
改进的连贯性和模型知识: 在生成图像的连贯性和模型知识方面有显著提升,导致更一致和准确地呈现提示。
-
增强的图像提示和混合模式: V6版本包括改进的图像提示功能,并引入了混合模式,允许在修改和重新想象生成的图像方面更具创造性。
-
限量文本绘制能力: 模型现在具有有限的绘制文本能力,可以通过使用特定的风格提示来增强。
-
改进的放大器: V6引入了’微妙放大’和’创造性放大’特性,这些特性显著提高了图像质量和艺术解释。’微妙放大’功能在增强分辨率的同时保持原始的艺术意图,而’创造性放大’可能在放大过程中添加新元素,为原始艺术品提供新的视角。
-
增强分辨率的放大功能: 此功能允许你将图像的分辨率提高2倍,为你的创意过程提供更多的灵活性。
-
更智能的自然语言处理: V6模型具有更智能的自然语言处理能力,导致基于给定提示的图像生成更准确和连贯。
-
社区和实验: 强调了社区方面,鼓励用户加入Discord上的Midjourney社区,分享创作,获得反馈,并向其他用户学习。
一雄觉得有四点变化是比较大的,
首先是细节处理和光影效果方面,v5.2到达以假乱真,v6很多时候可以感觉到就是真实的,算法更强了,对人物、景物特写这些尤其效果显著,我生成了一张v5.2和v6的风景图对比,
首先是v5.2的,感觉很真实,但很清楚知道不是真实的,
看v6的,看光影和细节,我不想承认它不是真实的,
第二点是关于对提示词的识别能力,v5之前都依赖比较专业的术语,v5有很强的midjourney写实风格,容易出效果,但不好出自定义的效果。v6释放了v5的强midjourney风格,更像回归v3那样的不好控制,如果没有详细描述,会变得不伦不类,
对于用惯了v5的人来说,需要从新学习提示词的写法了,它可以更好的识别自然语言了,据说可以媲美chatgpt 4.0的识别效果了,坏处是之前的咒语不灵了,好处是能听懂普通人说的话,不需要去学习太多太专业的术语才能沟通了。
我也尝试了几个用v5能出神图的提示词,放在v6里面一塌糊涂,很多东西得从新来了……
第三点是出图后的优化效果有是新的改变,最明显的就是放大功能,这个界面也还在改,官方也说了,现在v6版本还没定下来,估计还要等等吧,
第四点是文本绘制功能,这个功能目前AI领域还没有人能完美解决,之前就是GPT4做出来了一点效果,这次v6更新也能把英文字母绘制上去了,虽然成功率也不是很高,不过人家官方也说了,后面会慢慢完善的,一雄觉得只要有了这第一步,很快就会完善的,这个也是一雄最期待的功能,
最后值得一提的是,
Holz 在他的 Discord 帖子中指出,大家需要重新学习如何编写提示词,这也是变化很大的一个方面
-
V6 模型的使用方式与 V5 差异较大,您需要“重新学习”如何编写提示词。
-
V6 对于提示词的内容更加敏感,请勿使用诸如“广受好评、逼真、4k、8k”之类的“垃圾描述”。
-
请明确表达需求。V6 可能表现得不那么机灵,但只要提供明确的提示,它现在可以更好地理解您的意图。
-
如果希望生成摄影风格 / 少点自由发挥 / 多点忠于提示词的内容,则应默认使用—style raw。
-
将—stylize 的值设置得更低(默认为 100)往往有助于改善提示词理解效果,而较高的值(最高 1000)则倾向于牺牲还原度来换取美学效果。
对于我们普通用户来说,其实midjourney v5的功能已经差不多够用了,v6的来临更多的是锦上添花,而后面也会不断的完善更新,使其能更加傻瓜化操作。
这里不禁让我想起手机刚出来的时候,只有少数人懂用,要懂打字、各种复杂按键、到现在的智能手机,小孩和老人都能熟练操作了,感觉midjourney也正在走这条路,或者说AI技术应该最终也是要走这条真正的智能之路,能让更多人更轻松驾驭。