AI 绘画东西新版本 Midjourney V5 画人物更加传神，实际体验感到感染如何？

速度舆激情 · 发表于 2023-7-8 19:37:44

可以在回答里分享一下生成作品～

瑷倪 · 发表于 2023-7-8 19:38:20

这道题好答的很呐，有一个很简单的懒人方案，让 Midjourney 用它自己理解的逼真照片参数进行绘图即可。
先随便来三张“示意图”

<hr/>具体实现过程：通过上传照片给 MJ，让它解析原本真实的照片，得到“逼真照片”的 Prompt，然后结合 MJ 文档和 “Prompts 大全”项目，调整参数和对 Prompt 进行微调即可。

举个“栗子”

让模型告诉我们真实图片应该怎么描述

我在网上找了一张赫本的图，然后喂给 Midjourney。

将写实的照片喂给模型

稍等片刻，机器会吐出它认为合适的描述

机器吐出的描述内容

把描述内容复制过来：

audrey hepburn portrait, 1954, in the style of sebastian errazuriz, dave heath, harvey stein, high resolution, black and white portraits, precise and sharp, cinestill 50d --ar 26:33
audrey hepburn h 1957, in the style of black and white portraits, goosepunk --ar 26:33
audrey hepburn,1962 jpg, in the style of dramatic black and white portraits, dark bronze and gray, clean-lined, angura kei, golden age aesthetics, back button focus, charming characters --ar 26:33
a black and white photo of a woman with a ponytail, in the style of celebrity-portraits, i can&#39;t believe how beautiful this is, harry sternberg, light green and dark black, iconic imagery, crisp and delicate, dark indigo and dark brown --ar 26:33

预览模型 Prompt 的结果

我们可以先采纳机器给出的建议，啥都不改，把四个图片都生成一遍，看个效果。

啥都不改，直接预览的效果

好了，上面就是程序直接跑出来的效果了，可以看到其实已经很真实了。不过我们还可以让结果更好！
调整上面机器生成的 Prompt

因为题目是要求逼真写实，所以我们选择第一组风格，以及对应的 prompt 内容作为基础模版：

audrey hepburn portrait, 1954, in the style of sebastian errazuriz, dave heath, harvey stein, high resolution, black and white portraits, precise and sharp, cinestill 50d --ar 26:33

然后打开之前回答里提到的“Prompt大全”，找到风格里合适的词语。

找到风格列表

比如，我们先来一个“美丽风格（beauty）”，然后顺手把黑白照片变成彩色的，咒语改为：
beauty style, audrey hepburn portrait, 1954, in the style of sebastian errazuriz, dave heath, harvey stein, high resolution, color portraits, precise and sharp, cinestill 50d --ar 26:33

图片当然还是要放大看：

是不是看起来已经很不错了？还没结束。
强化细节，提升分辨率

在继续优化之前，我们需要把影响出高清真实的图片的一些矛盾的要素去掉（原本 prompt 中可能有一些风格会制约我们想要的结果），比如上面使用的 prompt 中的：

beauty style, audrey hepburn portrait, 1954, in the style of sebastian errazuriz, dave heath, harvey stein, high resolution, color portraits, precise and sharp, cinestill 50d --ar 26:33

in the style of sebastian errazuriz, dave heath, harvey stein, （特定风格）
high resolution（高清）
color portraits （彩色肖像）
1954 （老照片）

然后调整描述方案，设置一个“真实的预期方向”，比如“近几年的杂志封面的汗毛清晰可见的”肖像很真实，那么就这么改：

2020 年时代周刊杂志上的奥黛丽赫本，清晰可见的毛孔，红唇。
https://复制上一步的图片地址, In 2020, Portrait of Times Weekly, Audrey Hepburn, clear and clear pores, gorgeous red lips, and cheeks, super resolution, very sharp --ar 26:33

这里使用了不同的参数：

super resolution （最棒的分辨率）
very sharp （非常锐利）

或者，我们也可以脑洞开的更大一些：

https://上一步的照片, in the style of realistic style, dynamic and action-packed scenes, portrait of Times Weekly, clear and clear pores, gorgeous red lips, and cheeks, super resolution, very sharp , exaggerated expressions, dynamic lighting, cabincore --stylize 750 --ar 26:33

把描绘电影感的那一套搬运过来

当然，我们还可以脑洞更大一些，因为我们在之前已经生成了接近我们预期方向的图片，所以以这个图为底子，继续喂真实场景的脑洞即可：

https://刚刚生成图片的地址.png , The young woman in the photo is lecturing on the lectern in the classroom

比如，照片里的主人公在教室教书

感觉是文学相关的老师...

美术老师好！

应该是经济学？尔康！！

蒙一个，教物理的

好了，懒人的方法都教给你了，自己去试试如何？

其他相关回答：
另外一个实践应用
给张图就能反推 Prompt，AI 绘画神器能够「看图说话」了，会比人类手写的更好吗？关键词大全项目和“平替开源项目”
你认为 AI 作图程序「MidJourney」有哪些比较好用的关键词？咒语作图开源软件的细节实现和原理
苏洋：八十行代码实现开源的 Midjourney、Stable Diffusion “咒语”作图工具

妞妞不哭 · 发表于 2023-7-8 19:38:32

底部更新了这套图的提示词思路，大家有需要可以参考一下。
<hr/>最近也入坑了V5版本，以这几天刚折腾的DC人物系列说说我的看法。
总体来说AI的再造能力已经越发强得离谱，干碎中低端的美工和摄影师真的只是早晚的事。以我自己的工作为例，有时给客户做一本画册需要配一些特定氛围但不是那么重要的照片或者图片，按照原来的方式注定面临一些问题：
自己做或者自己拍吧，折腾不说还不一定能出自己想要的效果。
外包给摄影师或者美工，性价比先不说，实效性就很差了。
网络找图，免费的想找到合适的不容易，花钱的如果这个图只是用来烘托氛围又觉得没必要花钱。
AI这时候就是最优解，比如我要一张白天的高级别墅图，调整好提示词就能迅速出图。
但让AI完成整个设计项目还是不现实的，当做辅助工具还成。
接下来给大家“欣赏”一下V5创作的全新正义联盟吧！

多数人的既视感还是很强的，我们很容易在各种影视或者游戏作品找到相似的元素。尤其神奇女侠和海王，我跑了好几次都会默认参考盖尔加朵与杰森莫玛的版本。
跑图相对比较波折的是钢骨，一开始使用Cyborg这个词，很容易跑成类似奥创这样的机器人。后面补充了DC Charactor，还是会出现一堆特种兵一样的造型。最后加了VictorStone，就跑出了如上的钢骨，但造型很有AI自己的想法，比较吊诡的就是这小哥长者黑人的脸却有这白人的发型……
这套正联跑出来后，我的感觉就是意料之中没啥大惊喜，反而跑下面这组反派倒是惊喜颇多。

除了莱秃和逆闪，其他人物算是跟大家熟悉的版本有了较大区别。
其实一开始跑小丑的时候，头几次都是希斯莱杰和华金菲尼克斯，让我不禁感叹果然AI现在还只是一个缝合怪不会创造。但多调整几次之后，就出现上图这个有点特色的小丑了。
达克赛德更是与现有各种版本都截然不同，非常经典的好莱坞改编形式，要不是我在胸前P了一个Ω，还是不容易猜到他是谁的。
而贝恩以及猫女都在保留一些人物特质的前提下加入了自己的想法，也都蛮不错的。
最意外的当属LOBO，如果我没记错的话，这人还没有真人化形象，AI能够参考漫画形象并生成新的样子属实给力。
很多人担忧AI会取代画家摄影师设计师，我觉得至少现阶段不会，AI反而会成为助力这些职业成长的好工具。
画家可以根据跑出来的图调整自己的创作方向，摄影师也可以利用AI大致判断摄影的风格，设计师更是可以利用AI来收集自己的创意元素。
但是照这个势头发展下去，AI的确可以取代多数人类工作，就拿设计为例吧，未来可能会出现集合Chatgpt、MidJourney等各领域强者的综合性AI设计师，它能沟通能分析还能通过商业逻辑为你量身定制设计方案，并且可以短时间内给你出好几套可落地的视觉图，太可怕了。
当然AI如果能做到这样，人类也基本完蛋了。
接下来给大家说说自己跑这套图的提示词结构，主要由四个部分组成：人物主体与场景描述，人物细节描述，场景细节描述，固定图片规格。主要变量是前面三个，最后一个保持不变。
人物主题描述：基本上开头就是DC Charactor XXX + 具体动作与场景。
例如小丑就可以是DC charactor Joker sitting a chair in prison,
接着是人物细节描述：主要就是调整人物的神态与动作以及配饰。
例如莱秃我写的就是holding a green crystal,confident,bald,
再是场景细节描述：主要就是调整场景的布置以及时间天气。
例如贝恩我写的是surrounded by many green glowed bottles,night,foggy,green light,
最后就是一套图通用的一些参数：主要为了约束套图的画面比例、色彩风格等等。
我这组图通用的是whole body,8k,super detailed,realistic,fantasy,cinema lighting,30mm shot,--ar 1:2
祝大家跑出自己喜欢的人物吧！

番茄般的生命 · 发表于 2023-7-8 19:38:59

原作者： ~ ，编译：叶赛文
内容简介：今天看到这篇讲解ChatGPT-4 和 Midjourney V5结合的短文不错，大概翻译了一下。主要收获是：不要妄想一下子就生成完美的提示词，需要利用ChatGPT的理解上下文能力、详细描述、不断优化，最后做出优秀的提示词。
上周刚刚发布了两个重要版本，分别是GPT-4和Midjourney V5。由于这两个版本的推出，我们现在拥有生成极其逼真图像的能力。
本文重点了解先进的人工智能技术的能力，以及它们如何协同工作，产生令人印象深刻和逼真的图像。

关于 ChatGPT-4 和 Midjourney V5
如何同时使用这两者

ChatGPT 4是由OpenAI开发的强大语言模型，它可以根据上下文理解和生成类似人类的文本。
它可以为Midjourney V5生成提示。 Midjourney这是一个高级模型，可以通过文本描述，创建高质量的图像。
本文讲探讨如何把两者结合，生成高质量的图像。
引导ChatGPT-4，优化提示

当涉及到为所需的图像生成提示时，引导过程对于确保它们的准确性和描述性非常关键。
为了有效地运用ChatGPT-4，重要的是给它提供关于Midjourney V5的正确信息，例如图像应具有哪些功能、使用什么设置和示例提示。
这些信息帮助ChatGPT-4创建上下文丰富、生动的提示，帮Midjourney V5理解并转化为高质量图像。
构建上下文意识

ChatGPT-4的独特之处在于其出色的上下文理解能力。
ChatGPT-4可以通过获取Midjourney V5的所有必要信息，理解扩散模型中微妙的细节和复杂性，例如如何将文本描述转化为图像。
ChatGPT-4可以通过上下文意识创建与Midjourney V5完美匹配的提示，确保两种人工智能技术之间的顺畅协作。
生成详细提示

ChatGPT-4可以开发适合不同主题和风格的详细提示，前提是它已经掌握了Midjourney V5。
ChatGPT-4可以根据你的要求，精确地制作出你想要的图像，包括颜色、光线、纹理和情绪等方面。
ChatGPT-4可以处理抽象的东西，比如特定的情感或故事情节。
ChatGPT-4通过这些细节创造出超级描述性和富有想象力的提示，这正是Midjourney V5创建图像需要的。
不断迭代优化

ChatGPT-4和Midjourney V5的配合，不仅是一次就能做好的。
这个过程更像是一个持续的改进过程，以确保我们获得最佳结果。
如果生成的图像不符合质量或准确性标准，我们可以给ChatGPT-4提供更多信息或更好的提示，帮助它为Midjourney V5产生更适合的描述。
不断改进和重新生成图像，可以确保随着时间的推移，结果变得越来越好，从而产生更准确、视觉效果更佳的图像。
ChatGPT-4 + Midjourney V5 创建图案实例

ChatGPT-4和Midjourney V5的配合使用，结果将令人印象深刻。
AI生成图片的潜力无群，Midjourney V5可以通过使用GPT-4提供详细提示，来创建符合不同主题和风格的各种图像。
例如：
历史人物：产生一个美洲原住民女人（Historical figures: Generate A Native American Woman）
ChatGPT-4 的响应：

Midjourney V5 图片输出：

ChatGPT 提示:
Picture a humanoid robot with a sleek and futuristic design, standing around six feet tall. Its head would resemble that of Elon Musk, with his distinctive hairline, sharp jawline, and piercing gaze. The robot’s body would be clad in a form-fitting suit, perhaps similar to the one Mr Musk wears when presenting at events. The robot’s movements would be precise and controlled, reflecting the CEO’s reputation for attention to detail and perfectionism. （想象一个具有时尚和未来主义设计的人形机器人，站立在大约六英尺高的地方。它的头部类似于埃隆·马斯克（Elon Musk），有着独特的发际线、尖锐的下巴和锐利的目光。机器人的身体将穿着合身的西装，可能与马斯克在活动中展示时穿的西装相似。机器人的动作将是精确和可控的，反映了首席执行官注重细节和完美主义的声誉。）
Midjourney V5 输出：

更多的照片：
直接用Midjourney V5生成的图片——高仿真图片（Realistic Photos）：
穿汉服的女孩提示词（作者Mage)： In a palace, a girl dressed in a gorgeous Hanfu( traditional Chinese clothing) is being photographed. She is a celebrity named Song Zu&#39;er, a princess, with exquisite hair accessories, clean attire, a pure and innocent face, a playful and cute demeanor, and a perfect figure. The background is also very clean, The scene is hyperrealistic, photorealistic, with a clear focus, delicate lighting and shadows, and a studio - like set - up that evokes a cinematic feeling，85mm, f 10, sharp focus, with bright lighting, 4K, ultra photorealistic, ultra detailed, intricate details, Kodak gold 100, 4k --ar 2:3 --stylize 1000 --s 250 --v 5

中国模特提示词：Beautiful Chinese model, looking at camera, full body, low - cut short dress, tight --ar 9:16 --q 0.5 --upbeta --v 5 --s 750

说明：在测试中发现，如果输入不适当的提示词，Midjourney会自动忽略这些不合适的提示词。
我觉得AI生成模型将继续优先考虑安全，避免生成不适当的内容。

AI生成模型的安全性和内容适宜性正在得到研究人员和科技公司的持续关注。虽然未来无法确定，但可以肯定的是这方面会有不断努力。
结论

GPT-4和Midjourney V5的配合使用，充满无限可能性，令人振奋。
技术和艺术的交汇将会革新创意世界，为艺术家提供探索和表达自我的新颖方法。
期待这个强大组合将会创造出令人惊叹的作品。

LINSJX · 发表于 2023-7-8 19:39:45

感谢楼下@发条牛同学优秀的打光和服装设置
我也做了一组，请大家欣赏下

bing1983 · 发表于 2023-7-8 19:40:35

实际体验感受就一个字：强！比V4的强更强！
实际体验下来画人物真实感更强，与照片的边界越来越模糊，会画手了，也摆脱了 Ai 对亚洲女性的固有印象，发几张自己用V5画的私房摄影照，附关键词自取测试，摄影师们可以看看，Midjourney 几分钟的事情，自己要复刻拍出来要花多大功夫。

提示词：
realistic photograph of perfect Korean Girl,Sheer tulle dress, halter dress, brunette hair, slim body，Charming eyes，In bedroom bed，Private Photography，Golden Hour，cinematic lighting，rim light ，Overhead view，50mm lens，Canon 5D，hyperdetailed --ar 2:3 --v 5
<hr/>本部分内容为2023.4.12补充：
有朋友说用了我的提示词，生成风格差异比较大，在此说明一下，复制关键词注意检查下是否使用的V5模型，再补充一下上面几张照片的stylize值为750，即加上指令“--s 750” ，stylize 值指的是 Midjourney 的审美风格对结果的影响程度，希望更接近描述就用更小的s值，反之，希望更有想象力一点，就用更大的s值，s值的取值范围为0-1000，善用不同的s值，会得到一些意想不到的结果，我自己常用的s值为 50 100 250 750 1000。
另外再补充一些近期新画的具有真实感风格的图，并附上关键词，供参考。

提示词：
Powerful action shot,Daenerys Targaryen(Emilia Clarke)in mid-battle,,fight with her dragon,professionally shot and edited Game of Thrones episode,dynamic movement,sparks flying from clashing swords,intense and raw emotion,cinematic lighting,extremely high facial details,rich,cinematic color grading,stunning,photorealistic,shot on Canon EOS-1D X Mark III --ar 3:4 --q 2 --s 1000 --v 5

提示词：
Gundam In the midst of urban ruins,at night，Close up shots,Bust portrait,red eyes,Bright light mechs,sci-fi effects,intricate mecha armor,character concept art,surrealism,HD,hyperrealism,rendered in octane,futuristic,Film Lighting,volumetric lighting,technologically advanced,high detail,ultra-high image quality,hyper quality,ultrahigh clarity,picture-perfect,flawless,meticulously crafted --s 250 --q 2 --v 5 --ar 3:4

提示词：
Mountain motorbikes,Transparent,Internal mechanics,apple design,with the wires and mechanical parts visible,white,clean background,realistic,3.5mm,f2.1,fujiflm,super detailed,3D,c4d,cinematic --ar 3:4 --s 750 --v 5
这组词用的时候替换一下摩托车类型就行。

		自动登录	找回密码
密码			立即注册

AI 绘画东西新版本 Midjourney V5 画人物更加传神，实际体验感到感染如何？

本帖子中包含更多资源

本帖子中包含更多资源

本帖子中包含更多资源

本帖子中包含更多资源

本帖子中包含更多资源