2025年8月14日星期四

如何在Google Veo3中搞掂角色一致性?这个方法很管用!

很多人在用Google Veo3制作视频的时候,面临的一个比较麻烦的问题就是:角色的一致性。

很多人在用Google Veo3制作视频的时候,面临的一个比较麻烦的问题就是:角色的一致性。即使同一个项目,生成的人物差别还是很大。下面这个流程和方法,可以完美的解决角色一致性问题。

图片

首先,我们去Whisk AI,它是谷歌的图像生成工具,也是整个流程的基础。我下面直接给你链接:

labs.google/fx/tools/whisk

图片

到了主页,你会看到界面很简洁,有几个不同选项。在这儿我们点"进入工具",就能进到Whisk的界面。在这个提示框里,我们就可以开始创建角色了。很多人在这儿就出错了,他们对角色的描述不够具体。你得把角色外貌的每个方面都详细描述出来。

图片

我给你举个例子。在这个文本框里,把角色描述得特别详细。就像这样,写的是一个中年希腊渔夫,还写了他的手、眼睛、衣服、背景,还有这个人整体给人的感觉。不只说"一个男人",而是把年龄、职业、具体穿着、面部特征这些全写了。所以,细节程度对接下来的操作特别关键。

在下面,我们得确保长宽比设置正确,我选的是横向。然后这边,要选"最佳质量"。

你能看到,生成的角色跟我描述的一模一样,中年、希腊人的长相,渔夫的样子。这就是我们整个过程都会用到的基础角色。要是你不喜欢生成的结果,可以点击"优化"来编辑,还能添加额外细节,比如给他加副眼镜、戴顶帽子,或者改变其他特征。之后,我们做的每个视频都会围绕在Whisk里创建的这个角色。

选这张图片,把它拖到"主体"里,然后打开。Whisk会分析这张图片,从AI的视角告诉我们它看到了什么。

图片

这特别有用,能让我们知道谷歌的AI是怎么识别这个角色的。现在点击这个按钮,就能看到谷歌识别这张图片的描述。这比我们一开始输入的详细多了,对Google Veo3也很有用。我把这个人物描述复制下来,再把这张图片下载到电脑上。

有了基础角色和描述后,我们去Gemini创建角色模板。

直接打开 gemini.google.com

接着上传人物图片,给Gemini一些背景信息,告诉它我们要做什么。高速它我在Whisk里写提示词,以及粘贴从Whisk得到的图片描述。

图片
图片

接下来是重要的一步,让Gemini 创建 Veo3 的优化描述,接着输入"我想要一份详细的Veo3角色描述,只关于人物的面部和身体特征。这将作为创建一致提示的基础模板,请只关注面部结构和显著特征,不用描述服装",然后回车。

图片

接着,它生成了详细描述,包括面部结构、肤色、眼睛形状、胡须特点,这正是我们在Veo3里保持一致性需要的。

图片

如果你还想让角色一直有一致的声音,所以也让Gemini给出声音提示 

图片

它给了三种声音类型的选项,比如深沉的男性声音、带有希腊口音的成熟男性声音。

我们可以选其中一个用在提示词里,这能帮我们在视频里保持声音一致。我又让Gemini提供角色描述、角色声音,还有场景整体电影风格和构图的核心提示。点击回车后,每个方面都有了核心提示,我们在V3里随时都能用到。在去Veo3之前,建议把这些描述保存到文本文件里。

现在进入视频生成平台Google Flow

labs.google/fx/tools/flow

在这儿点击"用Flow创建",屏幕上就会显示你的项目。

在Flow里我点击"创建新项目"。在下面的模型选择里,选Veo3 快速,这个模式兼具速度和质量,只需要20个积分。

我不想从头写复杂的提示来制作视频,就回到Gemini,让它根据角色模板生成具体提示。我输入"用你刚创建的核心提示,为我们的角色写一个自拍vlog风格的Veo3提示,内容是他登上飞机,看着美丽的风景说'嘿,又是我,希腊渔夫。我要去看望我的朋友了'",然后提交。

图片

它会生成一个完整的Veo3提示,我把提示复制到Flow里,粘贴到描述框,然后回车。生成视频通常要一两分钟。视频生成好了,角色跟我们最初创建的一模一样,声音也符合我们的要求,整体质量很不错。要是和之前生成的视频对比,能明显看出是同一个人。

图片

我再测试一下一致性,回到Gemini,让它生成另一个场景的提示。我输入"用你刚创建的核心提示,为我们的角色写一个自拍vlog风格的Veo3提示,内容是他在日落时坐在海边咖啡馆外,拿着一个小杯子,微笑着对着镜头说'嘿,又是我,你们最喜欢的希腊渔夫。今天休息了一下,想欣赏下风景,思考下人生'",然后点击生成。

它又生成了一个能在Veo3里用的提示,我复制到Veo3里,再次点击生成。看,结果太棒了,还是同一个人,还是带着希腊口音的声音,完全达到了我们的目标。

图片

这里有个很多人不知道的重要技巧Veo3在同一个聊天会话里是有记忆功能的。所以,要是你要为同一个角色生成多个视频,最好在同一个聊天设置里做,而不是每次都开新项目。

我发现,在同一个Flow项目里生成多个场景,角色一致性会更好,因为AI会基于之前的内容继续生成。要是生成结果不一致,有几个常见问题要注意。

  • 要一直用完全相同的角色描述,用Gemini的同一个聊天和描述就能做到。

  • 其次,要一直在同一个聊天里操作。最后,对话要简短清晰,最多一到三句简单的话。


我们试试用Veo3里的场景构建器做一个完整的场景。比如,打开一个视频,点击"添加到场景",就会自动打开场景构建器。

点击"+",有"跳转至"和"扩展"两个选项。我可以选择扩展这个镜头,然后写一个提示,描述接下来会发生什么。

图片

Veo3还是目前唯一可以同时生成人物动作、声音、还有背景音乐的AI视频生成工具,真实感也很强,用它做的视频比其他软件更有竞争力。

有了角色的一致性,你就可以在每个场景里角色都长一样、声音一样、感觉也一样。无论你是做AI电影、故事短片,还是做其他实验,这方法能让你的角色看着就像好莱坞大片里的,而不是那种有瑕疵的AI演示。

希望这个流程能帮你在自己的项目里创建出很棒的一致角色。要是这个教程对你有帮助,记得点赞,分享。



没有评论:

发表评论

1%创业者的思维:为什么你必须和大多数人不一样?

1%创业者的思维:为什么你必须和大多数人不一样?如果你是创业者,或者想创业,那你必须接受一个现实:你是少数派,而且最好永远保持少数派。 1%创业者的思维:为什么你必须和大多数人不一样?如果你是创业者,或者想创业,那你必须接受一个现实:你是少数派,而且最好永远保持少数派。 为什...