2025年6月22日星期日

Midjourney V1 视频模型性价比超绝,泛化性优秀!

60美元无限生成图像和视频的Midjourney V1,超高性价比!

最近的AI视频厂商更新超卷超频繁,几乎每周都能听见产品更新或内测。
但因为都还在DIT的技术框架架构下,所以即便有模型的更新,大部分普通用户可能很难有直接的体感。
即便想上手体验,质量好的AI视频产品价格对大部分普通用户来说还是相对较高。
除了买多家视频产品的会员还得买图片产品的会员,想要做好一个1到3分钟的AI短片,单消耗的积分成本,少则几千块,多的可能要到几万块。
Midjourney V1 Video模型的更新不在于他使用了多新多前沿的AI视频技术,而是它在建立了图像生成领域护城河的前提下,把AI视频生成的性价比打穿了,拉满了。
图片
宣传片如下,网址是:https://www.midjourney.com

模型评析内容视频如下,4分21秒有以"机甲"主题的多风格场景实测视频!看完视频也还可以看图文分析~

一、价格便宜,性价比拉满
MJ V1可能不是目前视频模型里运动上限最高、能力最强的,但每月60刀(大约430元)的价格,就可以有无限高质量审美的图片生成和效果还可以的视频生成,只要一顿饭钱啊……绝对是性价比超绝、且AI视频玩家可以负担得起的价格。
图片
10美元起订,还有30美元、60美元、120美元档,30美元有无限生图但视频生成有限(花费Fast时间),60美元起有无限图和视频生成,以及隐身模式的选项(不会让其他人看到,否则其他人是可以搜索到你生成的内容的)。
一般专业用户都是无脑买60美元的年付,每个月打折下来只要48美元(大约345元),如果是有商业制作需求的创作者,60美元就是非常划算的套餐了。
毕竟以前也是要买60刀画图,现在还有无限视频生成,相当于白给了!
况且它的视频生成效果并不差,视频动态的泛化性几乎就是第一梯队的水平。
所谓泛化性,指的是视频模型可以在不同数据、场景、任务和风格之间表现一致性与适应能力,不仅可以识别不同风格化的图片、"记住"训练数据,而且还能一定程度"学会"在新情况中正确地生成或理解视频内容
二、泛化性强,支持多种风格动态
之前我们做AI视频有一个难点,在风格化和视频动态之间很难取得平衡。因为审美好的图片,很多视频模型并没有对应的数据集,识别不了风格化强的图片元素,一些非常规的风格图,就很难跑出好的动态效果。
只能牺牲图片审美,去制作一些常规写实或者已知的比较常见的动画风格。在MJ V1出来之前,泛化性做得比较好的是即梦3.0 pro、Vidu的Q1,可灵2.1、PixVerse 4.5等效果也不错,每家模型都有自己的小擅长,互相追得特别紧。
我有一段时间没有怎么更新原创的AI视频作品(其实做了好些但不满意还没有发),除了拖延症之外,主要是不想重复做已经做过的画风作品。
但做稍微风格化强一些美学风格,动态效果会受限,很难有动力继续做下去。之前在X上抱怨过,有不少创作者互动,所以是有很多人被这个问题困扰。
图片
风格化审美这块Midjourney应该是目前当之无愧的Top1,毕竟累积了太多生图的美学元素了。原来在MJ上生成的,其他视频产品识别不了动态的图片,都可以在MJ上"无痛"生成了。
多角色或者多物体的交互也一直是视频模型生成的难点,MJ V1的表现还不错,常规的物体变形以及双人打架等动态可以用简单的提示词轻松实现。
因为现在有太多优秀的视频模型,所以V1在视频能力的某些细分方向肯定比不过跑在前面的模型,但它便宜大碗,能承接住大部分优秀美学能力图片的动态化,它就有了非常广泛的商业化场景。
要知道其实现在DIT架构下的视频模型能力,本质上拉不开太大的差距。便宜+审美+稳定性,就是非常大的商业化优势了。
小商家们的产品动态视频、博物馆的文物、风格化装置艺术、老师们的教学视频,只要可以被可视化的内容和场景,因为它低廉的价格和优秀的审美,就给了更多人上手制作的机会。
这个风格化的案例视频单独摘了出来,大家可以再看看~

三、界面交互集成,减少繁琐流程
之前每次从Midjourney把生完的图片下下来,再到不同视频产品上去测试和生成,工作量确实不小。对于图生视频工作流的创作者来说,只要其他家视频产品的图片生成做好了,用户就会跑到又能生好图和视频的网站了。
比如前段时间即梦生图的能力上来之后,我的Midjourney就开始吃灰了。本来都想是不是差不多可以取消订阅了,结果Midjourney V1一出,国内外的视频厂家的压力可能又上来了。
毕竟现在还有很多视频厂家没有推无限套餐,Midjourney买图片生成送视频生成,有种财大气粗的气势,想要把视频用户也牢牢锁死。
目前Midjourney的视频生成只有图生视频功能,毕竟它是以画图起家,所以直接放掉了文生视频模型。
图片
图片
Midjourney的网页版支持上传图片,选择低或者高两档动态,并写视频生成提示词。
图片
或者是在Midjourney生成图片之后,在画图界面点开大图,就有视频运动的选项。
4档模式,自动低动态、自动高动态、手动低动态、手动高动态。选择手动,就正常写视频运动的提示词即可,测试下来,视频提示词的遵循效果还是不错的。
图片
鼠标放到缩小图上面,也有一个可以直接生成视频动态的按键,可以快速便捷生成动态效果预览。
图片
假如你对生成的视频效果满意,还可以进行稳定的视频延长,同样支持四种模式。可以延长4次,最长可达20秒。
图片
整体交互非常简洁明了,对于习惯用web端的Midjourney用户没有任何上手难度,且免去了每次生完图还得下载下来再到别的网站去测试的繁琐流程。
之前我们做作品,经常需要买Midjourney账号的同时,再买一个可以无限生成的视频账号,先过一遍基础的生成,把难度较高的镜头再放到能力比较高的产品去生成,比如Veo3、即梦3.0 pro、可灵2.1大师版等(积分太贵了,不敢作为基础模型抽卡)
Midjourney的视频能力完全可以作为基础抽卡模型,再用其他能力好的模型作为补充模型。
Midjourney V1作为保底视频模型,绝对是我目前的第一选择。(可能过两天就变了,毕竟模型更新迭代太快了嘿)
只要做过大量的视频生成的人,就知道有一个基础保底视频模型的重要性,这是商业化创作的基础。
V1保证了大量人群的低成本触达,作为一家企业,能做到这点,其实是一件非常了不起的事情。
四、目前存在的问题
分辨率不够:Midjourney官方写的分辨率目前是480p,但其实测下来,大部分人都感觉应有720p,分辨率加上topaz超清的话还能接受。
只是在众多厂家都出品1080p以上分辨率视频的阶段,Midjourney目前的分辨率还不太够,期待它的高分辨率版本。分辨率高是商业化创作的基础标准,清晰度不够就难以商用。
视频运动幅度上限:Veo3等模型的运动幅度目前还是比较好的,Midjourney上限会低一些,翻跟头、跟跑等大幅度的物理运动还比较勉强。
稳定性偏科:不过比起运动幅度的问题,Midjourney似乎更重视视频模型的延长稳定性,延长能持续保持物体一致备受好评。
但这个稳定性也需要抽卡,它的延续上,可以保持风格审美的稳定,但物理运动的保持偶尔还是会有些问题。
包括容易出现闪烁问题,但这应该也会在后续模型迭代进行优化。
组件功能不全:V1视频模型刚出,很多组件的功能如运动方向键、首尾帧、参考生还没有,在功能上可能不如市面上现有的视频厂家多,但也不确定这些功能的完善是否在Midjourney的考虑范围内。
图片
毕竟Midjourney的理想征途,是构建一个可以实时生成视觉元素3D空间。从图像、视频、3D模型、到实时生成系统……他们有自己的一系列规划,现在的更新不过是其中的一小步。
总之,这一波Midjourney的视频模型虽没有意料之外的惊喜,但也没有让人失望,毕竟价格和审美优势,足以让它进行商业化盈利闭环。
只不过AI视频本身还有很多问题没有被解决,使用AI来创作,目前仍然是一件相对困难的事情,但也是一步步在朝着好的方向过渡发展。

未来,一定会有越来越多的人,能够以极低的工具成本创作出高价值的AI影像作品,AI产品迭代速度之快让人焦虑,但也让人期待呀!

最后的最后,如果你喜欢我的分享的话,感谢你的点赞、转发、评论、在看,一键四连!

没有评论:

发表评论

被指冒充清华大学经管学院院长,曹玉磊否认:清大经管是我的品牌,职务是院长,做“老板培训班”

6月23日,"冒充清华大学经管学院院长"一事持续引发关注。14时30分许,澎湃新闻联系到当事的北京清大纵横教育科技有限公司负责人曹玉磊,其就相关质疑进行了回应, 他否认冒充,"清大经管是我的品牌" 。 左侧为清华大学经济管理学院官网截图...