60刀无限AI视频！Midjourney V1震撼登场，成本狂降99%！

最近这段时间，咱们AI视频领域真是“卷”得不亦乐乎，几乎每周都能听到各大厂商发布新产品或者启动内部测试的消息。不过，话说回来，尽管更新频率很高，但由于目前大部分技术都还在DIT（Diffusion In Transformer）这个大框架下，很多普通用户可能很难直接感受到显著的体验差异。即便是那些对新技术充满好奇、想亲身体验一番的创作者，面对市面上那些质量上乘的AI视频产品，价格门槛往往还是不低。

想想看，如果想制作一个短短一到三分钟的AI短片，可能不光要买好几家视频产品的会员，还得搭配图片生成工具的会员。这样一来，光是生成素材消耗的积分成本，少则几千块，多则可能飙升到好几万，对于普通创作者来说，这笔投入确实让人有些望而却步。

而就在这时，新媒网跨境获悉，Midjourney V1视频模型突然入场，它最大的亮点，并不在于带来了多么颠覆性的AI视频技术，而是在它已经在图像生成领域铸就了坚实的“护城河”之后，又把AI视频生成的性价比直接“打穿了”，真正做到了让大家觉得“值”！

一、价格亲民，性价比直接拉满

Midjourney V1模型在视频生成能力上，或许不是目前市面上运动上限最高、技术最顶尖的，但它所提供的每月60美元（折合人民币大约430元）的价格，就能享受到无限高质量、高审美的图片生成，同时附带效果不错的视频生成功能。这笔费用，用咱们老百姓的话说，也就相当于一顿稍好些的饭钱，却能撬动无限的创意可能。对于AI视频的爱好者和创作者来说，这无疑是一个极具吸引力、完全可以负担得起的方案，性价比简直是“超绝”！

咱们来看看它的订阅套餐。最基础的10美元起步，往上还有30美元、60美元和120美元的档位。其中，30美元的套餐就能实现无限量的图片生成，但视频生成会受限于“快速时间”（Fast时间）的消耗。而一旦你选择60美元以上的套餐，就能同时拥有无限量的图片和视频生成，甚至还包括“隐身模式”选项，这样你的创作内容就不会被其他用户搜索到了。

对于追求专业创作的用户来说，很多朋友都是毫不犹豫地选择购买60美元的年付套餐。这样算下来，每个月只需大约48美元（折合人民币约345元），如果创作者有商业化制作的需求，这个60美元的套餐就显得尤其划算了。毕竟，以前咱们为了高品质的图片生成，也常常需要支付60美元的订阅费，现在 Midjourney V1直接把无限视频生成作为“附加赠品”，这简直就是“白给了”！更何况，它的视频生成效果并非凑数，在视频动态的泛化性方面，已经达到了行业第一梯队的水平。

所谓“泛化性”，简单来说，就是指一个视频模型在面对各种不同的数据、场景、任务和风格时，能够保持稳定一致且具有良好适应性的能力。它不仅能识别并“记住”各种风格化的图片以及训练数据中的特点，更厉害的是，它还能在全新的情境下，准确地生成或理解视频内容，这种能力对于创作来说至关重要。

二、泛化性强大，各种风格动态都能驾驭

在过去做AI视频创作时，咱们经常会遇到一个两难的困境：在追求艺术风格化和保持视频流畅动态之间，很难找到一个完美的平衡点。因为很多视频模型并没有足够的数据集来识别那些审美独特、风格强烈的图片，导致一些非常规的风格化图片，很难跑出理想的动态效果。为了确保视频的动态质量，创作者们有时不得不牺牲掉图片的审美，转而去制作一些更常规的写实风格，或者那些模型已知且比较常见的动画风格作品。这种限制，无疑束缚了创作者的想象力。

在新媒网跨境了解到，在Midjourney V1横空出世之前，市面上泛化性做得比较好的模型有即梦3.0 Pro、Vidu Q1等，而可灵2.1、PixVerse 4.5等产品的效果也相当不错，可以说，各大厂商你追我赶，技术迭代得非常快。有段时间，我本人在更新原创AI视频作品上确实慢了下来（其实做了不少，但总觉得不够满意没发），除了偶尔的“拖延症”作祟外，更主要的原因就是不想重复创作那些已经做过的画风。可一旦尝试制作一些风格化更强、美学倾向更明显的作品，动态效果就容易受限，那种创作的冲劲自然也就减弱了。

之前在国外社交平台上，我也曾就这个问题“抱怨”过几句，没想到引来了不少创作者的互动，这说明被这个问题困扰的人还真不少。但在风格化审美方面，Midjourney无疑是目前公认的“Top 1”，毕竟它在图片生成领域积累了海量的美学元素和数据。现在，那些原本在Midjourney上生成，却让其他视频产品“识别不了动态”的图片，都能在Midjourney V1上实现“无痛”生成了，这简直是解放了创作者的一大痛点！

此外，多角色或多物体之间的复杂交互，也一直是AI视频生成的一大难点。Midjourney V1在这方面的表现也相当亮眼，像常规的物体变形，甚至是双人打斗这种需要精确协调的动态，现在都可以通过简单的提示词轻松实现，为创作者省去了大量调试的精力。

当然，鉴于当前市面上有太多优秀的视频模型，Midjourney V1在某些细分领域的视频能力上，肯定会暂时落后于一些先行者。但它胜在“便宜大碗”，能够完美承接大部分优秀美学图片进行动态化处理，这就为它带来了极其广泛的商业化应用场景。毕竟，咱们要知道，目前DIT架构下的AI视频模型能力，从本质上来说，各家之间的差距并没有那么巨大。

因此，当“价格亲民”、“审美出众”和“稳定性高”这三大优势叠加在一起时，就构成了Midjourney V1巨大的商业化竞争力。无论是小商家制作产品动态视频，还是博物馆展示珍贵文物、风格化装置艺术，亦或是老师们制作生动的教学视频，只要内容和场景可以被可视化呈现，Midjourney V1低廉的价格和出色的审美，都为更多人提供了亲自上手制作、将创意变为现实的机会。这种技术普惠，正是咱们这个时代最让人欣喜的进步之一。

三、界面交互高度集成，告别繁琐流程

回想起过去，每次从Midjourney生成完精美的图片后，咱们创作者都得把图片下载下来，再上传到不同的视频产品上去测试和生成，这个工作流程确实不小，既费时又费力。对于习惯于“图生视频”工作流的创作者来说，只要其他家视频产品在图片生成方面能做好，用户自然就会“用脚投票”，跑到那个既能生成好图又能生成好视频的平台上去。比如前段时间，即梦的生图能力显著提升后，我自己的Midjourney账号都开始“吃灰”了，当时甚至在想是不是可以取消订阅了。结果，Midjourney V1一发布，相信无论是国内还是外媒报道的海外视频厂商，都感受到了不小的压力。

毕竟，现在还有不少视频厂商没有推出无限量套餐。Midjourney这次直接把图片生成和视频生成“打包”销售，甚至可以说买了图片生成“送”视频生成，这份“财大气粗”的姿态，明显是想把视频用户也牢牢地锁定在自己的生态系统里。

目前，Midjourney的视频生成功能主要集中在“图生视频”上。毕竟，它最初就是以画图起家，所以目前它直接放掉了“文生视频”模型。在Midjourney的网页版上，用户可以直接上传图片，然后选择“低动态”或“高动态”两个档位，再配上视频生成的提示词，就能轻松生成视频。或者，如果你在Midjourney里已经生成了图片，直接在画图界面点开大图，就能找到“视频运动”的选项，操作起来非常直观。

它提供了四种模式供咱们选择：自动低动态、自动高动态、手动低动态、手动高动态。如果你选择手动模式，就可以像写提示词一样，自由地描述你想要的视频运动效果。通过我个人的测试，它对视频提示词的遵循效果还是相当不错的，基本上能够达到预期。

更贴心的是，当你的鼠标悬停在缩小图上方时，还会直接弹出一个“生成视频动态”的按键，让你能够快速便捷地预览动态效果。假如你对生成的视频效果感到满意，还可以进行“视频延长”操作，同样支持这四种模式。每次可以延长一部分，最多可以延长4次，最终的视频长度最长能达到20秒，这对于制作短片来说，已经非常实用了。

整体来看，Midjourney V1的交互界面设计得非常简洁明了。对于那些习惯使用Midjourney网页端的用户来说，几乎没有任何上手难度，这无疑大大提升了用户体验。它免去了每次生成完图片后，还得下载下来，再跳转到其他网站进行测试的繁琐流程，真正实现了“一站式”创作，让咱们创作者能够更专注于创意本身。

过去，咱们在制作作品时，经常需要同时购买Midjourney账号，再另外购买一个可以无限生成的视频账号。先用这个视频账号进行基础生成，把一些难度较高的镜头，再放到那些能力更强、但积分又特别昂贵的产品上去生成，比如Veo3、即梦3.0 Pro、可灵2.1大师版等（因为积分太贵了，所以不敢直接把它们作为基础模型去“抽卡”）。现在有了Midjourney V1，它的视频能力完全可以作为咱们的基础“抽卡”模型，然后用其他能力出众的模型作为补充。毫不夸张地说，Midjourney V1作为咱们创作的“保底视频模型”，绝对是我目前的第一选择。（当然啦，说不定过两天又变了，毕竟模型更新迭代的速度实在是太快了，嘿！）

任何一个做过大量视频生成工作的人都深知，拥有一个基础且可靠的“保底视频模型”是多么重要，它是商业化创作流程能够顺畅进行的基础。Midjourney V1的出现，保证了大量人群能够以极低的成本触达AI视频创作，作为一家科技企业，能做到这一点，新媒网跨境认为，其实是一件非常了不起、值得肯定和鼓励的事情，它极大地推动了AI技术的普惠化进程。

四、目前存在的一些小问题

尽管Midjourney V1带来了诸多惊喜，但作为一个刚刚面世的新模型，它也存在一些可以优化提升的空间，咱们也得实事求是地看待这些问题：

分辨率略显不足： Midjourney官方标称的分辨率目前是480p，不过实际测试下来，大部分用户感觉它应该能达到720p的水平。如果再搭配Topaz等超清工具进行后期处理，画质方面倒也能接受。然而，在如今众多厂商都能提供1080p甚至更高分辨率视频的阶段，Midjourney目前的这个分辨率确实还不太够看。咱们非常期待它的高分辨率版本能够尽快推出。毕竟，高分辨率是商业化创作的基础标准之一，清晰度不够，很多时候就难以满足商用需求。
视频运动幅度上限： 相比于Veo3等模型，Midjourney V1在视频运动幅度方面目前的上限会低一些。像翻跟头、人物快速跟跑等幅度较大的物理运动，目前表现得还比较勉强，距离自然流畅的效果还有一定的距离。
稳定性略有“偏科”： 不过，相比于运动幅度的问题，Midjourney似乎更注重视频模型的延长稳定性。在视频延长过程中，它能够持续保持物体的一致性，这一点备受好评。但这种稳定性也需要一定的“抽卡”运气，虽然它能保持风格审美的一致性，但物理运动的持续性偶尔还是会出一些小问题。此外，视频中还容易出现一些闪烁问题，不过咱们相信，这些都会在后续的模型迭代中得到优化。
组件功能尚不完善： V1视频模型毕竟刚推出不久，目前很多组件功能还不够齐全，比如运动方向键、首尾帧控制、参考生成等功能都还没有。在功能丰富性上，可能暂时不如市面上一些已经发展了一段时间的视频厂商。但咱们也无法确定这些功能的完善是否都在Midjourney的未来规划范围内。

毕竟，新媒网跨境了解到，Midjourney的理想征途，是构建一个可以实时生成视觉元素的3D空间。从图像、视频，到3D模型，再到实时的生成系统……他们有着自己宏大而清晰的一系列规划，现在这次更新，不过是其中迈出的一小步。

总而言之，Midjourney这次推出的视频模型，虽然没有带来意料之外的颠覆性惊喜，但也绝没有让人失望。毕竟，其在价格和审美上的巨大优势，足以让它在商业化盈利上形成一个健康的闭环。当然，AI视频本身还有许多核心技术问题尚未完全解决，目前使用AI工具进行高质量创作，仍然是一件相对需要技巧和耐心的事情。但咱们也能清晰地看到，这个领域正在一步步朝着好的方向发展。未来，新媒网跨境预测，一定会有越来越多的人，能够以极低的工具成本，创作出高价值的AI影像作品。AI产品的迭代速度之快，虽然有时会让人感到一丝焦虑，但更多的是让人充满期待呀！

新媒网（公号: 新媒网跨境发布），是一个专业的跨境电商、游戏、支付、贸易和广告社区平台，为百万跨境人传递最新的海外淘金精准资讯情报。

本文来源：新媒网 https://nmedialink.com/posts/20707.html