60刀无限AI视频!Midjourney V1震撼登场,成本狂降99%!
最近这段时间,咱们AI视频领域真是“卷”得不亦乐乎,几乎每周都能听到各大厂商发布新产品或者启动内部测试的消息。不过,话说回来,尽管更新频率很高,但由于目前大部分技术都还在DIT(Diffusion In Transformer)这个大框架下,很多普通用户可能很难直接感受到显著的体验差异。即便是那些对新技术充满好奇、想亲身体验一番的创作者,面对市面上那些质量上乘的AI视频产品,价格门槛往往还是不低。
想想看,如果想制作一个短短一到三分钟的AI短片,可能不光要买好几家视频产品的会员,还得搭配图片生成工具的会员。这样一来,光是生成素材消耗的积分成本,少则几千块,多则可能飙升到好几万,对于普通创作者来说,这笔投入确实让人有些望而却步。
而就在这时,新媒网跨境获悉,Midjourney V1视频模型突然入场,它最大的亮点,并不在于带来了多么颠覆性的AI视频技术,而是在它已经在图像生成领域铸就了坚实的“护城河”之后,又把AI视频生成的性价比直接“打穿了”,真正做到了让大家觉得“值”!
一、价格亲民,性价比直接拉满
Midjourney V1模型在视频生成能力上,或许不是目前市面上运动上限最高、技术最顶尖的,但它所提供的每月60美元(折合人民币大约430元)的价格,就能享受到无限高质量、高审美的图片生成,同时附带效果不错的视频生成功能。这笔费用,用咱们老百姓的话说,也就相当于一顿稍好些的饭钱,却能撬动无限的创意可能。对于AI视频的爱好者和创作者来说,这无疑是一个极具吸引力、完全可以负担得起的方案,性价比简直是“超绝”!
咱们来看看它的订阅套餐。最基础的10美元起步,往上还有30美元、60美元和120美元的档位。其中,30美元的套餐就能实现无限量的图片生成,但视频生成会受限于“快速时间”(Fast时间)的消耗。而一旦你选择60美元以上的套餐,就能同时拥有无限量的图片和视频生成,甚至还包括“隐身模式”选项,这样你的创作内容就不会被其他用户搜索到了。
对于追求专业创作的用户来说,很多朋友都是毫不犹豫地选择购买60美元的年付套餐。这样算下来,每个月只需大约48美元(折合人民币约345元),如果创作者有商业化制作的需求,这个60美元的套餐就显得尤其划算了。毕竟,以前咱们为了高品质的图片生成,也常常需要支付60美元的订阅费,现在 Midjourney V1直接把无限视频生成作为“附加赠品”,这简直就是“白给了”!更何况,它的视频生成效果并非凑数,在视频动态的泛化性方面,已经达到了行业第一梯队的水平。
所谓“泛化性”,简单来说,就是指一个视频模型在面对各种不同的数据、场景、任务和风格时,能够保持稳定一致且具有良好适应性的能力。它不仅能识别并“记住”各种风格化的图片以及训练数据中的特点,更厉害的是,它还能在全新的情境下,准确地生成或理解视频内容,这种能力对于创作来说至关重要。
二、泛化性强大,各种风格动态都能驾驭
在过去做AI视频创作时,咱们经常会遇到一个两难的困境:在追求艺术风格化和保持视频流畅动态之间,很难找到一个完美的平衡点。因为很多视频模型并没有足够的数据集来识别那些审美独特、风格强烈的图片,导致一些非常规的风格化图片,很难跑出理想的动态效果。为了确保视频的动态质量,创作者们有时不得不牺牲掉图片的审美,转而去制作一些更常规的写实风格,或者那些模型已知且比较常见的动画风格作品。这种限制,无疑束缚了创作者的想象力。
在新媒网跨境了解到,在Midjourney V1横空出世之前,市面上泛化性做得比较好的模型有即梦3.0 Pro、Vidu Q1等,而可灵2.1、PixVerse 4.5等产品的效果也相当不错,可以说,各大厂商你追我赶,技术迭代得非常快。有段时间,我本人在更新原创AI视频作品上确实慢了下来(其实做了不少,但总觉得不够满意没发),除了偶尔的“拖延症”作祟外,更主要的原因就是不想重复创作那些已经做过的画风。可一旦尝试制作一些风格化更强、美学倾向更明显的作品,动态效果就容易受限,那种创作的冲劲自然也就减弱了。
之前在国外社交平台上,我也曾就这个问题“抱怨”过几句,没想到引来了不少创作者的互动,这说明被这个问题困扰的人还真不少。但在风格化审美方面,Midjourney无疑是目前公认的“Top 1”,毕竟它在图片生成领域积累了海量的美学元素和数据。现在,那些原本在Midjourney上生成,却让其他视频产品“识别不了动态”的图片,都能在Midjourney V1上实现“无痛”生成了,这简直是解放了创作者的一大痛点!
此外,多角色或多物体之间的复杂交互,也一直是AI视频生成的一大难点。Midjourney V1在这方面的表现也相当亮眼,像常规的物体变形,甚至是双人打斗这种需要精确协调的动态,现在都可以通过简单的提示词轻松实现,为创作者省去了大量调试的精力。
当然,鉴于当前市面上有太多优秀的视频模型,Midjourney V1在某些细分领域的视频能力上,肯定会暂时落后于一些先行者。但它胜在“便宜大碗”,能够完美承接大部分优秀美学图片进行动态化处理,这就为它带来了极其广泛的商业化应用场景。毕竟,咱们要知道,目前DIT架构下的AI视频模型能力,从本质上来说,各家之间的差距并没有那么巨大。
因此,当“价格亲民”、“审美出众”和“稳定性高”这三大优势叠加在一起时,就构成了Midjourney V1巨大的商业化竞争力。无论是小商家制作产品动态视频,还是博物馆展示珍贵文物、风格化装置艺术,亦或是老师们制作生动的教学视频,只要内容和场景可以被可视化呈现,Midjourney V1低廉的价格和出色的审美,都为更多人提供了亲自上手制作、将创意变为现实的机会。这种技术普惠,正是咱们这个时代最让人欣喜的进步之一。
三、界面交互高度集成,告别繁琐流程
回想起过去,每次从Midjourney生成完精美的图片后,咱们创作者都得把图片下载下来,再上传到不同的视频产品上去测试和生成,这个工作流程确实不小,既费时又费力。对于习惯于“图生视频”工作流的创作者来说,只要其他家视频产品在图片生成方面能做好,用户自然就会“用脚投票”,跑到那个既能生成好图又能生成好视频的平台上去。比如前段时间,即梦的生图能力显著提升后,我自己的Midjourney账号都开始“吃灰”了,当时甚至在想是不是可以取消订阅了。结果,Midjourney V1一发布,相信无论是国内还是外媒报道的海外视频厂商,都感受到了不小的压力。
毕竟,现在还有不少视频厂商没有推出无限量套餐。Midjourney这次直接把图片生成和视频生成“打包”销售,甚至可以说买了图片生成“送”视频生成,这份“财大气粗”的姿态,明显是想把视频用户也牢牢地锁定在自己的生态系统里。
目前,Midjourney的视频生成功能主要集中在“图生视频”上。毕竟,它最初就是以画图起家,所以目前它直接放掉了“文生视频”模型。在Midjourney的网页版上,用户可以直接上传图片,然后选择“低动态”或“高动态”两个档位,再配上视频生成的提示词,就能轻松生成视频。或者,如果你在Midjourney里已经生成了图片,直接在画图界面点开大图,就能找到“视频运动”的选项,操作起来非常直观。
它提供了四种模式供咱们选择:自动低动态、自动高动态、手动低动态、手动高动态。如果你选择手动模式,就可以像写提示词一样,自由地描述你想要的视频运动效果。通过我个人的测试,它对视频提示词的遵循效果还是相当不错的,基本上能够达到预期。
更贴心的是,当你的鼠标悬停在缩小图上方时,还会直接弹出一个“生成视频动态”的按键,让你能够快速便捷地预览动态效果。假如你对生成的视频效果感到满意,还可以进行“视频延长”操作,同样支持这四种模式。每次可以延长一部分,最多可以延长4次,最终的视频长度最长能达到20秒,这对于制作短片来说,已经非常实用了。
整体来看,Midjourney V1的交互界面设计得非常简洁明了。对于那些习惯使用Midjourney网页端的用户来说,几乎没有任何上手难度,这无疑大大提升了用户体验。它免去了每次生成完图片后,还得下载下来,再跳转到其他网站进行测试的繁琐流程,真正实现了“一站式”创作,让咱们创作者能够更专注于创意本身。
过去,咱们在制作作品时,经常需要同时购买Midjourney账号,再另外购买一个可以无限生成的视频账号。先用这个视频账号进行基础生成,把一些难度较高的镜头,再放到那些能力更强、但积分又特别昂贵的产品上去生成,比如Veo3、即梦3.0 Pro、可灵2.1大师版等(因为积分太贵了,所以不敢直接把它们作为基础模型去“抽卡”)。现在有了Midjourney V1,它的视频能力完全可以作为咱们的基础“抽卡”模型,然后用其他能力出众的模型作为补充。毫不夸张地说,Midjourney V1作为咱们创作的“保底视频模型”,绝对是我目前的第一选择。(当然啦,说不定过两天又变了,毕竟模型更新迭代的速度实在是太快了,嘿!)
任何一个做过大量视频生成工作的人都深知,拥有一个基础且可靠的“保底视频模型”是多么重要,它是商业化创作流程能够顺畅进行的基础。Midjourney V1的出现,保证了大量人群能够以极低的成本触达AI视频创作,作为一家科技企业,能做到这一点,新媒网跨境认为,其实是一件非常了不起、值得肯定和鼓励的事情,它极大地推动了AI技术的普惠化进程。
四、目前存在的一些小问题
尽管Midjourney V1带来了诸多惊喜,但作为一个刚刚面世的新模型,它也存在一些可以优化提升的空间,咱们也得实事求是地看待这些问题:
分辨率略显不足: Midjourney官方标称的分辨率目前是480p,不过实际测试下来,大部分用户感觉它应该能达到720p的水平。如果再搭配Topaz等超清工具进行后期处理,画质方面倒也能接受。然而,在如今众多厂商都能提供1080p甚至更高分辨率视频的阶段,Midjourney目前的这个分辨率确实还不太够看。咱们非常期待它的高分辨率版本能够尽快推出。毕竟,高分辨率是商业化创作的基础标准之一,清晰度不够,很多时候就难以满足商用需求。
视频运动幅度上限: 相比于Veo3等模型,Midjourney V1在视频运动幅度方面目前的上限会低一些。像翻跟头、人物快速跟跑等幅度较大的物理运动,目前表现得还比较勉强,距离自然流畅的效果还有一定的距离。
稳定性略有“偏科”: 不过,相比于运动幅度的问题,Midjourney似乎更注重视频模型的延长稳定性。在视频延长过程中,它能够持续保持物体的一致性,这一点备受好评。但这种稳定性也需要一定的“抽卡”运气,虽然它能保持风格审美的一致性,但物理运动的持续性偶尔还是会出一些小问题。此外,视频中还容易出现一些闪烁问题,不过咱们相信,这些都会在后续的模型迭代中得到优化。
组件功能尚不完善: V1视频模型毕竟刚推出不久,目前很多组件功能还不够齐全,比如运动方向键、首尾帧控制、参考生成等功能都还没有。在功能丰富性上,可能暂时不如市面上一些已经发展了一段时间的视频厂商。但咱们也无法确定这些功能的完善是否都在Midjourney的未来规划范围内。
毕竟,新媒网跨境了解到,Midjourney的理想征途,是构建一个可以实时生成视觉元素的3D空间。从图像、视频,到3D模型,再到实时的生成系统……他们有着自己宏大而清晰的一系列规划,现在这次更新,不过是其中迈出的一小步。
总而言之,Midjourney这次推出的视频模型,虽然没有带来意料之外的颠覆性惊喜,但也绝没有让人失望。毕竟,其在价格和审美上的巨大优势,足以让它在商业化盈利上形成一个健康的闭环。当然,AI视频本身还有许多核心技术问题尚未完全解决,目前使用AI工具进行高质量创作,仍然是一件相对需要技巧和耐心的事情。但咱们也能清晰地看到,这个领域正在一步步朝着好的方向发展。未来,新媒网跨境预测,一定会有越来越多的人,能够以极低的工具成本,创作出高价值的AI影像作品。AI产品的迭代速度之快,虽然有时会让人感到一丝焦虑,但更多的是让人充满期待呀!
新媒网(公号: 新媒网跨境发布),是一个专业的跨境电商、游戏、支付、贸易和广告社区平台,为百万跨境人传递最新的海外淘金精准资讯情报。

Amazon Fire TV Stick HD (newest model), free and live TV, Alexa Voice Remote, smart home controls, HD streaming
$ 24.99

Amazon Fire TV Stick 4K (newest model) with AI-powered Fire TV Search, Wi-Fi 6, stream over 1.8 million movies and shows, free & live TV
$ 29.99

Amazon Fire TV Stick 4K Max streaming device (newest model) with AI-powered Fire TV Search, supports Wi-Fi 6E, free & live TV without cable or satellite
$ 39.99

Amazon Echo Show 5 (newest model), Smart display with 2x the bass and clearer sound, Charcoal
$ 64.99

Amazon Kindle 16 GB (newest model) - Lightest and most compact Kindle, now with faster page turns, and higher contrast ratio, for an enhanced reading experience - Black
$ 76.49











评论(0)