AI图惊变:自降画质骗眼!Pixel 10力推真伪凭证!

还记得人工智能图像生成技术刚崭露头角的那几年吗?彼时,我们常常被那些拥有多余手指、肢体扭曲或细节失真的图片逗乐,总能一眼识破它们的“庐山真面目”。但如果您最近没有持续关注,那么新媒网要告诉您,这场关于“真假”的玩笑,现在可不那么好笑了。因为人工智能图像生成技术正在以惊人的速度提升其逼真度,甚至出现了一种出人意料的新趋势:通过“降低”图片质量来达到更真实的视觉效果。
五年前,当我们还在惊叹科技进步时,美国开放人工智能研究中心(OpenAI)推出了首个图像生成工具DALL-E。最初,它只能生成256x256像素的图片,大致相当于一张小小的缩略图。短短一年后,DALL-E 2的问世带来了巨大飞跃,图片分辨率提升至1024x1024,并且开始呈现出令人惊叹的真实感。然而,那时生成的图片总还是带有一些明显的“瑕疵”,让细心的人能够分辨。
例如,在外媒记者凯西·牛顿(Casey Newton)对测试版DALL-E 2进行体验时,他用“一只打扮成消防员的柴犬”作为提示词生成了一张图片。这张图乍看之下颇为逼真,但仔细观察就会发现,柴犬皮毛的边缘有些模糊,它可爱的小外套上的徽章只是一些杂乱无章的涂鸦,脖子旁边还挂着一个不属于它的笨重项圈标签。相比之下,同一篇文章中那些“长着眼睛的肉桂卷”反而更容易让人信以为真。
与此同时,Midjourney和Stable Diffusion等图像生成工具也逐渐崭露头角,它们不仅受到人工智能艺术创作者的欢迎,也被一些有其他用途的用户所青睐。在接下来的几年里,随着模型不断迭代更新,这些工具的缺陷被逐步弥补,甚至能更准确地渲染文本内容。然而,大多数人工智能生成的图像依然带有一种独特的“风格”:画面过于平滑和完美,仿佛笼罩着一层柔和的光晕,更像一幅经过精心修饰的肖像画,而非一张随意抓拍的真实照片。虽然现在仍有部分人工智能图像保持着这种风格,但一股追求真实、甚至刻意降低“完美度”的新趋势正在悄然兴起。
新趋势:拥抱不完美,追求“生活化”真实
与谷歌(Google)和美国脸书母公司Meta等老牌科技巨头相比,开放人工智能研究中心(OpenAI)在科技界算是一个相对年轻的挑战者。然而,面对人工智能技术的迅猛发展,这些传统巨头也并未止步不前。新媒网了解到,在2025年下半年,谷歌就在其Gemini应用中发布了一款名为Nano Banana的全新图像生成模型。这款模型一经推出便迅速走红,用户纷纷用它来制作与自己神似的逼真迷你人偶。外媒记者罗伯特·哈特(Robert Hart)也尝试了这一潮流,他惊喜地发现,这款模型在还原他真实肖像方面,比其他人工智能工具表现得更为出色。
这正是人工智能图像生成技术的奇妙之处:它们往往倾向于生成一种“中性化”的、缺乏个性的平均形象。比如,当你要求生成一张桌子的图片时,它看起来可能大致正确,但却像是由计算机将所有见过的桌子取平均值后得到的产物,缺少任何实际的特色。而那些能让一张桌子看起来真实、或能精确再现你面部特征的元素,往往恰恰在于那些“不完美”之处。这里指的并非人工智能在理解字母时出现的奇怪偏差,而是指画面中略显凌乱的摆设、不那么理想的光线效果,甚至是相机本身固有的一些特性。最近,这种“不完美”的趋势,还体现在模仿我们日常最常用的手机相机所拍摄出的效果上。
就在不到一个月前,谷歌又更新了其图像生成模型,推出了Nano Banana Pro,并将其宣传为目前最先进、最逼真的模型。这款模型能够从现实世界的知识中汲取灵感,更好地渲染文本。但最引人关注的是,它生成的许多图片都带有明显的手机相机拍摄痕迹,比如对比度(或缺乏对比度)、独特的透视感、为了突出细节而进行的过度锐化处理以及特定的曝光选择等。
无论您是否意识到,我们对这种“手机摄影”的风格早已司空见惯。手机中微小的传感器和镜头,通过多帧处理技术克服了与大型专业相机相比的局限性,并且这些照片通常针对小屏幕显示进行优化。这一切都使得手机照片呈现出一种独特的“风格”,它不同于那种艺术化的场景表现——例如,为了展现更多细节而提升阴影亮度,或为了让主体更鲜明而增强锐度。显然,谷歌的图像生成器也吸收了这种深受大众喜爱的风格。
提供更逼真的图像生成效果的,并非谷歌一家。美国图像处理软件巨头Adobe公司的Firefly图像生成器就提供了一个名为“视觉强度”(Visual Intensity)的控制选项,允许用户降低那种过度完美的“人工智能光泽”。调整后的结果显得不那么“完美无瑕”,反而更像是用真正的相机拍摄出来的——或许更接近专业相机而非手机相机,这也很符合Adobe将专业人士作为其目标用户的定位。甚至美国社交媒体巨头Meta公司的人工智能生成器也带有一个“风格化”(Stylization)滑块,可以根据用户的需求调节真实感的程度。此外,一些视频生成工具,如开放人工智能研究中心(OpenAI)的Sora 2和谷歌(Google)的Veo 3,也已被用于制作模仿低分辨率、颗粒感十足的监控摄像头画面的病毒式传播视频。当人工智能只需达到与监控摄像头相似的真实度时,其效果往往会变得相当令人信服。

真正了解情况的人会发现,图片中雷尼尔山(Mount Rainier)看起来有些过于巨大,但这张人工智能图片对美国华盛顿州渡轮的再现却达到了惊人的逼真度。
未来展望:真实性与信任的挑战与机遇
尽管人工智能在图像生成方面取得了令人瞩目的进步,但我们仍需对人工智能“无限进步”的说法保持一份审慎。毕竟,如今的人工智能代理在帮你购买一双合适的鞋子时,有时仍会显得力不从心。然而,就图像生成模型而言,它们的进步是显而易见的,并且成果就在我们眼前。
新媒网近期与知名iPhone相机应用Halide的联合创始人本·桑多夫斯基(Ben Sandofsky)就人工智能模仿智能手机摄影趋势进行了深入交流。他表示,通过借鉴手机相机强大的图像处理倾向和我们所熟悉的照片风格(这些风格本身就让照片略微脱离了纯粹的现实),“谷歌可能巧妙地绕过了‘恐怖谷理论’效应。”人工智能不必刻意让一个场景看起来百分之百真实——因为那种刻意的完美反而可能成为破绽。它只需模仿我们记录现实的方式,带着所有真实的“瑕疵”,以此作为一种“作弊码”,让图像看起来更具说服力。那么,面对未来扑面而来的海量图片,我们又该如何辨别其真伪呢?
美国开放人工智能研究中心(OpenAI)的首席执行官萨姆·奥特曼(Sam Altman)曾提出一种观点,认为未来真实图像与人工智能图像将融为一体,而我们最终也会对此习以为常。新媒网认为,他说的部分是对的,但我们很难相信,人们会真的不在乎什么是真实,什么又仅仅是虚拟。为了帮助我们区分二者,我们需要一些有效的工具和方法,而这些也正在逐渐成为现实——尽管其发展速度可能不如人工智能图像模型迭代那么快。
由内容真实性和出处联盟(C2PA)提出的“内容凭证”(Content Credentials)标准正在获得越来越多的关注和支持。在谷歌(Google)的Pixel 10系列手机上,每一张通过摄像头拍摄的图片都会被赋予一个加密签名,用以标识其生成方式。这有效避免了“隐含真实效应”,正如谷歌Pixel相机负责人艾萨克·雷诺兹(Isaac Reynolds)今年早些时候向新媒网解释的那样:如果仅仅给人工智能生成的图片贴上标签,那么我们可能会默认所有没有标签的图片都是真实的。但实际上,没有标签只意味着我们不知道图片的来源。因此,Pixel相机无论生成的是人工智能图片还是真实照片,都会一视同仁地进行标记。
虽然标签的存在意义重大,但如果无法被用户直观地看到,其作用也会大打折扣。幸运的是,这种情况正在改变。今年早些时候,谷歌相册(Google Photos)已经开始支持显示“内容凭证”。谷歌公司还表示,未来在搜索结果和广告中,如果图片包含“内容凭证”,也将方便用户进行查看。然而,这最后一点是关键——目前,大多数通过手机相机拍摄的图片尚未被赋予这些凭证。为了使整个系统有效运行,硬件制造商需要广泛采纳这一标准,确保图片在生成之初就被标记为人工智能生成或非人工智能生成。同时,各大图片分享平台也需要积极配合。在此之前,我们只能依靠自己的判断——而现在,比以往任何时候都更需要我们对所见之物保持一份审慎。
科技快讯点滴
(一)谷歌(Google)的Pixel 10相机不仅提供了人工智能图片编辑工具,其成像管线中还内置了生成式人工智能模型。目前,这一技术仅应用于名为“Pro Res Zoom”的功能,旨在提升数字变焦下原本可能不尽如人意的画质。值得一提的是,目前该功能不适用于人像拍摄,新媒网认为这在某些方面是一个好的选择。
(二)传统相机制造商也在逐步采纳C2PA的“内容凭证”标准,尽管进展较为缓慢。例如,售价超过9000美元的徕卡M-11P相机就已具备此项功能。
(三)与此同时,美国Adobe公司旗下Photoshop软件中的人工智能编辑工具,如生成式填充(generative fill)等,功能越来越强大,也越来越受到摄影师的青睐。介于完全由人工智能生成和完全未被人工智能修饰的图片之间,如今的界限正变得愈发模糊,定义起来也更具挑战性。
新媒网(公号: 新媒网跨境发布),是一个专业的跨境电商、游戏、支付、贸易和广告社区平台,为百万跨境人传递最新的海外淘金精准资讯情报。
本文来源:新媒网 https://nmedialink.com/posts/ai-images-shock-low-res-deceit-pixel-10-auth.html


粤公网安备 44011302004783号 













