Gemini AI搞事情!睡前故事多模态创作,儿童内容风口要来?

2025-08-06AI工具

Image

谷歌Gemini推出AI生成睡前故事功能 用户可自定义艺术风格

2025年8月,谷歌在其Gemini AI聊天机器人中推出名为"Storybook"的新功能。该工具允许用户通过简单描述自动生成10页图文并茂的睡前故事,每页包含一段可由Gemini朗读的文本及配套插画。新媒网跨境获悉,这是谷歌首次将多模态AI技术应用于儿童内容创作领域。

多维度定制化创作
用户可指定黏土动画、动漫、漫画等不同艺术风格,还能上传照片或儿童画作作为创作参考。例如当用户上传一幅卡通猫绘画后,Gemini能据此生成完整故事。不过测试显示,AI对用户创作意图的理解存在偏差——在生成的故事中,用户手绘的卡通猫形象未能准确呈现。
用户上传的卡通猫绘画

技术局限显现
在实际测试中,Gemini生成的"鲶鱼在水族馆交友"故事出现角色设计不一致的情况:某条鱼被错误添加人类手臂。另一则关于意大利面的故事插图被处理成卡通犯罪现场风格,而"母子看电视"场景中电视机位置呈现错误。外媒The Verge记者还发现,谷歌官方演示视频中出现的"女性建造太空船"场景,其工具细节存在识别偏差。
出现人类手臂的鱼角色
位置错误的电视机场景

全球化服务部署
目前该功能已支持Gemini所有服务语言,用户可通过桌面端和移动端全球访问。新媒网跨境了解到,这是继2024年文本生成功能后,谷歌在AI内容创作工具链上的又一次重要升级。
演示视频中的工具识别偏差

新媒网(公号: 新媒网跨境发布),是一个专业的跨境电商、游戏、支付、贸易和广告社区平台,为百万跨境人传递最新的海外淘金精准资讯情报。

本文来源:新媒网 https://nmedialink.com/posts/10741.html

评论(0)

暂无评论,快来抢沙发~
谷歌Gemini推出Storybook功能,用户可通过AI生成图文并茂的睡前故事,并自定义艺术风格。但测试显示,AI生成内容存在图像理解偏差和细节错误。该功能已支持Gemini所有服务语言,全球用户均可使用。
发布于 2025-08-06
查看人数 1212
人民币汇率走势
CNY
关注我们
新媒网跨境发布
本站原创内容版权归作者及NMedia共同所有,未经许可,禁止以任何形式转载。