܄

深耕一致性,生数科技全球上线Vidu Q1参考生图,打造真正可用生产力工具

【数据猿导读】 继面向企业推出Q1参考生图商用解决方案后,9月9日,生数科技正式将其视频大模型Vidu的Q1参考生图功能向大众用户开放。

深耕一致性,生数科技全球上线Vidu Q1参考生图,打造真正可用生产力工具

继面向企业推出Q1参考生图商用解决方案后,9月9日,生数科技正式将其视频大模型Vidu的Q1参考生图功能向大众用户开放。

此次Vidu Q1参考生图功能的推出,旨在助力行业突破多主体一致性技术难题,推动Vidu升级为真正的“商业生产力”,实现从AI图像生成到视频生成的完整商业生产链闭环,引领AI多模态创作进入“生产级应用”新纪元。

Vidu Q1参考生图以“参考够多,还原够真”为核心,主要包括五大亮点:

1.参考数量行业领先

同时支持7张参考图输入,可控性强。

2.主体一致性更强

在多人、多场景、多次生成下,依旧保证人物/主体的面貌与特征不跑偏。

3.高还原度,真实感更强

在保持参考图特征的同时,还原度高,更贴近用户原始输入,真正做到“所见即所得”。

4.创作自由度极高

一张图 + 一句提示词,就能自由换装、换背景、自由合成。支持多人同场景或者多人多场景,满足复杂剧情、合影、多角色电商等场景。

5.支持1080P高清分辨率,中文语义理解更强,审美更适合本地

生数科技_Vidu_Q1_生产力工具-1

生数科技_Vidu_Q1_生产力工具-2

生数科技_Vidu_Q1_生产力工具-3

01

多图参考时代来临

Vidu Q1突破7张输入上限

“参考够多,才能还原够真”。输入的参考图数量“多”的意义在于多主体、多道具始终保持一致,灵活适配多类型场景需求,画面更加丰富。这背后是Vidu Q1 大模型底座对于一致性、真实性、物理理解能力等维度的大幅提升,也是AI生图从获取灵感创意的抽盲盒游戏迈向真正“指哪打哪”“所见即所得”的关键一步。

从单图参考到多图参考,是AI生图在一致性上的不断突破,可以说没有一致性,就没有大规模商业化应用。不同于单图参考的单一限定条件,Vidu Q1参考生图可以指定人物、场景、道具进行自由创作,通过多个参考对象实现对画面的更强可控,即使是复杂场景也能轻松拿捏。

举例来说,让小李子坐在霍格沃茨学院的教室里练习魔法。输入的多张参考图中包含了人物、道具、服饰、配饰等多个主体,场景非常复杂。从输出的结果来看,Vidu Q1参考生图严格遵循提示词,人物发型、五官均保持与原图一致,就连书本中的插图细节也被精准还原,每个物品位置摆放正确,且比例合理。左侧亮起的台灯灯光照亮了小李子侧脸和桌面上摊开的书本,宠物海德薇站在红色行李箱上毫无违和感,多个主体的融合高度一致。

案例1

输入图

生数科技_Vidu_Q1_生产力工具-4

输出结果

生数科技_Vidu_Q1_生产力工具-5

02

三大生成模式

合成、替换、变换,覆盖全场景

Vidu Q1 参考生图的推出,也正在改变原有用户与AI内容生产协作方式。

此前,AI内容工具更多扮演首席创意官,主要工作是发挥想象,给予灵感,而用户扮演AI内容加工厂厂长,负责指派任务,并通过不断修改提示词、反复抽卡来控制AI生成的内容不跑偏。

Vidu Q1 参考生图则让AI同时扮演首席创意官与厂长角色,将可控生产更多交给AI来完成,用户则成为AI内容加工厂的监督管理员,无需修炼为提示词专家,只需输入参考图+简单的提示词,就能稳定输出用户想要的内容,大幅降低AI内容生产门槛。

此外,作为业内最多参考数量,最强一致性的AI生图工具,Vidu Q1 参考生图适配多主体复杂场景,按照变化方式,主要分为合成、替换、变换三大类。

万物皆可合成

Vidu Q1 参考生图支持让不同人物同框或者将某个人物或者商品放入具体场景中,让想象中的画面成真,让不可能成为可能。

1.复杂场景合成

通过指定某主体在某个场景中做什么,可以生成高大上的杂志封面、商品海报、动漫短剧分镜。

比如你可以用Vidu Q1 参考生图制作时尚杂志封面。

案例2

生数科技_Vidu_Q1_生产力工具-6

画面中每个主体精准还原,背景换成室内有光线的房间后,男士和羊的光影也随之变化,画面十分逼真。

中秋节来临,Vidu Q1参考生图也能成为电商、设计师们的提效神器。

案例3

生数科技_Vidu_Q1_生产力工具-7

Vidu Q1参考生图还可用于创意营销的产品素材,比如让林黛玉代言川贝枇杷膏。产品包装的细节、颜色、质感都与原图保持完全一致,古代人物与现代商品间的互动,有种穿越古今的反差感。

案例4

生数科技_Vidu_Q1_生产力工具-8

2.人物、商品同框场景

利用Vidu Q1参考生图功能,即可让你和你喜欢的明星实现同框。

比如输入你和明星的照片和大头贴框,即可生成你和泰勒斯威夫特在海边的合影照,融合自然,仿佛是在某个海边拍的偶遇照片。

案例5

生数科技_Vidu_Q1_生产力工具-9

案例6和7

生数科技_Vidu_Q1_生产力工具-10

3.服装流行元素合成

Vidu Q1参考生图在服装设计领域也有广泛的应用场景。

用Vidu Q1参考生图把裙子换上今年夏天最时髦的碎花花纹,变成最潮达人。

案例8

生数科技_Vidu_Q1_生产力工具-11

万物皆可替

Vidu Q1参考图中的人物、道具、场景都可以随意替换,不仅可玩性高,而且也大幅提高创意资产复用率,不到半小时即可批量产出实用产品宣传素材、海报大片。

1.场景替换

十一假期来临,利用Vidu Q1参考生图,帮助用户解锁热门旅游地,再也不用”人从众”中各种找角度拍照,也无需等待黄金拍照时间,即可快速生成完美旅游打卡照。

比如下图案例,遗憾错过日照金山,直接用Vidu Q1参考生图将背景换成日照金山的背景,即刻生成人生照片。

案例9

生数科技_Vidu_Q1_生产力工具-12

品牌方也可以通过替换不同的背景,打造更多样化的使用场景,传递不同的品牌调性,促进销售转化。

比如将图一的蓝色便携音响换成户外森林和岩石的背景,适配不同的季节,体现别具一格的生活品味。

案例10

生数科技_Vidu_Q1_生产力工具-13

2.道具替换

同样的背景,通过道具替换,可产出一系列产品素材图,适用于TO C 玩法以及产品上新场景。

比如利用Vidu Q1 参考生图将超现实主义画家雷尼·马格利特的名画《人类之子》的经典绿苹果替换成茄子、拖鞋、南瓜,生成一系列趣味组图。

案例11

生数科技_Vidu_Q1_生产力工具-14生数科技_Vidu_Q1_生产力工具-15

3.AI虚拟换装

《穿Prada 的女魔头2》正在紧锣密鼓拍摄中,曾经《穿Prada的女魔头》中的女主角安妮.海瑟薇一天需要换4套服装,换装之频繁令人印象深刻。而现在利用Vidu Q1参考生图,服装模特不到5分钟就可实现迅速换装,对于消费者来说,也可以通过AI换装直观感受试穿效果。

案例12中,让模特在银白色现代化的室内房间中,分别换上西服、晚礼服、紧身装、休闲运动装,呈现的效果非常出片。

案例12

生数科技_Vidu_Q1_生产力工具-16

生数科技_Vidu_Q1_生产力工具-17

Vidu Q1参考生图也支持同时换装+换场景。比如用AI生成霉霉的结婚现场照。

案例13

生数科技_Vidu_Q1_生产力工具-18

万物皆可变

Vidu Q1参考生图不仅仅能实现替换、合成,而且还可实现线稿转3D、照片转手办、转冰箱贴、线稿上色、老照片修复等趣味玩法。

1.线稿转3D

Vidu Q1参考生图能将复杂的建筑设计图,直接转化为3D立体模型图,建筑细节精准还原,省去复杂的建模流程。

如下图所示:

生数科技_Vidu_Q1_生产力工具-19

2.线稿上色

通过指定建筑物替换成木头材质,并为周围的景观涂色,生成一张上色后的建筑效果图。

生数科技_Vidu_Q1_生产力工具-20

3.变成冰箱贴

Vidu Q1参考生图还可以将一张普通的平面照片直接变成立体冰箱贴,真实得如商场售卖的纪念品。

生数科技_Vidu_Q1_生产力工具-21

4.变身手办

当然最近很火的手办玩法,Vidu Q1参考生图也能稳定发挥,不仅支持二次元转手办,还可以让真人直接变成桌面手办,与真人简直神同步。

生数科技_Vidu_Q1_生产力工具-22

5.局部放大/缩小

还是以上述《人类之子》的图片为例,通过提示词让下图的南瓜分别变大1倍,1.5倍。

生数科技_Vidu_Q1_生产力工具-23

6.特效画面

Vidu 还支持用户解锁特效玩法,让动漫人物自带特效。

生数科技_Vidu_Q1_生产力工具-24

结合Vidu Q1首尾帧功能,短发女生后面的金色神秘光环自动旋转了起来,效果惊艳,仿佛在召唤某种魔法。

从静态图片到动态视频,Vidu让AI内容生产的每一个环节都精准可控。

此次Vidu Q1参考生图的发布,是Vidu在参考生图的一小步,也是在AI内容创作精细化可控的一大步。无论是参考生图还是参考生视频,生数科技始终致力于突破行业技术瓶颈,真正让AI作为可用生产力工具,赋能每一个行业和创作者。


来源:生数科技

声明:数据猿尊重媒体行业规范,相关内容都会注明来源与作者;转载我们原创内容时,也请务必注明“来源:数据猿”与作者名称,否则将会受到数据猿追责。

我要评论

数据猿微信公众号
第22届国际物联网展
返回顶部