快速开始:3分钟制作视频

1

上传

将你的参考图像(角色/风格)拖入 'Image' 标签页。

2

提示词

简单描述动作:'电影镜头,[reference] 在雨中行走。'

3

生成

点击生成。等待约60秒。预览结果,满意则下载。

核心工作流

当前生成器的流程比较直接:要么从文字开始生成视频,要么上传一张图片并用提示词驱动画面。

1. 素材准备

  • 角色卡:使用清晰、正面的角色照片。避免背景杂乱。
  • 风格参考:(可选)定义色调或光照的图像。

2. 起始图片

在图生视频模式下,上传一张清晰的起始图片即可。当前 UI 暂未开放视频参考和音频参考输入。

提示词最佳实践

结构化你的提示词以获得最大控制权。

公式
[主体定义] + [动作/运动] + [摄像机角度] + [氛围/光照]
示例:
"赛博朋克武士 (@image1) 缓慢拔出武士刀,低角度希区柯克变焦,霓虹雨,体积雾,8k分辨率。"

音频选项

当前生成器提供基础的音频开关。音频参考、人声驱动和口型同步等工作流暂未在这个 UI 中开放。

当前可用

如果模型支持,你可以开启生成音频选项,让成片带有基础环境音输出。

当前未开放

上传语音、音乐或音频参考并不属于当前产品工作流。

高级:实现一致性

在当前 UI 下,一致性主要来自清晰的起始图片和稳定的提示词结构。

策略 1:先用一张强参考图

先选一张主体清晰、信息密度高的图片,再逐步微调提示词,不要一次改太多变量。

输入
  • • 一张清晰的商品、人物或场景图片
  • • 迭代时尽量复用同一张图片
提示词

“同一主体的电影感近景,镜头缓慢推进,边缘柔和轮廓光...”

多镜头一致性

要在不同场景(例如:场景A:客厅,场景B:公园)中保持角色一致:

  • 每次生成都使用完全相同的 @image 参考。
  • 在提示词中保持“主体描述”完全一致(例如,“一个红发年轻女子”)。
  • 只改变“动作”和“环境”词汇。

镜头规划

如果想让运动更稳定,就在提示词里明确写清镜头方式和运动速度。

“缓慢推近,镜头稳定,手部动作轻柔,没有突然运动。”

常见问题

面部在运动中看起来扭曲

使用更高分辨率的参考图像。尽量避免极度特写结合快速运动。

视频中的文字乱码

AI在此方面仍有困难。避免要在视频中显示标志/文字的提示词,除非使用后期添加。

生成失败 / 超时

服务器负载高。请在非高峰时段重试或检查你的信用额度。