docs: 添加Seedance R2V多模态参考生视频示例
This commit is contained in:
parent
d51018aeff
commit
0d0c5b70bd
@ -221,6 +221,19 @@ curl -X POST 'https://token.opencomputing.cn/llmage/v1/video/generations' \
|
||||
"duration": 8
|
||||
}'
|
||||
|
||||
# ---- Seedance R2V 多模态参考生视频 ----
|
||||
curl -X POST 'https://token.opencomputing.cn/llmage/v1/video/generations' \
|
||||
-H "Authorization: Bearer *** \
|
||||
-F "model=doubao-seedance-2-0-260128" \
|
||||
-F "catelogid=r2v" \
|
||||
-F "prompt=第一优先级:人物主体形象严格参考@图1。第二优先级:学习机产品外观严格参考@图2。第三优先级:门店背景空间严格参考@图3。视频主角只有一人,为@图1中的女性人物。人物外貌、脸型、五官、发型、气质、服装必须与@图1保持一致。保持知性温婉、干净利落的女性形象。服装为浅蓝色短袖针织上衣、米白色半身长裙、白色浅口单鞋。人物始终位于画面中心,主体占画面面积60%以上,面部清晰锐利。人物手持学习机,外观严格参考@图2。必须保持白色边框机身、橙色支架、底部笔槽结构、屏幕正面朝向镜头。不允许替换成其他电子设备。不允许产品变形、悬空、缺角、穿模。背景场景严格参考@图3,保持作业帮门店的橙红色主背景墙、100标识、暖白灯光和真实展示空间氛围。背景只作为场景识别与空间陪衬,不允许喧宾夺主,不要求生成清晰可读文字,不允许复杂宣传文案抢镜。镜头为竖屏中近景,人物自然站立面对镜头,轻微微笑,稳定展示学习机。双手或单手自然托持学习机,动作轻柔克制。整体为写实高清商业宣传短视频风格,画面明亮,人物皮肤自然通透,产品结构准确。禁止字幕、文字叠加、花字、水印。禁止出现第二个主要人物。禁止人物换脸、换装、肢体错误。禁止学习机外观错误、产品漂浮、手穿模。" \
|
||||
-F "ratio=9:16" \
|
||||
-F "resolution=1080p" \
|
||||
-F "duration=5" \
|
||||
-F "image_files=asset://asset-20260617135652-dczbp" \
|
||||
-F "image_files=asset://asset-20260617135840-ljmv9" \
|
||||
-F "image_files=asset://asset-20260617135924-s69z8"
|
||||
|
||||
# ---- 通义万象 T2V 文生视频 ----
|
||||
curl -X POST 'https://token.opencomputing.cn/llmage/v1/video/generations' \
|
||||
-H 'Authorization: Bearer *** \
|
||||
@ -390,42 +403,101 @@ curl -X POST 'https://token.opencomputing.cn/llmage/v1/video/generations' \
|
||||
|
||||
---
|
||||
|
||||
#### Seedance 平台(火山方舟)
|
||||
#### Seedance 平台(火山方舟)— Seedance 2.0
|
||||
|
||||
> 上游 API: `POST https://ark.cn-beijing.volces.com/api/v3/contents/generations/tasks`
|
||||
> SDK: `pip install 'volcengine-python-sdk[ark]'`
|
||||
> 开通条件: 账户余额 >= 200元 或已购资源包
|
||||
> 任务ID仅保存7天,视频URL 24小时有效
|
||||
|
||||
##### 模型列表
|
||||
|
||||
| 模型 | Model ID | 1080p | 有声视频 | 联网搜索 |
|
||||
|------|----------|-------|----------|----------|
|
||||
| Seedance 2.0 | `doubao-seedance-2-0-260128` | ✅ | ✅ | ✅ |
|
||||
| Seedance 2.0 Fast | `doubao-seedance-2-0-fast-260128` | ❌ | ✅ | ✅ |
|
||||
|
||||
##### T2V - 文生视频
|
||||
|
||||
| 参数名 | 类型 | 必填 | 默认值 | 说明 | 可选值 |
|
||||
|--------|------|------|--------|------|--------|
|
||||
| `model` | string | 是 | `doubao-seedance-2-0-260128` | 模型名称 | `doubao-seedance-2-0-260128`, `doubao-seedance-2-0-fast-260128` |
|
||||
| `prompt` | string | 是 | - | 提示词 | - |
|
||||
| `resolution` | string | 否 | `720p` | 尺寸 | `480p`, `720p`, `1080p` |
|
||||
| `duration` | integer | 否 | `8` | 视频长度 | - |
|
||||
| `ratio` | string | 否 | `1:1` | 宽高比 | `1:1`, `16:9`, `9:16`, `4:3`, `3:4`, `21:9`, `9:21` |
|
||||
| `prompt` | string | 是 | - | 提示词(中文<=500字,英文<=1000词) | - |
|
||||
| `resolution` | string | 否 | `720p` | 分辨率 | `480p`, `720p`, `1080p`(Fast不支持) |
|
||||
| `duration` | integer | 否 | `5` | 视频长度[4,15]秒, 或-1自动选择 | 4-15, -1 |
|
||||
| `ratio` | string | 否 | `adaptive` | 宽高比 | `16:9`, `4:3`, `1:1`, `3:4`, `9:16`, `21:9`, `adaptive` |
|
||||
| `generate_audio` | boolean | 否 | `true` | 是否生成同步音效(人声+音效+BGM) | `true`, `false` |
|
||||
| `watermark` | boolean | 否 | `false` | 是否含AI生成水印 | `true`, `false` |
|
||||
| `return_last_frame` | boolean | 否 | `false` | 返回尾帧图片(用于连续视频拼接) | `true`, `false` |
|
||||
| `priority` | integer | 否 | `0` | 执行优先级(0-9,越大越优先) | 0-9 |
|
||||
| `tools` | array | 否 | - | 联网搜索 `[{"type":"web_search"}]` | `web_search` |
|
||||
|
||||
##### TI2V - 文图生视频
|
||||
##### TI2V - 首帧/首尾帧生视频
|
||||
|
||||
| 参数名 | 类型 | 必填 | 默认值 | 说明 | 可选值 |
|
||||
|--------|------|------|--------|------|--------|
|
||||
| `model` | string | 是 | `doubao-seedance-2-0-260128` | 模型名称 | `doubao-seedance-2-0-260128`, `doubao-seedance-2-0-fast-260128` |
|
||||
| `model` | string | 是 | `doubao-seedance-2-0-260128` | 模型名称 | 同上 |
|
||||
| `prompt` | string | 是 | - | 提示词 | - |
|
||||
| `image1_file` | image | 是 | - | 首帧图片 | - |
|
||||
| `image2_file` | image | 否 | - | 尾帧图片 | - |
|
||||
| `resolution` | string | 否 | `720p` | 尺寸 | `480p`, `720p`, `1080p` |
|
||||
| `duration` | integer | 否 | `8` | 视频长度 | - |
|
||||
| `ratio` | string | 否 | `1:1` | 宽高比 | `1:1`, `16:9`, `9:16`, `4:3`, `3:4`, `21:9`, `9:21` |
|
||||
| `image1_file` | image | 是 | - | 首帧图片(role=first_frame) | - |
|
||||
| `image2_file` | image | 否 | - | 尾帧图片(role=last_frame) | - |
|
||||
| `resolution` | string | 否 | `720p` | 分辨率 | `480p`, `720p`, `1080p` |
|
||||
| `duration` | integer | 否 | `5` | 视频长度[4,15]秒 | 4-15, -1 |
|
||||
| `ratio` | string | 否 | `adaptive` | 宽高比(adaptive时以首帧为准) | 同上 |
|
||||
|
||||
##### Ref2V - 参考生视频
|
||||
> 首尾帧图片宽高比不一致时,以首帧为准,尾帧自动裁剪适配。
|
||||
|
||||
##### Ref2V - 多模态参考生视频(Seedance 2.0 核心能力)
|
||||
|
||||
传入参考图片(1-9张) + 参考视频(1-3个) + 参考音频,基于素材+提示词生成视频。
|
||||
|
||||
| 参数名 | 类型 | 必填 | 默认值 | 说明 |
|
||||
|--------|------|------|--------|------|
|
||||
| `model` | string | 是 | - | 模型名称 |
|
||||
| `prompt` | string | 是 | - | 提示词 |
|
||||
| `image_file` | image | 否 | - | 参考图片(支持数组,多张参考图) |
|
||||
| `video_file` | video | 否 | - | 参考视频(支持数组) |
|
||||
| `audio_file` | audio | 否 | - | 参考音频(支持数组) |
|
||||
| `duration` | integer | 否 | `12` | 视频长度 |
|
||||
| `resolution` | string | 否 | `720p` | 尺寸 |
|
||||
| `ratio` | string | 否 | - | 宽高比 |
|
||||
| `model` | string | 是 | `doubao-seedance-2-0-260128` | 模型名称 |
|
||||
| `prompt` | string | 是 | - | 提示词,用"图片1""视频1""音频1"指代素材 |
|
||||
| `image_files` | array | 否 | - | 参考图片URL列表(1-9张), role=reference_image |
|
||||
| `video_files` | array | 否 | - | 参考视频URL列表(1-3个,总时长<=15s), role=reference_video |
|
||||
| `audio_files` | array | 否 | - | 参考音频URL列表, role=reference_audio(须搭配图/视频) |
|
||||
| `resolution` | string | 否 | `720p` | 分辨率 |
|
||||
| `duration` | integer | 否 | `5` | 视频长度[4,15]秒 | 4-15, -1 |
|
||||
| `ratio` | string | 否 | `adaptive` | 宽高比 |
|
||||
| `generate_audio` | boolean | 否 | `true` | 是否生成同步音效 |
|
||||
|
||||
> **三种图片场景互斥不可混用**: 首帧(first_frame) / 首尾帧(first_frame+last_frame) / 参考图(reference_image)
|
||||
> **音频不可单独传入**: 须至少包含1个参考视频或图片。
|
||||
> **人脸限制**: 不支持直接上传含真人人脸的参考图/视频。可用模型生成的含人脸产物、预置虚拟人像(asset://ID)、或已授权真人素材。
|
||||
|
||||
##### 输入素材规格
|
||||
|
||||
| 类型 | 格式 | 限制 |
|
||||
|------|------|------|
|
||||
| 图片 | jpeg/png/webp/bmp/tiff/gif/heic/heif | 宽高比(0.4,2.5), 宽高300-6000px, <30MB |
|
||||
| 视频 | mp4/mov (H.264/H.265+AAC/MP3) | 480p/720p/1080p, 时长2-15s, <50MB, FPS 24-60 |
|
||||
| 音频 | mp3/wav/aac | 不可单独传入,须搭配图/视频 |
|
||||
|
||||
> 图片URL支持三种格式: 公网URL / Base64(`data:image/png;base64,...`) / 素材ID(`asset://ASSET_ID`)
|
||||
|
||||
##### 输出视频像素表 (Seedance 2.0)
|
||||
|
||||
| 分辨率 | 16:9 | 4:3 | 1:1 | 3:4 | 9:16 | 21:9 |
|
||||
|--------|------|-----|-----|-----|------|------|
|
||||
| 480p | 864×496 | 752×560 | 640×640 | 560×752 | 496×864 | 992×432 |
|
||||
| 720p | 1280×720 | 1112×834 | 960×960 | 834×1112 | 720×1280 | 1470×630 |
|
||||
| 1080p | 1920×1080 | 1664×1248 | 1440×1440 | 1248×1664 | 1080×1920 | 2206×946 |
|
||||
|
||||
##### Ref2V 提示词写法
|
||||
|
||||
用"图片1/2""视频1""音频1"指代素材,按时间轴描述场景:
|
||||
|
||||
```
|
||||
全程使用视频1的第一视角构图,全程使用音频1作为背景音乐。
|
||||
第一人称视角果茶宣传广告;首帧为图片1,你的手摘下一颗带晨露的苹果,
|
||||
轻脆的碰撞声;2-4秒:快速切镜,将苹果块投入雪克杯,加入冰块与茶底,
|
||||
用力摇晃;4-6秒:成品特写,分层果茶倒入透明杯;
|
||||
6-8秒:手持举杯,将图片2中的果茶举到镜头前,尾帧定格为图片2。
|
||||
背景声音统一为女生音色。
|
||||
```
|
||||
|
||||
> 对话内容用双引号包裹可优化音频生成效果。
|
||||
|
||||
---
|
||||
|
||||
|
||||
Loading…
x
Reference in New Issue
Block a user