docs: 添加Seedance R2V多模态参考生视频示例

This commit is contained in:
Hermes Agent 2026-06-17 15:40:50 +08:00
parent d51018aeff
commit 0d0c5b70bd

View File

@ -221,6 +221,19 @@ curl -X POST 'https://token.opencomputing.cn/llmage/v1/video/generations' \
"duration": 8
}'
# ---- Seedance R2V 多模态参考生视频 ----
curl -X POST 'https://token.opencomputing.cn/llmage/v1/video/generations' \
-H "Authorization: Bearer *** \
-F "model=doubao-seedance-2-0-260128" \
-F "catelogid=r2v" \
-F "prompt=第一优先级:人物主体形象严格参考@图1。第二优先级:学习机产品外观严格参考@图2。第三优先级:门店背景空间严格参考@图3。视频主角只有一人,为@图1中的女性人物。人物外貌、脸型、五官、发型、气质、服装必须与@图1保持一致。保持知性温婉、干净利落的女性形象。服装为浅蓝色短袖针织上衣、米白色半身长裙、白色浅口单鞋。人物始终位于画面中心主体占画面面积60%以上,面部清晰锐利。人物手持学习机,外观严格参考@图2。必须保持白色边框机身、橙色支架、底部笔槽结构、屏幕正面朝向镜头。不允许替换成其他电子设备。不允许产品变形、悬空、缺角、穿模。背景场景严格参考@图3保持作业帮门店的橙红色主背景墙、100标识、暖白灯光和真实展示空间氛围。背景只作为场景识别与空间陪衬不允许喧宾夺主不要求生成清晰可读文字不允许复杂宣传文案抢镜。镜头为竖屏中近景人物自然站立面对镜头轻微微笑稳定展示学习机。双手或单手自然托持学习机动作轻柔克制。整体为写实高清商业宣传短视频风格画面明亮人物皮肤自然通透产品结构准确。禁止字幕、文字叠加、花字、水印。禁止出现第二个主要人物。禁止人物换脸、换装、肢体错误。禁止学习机外观错误、产品漂浮、手穿模。" \
-F "ratio=9:16" \
-F "resolution=1080p" \
-F "duration=5" \
-F "image_files=asset://asset-20260617135652-dczbp" \
-F "image_files=asset://asset-20260617135840-ljmv9" \
-F "image_files=asset://asset-20260617135924-s69z8"
# ---- 通义万象 T2V 文生视频 ----
curl -X POST 'https://token.opencomputing.cn/llmage/v1/video/generations' \
-H 'Authorization: Bearer *** \
@ -390,42 +403,101 @@ curl -X POST 'https://token.opencomputing.cn/llmage/v1/video/generations' \
---
#### Seedance 平台(火山方舟)
#### Seedance 平台(火山方舟)— Seedance 2.0
> 上游 API: `POST https://ark.cn-beijing.volces.com/api/v3/contents/generations/tasks`
> SDK: `pip install 'volcengine-python-sdk[ark]'`
> 开通条件: 账户余额 >= 200元 或已购资源包
> 任务ID仅保存7天视频URL 24小时有效
##### 模型列表
| 模型 | Model ID | 1080p | 有声视频 | 联网搜索 |
|------|----------|-------|----------|----------|
| Seedance 2.0 | `doubao-seedance-2-0-260128` | ✅ | ✅ | ✅ |
| Seedance 2.0 Fast | `doubao-seedance-2-0-fast-260128` | ❌ | ✅ | ✅ |
##### T2V - 文生视频
| 参数名 | 类型 | 必填 | 默认值 | 说明 | 可选值 |
|--------|------|------|--------|------|--------|
| `model` | string | 是 | `doubao-seedance-2-0-260128` | 模型名称 | `doubao-seedance-2-0-260128`, `doubao-seedance-2-0-fast-260128` |
| `prompt` | string | 是 | - | 提示词 | - |
| `resolution` | string | 否 | `720p` | 尺寸 | `480p`, `720p`, `1080p` |
| `duration` | integer | 否 | `8` | 视频长度 | - |
| `ratio` | string | 否 | `1:1` | 宽高比 | `1:1`, `16:9`, `9:16`, `4:3`, `3:4`, `21:9`, `9:21` |
| `prompt` | string | 是 | - | 提示词(中文<=500字,英文<=1000词) | - |
| `resolution` | string | 否 | `720p` | 分辨率 | `480p`, `720p`, `1080p`(Fast不支持) |
| `duration` | integer | 否 | `5` | 视频长度[4,15]秒, 或-1自动选择 | 4-15, -1 |
| `ratio` | string | 否 | `adaptive` | 宽高比 | `16:9`, `4:3`, `1:1`, `3:4`, `9:16`, `21:9`, `adaptive` |
| `generate_audio` | boolean | 否 | `true` | 是否生成同步音效(人声+音效+BGM) | `true`, `false` |
| `watermark` | boolean | 否 | `false` | 是否含AI生成水印 | `true`, `false` |
| `return_last_frame` | boolean | 否 | `false` | 返回尾帧图片(用于连续视频拼接) | `true`, `false` |
| `priority` | integer | 否 | `0` | 执行优先级(0-9,越大越优先) | 0-9 |
| `tools` | array | 否 | - | 联网搜索 `[{"type":"web_search"}]` | `web_search` |
##### TI2V - 文图生视频
##### TI2V - 首帧/首尾帧生视频
| 参数名 | 类型 | 必填 | 默认值 | 说明 | 可选值 |
|--------|------|------|--------|------|--------|
| `model` | string | 是 | `doubao-seedance-2-0-260128` | 模型名称 | `doubao-seedance-2-0-260128`, `doubao-seedance-2-0-fast-260128` |
| `model` | string | 是 | `doubao-seedance-2-0-260128` | 模型名称 | 同上 |
| `prompt` | string | 是 | - | 提示词 | - |
| `image1_file` | image | 是 | - | 首帧图片 | - |
| `image2_file` | image | 否 | - | 尾帧图片 | - |
| `resolution` | string | 否 | `720p` | 尺寸 | `480p`, `720p`, `1080p` |
| `duration` | integer | 否 | `8` | 视频长度 | - |
| `ratio` | string | 否 | `1:1` | 宽高比 | `1:1`, `16:9`, `9:16`, `4:3`, `3:4`, `21:9`, `9:21` |
| `image1_file` | image | 是 | - | 首帧图片(role=first_frame) | - |
| `image2_file` | image | 否 | - | 尾帧图片(role=last_frame) | - |
| `resolution` | string | 否 | `720p` | 分辨率 | `480p`, `720p`, `1080p` |
| `duration` | integer | 否 | `5` | 视频长度[4,15]秒 | 4-15, -1 |
| `ratio` | string | 否 | `adaptive` | 宽高比(adaptive时以首帧为准) | 同上 |
##### Ref2V - 参考生视频
> 首尾帧图片宽高比不一致时,以首帧为准,尾帧自动裁剪适配。
##### Ref2V - 多模态参考生视频Seedance 2.0 核心能力)
传入参考图片(1-9张) + 参考视频(1-3个) + 参考音频,基于素材+提示词生成视频。
| 参数名 | 类型 | 必填 | 默认值 | 说明 |
|--------|------|------|--------|------|
| `model` | string | 是 | - | 模型名称 |
| `prompt` | string | 是 | - | 提示词 |
| `image_file` | image | 否 | - | 参考图片(支持数组,多张参考图) |
| `video_file` | video | 否 | - | 参考视频(支持数组) |
| `audio_file` | audio | 否 | - | 参考音频(支持数组) |
| `duration` | integer | 否 | `12` | 视频长度 |
| `resolution` | string | 否 | `720p` | 尺寸 |
| `ratio` | string | 否 | - | 宽高比 |
| `model` | string | 是 | `doubao-seedance-2-0-260128` | 模型名称 |
| `prompt` | string | 是 | - | 提示词,用"图片1""视频1""音频1"指代素材 |
| `image_files` | array | 否 | - | 参考图片URL列表(1-9张), role=reference_image |
| `video_files` | array | 否 | - | 参考视频URL列表(1-3个,总时长<=15s), role=reference_video |
| `audio_files` | array | 否 | - | 参考音频URL列表, role=reference_audio(须搭配图/视频) |
| `resolution` | string | 否 | `720p` | 分辨率 |
| `duration` | integer | 否 | `5` | 视频长度[4,15]秒 | 4-15, -1 |
| `ratio` | string | 否 | `adaptive` | 宽高比 |
| `generate_audio` | boolean | 否 | `true` | 是否生成同步音效 |
> **三种图片场景互斥不可混用**: 首帧(first_frame) / 首尾帧(first_frame+last_frame) / 参考图(reference_image)
> **音频不可单独传入**: 须至少包含1个参考视频或图片。
> **人脸限制**: 不支持直接上传含真人人脸的参考图/视频。可用模型生成的含人脸产物、预置虚拟人像(asset://ID)、或已授权真人素材。
##### 输入素材规格
| 类型 | 格式 | 限制 |
|------|------|------|
| 图片 | jpeg/png/webp/bmp/tiff/gif/heic/heif | 宽高比(0.4,2.5), 宽高300-6000px, <30MB |
| 视频 | mp4/mov (H.264/H.265+AAC/MP3) | 480p/720p/1080p, 时长2-15s, <50MB, FPS 24-60 |
| 音频 | mp3/wav/aac | 不可单独传入,须搭配图/视频 |
> 图片URL支持三种格式: 公网URL / Base64(`data:image/png;base64,...`) / 素材ID(`asset://ASSET_ID`)
##### 输出视频像素表 (Seedance 2.0)
| 分辨率 | 16:9 | 4:3 | 1:1 | 3:4 | 9:16 | 21:9 |
|--------|------|-----|-----|-----|------|------|
| 480p | 864×496 | 752×560 | 640×640 | 560×752 | 496×864 | 992×432 |
| 720p | 1280×720 | 1112×834 | 960×960 | 834×1112 | 720×1280 | 1470×630 |
| 1080p | 1920×1080 | 1664×1248 | 1440×1440 | 1248×1664 | 1080×1920 | 2206×946 |
##### Ref2V 提示词写法
用"图片1/2""视频1""音频1"指代素材,按时间轴描述场景:
```
全程使用视频1的第一视角构图全程使用音频1作为背景音乐。
第一人称视角果茶宣传广告首帧为图片1你的手摘下一颗带晨露的苹果
轻脆的碰撞声2-4秒快速切镜将苹果块投入雪克杯加入冰块与茶底
用力摇晃4-6秒成品特写分层果茶倒入透明杯
6-8秒手持举杯将图片2中的果茶举到镜头前尾帧定格为图片2。
背景声音统一为女生音色。
```
> 对话内容用双引号包裹可优化音频生成效果。
---