docs: 添加Seedance R2V多模态参考生视频示例

2026-06-17 15:40:50 +08:00 · 2026-06-17 15:40:50 +08:00 · 0d0c5b70bd
commit 0d0c5b70bd
parent d51018aeff
1 changed files with 93 additions and 21 deletions
--- a/wwwroot/api_doc.md
+++ b/wwwroot/api_doc.md
@ -221,6 +221,19 @@ curl -X POST 'https://token.opencomputing.cn/llmage/v1/video/generations' \
    "duration": 8
  }'

+# ---- Seedance R2V 多模态参考生视频 ----
+curl -X POST 'https://token.opencomputing.cn/llmage/v1/video/generations' \
+  -H "Authorization: Bearer *** \
+  -F "model=doubao-seedance-2-0-260128" \
+  -F "catelogid=r2v" \
+  -F "prompt=第一优先级：人物主体形象严格参考@图1。第二优先级：学习机产品外观严格参考@图2。第三优先级：门店背景空间严格参考@图3。视频主角只有一人，为@图1中的女性人物。人物外貌、脸型、五官、发型、气质、服装必须与@图1保持一致。保持知性温婉、干净利落的女性形象。服装为浅蓝色短袖针织上衣、米白色半身长裙、白色浅口单鞋。人物始终位于画面中心，主体占画面面积60%以上，面部清晰锐利。人物手持学习机，外观严格参考@图2。必须保持白色边框机身、橙色支架、底部笔槽结构、屏幕正面朝向镜头。不允许替换成其他电子设备。不允许产品变形、悬空、缺角、穿模。背景场景严格参考@图3，保持作业帮门店的橙红色主背景墙、100标识、暖白灯光和真实展示空间氛围。背景只作为场景识别与空间陪衬，不允许喧宾夺主，不要求生成清晰可读文字，不允许复杂宣传文案抢镜。镜头为竖屏中近景，人物自然站立面对镜头，轻微微笑，稳定展示学习机。双手或单手自然托持学习机，动作轻柔克制。整体为写实高清商业宣传短视频风格，画面明亮，人物皮肤自然通透，产品结构准确。禁止字幕、文字叠加、花字、水印。禁止出现第二个主要人物。禁止人物换脸、换装、肢体错误。禁止学习机外观错误、产品漂浮、手穿模。" \
+  -F "ratio=9:16" \
+  -F "resolution=1080p" \
+  -F "duration=5" \
+  -F "image_files=asset://asset-20260617135652-dczbp" \
+  -F "image_files=asset://asset-20260617135840-ljmv9" \
+  -F "image_files=asset://asset-20260617135924-s69z8"
+
 # ---- 通义万象 T2V 文生视频 ----
 curl -X POST 'https://token.opencomputing.cn/llmage/v1/video/generations' \
  -H 'Authorization: Bearer *** \
@ -390,42 +403,101 @@ curl -X POST 'https://token.opencomputing.cn/llmage/v1/video/generations' \

 ---

-#### Seedance 平台（火山方舟）
+#### Seedance 平台（火山方舟）— Seedance 2.0
+
+> 上游 API: `POST https://ark.cn-beijing.volces.com/api/v3/contents/generations/tasks`
+> SDK: `pip install 'volcengine-python-sdk[ark]'`
+> 开通条件: 账户余额 >= 200元 或已购资源包
+> 任务ID仅保存7天，视频URL 24小时有效
+
+##### 模型列表
+
+| 模型 | Model ID | 1080p | 有声视频 | 联网搜索 |
+|------|----------|-------|----------|----------|
+| Seedance 2.0 | `doubao-seedance-2-0-260128` | ✅ | ✅ | ✅ |
+| Seedance 2.0 Fast | `doubao-seedance-2-0-fast-260128` | ❌ | ✅ | ✅ |

 ##### T2V - 文生视频

 | 参数名 | 类型 | 必填 | 默认值 | 说明 | 可选值 |
 |--------|------|------|--------|------|--------|
 | `model` | string | 是 | `doubao-seedance-2-0-260128` | 模型名称 | `doubao-seedance-2-0-260128`, `doubao-seedance-2-0-fast-260128` |
-| `prompt` | string | 是 | - | 提示词 | - |
-| `resolution` | string | 否 | `720p` | 尺寸 | `480p`, `720p`, `1080p` |
-| `duration` | integer | 否 | `8` | 视频长度 | - |
-| `ratio` | string | 否 | `1:1` | 宽高比 | `1:1`, `16:9`, `9:16`, `4:3`, `3:4`, `21:9`, `9:21` |
+| `prompt` | string | 是 | - | 提示词(中文<=500字,英文<=1000词) | - |
+| `resolution` | string | 否 | `720p` | 分辨率 | `480p`, `720p`, `1080p`(Fast不支持) |
+| `duration` | integer | 否 | `5` | 视频长度[4,15]秒, 或-1自动选择 | 4-15, -1 |
+| `ratio` | string | 否 | `adaptive` | 宽高比 | `16:9`, `4:3`, `1:1`, `3:4`, `9:16`, `21:9`, `adaptive` |
+| `generate_audio` | boolean | 否 | `true` | 是否生成同步音效(人声+音效+BGM) | `true`, `false` |
+| `watermark` | boolean | 否 | `false` | 是否含AI生成水印 | `true`, `false` |
+| `return_last_frame` | boolean | 否 | `false` | 返回尾帧图片(用于连续视频拼接) | `true`, `false` |
+| `priority` | integer | 否 | `0` | 执行优先级(0-9,越大越优先) | 0-9 |
+| `tools` | array | 否 | - | 联网搜索 `[{"type":"web_search"}]` | `web_search` |

-##### TI2V - 文图生视频
+##### TI2V - 首帧/首尾帧生视频

 | 参数名 | 类型 | 必填 | 默认值 | 说明 | 可选值 |
 |--------|------|------|--------|------|--------|
-| `model` | string | 是 | `doubao-seedance-2-0-260128` | 模型名称 | `doubao-seedance-2-0-260128`, `doubao-seedance-2-0-fast-260128` |
+| `model` | string | 是 | `doubao-seedance-2-0-260128` | 模型名称 | 同上 |
 | `prompt` | string | 是 | - | 提示词 | - |
-| `image1_file` | image | 是 | - | 首帧图片 | - |
-| `image2_file` | image | 否 | - | 尾帧图片 | - |
-| `resolution` | string | 否 | `720p` | 尺寸 | `480p`, `720p`, `1080p` |
-| `duration` | integer | 否 | `8` | 视频长度 | - |
-| `ratio` | string | 否 | `1:1` | 宽高比 | `1:1`, `16:9`, `9:16`, `4:3`, `3:4`, `21:9`, `9:21` |
+| `image1_file` | image | 是 | - | 首帧图片(role=first_frame) | - |
+| `image2_file` | image | 否 | - | 尾帧图片(role=last_frame) | - |
+| `resolution` | string | 否 | `720p` | 分辨率 | `480p`, `720p`, `1080p` |
+| `duration` | integer | 否 | `5` | 视频长度[4,15]秒 | 4-15, -1 |
+| `ratio` | string | 否 | `adaptive` | 宽高比(adaptive时以首帧为准) | 同上 |

-##### Ref2V - 参考生视频
+> 首尾帧图片宽高比不一致时，以首帧为准，尾帧自动裁剪适配。
+
+##### Ref2V - 多模态参考生视频（Seedance 2.0 核心能力）
+
+传入参考图片(1-9张) + 参考视频(1-3个) + 参考音频，基于素材+提示词生成视频。

 | 参数名 | 类型 | 必填 | 默认值 | 说明 |
 |--------|------|------|--------|------|
-| `model` | string | 是 | - | 模型名称 |
-| `prompt` | string | 是 | - | 提示词 |
-| `image_file` | image | 否 | - | 参考图片（支持数组，多张参考图） |
-| `video_file` | video | 否 | - | 参考视频（支持数组） |
-| `audio_file` | audio | 否 | - | 参考音频（支持数组） |
-| `duration` | integer | 否 | `12` | 视频长度 |
-| `resolution` | string | 否 | `720p` | 尺寸 |
-| `ratio` | string | 否 | - | 宽高比 |
+| `model` | string | 是 | `doubao-seedance-2-0-260128` | 模型名称 |
+| `prompt` | string | 是 | - | 提示词，用"图片1""视频1""音频1"指代素材 |
+| `image_files` | array | 否 | - | 参考图片URL列表(1-9张), role=reference_image |
+| `video_files` | array | 否 | - | 参考视频URL列表(1-3个,总时长<=15s), role=reference_video |
+| `audio_files` | array | 否 | - | 参考音频URL列表, role=reference_audio(须搭配图/视频) |
+| `resolution` | string | 否 | `720p` | 分辨率 |
+| `duration` | integer | 否 | `5` | 视频长度[4,15]秒 | 4-15, -1 |
+| `ratio` | string | 否 | `adaptive` | 宽高比 |
+| `generate_audio` | boolean | 否 | `true` | 是否生成同步音效 |
+
+> **三种图片场景互斥不可混用**: 首帧(first_frame) / 首尾帧(first_frame+last_frame) / 参考图(reference_image)
+> **音频不可单独传入**: 须至少包含1个参考视频或图片。
+> **人脸限制**: 不支持直接上传含真人人脸的参考图/视频。可用模型生成的含人脸产物、预置虚拟人像(asset://ID)、或已授权真人素材。
+
+##### 输入素材规格
+
+| 类型 | 格式 | 限制 |
+|------|------|------|
+| 图片 | jpeg/png/webp/bmp/tiff/gif/heic/heif | 宽高比(0.4,2.5), 宽高300-6000px, <30MB |
+| 视频 | mp4/mov (H.264/H.265+AAC/MP3) | 480p/720p/1080p, 时长2-15s, <50MB, FPS 24-60 |
+| 音频 | mp3/wav/aac | 不可单独传入,须搭配图/视频 |
+
+> 图片URL支持三种格式: 公网URL / Base64(`data:image/png;base64,...`) / 素材ID(`asset://ASSET_ID`)
+
+##### 输出视频像素表 (Seedance 2.0)
+
+| 分辨率 | 16:9 | 4:3 | 1:1 | 3:4 | 9:16 | 21:9 |
+|--------|------|-----|-----|-----|------|------|
+| 480p | 864×496 | 752×560 | 640×640 | 560×752 | 496×864 | 992×432 |
+| 720p | 1280×720 | 1112×834 | 960×960 | 834×1112 | 720×1280 | 1470×630 |
+| 1080p | 1920×1080 | 1664×1248 | 1440×1440 | 1248×1664 | 1080×1920 | 2206×946 |
+
+##### Ref2V 提示词写法
+
+用"图片1/2""视频1""音频1"指代素材，按时间轴描述场景：
+
+```
+全程使用视频1的第一视角构图，全程使用音频1作为背景音乐。
+第一人称视角果茶宣传广告；首帧为图片1，你的手摘下一颗带晨露的苹果，
+轻脆的碰撞声；2-4秒：快速切镜，将苹果块投入雪克杯，加入冰块与茶底，
+用力摇晃；4-6秒：成品特写，分层果茶倒入透明杯；
+6-8秒：手持举杯，将图片2中的果茶举到镜头前，尾帧定格为图片2。
+背景声音统一为女生音色。
+```
+
+> 对话内容用双引号包裹可优化音频生成效果。

 ---