From 0d0c5b70bd413ea309aa6f0d1e98276b93ab29e2 Mon Sep 17 00:00:00 2001 From: Hermes Agent Date: Wed, 17 Jun 2026 15:40:50 +0800 Subject: [PATCH] =?UTF-8?q?docs:=20=E6=B7=BB=E5=8A=A0Seedance=20R2V?= =?UTF-8?q?=E5=A4=9A=E6=A8=A1=E6=80=81=E5=8F=82=E8=80=83=E7=94=9F=E8=A7=86?= =?UTF-8?q?=E9=A2=91=E7=A4=BA=E4=BE=8B?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- wwwroot/api_doc.md | 114 ++++++++++++++++++++++++++++++++++++--------- 1 file changed, 93 insertions(+), 21 deletions(-) diff --git a/wwwroot/api_doc.md b/wwwroot/api_doc.md index 1f345ae..6a72e44 100644 --- a/wwwroot/api_doc.md +++ b/wwwroot/api_doc.md @@ -221,6 +221,19 @@ curl -X POST 'https://token.opencomputing.cn/llmage/v1/video/generations' \ "duration": 8 }' +# ---- Seedance R2V 多模态参考生视频 ---- +curl -X POST 'https://token.opencomputing.cn/llmage/v1/video/generations' \ + -H "Authorization: Bearer *** \ + -F "model=doubao-seedance-2-0-260128" \ + -F "catelogid=r2v" \ + -F "prompt=第一优先级:人物主体形象严格参考@图1。第二优先级:学习机产品外观严格参考@图2。第三优先级:门店背景空间严格参考@图3。视频主角只有一人,为@图1中的女性人物。人物外貌、脸型、五官、发型、气质、服装必须与@图1保持一致。保持知性温婉、干净利落的女性形象。服装为浅蓝色短袖针织上衣、米白色半身长裙、白色浅口单鞋。人物始终位于画面中心,主体占画面面积60%以上,面部清晰锐利。人物手持学习机,外观严格参考@图2。必须保持白色边框机身、橙色支架、底部笔槽结构、屏幕正面朝向镜头。不允许替换成其他电子设备。不允许产品变形、悬空、缺角、穿模。背景场景严格参考@图3,保持作业帮门店的橙红色主背景墙、100标识、暖白灯光和真实展示空间氛围。背景只作为场景识别与空间陪衬,不允许喧宾夺主,不要求生成清晰可读文字,不允许复杂宣传文案抢镜。镜头为竖屏中近景,人物自然站立面对镜头,轻微微笑,稳定展示学习机。双手或单手自然托持学习机,动作轻柔克制。整体为写实高清商业宣传短视频风格,画面明亮,人物皮肤自然通透,产品结构准确。禁止字幕、文字叠加、花字、水印。禁止出现第二个主要人物。禁止人物换脸、换装、肢体错误。禁止学习机外观错误、产品漂浮、手穿模。" \ + -F "ratio=9:16" \ + -F "resolution=1080p" \ + -F "duration=5" \ + -F "image_files=asset://asset-20260617135652-dczbp" \ + -F "image_files=asset://asset-20260617135840-ljmv9" \ + -F "image_files=asset://asset-20260617135924-s69z8" + # ---- 通义万象 T2V 文生视频 ---- curl -X POST 'https://token.opencomputing.cn/llmage/v1/video/generations' \ -H 'Authorization: Bearer *** \ @@ -390,42 +403,101 @@ curl -X POST 'https://token.opencomputing.cn/llmage/v1/video/generations' \ --- -#### Seedance 平台(火山方舟) +#### Seedance 平台(火山方舟)— Seedance 2.0 + +> 上游 API: `POST https://ark.cn-beijing.volces.com/api/v3/contents/generations/tasks` +> SDK: `pip install 'volcengine-python-sdk[ark]'` +> 开通条件: 账户余额 >= 200元 或已购资源包 +> 任务ID仅保存7天,视频URL 24小时有效 + +##### 模型列表 + +| 模型 | Model ID | 1080p | 有声视频 | 联网搜索 | +|------|----------|-------|----------|----------| +| Seedance 2.0 | `doubao-seedance-2-0-260128` | ✅ | ✅ | ✅ | +| Seedance 2.0 Fast | `doubao-seedance-2-0-fast-260128` | ❌ | ✅ | ✅ | ##### T2V - 文生视频 | 参数名 | 类型 | 必填 | 默认值 | 说明 | 可选值 | |--------|------|------|--------|------|--------| | `model` | string | 是 | `doubao-seedance-2-0-260128` | 模型名称 | `doubao-seedance-2-0-260128`, `doubao-seedance-2-0-fast-260128` | -| `prompt` | string | 是 | - | 提示词 | - | -| `resolution` | string | 否 | `720p` | 尺寸 | `480p`, `720p`, `1080p` | -| `duration` | integer | 否 | `8` | 视频长度 | - | -| `ratio` | string | 否 | `1:1` | 宽高比 | `1:1`, `16:9`, `9:16`, `4:3`, `3:4`, `21:9`, `9:21` | +| `prompt` | string | 是 | - | 提示词(中文<=500字,英文<=1000词) | - | +| `resolution` | string | 否 | `720p` | 分辨率 | `480p`, `720p`, `1080p`(Fast不支持) | +| `duration` | integer | 否 | `5` | 视频长度[4,15]秒, 或-1自动选择 | 4-15, -1 | +| `ratio` | string | 否 | `adaptive` | 宽高比 | `16:9`, `4:3`, `1:1`, `3:4`, `9:16`, `21:9`, `adaptive` | +| `generate_audio` | boolean | 否 | `true` | 是否生成同步音效(人声+音效+BGM) | `true`, `false` | +| `watermark` | boolean | 否 | `false` | 是否含AI生成水印 | `true`, `false` | +| `return_last_frame` | boolean | 否 | `false` | 返回尾帧图片(用于连续视频拼接) | `true`, `false` | +| `priority` | integer | 否 | `0` | 执行优先级(0-9,越大越优先) | 0-9 | +| `tools` | array | 否 | - | 联网搜索 `[{"type":"web_search"}]` | `web_search` | -##### TI2V - 文图生视频 +##### TI2V - 首帧/首尾帧生视频 | 参数名 | 类型 | 必填 | 默认值 | 说明 | 可选值 | |--------|------|------|--------|------|--------| -| `model` | string | 是 | `doubao-seedance-2-0-260128` | 模型名称 | `doubao-seedance-2-0-260128`, `doubao-seedance-2-0-fast-260128` | +| `model` | string | 是 | `doubao-seedance-2-0-260128` | 模型名称 | 同上 | | `prompt` | string | 是 | - | 提示词 | - | -| `image1_file` | image | 是 | - | 首帧图片 | - | -| `image2_file` | image | 否 | - | 尾帧图片 | - | -| `resolution` | string | 否 | `720p` | 尺寸 | `480p`, `720p`, `1080p` | -| `duration` | integer | 否 | `8` | 视频长度 | - | -| `ratio` | string | 否 | `1:1` | 宽高比 | `1:1`, `16:9`, `9:16`, `4:3`, `3:4`, `21:9`, `9:21` | +| `image1_file` | image | 是 | - | 首帧图片(role=first_frame) | - | +| `image2_file` | image | 否 | - | 尾帧图片(role=last_frame) | - | +| `resolution` | string | 否 | `720p` | 分辨率 | `480p`, `720p`, `1080p` | +| `duration` | integer | 否 | `5` | 视频长度[4,15]秒 | 4-15, -1 | +| `ratio` | string | 否 | `adaptive` | 宽高比(adaptive时以首帧为准) | 同上 | -##### Ref2V - 参考生视频 +> 首尾帧图片宽高比不一致时,以首帧为准,尾帧自动裁剪适配。 + +##### Ref2V - 多模态参考生视频(Seedance 2.0 核心能力) + +传入参考图片(1-9张) + 参考视频(1-3个) + 参考音频,基于素材+提示词生成视频。 | 参数名 | 类型 | 必填 | 默认值 | 说明 | |--------|------|------|--------|------| -| `model` | string | 是 | - | 模型名称 | -| `prompt` | string | 是 | - | 提示词 | -| `image_file` | image | 否 | - | 参考图片(支持数组,多张参考图) | -| `video_file` | video | 否 | - | 参考视频(支持数组) | -| `audio_file` | audio | 否 | - | 参考音频(支持数组) | -| `duration` | integer | 否 | `12` | 视频长度 | -| `resolution` | string | 否 | `720p` | 尺寸 | -| `ratio` | string | 否 | - | 宽高比 | +| `model` | string | 是 | `doubao-seedance-2-0-260128` | 模型名称 | +| `prompt` | string | 是 | - | 提示词,用"图片1""视频1""音频1"指代素材 | +| `image_files` | array | 否 | - | 参考图片URL列表(1-9张), role=reference_image | +| `video_files` | array | 否 | - | 参考视频URL列表(1-3个,总时长<=15s), role=reference_video | +| `audio_files` | array | 否 | - | 参考音频URL列表, role=reference_audio(须搭配图/视频) | +| `resolution` | string | 否 | `720p` | 分辨率 | +| `duration` | integer | 否 | `5` | 视频长度[4,15]秒 | 4-15, -1 | +| `ratio` | string | 否 | `adaptive` | 宽高比 | +| `generate_audio` | boolean | 否 | `true` | 是否生成同步音效 | + +> **三种图片场景互斥不可混用**: 首帧(first_frame) / 首尾帧(first_frame+last_frame) / 参考图(reference_image) +> **音频不可单独传入**: 须至少包含1个参考视频或图片。 +> **人脸限制**: 不支持直接上传含真人人脸的参考图/视频。可用模型生成的含人脸产物、预置虚拟人像(asset://ID)、或已授权真人素材。 + +##### 输入素材规格 + +| 类型 | 格式 | 限制 | +|------|------|------| +| 图片 | jpeg/png/webp/bmp/tiff/gif/heic/heif | 宽高比(0.4,2.5), 宽高300-6000px, <30MB | +| 视频 | mp4/mov (H.264/H.265+AAC/MP3) | 480p/720p/1080p, 时长2-15s, <50MB, FPS 24-60 | +| 音频 | mp3/wav/aac | 不可单独传入,须搭配图/视频 | + +> 图片URL支持三种格式: 公网URL / Base64(`data:image/png;base64,...`) / 素材ID(`asset://ASSET_ID`) + +##### 输出视频像素表 (Seedance 2.0) + +| 分辨率 | 16:9 | 4:3 | 1:1 | 3:4 | 9:16 | 21:9 | +|--------|------|-----|-----|-----|------|------| +| 480p | 864×496 | 752×560 | 640×640 | 560×752 | 496×864 | 992×432 | +| 720p | 1280×720 | 1112×834 | 960×960 | 834×1112 | 720×1280 | 1470×630 | +| 1080p | 1920×1080 | 1664×1248 | 1440×1440 | 1248×1664 | 1080×1920 | 2206×946 | + +##### Ref2V 提示词写法 + +用"图片1/2""视频1""音频1"指代素材,按时间轴描述场景: + +``` +全程使用视频1的第一视角构图,全程使用音频1作为背景音乐。 +第一人称视角果茶宣传广告;首帧为图片1,你的手摘下一颗带晨露的苹果, +轻脆的碰撞声;2-4秒:快速切镜,将苹果块投入雪克杯,加入冰块与茶底, +用力摇晃;4-6秒:成品特写,分层果茶倒入透明杯; +6-8秒:手持举杯,将图片2中的果茶举到镜头前,尾帧定格为图片2。 +背景声音统一为女生音色。 +``` + +> 对话内容用双引号包裹可优化音频生成效果。 ---