pcapi/wwwroot/doc/slurm/队列相关.md
2025-07-16 14:46:24 +08:00

7.9 KiB
Raw Blame History

GET V1查询队列详细json

  • url /api/v1/slurm/partition/list_partition_detail_json
  • resopone
{
    "status": "success",
    "data": [
        {
            "PartitionName": "master",
            "AllowGroups": "ALL",
            "AllowAccounts": "ALL",
            "AllowQos": "ALL",
            "AllocNodes": "ALL",
            "Default": "NO",
            "QoS": "N/A",
            "DefaultTime": "NONE",
            "DisableRootJobs": "NO",
            "ExclusiveUser": "NO",
            "GraceTime": "0",
            "Hidden": "NO",
            "MaxNodes": "UNLIMITED",
            "MaxTime": "UNLIMITED",
            "MinNodes": "0",
            "LLN": "NO",
            "MaxCPUsPerNode": "UNLIMITED",
            "Nodes": "CENI-KFSJK,CENI-CSSJK",
            "PriorityJobFactor": "1",
            "PriorityTier": "1",
            "RootOnly": "NO",
            "ReqResv": "NO",
            "OverSubscribe": "NO",
            "OverTimeLimit": "NONE",
            "PreemptMode": "OFF",
            "State": "UP",
            "TotalCPUs": "16",
            "TotalNodes": "2",
            "SelectTypeParameters": "NONE",
            "JobDefaults": "(null)",
            "DefMemPerNode": "UNLIMITED",
            "MaxMemPerNode": "UNLIMITED"
        }
    ]
}

GET V1创建队列

  • url:/api/v1/slurm/partition/create_partition

创建一个队列名为kaiyuanyun

  • query
    • PartitionName:kaiyuanyun

/api/v1/slurm/partition/create_partition?PartitionName=kaiyuanyun

创建一个队列名为kaiyuanyun且节点包含CENI-KFSJK

  • query
    • PartitionName:kaiyuanyun
    • Nodes:CENI-KFSJK

/api/v1/slurm/partition/create_partition?PartitionName=kaiyuanyun&nodes=CENI-KFSJK

创建一个队列名为kaiyuanyun且节点包含CENI-KFSJK且只允许testgroup

/api/v1/slurm/partition/create_partition?PartitionName=kaiyuanyun&nodes=CENI-KFSJK&AllowGroups=testgroup

GET V1修改队列

  • url:/api/v1/slurm/partition/update_partition

修改队列名为kaiyuanyun的节点 为CENI-KFSJK

  • query
    • PartitionName:kaiyuanyun
    • Nodes:CENI-KFSJK

/api/v1/slurm/partition/update_partition?PartitionName=kaiyuanyun&nodes=CENI-KFSJK

修改队列名为kaiyuanyun 节点为CENI-KFSJK且只允许testgroup

/api/v1/slurm/partition/update_partition?PartitionName=kaiyuanyun&nodes=CENI-KFSJK&AllowGroups=testgroup

启用队列

/api/v1/slurm/partition/update_partition?PartitionName=kaiyuanyun&state=UP

禁用队列

/api/v1/slurm/partition/update_partition?PartitionName=kaiyuanyun&state=DOWN

GET V1删除队列

  • url:/api/v1/slurm/partition/delete_partition

删除kaiyuanyuan队列

  • query
    • PartitionName:kaiyuanyun

/api/v1/slurm/partition/delete_partition?PartitionName=kaiyuanyu

属性字段参考

### 1. **PartitionName**
- **含义**:分区的名称。
- **示例**`master`
- **说明**:这是分区的唯一标识符,用户提交作业时可以指定分区。

---

### 2. **AllowGroups**
- **含义**:允许使用该分区的用户组。
- **示例**`ALL`
- **说明**`ALL` 表示所有用户组都可以使用该分区。

---

### 3. **AllowAccounts**
- **含义**:允许使用该分区的账户。
- **示例**`ALL`
- **说明**`ALL` 表示所有账户都可以使用该分区。

---

### 4. **AllowQos**
- **含义**允许使用该分区的服务质量QoS- **示例**`ALL`
- **说明**`ALL` 表示所有 QoS 都可以在该分区中使用。

---

### 5. **AllocNodes**
- **含义**:允许分配节点的规则。
- **示例**`ALL`
- **说明**`ALL` 表示可以分配所有节点。

---

### 6. **Default**
- **含义**:是否为默认分区。
- **示例**`NO`
- **说明**`NO` 表示该分区不是默认分区。如果用户未指定分区,作业将提交到默认分区。

---

### 7. **QoS**
- **含义**分区的默认服务质量QoS- **示例**`N/A`
- **说明**`N/A` 表示该分区没有配置默认的 QoS。

---

### 8. **DefaultTime**
- **含义**:分区的默认作业时间限制。
- **示例**`NONE`
- **说明**`NONE` 表示该分区没有配置默认的作业时间限制。

---

### 9. **DisableRootJobs**
- **含义**:是否禁止 root 用户提交作业。
- **示例**`NO`
- **说明**`NO` 表示允许 root 用户提交作业。

---

### 10. **ExclusiveUser**
- **含义**:是否允许独占用户。
- **示例**`NO`
- **说明**`NO` 表示不允许用户独占分区。

---

### 11. **GraceTime**
- **含义**:作业结束后的宽限时间(单位:秒)。
- **示例**`0`
- **说明**`0` 表示作业结束后立即释放资源。

---

### 12. **Hidden**
- **含义**:分区是否隐藏。
- **示例**`NO`
- **说明**`NO` 表示该分区对用户可见。

---

### 13. **MaxNodes**
- **含义**:单个作业可以使用的最大节点数。
- **示例**`UNLIMITED`
- **说明**`UNLIMITED` 表示没有限制。

---

### 14. **MaxTime**
- **含义**:作业的最大运行时间。
- **示例**`UNLIMITED`
- **说明**`UNLIMITED` 表示作业可以无限期运行。

---

### 15. **MinNodes**
- **含义**:单个作业可以使用的最小节点数。
- **示例**`0`
- **说明**`0` 表示作业可以使用任意数量的节点。

---

### 16. **LLN**
- **含义**是否为低延迟网络Low Latency Network分区。
- **示例**`NO`
- **说明**`NO` 表示该分区不是低延迟网络分区。

---

### 17. **MaxCPUsPerNode**
- **含义**:每个节点上可以使用的最大 CPU 核心数。
- **示例**`UNLIMITED`
- **说明**`UNLIMITED` 表示没有限制。

---

### 18. **Nodes**
- **含义**:分区中包含的节点列表。
- **示例**`CENI-KFSJK,CENI-CSSJK`
- **说明**:该分区包含 `CENI-KFSJK``CENI-CSSJK` 两个节点。

---

### 19. **PriorityJobFactor**
- **含义**:作业优先级因子。
- **示例**`1`
- **说明**`1` 表示该分区的作业优先级因子为 1。

---

### 20. **PriorityTier**
- **含义**:分区的优先级层级。
- **示例**`1`
- **说明**`1` 表示该分区的优先级层级为 1。

---

### 21. **RootOnly**
- **含义**:是否仅允许 root 用户提交作业。
- **示例**`NO`
- **说明**`NO` 表示允许所有用户提交作业。

---

### 22. **ReqResv**
- **含义**:是否要求预留资源。
- **示例**`NO`
- **说明**`NO` 表示不要求预留资源。

---

### 23. **OverSubscribe**
- **含义**:是否允许超额订阅资源。
- **示例**`NO`
- **说明**`NO` 表示不允许超额订阅资源。

---

### 24. **OverTimeLimit**
- **含义**:作业超时后的处理方式。
- **示例**`NONE`
- **说明**`NONE` 表示作业超时后不采取任何特殊处理。

---

### 25. **PreemptMode**
- **含义**:作业抢占模式。
- **示例**`OFF`
- **说明**`OFF` 表示不允许作业抢占。

---

### 26. **State**
- **含义**:分区的当前状态。
- **示例**`UP`
- **说明**`UP` 表示该分区处于可用状态。

---

### 27. **TotalCPUs**
- **含义**:分区中所有节点的总 CPU 核心数。
- **示例**`16`
- **说明**:该分区总共有 16 个 CPU 核心。

---

### 28. **TotalNodes**
- **含义**:分区中包含的节点总数。
- **示例**`2`
- **说明**:该分区包含 2 个节点。

---

### 29. **SelectTypeParameters**
- **含义**:节点选择类型的参数。
- **示例**`NONE`
- **说明**`NONE` 表示没有特殊的节点选择参数。

---

### 30. **JobDefaults**
- **含义**:作业的默认配置。
- **示例**`(null)`
- **说明**`(null)` 表示没有配置作业的默认参数。

---

### 31. **DefMemPerNode**
- **含义**:每个节点的默认内存限制。
- **示例**`UNLIMITED`
- **说明**`UNLIMITED` 表示没有默认的内存限制。

---

### 32. **MaxMemPerNode**
- **含义**:每个节点的最大内存限制。
- **示例**`UNLIMITED`
- **说明**`UNLIMITED` 表示没有最大内存限制。

---