搜索_华为云

创建训练作业参数 - AI开发平台ModelArts

参数说明参数是否必选参数类型说明 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。请求消息请求参数如表2所示。表2 参数说明参数是否必选参数类型说明 config_name 是 String 训练作业参数名称。限制为1

帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 训练管理（旧版） > 训练作业参数配置
创建训练作业提示错误码ModelArts.2763 - AI开发平台ModelArts

创建训练作业提示错误码ModelArts.2763 问题现象创建训练作业时，提示ModelArts.2763 : 选择的支持实例无效，请检查请求中信息的合法性。原因分析用户选择的训练规格资源和算法不匹配。例如：算法支持的是GPU规格，创建训练作业时选择了ASCEND规格的资源类型。

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > 云上迁移适配故障
日志提示“RuntimeError: connect() timed out” - AI开发平台ModelArts

复制完，其他节点进行torch.distributed.init_process_group()导致超时。处理方法如果是多个节点复制不同步，并且没有barrier的话导致的超时，可以在复制数据之前，先进行torch.distributed.init_process_group

帮助中心 > AI开发平台ModelArts > 故障排除 > 训练作业 > GPU相关问题
实时推理的部署及使用流程 - AI开发平台ModelArts

起来，避免频繁调用。 AK/SK认证：使用AK/SK对请求进行签名，在请求时将签名信息添加到消息头，从而通过身份认证。AK/SK签名认证方式仅支持消息体大小12M以内，12M以上的请求请使用Token认证。 APP认证：在请求头部消息增加一个参数即可完成认证，认证方式简单，永久有效。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业
在Standard上部署SD WebUI推理服务 - AI开发平台ModelArts

随机种子，控制生成图像的多样性否无您可在ModelArts控制台查看相关日志。图18 查看相关日志首次请求时会进行模型加载，耗时较长，因此第一个请求可能超时，第二个请求将会正常，请耐心等待。父主题： SD WEBUI套件适配PyTorch NPU的推理指导（6.3.908）

帮助中心 > AI开发平台ModelArts > 最佳实践 > 文生图模型训练推理 > SD WEBUI套件适配PyTorch NPU的推理指导（6.3.908）
查看ModelArts模型详情 - AI开发平台ModelArts

模型当前状态。部署类型模型支持部署的服务类型。版本数量模型的版本数量。请求模式在线服务的请求模式。同步请求：单次推理，可同步返回结果（约<60s）。例如: 图片、较小视频文件。异步请求：单次推理，需要异步处理返回结果（约>60s）。例如: 实时视频推理、大视频文件。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理ModelArts模型
修改模型服务QPS - AI开发平台ModelArts

修改模型服务QPS 流量限制QPS是评估模型服务处理能力的关键指标，它指示系统在高并发场景下每秒能处理的请求量。这一指标直接关系到模型的响应速度和处理效率。不当的QPS配置可能导致用户等待时间延长，影响满意度。因此，能够灵活调整模型的QPS对于保障服务性能、优化用户体验、维持业务流畅及控制成本至关重要。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Studio） > 管理我的服务
创建处理任务 - AI开发平台ModelArts

路径参数参数是否必选参数类型描述 project_id 是 String 用户项目ID。获取方法请参见获取项目ID和名称。请求参数表2 请求Body参数参数是否必选参数类型描述 create_version 否 Boolean 创建任务时是否同步创建一个任务版本

 帮助中心 > AI开发平台ModelArts > API参考 > 历史API > 数据管理（旧版）
从OBS中导入模型文件创建模型 - AI开发平台ModelArts

（秒）：每次检查的超时时间，填写0-2147483647之间的整数，单位为秒。最大失败次数：填写1-2147483647之间的整数。在服务启动阶段，当健康检查请求连续失败达到所填次数后，服务会进入异常状态；在服务运行阶段，当健康检查请求连续失败达到所填次数后，服务会进入告警状态。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型
推理性能测试 - AI开发平台ModelArts

chmark的请求频率（request-rate参数）较高，会触发推理平台的流控，请在ModelArts Standard“在线服务”详情页修改服务流量限制。同步请求时，平台每次请求预测的时间不能超过60秒。例如输出数据比较大的调用请求（例如输出大于1k），请求预测会超过60秒

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.906）
图模式 - AI开发平台ModelArts
图模式 - AI开发平台ModelArts

模型建议最大设置4个档位) export VLLM_ENGINE_ITERATION_TIMEOUT_S=1500 # 设置vllm请求超时时间(DeepSeek V2 236B W8A8 模型建议调大为6000) export HCCL_OP_EXPANSION_MODE=AIV

帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Lite Server适配Ascend-vLLM PyTorch NPU推理指导（6.3.912） > 推理关键特性使用
推理性能测试 - AI开发平台ModelArts

chmark的请求频率（request-rate参数）较高，会触发推理平台的流控，请在ModelArts Standard“在线服务”详情页修改服务流量限制。同步请求时，平台每次请求预测的时间不能超过60秒。例如输出数据比较大的调用请求（例如输出大于1k），请求预测会超过60秒

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.907）
查看在线服务详情 - AI开发平台ModelArts

DOMAIN_NAME 调用预测请求的账号名。 DOMAIN_ID 调用预测请求的账号ID。 PROJECT_NAME 调用预测请求的项目名。 PROJECT_ID 调用预测请求的项目ID。 USER_NAME 调用预测请求的用户名。 USER_ID 调用预测请求的用户ID。 “#”表示引用变量，匹配的字符串需要用单引号。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 管理同步在线服务
推理性能测试 - AI开发平台ModelArts

chmark的请求频率（request-rate参数）较高，会触发推理平台的流控，请在ModelArts Standard“在线服务”详情页修改服务流量限制。同步请求时，平台每次请求预测的时间不能超过60秒。例如输出数据比较大的调用请求（例如输出大于1k），请求预测会超过60秒

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.908）
推理性能测试 - AI开发平台ModelArts

chmark的请求频率（request-rate参数）较高，会触发推理平台的流控，请在ModelArts Standard“在线服务”详情页修改服务流量限制。同步请求时，平台每次请求预测的时间不能超过60秒。例如输出数据比较大的调用请求（例如输出大于1k），请求预测会超过60秒

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.909）
推理性能测试 - AI开发平台ModelArts

chmark的请求频率（request-rate参数）较高，会触发推理平台的流控，请在ModelArts Standard“在线服务”详情页修改服务流量限制。同步请求时，平台每次请求预测的时间不能超过60秒。例如输出数据比较大的调用请求（例如输出大于1k），请求预测会超过60秒

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.910）
推理性能测试 - AI开发平台ModelArts

chmark的请求频率（request-rate参数）较高，会触发推理平台的流控，请在ModelArts Standard“在线服务”详情页修改服务流量限制。同步请求时，平台每次请求预测的时间不能超过60秒。例如输出数据比较大的调用请求（例如输出大于1k），请求预测会超过60秒

 帮助中心 > AI开发平台ModelArts > 最佳实践 > LLM大语言模型训练推理 > 主流开源大模型基于Standard适配PyTorch NPU推理指导（6.3.911）
错误码 - AI开发平台ModelArts
错误码 - AI开发平台ModelArts

request. 请求错误，存在不合法的请求参数。请检查请求参数是否正确。 400 ModelArts.4201 Invalid request URL because no service ID or request URI included. 请求url中需要包含服务ID 请求地址不合法，请使用正确的预测地址

 帮助中心 > AI开发平台ModelArts > API参考 > 公共参数
部署模型为在线服务 - AI开发平台ModelArts

“环境变量” 设置环境变量，注入环境变量到容器实例。为确保您的数据安全，在环境变量中，请勿输入敏感信息，如明文密码。 “部署超时时间” 用于设置单个模型实例的超时时间，包括部署和启动时间。默认值为20分钟，输入值必须在3到120之间。 “添加模型版本进行灰度发布” 当选择的模型有多个

 帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 将模型部署为实时推理作业
模型推理代码编写说明 - AI开发平台ModelArts

spark）。 _preprocess(self, data) 预处理方法，在推理请求前调用，用于将API接口输入的用户原始请求数据转换为模型期望输入数据。 _inference(self, data) 实际推理请求方法（不建议重写，重写后会覆盖ModelArts内置的推理过程，运行自定义的推理逻辑）。

帮助中心 > AI开发平台ModelArts > ModelArts用户指南（Standard） > 使用ModelArts Standard部署模型并推理预测 > 创建模型规范参考

总条数： 556

上一页
1
...
6
7
8
...
28
下一页
跳转

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

创建训练作业参数 - AI开发平台ModelArts

创建训练作业提示错误码ModelArts.2763 - AI开发平台ModelArts

日志提示“RuntimeError: connect() timed out” - AI开发平台ModelArts

实时推理的部署及使用流程 - AI开发平台ModelArts

在Standard上部署SD WebUI推理服务 - AI开发平台ModelArts

查看ModelArts模型详情 - AI开发平台ModelArts

修改模型服务QPS - AI开发平台ModelArts

创建处理任务 - AI开发平台ModelArts

从OBS中导入模型文件创建模型 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

图模式 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

查看在线服务详情 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

推理性能测试 - AI开发平台ModelArts

错误码 - AI开发平台ModelArts

部署模型为在线服务 - AI开发平台ModelArts

模型推理代码编写说明 - AI开发平台ModelArts

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线